TajikVoice AI: как молодой программист научил искусственный интеллект говорить по-таджикски и победил на конкурсе
В условиях, когда качественных программ для преобразования текста в голос и голоса в текст на таджикском языке крайне мало, а существующие решения не всегда работают корректно, молодой программист Абдулазиз Авезов создал прорывное решение — программу TajikVoice AI. О своём проекте, его возможностях и пути к программированию Абдулазиз рассказал в беседе с журналистом «Азия-Плюс».
Идея создания программы родилась из личных потребностей разработчика. Абдулазиз признался, что устал от использования онлайн-переводчиков, отсутствия автоматических субтитров на таджикском языке в YouTube и не мог найти нужные аудиокниги на родном языке. Обучающие видео по программированию также были доступны преимущественно на английском, что подтолкнуло его к разработке собственного решения. «Каждый раз, размышляя о своих потребностях, я добавлял в программу новые функции», — говорит Абдулазиз, подчеркивая, что именно личные задачи стали движущей силой развития проекта.
Интерес к технологиям зародился у него ещё в детстве: он самостоятельно изучал основы робототехники на YouTube. Из-за отсутствия необходимого оборудования в селе, Абдулазиз покупал радиоуправляемые машинки и использовал их детали для создания роботов. Позже он углубил свои знания, работая учеником мастера по ремонту телефонов, что еще больше усилило его стремление к изучению программирования.
TajikVoice AI — это многофункциональная платформа, способная преобразовывать текст в голосовое сообщение и наоборот, автоматически добавлять субтитры к видеороликам, а также использоваться в колл-центрах и на новостных сайтах. Программа умеет очищать звук от посторонних шумов с использованием технологии 16 kHz, распознает и записывает только литературную речь. Скорость работы программы впечатляет: 10 тысяч слов преобразуются в звук всего за 23 секунды. При этом точность распознавания речи достигает 90–95%, а преобразование текста в звук — 85%. Абдулазиз подчёркивает, что программа постоянно совершенствуется, и активное её использование помогает улучшать качество распознавания и произношения.
В этом году TajikVoice AI заняла первое место на республиканском конкурсе «Наука — свет просвещения» в номинации «Искусственный интеллект и программирование», набрав 77 баллов и получив премию в размере 70 тысяч сомони. Это не первое достижение Абдулазиза; в школьные годы он дважды становился победителем областного конкурса юных изобретателей.
В долгосрочной перспективе Абдулазиз стремится к тому, чтобы TajikVoice AI могла выполнять команды на таджикском языке, подобно российской «Алисе», находя применение в умных домах и офисах, а также в качестве аналитического инструмента для колл-центров. На данный момент программа ещё не доступна для общего пользования в виде мобильного приложения, но в ближайшие дни ожидается её публичный релиз. Впоследствии разработчик планирует предложить платные тарифы Pro и Business.
Идея создания программы родилась из личных потребностей разработчика. Абдулазиз признался, что устал от использования онлайн-переводчиков, отсутствия автоматических субтитров на таджикском языке в YouTube и не мог найти нужные аудиокниги на родном языке. Обучающие видео по программированию также были доступны преимущественно на английском, что подтолкнуло его к разработке собственного решения. «Каждый раз, размышляя о своих потребностях, я добавлял в программу новые функции», — говорит Абдулазиз, подчеркивая, что именно личные задачи стали движущей силой развития проекта.
Интерес к технологиям зародился у него ещё в детстве: он самостоятельно изучал основы робототехники на YouTube. Из-за отсутствия необходимого оборудования в селе, Абдулазиз покупал радиоуправляемые машинки и использовал их детали для создания роботов. Позже он углубил свои знания, работая учеником мастера по ремонту телефонов, что еще больше усилило его стремление к изучению программирования.
TajikVoice AI — это многофункциональная платформа, способная преобразовывать текст в голосовое сообщение и наоборот, автоматически добавлять субтитры к видеороликам, а также использоваться в колл-центрах и на новостных сайтах. Программа умеет очищать звук от посторонних шумов с использованием технологии 16 kHz, распознает и записывает только литературную речь. Скорость работы программы впечатляет: 10 тысяч слов преобразуются в звук всего за 23 секунды. При этом точность распознавания речи достигает 90–95%, а преобразование текста в звук — 85%. Абдулазиз подчёркивает, что программа постоянно совершенствуется, и активное её использование помогает улучшать качество распознавания и произношения.
В этом году TajikVoice AI заняла первое место на республиканском конкурсе «Наука — свет просвещения» в номинации «Искусственный интеллект и программирование», набрав 77 баллов и получив премию в размере 70 тысяч сомони. Это не первое достижение Абдулазиза; в школьные годы он дважды становился победителем областного конкурса юных изобретателей.
В долгосрочной перспективе Абдулазиз стремится к тому, чтобы TajikVoice AI могла выполнять команды на таджикском языке, подобно российской «Алисе», находя применение в умных домах и офисах, а также в качестве аналитического инструмента для колл-центров. На данный момент программа ещё не доступна для общего пользования в виде мобильного приложения, но в ближайшие дни ожидается её публичный релиз. Впоследствии разработчик планирует предложить платные тарифы Pro и Business.