ҺАВА ТОРЫШЫ -5 oC

Яңалыклар

барлык хәбәрләр Татарстан Россия

Җәмгыять, Татар дөньясы

Интернетта "Common Voice" татарча сөйләм таныгычы проекты булдырылды

13 август 2018, 09:29 , Фото: скриншот

Интернетта Оештыручы сүзләренчә, әлеге проектка киң җәмәгатьчелекнең, волонтерларның ярдәме кирәк.

(Казан, 13 август, “Татар-информ”, Зилә Мөбәрәкшина). Бу көннәрдә татар телендә “Common Voice” дип исемләнгән сөйләм таныгычы булдырылды. Оештыручы сүзләренчә, тупланган тавыш үрнәкләре сөйләм тану системаларында гына түгел, татар телен өйрәнүчеләргә сөйләмне камилләштерүдә куллану өчен дә бай материал була ала. Шуның өчен киң җәмәгатьчелекнең, күпсанлы волонтерларның ярдәме бик мөһим. Бу хакта “Татар-информ” агентлыгы хәбәрчесенә сөйләм таныгычын гамәлгә куюда катнашкан Мансур Сайхунов хәбәр итте.

“Күптән түгел без бергәләп Intertat.tatar сайтына "Тәлгать" сөйләм җыйнагычын урнаштырган идек, ягъни текстны сөйләмгә күчерә торган программаны. Киресенчә кеше сөйләмен текст формасына күчерү системалары исә сөйләм тану өлкәсенә карый. Монда иң танылганнардан "Ok, Google!" (Google), Siri (Apple), Алиса (Яндекс) системаларын атап үтәргә була”, - диде Мансур Сайхунов.

“Сөйләм тану юнәлеше бүгенге көндә шактый гына телләр өчен яхшы сыйфатлы системалар төзүгә иреште. Ләкин дөньядагы күпчелек кече телләр өлкәсендә вазгыять катлаулырак. Әлеге системаларны булдыру бик күп көч, акча, вакыт таләп итә. Кечкенә коллективларның аерым гына бу өлкәдә нинди дә булса уңышка ирешә алулары бик шикле. Шуңа күрә уртак бер система төзеп, аны барлык телләр өчен дә куллану иң кулай һәм акча ягыннан да эконом вариант булып күренә", - ди М.Сайхунов.

Mozilla компаниясенең “Common Voice” проекты нәкъ менә шуны күз алдында тотып эшләнә дә. Әлеге системаны ясау 2017 елда башлана һәм 2018 елда аңарда барлык телләр белән эшләү мөмкинлеге ачыла. "Без Илнар Сәлимҗанов исемле егет белән бергә волонтер буларак “Common Voice”ның интерфейсын татарчага тәрҗемә итеп һәм беренчел көйләүләрне башкарып, июнь аенда татарча версиясенең эшли башлавына ирештек. Әмма бу әле юлның башы гына, чөнки сөйләм тану системасын төзү өчен бик зур сөйләм базасын тупларга кирәк”, - диде Мансур Сайхунов.

Мансур сүзләренчә, бу программада җәмәгатьчелекнең, волонтерларның ярдәме мөһим. “Common Voice проекты моның өчен аларга интернет аша эшли торган уңайлы интерфейс бирә: бүгенге көндә берникадәр волонтер бу эштә даими рәвештә катнаша. Татарстан Республикасы Фәннәр Академиясенең Тел, әдәбият һәм сәнгать институты һәм Казан федераль универститетының Лев Толстой исемендәге Филология һәм мәдәниятара багланышлар институты хезмәткәрләре дә зур активлык күрсәтә”, - ди ул.

“Бу сайтка һәркем ноутбук, компьютер (аерым микрофон булса) яки, иң җайлысы, смартфон аша кереп, шунда күрсәтелгән җөмләләрне укып чыга, аннары дөрес укылган булуларын тикшерә һәм серверда саклый ала. Моңа бик аз вакыт кирәк. Бу мәкаләне укучылар барыбыз да көн саен 5-10 минут вакытыбызны шуңа багышласак, ел дәвамында татарча сөйләмне тану процессын югары сыйфатка җиткерерлек база туплап булыр дип уйлыйм”, - диде Мансур Сайхунов.

Оештыручы сүзләренә караганда, программада үз тавышыңны яздыру белән бергә башка кешеләрнең язмаларын тикшерүдә дә катнашырга мөмкин. “Әлеге проектка тавышның студиядә язылган булуы кирәкми. Монда фонда төрле чит тавышларның булуы да ярый: үтеп баручы машиналар, җил, күрше әтәчнең көтмәгәндә кычкырып җибәрүе һ.б. Иң мөһиме, проект төрле диалект вәкилләрен дә активрак катнашырга чакыра, чөнки телнең бөтен байлыгы әдәби тел белән генә чикләнми, ә нәкъ менә төрле диалект, сөйләш һәм акцентларның җыелмасыннан гыйбарәт. Шуңа күрә монда “Мин татарча начар беләм” дигән сүз булырга тиеш түгел. Әгәр татарча язылган гади җөмләне аңлап укып чыга аласыз икән, Common Voice проектына рәхим итегез! Әлеге проект кысаларында тупланган тавыш үрнәкләре сөйләм тану системаларында гына түгел, ә, мәсәлән, Казан федераль университетында татар сөйләмен эксперименталь фонетика кысаларында өйрәнү өчен дә, татар телен өйрәнүчеләргә сөйләмне камилләштерүдә куллану өчен дә искиткеч бай материал булып тора”, - ди Мансур Сайхунов.

Common Voice проектының өстенлекләре:

1. Аның тулысынча ачык лицензияләр (GNU General Public License, Creative Commons) кысаларында эшләнүе, ягъни бу системаның коды һәм базалары һәркемгә тулысынча бушлай бирелә. Теләсә кайсы кеше яки оешма беркемнән дә рөхсәт сорамыйча, беркемгә дә акча түләмичә, бу проектны ирекле рәвештә интернеттан йөкләп куллана ала.

2. Әлеге халыкара проектта төрле илләрдән, төрле университетлардан галимнәр катнаша. Шуңа күрә монда бүгенге фәндәге иң алдынгы казанышлар чагылыш таба.

3. Башка зур проектлар кебек “Common Voice”та төрле программалар, системалар белән интеграцияләнүне күз алдында тотып төзелә. Мәсәлән, берәр оешма клиентлар белән эшләүдә русча сөйләмне таныту өчен “Common Voice”ны куллана икән, ул оешма аерым көч сарыф итмичә шунда ук татар, чуаш һ.б. телләр белән дә эш итә алачак дигән сүз.

4. Кече телләргә зур игътибар бирелә.

 Искәрмәләр:


Безгә Telegramда язылыгыз

Әгәр хата күрсәгез, текстны билгеләгез һәм Ctrl + Enter төймәләренә басыгыз

Фикерләр




Бик мөһим һәм кызыклы хәлнең шаһиты булдыгызмы? Редакциягә хәбәр итегез!

+7 927 037-91-10