Сәхифәләр
«Татар-информ» мәгълүмат агентлыгы баш редакторы
Ринат Вагыйз улы Билалов
420066, Татарстан Республикасы, Казан, Декабристлар ур., 2нче йорт.
«ТАТМЕДИА» акционерлык җәмгыяте
«Татар-информ» мәгълүмат агентлыгы татар редакциясе
Баш редактор урынбасары вазифасын башкаручы
Зилә Мөбәрәкшина
«Татсофт» сервисында татарча сөйләмне текстка әйләндерү мөмкинлеге барлыкка килде
- ВКонтакте
- Telegram
- РћРТвЂВВВВВВВВнокласснРСвЂВВВВВВВВРєРСвЂВВВВВВВВ
- РњРѕР№ Р В Р’В Р РЋРЎв„ўР В Р’В Р РЋРІР‚ВВВВВВВВРЎР‚

«Tatsoft» тәрҗемә сервисында татарча аудиоязмаларны текстка әйләндереп була. Гомумән алганда, әлеге сервиста татарча текстны русчага тәрҗемә итәргә, русча текстны татарчага тәрҗемә итәргә, татарча текстны сөйләмгә әйләндерергә мөмкин.
«Хәзер татарча сөйләмне текстка әйләндереп һәм татарча текстны тавышландырып була. Бүгенге көндә ул «Татсофт» сервисы буларак сайтта һәм аерым Телеграм-бот буларак та эшли башлады. Бот ярдәмендә тавыш белән дә яздырып җибәреп, тәрҗемә кирәк булган очракта документларны йөкләп эшкәртергә була», - диде «Татар-информ» хәбәрчесенә Татарстанның Фәннәр академиясенең Гамәли семиотика институты директоры Ринат Гыйльмуллин.
Фото: © «Татар-информ», Солтан Исхаков
Аның әйтүенчә, әлеге мөмкинлектән бушлай файдаланып була. Әмма аудиоязманың озынлыгы 10 минуттан артып китә алмый. «Серверларда чикләүләр булу сәбәпле массакүләм тарату өчен куәт җитеп бетми. Шуңа чикләүләр куярга туры килде. Сервер мәсьәләсе хәл ителсә, чикләүләрне арттырып булыр дип уйлыйм», - дип аңлатты ул.
«Бу эш дүрт ел элек башланды. Хәзер, ниһаять, тормышка ашты. Шул ук вакытта камиллекнең чиге юк, бу эш тукталмый, төгәлсезлекләр юк түгел. Модельләрне яңартып торабыз. Телеграм-ботта сөйләмне текстка әйләндерү өчен ике модель кулланып эшләргә була. Ул төрле очракта төрлечә: берсе тизрәк, икенчесе акрынрак эшли. Сыйфаты ягыннан да аермалар бар», - диде Ринат Гыйльмуллин.
Белгечләр Ясалма фәһем технологиясе, нейрочелтәрләргә нигезләнеп эшләгәннәр. «Аның өчен «датасет» тупларга туры килде. 500 сәгатькә якын аудио язмалар датасеты татар теле өчен уникаль. Әмма башка дөньякүләм телләр белән чагыштырганда бу әле барыбер аз. Шул сәбәпле датасетны хаталардан чистарту, сыйфатын, күләмен арттыру төп эшләребезнең берсе буларак дәвам итә. 500 сәгатькә якын язма эшкәртелде. Язмада 1200ләп артык кеше катнашты», - диде институт директоры.
Аның әйтүенчә, язмаларны туплау нейрочелтәргә сөйләмне таныр өчен кирәк. «Төрле кеше төрлечә сөйләшә, төрле диалектлар бар. Шуңа күрә төрле сөйләм үрнәкләре булдырылды», - диде ул.
Текстны тавышландыру мөмкинлеге дә бар. Галиәсгар Камал исемендәге Татар дәүләт академия театры актерлары тавышларын яздырганнар. «Ир-ат тавышы буларак Алмаз Гәрәев, хатын-кыз тавышы буларак Алсу Каюмованы ишетеп була. Сөйләмне текстка әйләндергән очракта базаларны арттырырга ниятлибез. 500гә якын сәгать язма бар дидем, башка дөнья күләмендәге телләр белән чагыштырганда бу аз. Хаталарны төзәттерәсе бар», - диде Ринат Гыйльмуллин.
«Төрле җиһазлардан, телефон, ноутбуктан яздырылды. Җиһазлар күбрәк булган саен безнең өчен яхшырак. Технологияләр дә үзгәреп тора. Модельләр камилләшеп, алга таба ул яңартылачак, яңа версияләре дә чыгып торачак», - диде ул.
Кызыклы яңалыкларны күзәтеп бару өчен Телеграм-каналга язылыгыз