AI преводот на Google сега може да го имитира гласот на говорникот


AI на Google продолжува да го подобрува својот превод на јазик и, заедно со подобрените семантички перформанси, го задржува вниманието во детали. Ова се однесува на гласовните карактеристики на софтверот. Оваа технологија сега е во можност не само да репродуцира звучно преведување, туку и да го дуплира оригиналниот тон на личноста, пишува TechnologyReview.

Тоа е преку промена во традиционалните потфати на транслационите системи кои претвораат аудио во текст, по што го преведуваат и конечно ресинтезираат звукот. На овој начин, сепак, карактеристиките на оригиналниот глас се губат. Ова е местото каде доаѓа иновацијата на Google, која е поврзана со директната конверзија на аудио без средни чекори.

Новиот систем се нарекува Translatotron и има три компоненти:

Првата компонента користи нервна мрежа која се совпаѓа со аудио спектрограмот на влезот и излезот. Вториот ја претвора спектрограмата во аудио бран, а третиот овозможува да се надредат вокални карактеристики на оригиналниот глас.

Овој пристап не само што произведува повеќе суптилни преводи, туку задржува и важни невербални сигнали, но во теорија треба исто да ја минимизира грешката во преводот, бидејќи ја сведува задачата до исполнувањето на помалку чекори.

Досега, Translatotron е тестиран за превод само од шпански на англиски.


Видете следно

СКОПЈЕ СО PUMPTRACK ПОЛИГОН КАЈ ОЛИМПИСКИОТ БАЗЕН

Вљубениците во велосипедизмот, ролерите и скејтбордите наскоро ќе имаат можност да ги покажат своите вештини …