Фото: unsplash
Индустрия синтеза голоса и речи быстро растет и развивается, и ее объемы уже превышают $1 млрд. Широкие возможности применения таких технологий очевидны: голосовые помощники, говорящие роботы, радио- и телепрограммы, озвучивание книг и фильмов голосами известных людей, восстановление голосов тех, кто умер или лишился возможности говорить и т. п. В последние два года в условиях пандемии разработки в этой области заметно активизировались.
Технологии синтеза голоса существуют давно, однако до начала 2010-х годов такие голоса звучали механически. С развитием технологий и ИИ появилась возможность буквально разложить человеческий голос «на атомы», ухватить все его характеристики и нюансы и создать голос, который не принадлежит человеку, но звучит абсолютно по-человечески, а также синтезировать голоса конкретных людей.
(По материалам "Коммерсантъ")