Наверняка, если вы активно пользуетесь своим смартфоном, вам приходилось слышать, как он говорит: например, озвучивает прогноз погоды или сообщает о пробках. Мы уже привыкли к некоторой искусственности этого голоса, даже если это составленные вместе кусочки человеческой речи. Непривычные паузы, искажённые смысловые акценты — всё это проблема синтеза речи.
Учёные из Адоби нашли способ, как обойти ограничения современных алгоритмов. Они создали нейросеть, которая обучается на двадцатиминутном примере, анализирует особенности речи по нескольким сотням параметров и начинает разговаривать тем самым голосом, который только что услышала.
Применений у технологии масса: от озвучивания мультфильмов и кино до утилитарных разговоров современных гаджетов с владельцем. Ну и не стоит забывать про забавные применения. Утренний будильник, говорящий голосом Иосифа Виссарионовича «Доброе утро, вы ещё спите?» разбудит, пожалуй, многих.