Китайский аналог Google — компания Baidu — анонсировала запуск нейронной сети, которая способна лучше и быстрее других программных аналогов может имитировать любой голос с учетом акцента и фонетических оттенков.
Предшественнику этой новинки, проект Baidu Deep Voice на базе искусственного интеллекта требовалось 30-минутное изучение исходного материала для генерации нового голоса. Инструмент Adobe VoCo делает это за 20 минут, канадский стартап Lyrebird всего за минуту обработки. Новая технология Baidu, у которой пока нет собственного имени, укладывается в несколько секунд, сообщает портал «Технокульт» со ссылкой на сообщение компании.
Коммерческий потенциал у такой инновационной разработки неимоверно широк, и первым делом на ум, разумеется, приходит мошенничество и фальсификация данных. Клонирование лиц, движений и генерация видео «с участием» конкретной персоны, де-факто, уже доступно, и может быть даже поставлено на поток. Достаточно добавить голосовое сопровождение и получить оптимизированную копию личности, например, для обхода систем биометрической идентификации.
Но есть примеры позитивного использования новинки. Вполне — «одушевленный» электронный помощник, который говорит голосом любимого персонажа. Цифровая нянька, способная успокоить ребенка или домашнего питомца голосом старшего члена семьи. Возможность привычного общения для человека, который утратил способность говорить, пусть и временно. Запись аудиокниг или озвучка текста известным голосом без необходимости утруждать его обладателя.