Нейросеть от Microsoft способна подделать голос любого человека

Недавно стало известно о том, что новая нейросеть VALL-E от корпорации Microsoft способна подделывать голос конкретного человека вплоть до интонаций.

Полученный образец VALL-E разбивает на мельчайшие фрагменты и сравнивает их с уже имеющейся базой данных. Обладая информацией о том, как в разных ситуациях звучат голоса других людей, нейросеть «предполагает», как в тех же ситуациях будет звучать голос «донора».

null

VALL-E обучали на библиотеке LibriLight, содержащей 60 тысяч часов англоязычной речи более чем от 7 тысяч человек. Для системы достаточно записи продолжительностью три секунды, чтобы получить высококачественную подделку.

Отметим, что голос имитируется очень достоверно, у него сохраняется тембр и верная эмоциональная окраска оригинала.

Согласно заявлению Microsoft, VALL-E не будет распространятся в открытом доступе по соображениям безопасности, чтобы нейросетью не воспользовались мошенники.

Поделись с друзьями — нажми на одну из кнопок ниже!

Рекомендованные статьи

Добавить комментарий

© 2020 - 2023 «Типичный айтишник». Копирование и видоизменение материалов возможно только при наличии активной ссылки на типичный-айтишник.рф