irina0921 (irina0921) wrote,
irina0921
irina0921

Category:

Нейросеть научили копировать голос при синтезе текста в речь





Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
Оригинал взят у bamymih в Нейросеть научили копировать голос при синтезе текста в речь

Subscribe

  • Ришта Святого Роха

    Перед вами фрагмент картины неизвестного художника конца XV — начала XVI века, которая хранится в галерее итальянского города-порта Бари и…

  • Есть ли у огня собственный вес

    Языки пламени — это потоки раскаленных газов, поднимающиеся вверх за счет силы Архимеда. В них продолжаются процессы горения, которые приводят к…

promo nemihail 14:00, вчера 30
Buy for 20 tokens
Удивительно тонкий киношный троллинг, в определенный момент фильма у людей появляется стойкое отвращение к нетрадиционным связям, однако возникает оно именно в самом конце, когда ваш мозг буквально вывернут наизнанку. История про нарушение не только личного пространства, но и... (фото: Яндекс…
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments