SMS/MMS
Новости
Справочная
Инновации



Словарь
ETSI (European Telecommunications Standards Institute) - Европейский институт телекоммуникационных стандартов, создан в 1988 г. Основу его деятельности составляет разработка стандартов в области связи. [...]
ещё

Говорящий искусственный интеллект WaveNet генерирует речь

Рубрика: Необычное | 12.09.16


В лаборатории DeepMind разрабатывают говорящий искусственный интеллект, который генерирует человекоподобную речь.

DeepMind – независимый отдел Google, работающий в сфере искусственного интеллекта. Именно эта лаборатория создала AlphaGo – систему, которая обыграла чемпиона мира по игре в го, корейца Ли Седола. Но DeepMind занимается не только логическими играми. В настоящее время специалисты компании работают над компьютерной системой генерации речи человека. Использование говорящего искусственного интеллекта, по мнению ученых, могло бы значительно усовершенствовать качество синтезированной речи.

Компьютеры в настоящее время умеют генерировать человеческую речь. Наиболее часто для этого используются сложные отрезки речи реальных людей. Применяют для генерации звуковых фраз также широкий спектр математических моделей. Но ни один из этих методов не является идеальным: люди легко на слух различают искусственные голоса, в основном из-за неестественной интонации и произношения.

Система WaveNet использует преимущества обоих названных выше методов. Новая модель работает с фрагментами реальных человеческих голосов, при этом самообучается на основе нейронных сетей, анализирующих звуковые фразы. Разрабатываемый учеными говорящий искусственный интеллект также учитывает языковые и фонетические правила.

Результаты впечатляют. Искусственный голос звучит практически как человеческий. В ходе испытаний с добровольцами, 50% людей посчитали, что голос машины на самом деле принадлежит человеку.

В WaveNet уже записано более 44 часов человеческой речи, а также звуки, слова и фразы 109 различных людей. Оказалось, что WaveNet прекрасно моделирует голос всех участников эксперимента и даже включает в речь специфическое дыхание и особенности речи конкретного человека.


Читайте также:


Хостинг-провайдер «Дельтахост» представляет обновленные тарифы на VPS и выделенные серверы на базе FreeBSD, Linux, Windows с бесплатной панелью управления ISPmanager Lite.


 
Copyright © sotamir.ru, 2006-2019.  Копирование материалов запрещено.
Частичное цитирование возможно только при указании прямой ссылки на www.sotamir.ru.
Контактная информация. Условия использования. Политика конфиденциальности



контакты на Главную