Нейросеть Google читает по губам лучше человека

Новое изобретение отличается самой высокой точностью среди аналогичных программ.

Искусственный интеллект Google умеет читать по губам

Команда научных сотрудников Google DeepMind и Оксфордского университета разработали систему искусственного интеллекта, которая превзошла человека в умении читать по губам.

Нейросеть WLAS (Watch, Listen, Attend and Spell) обучали с помощью шести популярных программ BBC, таких как BBC Breakfast, Newsnight и Question Time. Всего она «посмотрела» около 5 тысяч видео, которые содержали 118 тысяч предложений. Затем ее протестировали на незнакомых программах. В итоге искусственный интеллект смог распознать человеческую речь с точностью 46,8 %. При этом ошибки, допущенные системой, были незначительны и не мешали общему восприятию текста. Выполняя такое же задание, человек, профессионально читающий по губам, смог распознать только 12,4 % слов.

Разработчики полагают, что их изобретение может использоваться для создания субтитров к немому кино или для беззвучного управления виртуальными помощниками вроде Siri и Alexa через камеру. И, конечно, оно окажет неоценимую помощь людям с нарушениями слуха.

Статьи по теме:

Путешествие на диване: Google представил сервис, позволяющий побывать в любой точке планеты
То ли еще будет: 13 открытий будущего
Как технологии проникают в мир высокой моды

Фото: Gettyimages
Текст: Юлия Нестеренко
поделиться:

Войти с помощью: