Нейросеть Google читает по губам лучше человека
Новое изобретение отличается самой высокой точностью среди аналогичных программ.
Команда научных сотрудников Google DeepMind и Оксфордского университета разработали систему искусственного интеллекта, которая превзошла человека в умении читать по губам.
Нейросеть WLAS (Watch, Listen, Attend and Spell) обучали с помощью шести популярных программ BBC, таких как BBC Breakfast, Newsnight и Question Time. Всего она «посмотрела» около 5 тысяч видео, которые содержали 118 тысяч предложений. Затем ее протестировали на незнакомых программах. В итоге искусственный интеллект смог распознать человеческую речь с точностью 46,8 %. При этом ошибки, допущенные системой, были незначительны и не мешали общему восприятию текста. Выполняя такое же задание, человек, профессионально читающий по губам, смог распознать только 12,4 % слов.
Разработчики полагают, что их изобретение может использоваться для создания субтитров к немому кино или для беззвучного управления виртуальными помощниками вроде Siri и Alexa через камеру. И, конечно, оно окажет неоценимую помощь людям с нарушениями слуха.
Статьи по теме:
Путешествие на диване: Google представил сервис, позволяющий побывать в любой точке планеты
То ли еще будет: 13 открытий будущего
Как технологии проникают в мир высокой моды