Последние новости России и Украины, главные новости дня.

Добро пожаловать на сайт онлайн новостей Talks.su (последние новости России и Украины, главные новости дня). Мы ежедневно публикуем главные новости шоу-бизнеса, культуры, экономики, последние новости России и Украины.  Сегодня и вы сможете узнать последние новости России и Украины всего за 5 минут.  После того, как вы прочитаете последние новости Украины и России, советуем Вам почитать главные новости дня. Хороших вам новостей и, кстати, не забудьте проверить свой гороскоп.

Google разработала самую точную программу для чтения по губам

Искусственный интеллект Google DeepMind, разработанный вместе с учеными Оксфордского университета, научился понимать речь, следя за артикуляцией говорящего. ИИ-систему Google обучили на 6-ти телешоу (таких как Newsnight, BBC Breakfast и Question Time), которые выходили в эфир с 2010-го по 2015-й года, «скормив» ей видео общей длительностью 5 тысяч часов (около 118 тысяч предложений).

После показа случайной выборки из 200 видео из передач BBC, человек, читающий по губам, сумел расшифровать менее четверти произносимых слов.

Затем специалисту по распознаванию речи и искусственному разуму дали возможность посмотреть 200 не связанных между собой фрагментов. После просмотра тыс. часов эфира BBC обученная алгоритму распознавания мимики нейросеть WLAS начала понимать 46.8% слов. Показатель не выглядит впечатляющим (особенно на фоне актуальных на данный момент систем расшифровки аудиозаписей с ошибкой не по меньшей мере 12%), но даже опытный чтец по губам может правильно разобрать произнесенное только в 12.4% случаев.

Две недели назад еще одна система глубокого обучения, которая может читать по губам, была разработана в Оксфордском университете. Система под названием LipNet с точностью в 93.4% угадывала слова, однако программа имела дело с небольшой платформой видео и 51 уникальным словом. При всем этом приобретенные результаты могли быть еще лучше, однако в некоторых случаях аудио и видео отставали почти на секунду, что мешало ИИ правильно выстраивать ассоциативные связи.

GRID применяется в превосходно освещенных видео людей, стоящих перед камерой и читающих слова длительностью три секунды.

Ученые говорят, что система могла бы отыскать применение в мобильных технологиях, виртуальных помощниках, а еще для задач распознавания речи. Она также может посодействовать людям с неувязками слуха понимать других. На лицо еще одна победа ИИ над человеком. Разработкой занимались профессионалы подразделения DeepMind, информирует Газета.Ru со сылкой на печатное издание The Verge.

Google разработала самую точную программу для чтения по губам
Google разработала самую точную программу для чтения по губам

26 Ноября
Добавить комментарий

Обратная связь