Приложение и нейросеть для распознавания речи по губам создали в Петербурге.
Фото: Артем КИЛЬКИН (архив)
Искусственный интеллект научат распознавать слова в шумных условиях. Ученые из Петербурга создали приложение для смартфона и нейросеть для распознавания речи по губам. Об этом 11 апреля пишет ТАСС со ссылкой на Санкт-Петербургский Федеральный исследовательский центр РАН.
- Ученые придумали алгоритм и приложение для смартфона, которое сможет считывать речь пользователя, когда шумно. Такой сервис может пригодиться в отраслях, где используются голосовые команды – от сферы услуг до тяжелой промышленности, - пишет издание.
Нейросетевую модель научили распознавать несколько сотен наиболее распространенных команд. Искусственный интеллект может сам решить, что даст максимальную точность при распознавании: картинка, звук или оба канала.
Программу тестировали с помощью водителей шумных большегрузных автомобилей. Только по губам нейросеть восприняла 60-80 процентов информации, а вместе со звуком – 90 процентов. Теперь приложение будут улучшать.