Как реализовать голосовое управление без необходимости говорить

Как реализовать голосовое управление без необходимости говорить

22 февраля 2022

Оригинальный подход к реализации голосового управления продемонстрировали исследователи из Корнельского университета. Их разработка способна распознавать движения мимических мышц лица и шеи, не требуя произносить саму голосовую команду вслух.

Показанное устройство получило название SpeeChin и представляет собой небольшой нашейный кулон со встроенной инфракрасной камерой. Камера отвечает за съемку лица и шеи пользователя, а проприетарное программное обеспечение – за детектирование речевых паттернов и преобразование их в управляющие команды.

В результате проведенных тестов прототип SpeeChin продемонстрировал среднюю точность распознавания английской речи на уровне 90,5% и точность распознавания мандаринского диалекта китайского языка на уровне 91,6%. При этом, произносит ли пользователь команды вслух или нет, на точность распознавания не влияет.

Разработка ориентирована на использование в офисах открытого типа и других общественных рабочих пространствах, позволяя управлять различными устройствами без рук, но, в отличие от классических систем голосового управления, для этого не потребуется проговаривать голосовые команды, способные отвлекать окружающих.


Комментирует Руидонг Чжан, аспирант в области информатики Корнельского университета и участник команды исследователей:

«Мы считаем, что кулон – это наиболее комфортный для ношения форм-фактор устройства, который больше подходит людям, чем наушники и схожие с ними продукты. Некоторые могут подумать – зачем мне система распознавания речи, если она уже интегрирована в смартфон? Тем не менее, ее использование может не всегда быть социально приемлемым или уместным, что делает эту функцию в ряде случаев просто бесполезной. Наша разработка позволяет по-новому посмотреть на этот процесс».

Подпишитесь на рассылку
и получайте популярные статьи, видео и кейсы за неделю в одном письме