Распознавание речи

Распознавание речи — это компьютерные технологии 5-го поколения, позволяющие пользователю работать с компьютером и его данными, прилагая только работу голосовых связок.

Впервые технологии распознания речи были разработаны в 1982-1983-х годах. Первоначально (например, технология Dragon Naturally Speaking) они использовались для облегчения жизни пожилых людей и инвалидов. Программы были сложны, но могли выполнять только простые функции. Повышение вычислительных мощностей способствовало решению этой проблемы.

В конце 90-х годов прошлого века были созданы более «развитые» программы типа Microsoft Voice Command или Speereo Voice Translator. Их мощности были способны посредством голоса создавать документ, переключать музыку, «разговаривать» с пользователем на простые темы на нескольких языках.

В настоящее время перед учеными стоит задача создания программ, способных распознавать человеческую речь и давать внятный ответ (IVR-технологии). В программах такого уровня широко заинтересованы телефонные компании, операторы сервисных центров, секретари. Уже существуют многие технологии такого уровня, но почти все они не могут — пока – преодолеть порог узнаваемости только одного человеческого голоса.

Добавить комментарий