+7(996)961-96-66
+7(964)869-96-66
+7(996)961-96-66
Заказать помощь

Курсовая работа на тему Системы распознавания речи

ОПИСАНИЕ РАБОТЫ:

Предмет:
ИНФОРМАТИКА
Тема:
Системы распознавания речи
Тип:
Курсовая работа
Объем:
24 страницы
Дата:
11.04.03
Идентификатор:
idr_1909__0003351
ЦЕНА:
360 руб.

324
руб.
Внимание!!!
Ниже представлен фрагмент данной работы для ознакомления.
Вы можете купить данную работу прямо сейчас!
Просто нажмите кнопку "Купить" справа.

Оплата онлайн возможна с Яндекс.Кошелька, с банковской карты или со счета мобильного телефона (выберите, пожалуйста).
ЕСЛИ такие варианты Вам не удобны - Отправьте нам запрос данной работы, указав свой электронный адрес.
Мы оперативно ответим и предложим Вам более 20 способов оплаты.
Все подробности можно будет обсудить по электронной почте, или в Viber, WhatsApp и т.п.
 

Системы распознавания речи - работа из нашего списка "ГОТОВЫЕ РАБОТЫ". Мы помогли с ее выполнением и она была сдана на Отлично! Работа абсолютно эксклюзивная, нигде в Интернете не засвечена и Вашим преподавателям точно не знакома! Если Вы ищете уникальную, грамотно выполненную курсовую работу, курсовую, реферат и т.п. - Вы можете получить их на нашем ресурсе.
Вы можете заказать курсовую Системы распознавания речи у нас, написав на адрес ready@referatshop.ru.
Обращаем ваше внимание на то, что скачать курсовую Системы распознавания речи по предмету ИНФОРМАТИКА с сайта нельзя! Здесь представлено лишь несколько первых страниц и содержание этой эксклюзивной работы - для ознакомления. Если Вы хотите получить курсовую Системы распознавания речи (предмет - ИНФОРМАТИКА) - пишите.

Фрагмент работы:





Содержание


Введение 3
§ 1. Механизмы распознавания речи 4
§ 2. Компьютерные системы распознавания речи 6
2.1. Так работает система распознавания речи 7
2.2. В помощь медикам 8
2.3. Microsoft и распознавание речи 9
2.4. Общение по шести каналам 10
2.5. Слушай команду! 10
2.6. Можно и без ПК 11
2.7. Телефон слушает команды 12
§ 3. Обзор популярных программ распознавания речи 12
3.1. Dragon NaturallySpeaking Preferred 13
3.2. IBM ViaVoice Gold 15
3.3. L&H Voice Xpress Professional 17
3.4. Philips FreeSpeech 2000 18
3.5. А что у нас? "Горыныч Проф 1.0" 19
Заключение 21
Список используемой литературы 23
Приложение. Компьютер учится понимать речь 24


Введение

В данной работе рассматривается тема "Системы распознавания речи". В 70-х на переднем крае речевых технологий оказались советские ученые, специализировавшиеся на фундаментальных исследованиях теории языка. Их достижения легли в основу многих современных продуктов, однако, как бы велико ни было значение этих исследований, больше всего нынешним изобилием продуктов, основанных на речевых технологиях, мы обязаны рыночным механизмам. Они же обеспечили и снижение цен до их нынешнего уровня. Например, система речевого управления производства фирмы Dragon Systems - одного из лидеров в этой области - стоила в дни 386 процессора $5000, а теперь ее можно купить менее чем за $200.
Существует всего две основные технологии: распознавание речи и синтез речи. Первая обеспечивает ввод речевой информации в компьютер, вторая - вывод.
Продукты, основанные на технологии распознавания речи, можно разделить на три большие группы:
- средства речевого управления;
- средства диктовки;
- средства идентификации по образцу речи.
Центральным элементом любого продукта, относящегося к одной из перечисленных групп, служит механизм распознавания речи - существующий самостоятельно или в виде набора алгоритмов, реализованных в пакете ПО. Большинство механизмов распознавания речи состоит из четырех основных блоков: препроцессора, экстрактора, компаратора и интерпретатора.
Распознавание, опирающееся на анализ речи, является важной функцией обработки речи, выполняемой системой. Этот процесс позволяет заменять непроизводительную работу с клавиатурой либо световым пером применением речевого ввода с микрофона. Системы распознавания речи характеризуются тремя параметрами:
- объемом словаря понимаемых слов;
- допустимой беглостью речи (может речь произноситься слитно, либо между словами должны быть паузы);
- степенью зависимости от настойки на речь конкретного лица.
Системы распознавания, в первую очередь, используются там, где произносятся отдельные слова либо краткие словосочетания. Такие фразы произносят диспетчеры, работники медицины и банковских систем.
Вначале распознавание речи осуществлялось базовыми компьютерами. Но, уже в 1986 году корпорация IBM продемонстрировала этот процесс на основе Персонального Компьютера (ПК). Настольные системы распознавания речи особенно эффективны, ибо обеспечивают естественный и удобный способ ввода информации в абонентскую систему.
Итак, речевой ввод и голосовое управление - давно не новость. Но станет ли распознавание речи электронными устройствами привычным элементом нашего быта? Рассмотрим подробнее механизмы и системы распознавания речи, реальные программные продукты, существующие сегодня.

§ 1. Механизмы распознавания речи

Причинами внедрения систем распознавания речи является повсеместное распространение телефонных сетей и практика встраивания микрофонов в компьютеры и периферийные устройства, например в камеры. В качестве недостатков таких систем можно назвать факторы, влияющие на результаты распознавания: помехи в микрофонах, влияние окружающей обстановки на результаты распознавания (шум), ошибки при произнесении, различное эмоциональное состояние проверяемое в момент регистрации эталона при каждой идентификации, использование разных устройств при записи эталонов и идентификации, помехи в низкокачественных каналах передачи данных и т.п.
Над технологиями распознавания речи работает множество компаний, однако все они в основном следуют одной и той же базовой методологии, основанной на четырехэтапной процедуре. Различия сводятся к применяемым методам математического моделирования и алгоритмам. Один из ведущих поставщиков таких механизмов - фирма Learnout & Hauspie, продукт которой и использовался в качестве "натуры" для составления приведенного ниже описания.
Препроцессор, или модуль сбора данных, обеспечивает связь между аналоговым внешним миром и цифровым микрокосмосом компьютера. В число видов обработки входного сигнала могут входить автоматическая регулировка усиления, подавление эха, обнаружение присутствия/отсутствия речи и обнаружение интонационного конца фразы. Цель всей этой обработки состоит в том, чтобы передать на следующий этап как можно более качественный сигнал.
Экстрактор выполняет частотный анализ сигнала. Акустическо-фонетический поток данных разбивается на короткие кадры, или векторы, продолжительностью, как правило, около 10 мс. Эти алгоритмы обладают достаточной акустической устойчивостью благодаря адаптивности канала записи и подавлению шумов на предыдущем этапе.
Компаратор осуществляет акустическое сравнение: каждый кадр, или вектор, сравнивается с имеющимися акустическо-фонетическими образцами (субсловами). Для каждой пары вычисляется функция правдоподобия. Именно в этом модуле наука ближе всего подходит к превращению в реальную производительную силу. Речь не отличается высоким уровнем воспроизводимости, и создателям компаратора приходится пытаться воспроизвести работу человеческого мозга, который использует различные дополнительные признаки и контекст для интуитивного определения смысла сказанного.
Механизм, разработанный специалистами Learnout & Hauspie, использует в настоящее время три вида субслов: контекстно-независимые фонемы, контекстно-зависимые фонемы и модели слов. Такое разнообразие элементов отражает возрастающую степень детализации моделирования. Статистические