Математическое обеспечение систем и устройств с речевым вводом информации тема автореферата и диссертации по математике, 01.01.10 ВАК РФ

Орлова, Маргарита Изикиельевна АВТОР
кандидата технических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1984 ГОД ЗАЩИТЫ
   
01.01.10 КОД ВАК РФ
Диссертация по математике на тему «Математическое обеспечение систем и устройств с речевым вводом информации»
 
 
Содержание диссертации автор исследовательской работы: кандидата технических наук, Орлова, Маргарита Изикиельевна

ВВЕДЕНИЕ

ГЛАВА I. Проблема организации речевого ввода в диалоговых системах.

1.1. Общее состояние проблемы

1.2. Современные системы автоматического распознавания речи и особенности их эксплуатации.

1.3. Основные принципы построения систем автоматического распознавания речи.

1.4. Анализ известных методов построения матобеспечения распознающих систем

1.5. Принципы построения тестов для проверки и диагностики систем и устройств распознавания речи

 
Введение диссертация по математике, на тему "Математическое обеспечение систем и устройств с речевым вводом информации"

Разработка систем автоматического распознавания и синтеза речи является в настоящее время одним из основных направлений развития средств автоматизации. Такие системы позволяют повысить эффективность технического обслуживания различных систем в народном хозяйстве и допустить широкий круг пользователей, не обладающих специальной подготовкой, к эксплуатации сложных технических комплексов, в частности, вычислительных машин.

Диапазон потенциального практического использования устройств, воспринимающих речевые команды и выдающих информацию или управляющие сигналы голосом, необычайно широк [бЗ, 59, 66, 74, 105, 130] .

Широта возможных практических применений таких устройств определяется рядом специфических свойств речевого способа передачи информации Ы :

- речь является для человека естественным способом обмена информацией, не требует специального обучения, относительно устойчива к изменению психофизиологического состояния оператора ;

- речевой обмен информацией и речевое управление оставляют свободными глаза и руки, которые зачастую оказываются перегруженными в процессе практической деятельности ;

- речевой обмен информацией и речевое управление возможны в условиях пониженной (или нулевой) освещенности и при физических перегрузках ;

- для речевого управления и обмена информацией возможно использование стандартных каналов связи и стандартного периферийного оборудования.

Кроме того, системы распознавания речи могут работать от голоса конкретного пользователя ("санкционированный" доступ к органам управления), а также от речи, генерируемой в условиях искусственнои дыхательной среды (например, "гелиевая речь").

С перечисленных выше позиций разработка практических устройств распознавания речевых сигналов, включающая в себя математическое и программное обеспечение всех блоков этих устройств, является актуальной задачей, важной как с научной, так и с прикладной точек зрения.

Несмотря на очевидные преимущества систем автоматического распознавания речи и многолетние исследования в этой области, достигнутые успехи пока недостаточны. Связано это с чрезвычайной сложностью структуры речевого сигнала. Во-первых, элементы речевого потока весьма изменчивы, что определяется индивидуальными особенностями говорящего, его психофизиологическим состоянием, контекстом и просто мгновенно сложившейся артикуляторно-акустической ситуацией. Во-вторых, при общении человека с человеком речь включена в широкий неречевой контекст и чаще всего предполагает контрольный ответ (диалог). Система же автоматического распознавания речи имеет дело только с этим сообщением и редуцированность сигнала становится труднопреодолимой [24] .

Наиболее широкое развитие и применение нашли способы автоматического распознавания речи, основанные на использовании точных математических методов при сравнении входных и эталонных реализаций, которые рассматривают речевой сигнал, ке учитывая его биологическую природу, выражающуюся в неопределенности описания и многовариантности сигнала, отражающего не только смысл сказанного, но и эмоции говорящего, его индивидуальность и т.д. Это делает системы, основанные на отношении к речевому сигналу, несущему одно смысловое содержание, очень зависящими от диктора и условий, в которых он находится при произнесении высказывания. Большинство современных реальных промышленных систем не учитывают природу речи из-за трудностей ее моделирования. В отличие от более общего математического направления исследований в настоящей работе предлагается бионический подход, базирующийся на изучении основных закономерностей речевосприятия. Такой подход позволяет создавать системы, наиболее полно учитывающие способности человеческого мышления к восприятию реальных речевых сигналов.

Системы автоматического распознавания речи - это в первую очередь программные системы, которые должны работать в реальных условиях (в акустических шумах помещения, с множеством дикторов, не являющихся профессиональными пользователями вычислительных машин и т.д.). Реальные условия накладывают свои требования на системы речевого ввода и на их математическое обеспечение. Кроме того, современные системы распознавания должны быть экономичными с точки зрения памяти и вычислительных ресурсов. Вследствие этого актуальной проблемой построения таких систем является выбор модели распознавания, для которой развивается матобеспечение, связанной с выбором алгоритмов отдельных этапов дешифрации речи.

Цель данной работы - разработать специализированное программное обеспечение для систем и устройств с речевым вводом информации, обеспечивающим работу этих устройств в условиях акустических помех и искажений, характерных для практических задач. Ставилась задача совместить достоинства бионической модели процесса восприятия речи человеком и модели, на которой основываются большинство современных практических систем распознавания речи, не обладающих достаточной для применения в реальной практике устойчивостью.

Для решения этих задач было необходимо:

- определить архитектуру системы распознавания речевого сигнала, реализующей бионический подход к распознаванию речевого сообщения ;

- проанализировать старые и разработать новые методики и алгоритмы анализа и распознавания речи (включая оптимизацию признаков первичного описания) ;

- разработать математическое и программное обеспечение систем и устройств, работающих в реальных условиях ;

- экспериментально проверить работу предложенных алгоритмов и программ.

В диссертации, посвященной разработке специализированного матобеспечения речевого ввода информации, рассматриваются следующие вопросы:

- исследуется общая структура блоков речевого ввода в диалоговых системах ;

- анализируются методы и алгоритмы первичной обработки речи и методики автоматического распознавания речевых сигналов ;

- формулируются принципы построения тестов для проверки и диагностики систем и устройств распознавания речи ;

- предлагается бионический подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными статистическими методами обработки речевого сигнала учитывает основные принципы восприятия речи человеком ;

- разрабатывается матобеспечение для систем автоматического распознавания речи, основанной на бионическом принципе ;

- оптимизируется система различительных признаков речевого сигнала ;

- выбираются оптимальные параметры алгоритма нелинейного сравнения входной речевой реализации и эталонных произнесений ;

- разрабатывается специализированное матобеспечение для систем распознавания речевых образов, ориентированных на произвольного диктора ;

- предлагается модель системы автоматического распознавания изолированных слов на ЭВМ типа ЕС, основанная на бионическом принципе, позволяющая проводить сквозные эксперименты по выбору оптимальных параметров распознающей системы;

- проведена проверка работы системы в шумах ;

- предлагается матобеспечение для автоматического телефонного номеронабирателя, работающего с голоса произвольного диктора ;

- разрабатывается специализированное матобеспечение для обработки искаженных гелиевой средой сигналов для осуществления связи с акванавтами ;

- разрабатывается матобеспечение для диалоговой системы анализа речевых сигналов.

Общая методика проведения исследований в данной работе направлена на поиск оптимальных алгоритмов отдельных блоков матобеспечения речевого ввода и предусматривает:

- использование результатов биологических, психологических, психолингвистических исследований процесса восприятия речи человеком ;

- использование статистических методов обработки информации ;

- использование спектральных методов для анализа речевого сигнала ;

- использование метода динамического программирования для решения задач распознавания речевых образов;

- применение методов кластерного анализа для формирования эталонных реализаций речевых сигналов ;

- использование методов теории алгоритмов и организации банков данных для представления знаний в памяти ЭВМ.

Научная новизна работы заключается:

- в разработке и программной реализации новых алгоритмов анализа и распознавания речевых сигналов для систем, работающих в сложных условиях ;

- в оптимизации параметрического представления речевых сигналов для систем с речевым вводом информации ;

- в выборе оптимального варианта процедуры нелинейной деформации масштаба времени при сравнении распознаваемого и эталонного речевых сигналов методом динамического программирования ;

- в разработке специализированного математического и программного обеспечения для систем автоматического телефонного номеронабирателя, работающего от голоса произвольного диктора;

- в разработке матобеспечения для системы связи с акванавтами, находящимися в гелиево-кислородной дыхательной среде ;

- в разработке математического и программного обеспечения диалоговой системы анализа акустических сигналов с речевым запросом информации ;

- в формировании тестов для проверки и диагностики систем автоматического распознавания речи с целью исследования их применимости в сложных условиях.

Практическая ценность работы, подтвержденная актами использования результатов диссертации, определяется тем, что разработанные методики, алгоритмы и программы используются в конкретных системах и устройствах автоматического распознавания речи и в отдельных узлах таких систем, работающих, как правило, в сложных условиях (в шумах производственного помещения, в гелиевой среде, в телефонном канале).

Диссертация состоит из введения, четырех глав и заключения.

 
Заключение диссертации по теме "Математическое обеспечение вычислительных машин и систем"

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В работе получены следующие основные результаты:

- предложен подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными методами анализа речевого сигнала учитывает некоторые принципы восприятия речи человеком;

- разработана структура системы автоматического распознавания речи, основанная на бионическом принципе и использующая сегментно-целостный анализ произнесения с учетом просодических характеристик. Система учитывает: наличие параллельных путей анализа речевого сообщения; взаимодействие этих путей на любом этапе распознавания ; обработку речевого сообщения не только "снизу- вверх", но и "сверху - вниз", т.е. возможность генерации системой гипотезы о классе входного сигнала и сравнении гипотезы с входным сигналом ;

- разработано математическое и программное обеспечение для основных блоков этой системы ;

- сформулированы основные принципы построения тестов для проверки и диагностики систем автоматического распознавания речи и разработан вариант конкретного теста ;

- исследованы и выбраны оптимальные параметры анализа и обработки речевого сигнала в системах распознавания речи ;

- разработано специализированное матобеспечение для системы распознавания, ориентированное на голосовой набор номера телефона и работающей с произвольным диктором, которое при тестировании на 30 дикторах обеспечило надежность распознавания семизначного номера телефона>96$;

- разработано матобеспечение для автоматического распознавания слов, произносимых в нестандартных атмосферах с надежностыо»-92$ ;

- разработано матобеспечение автоматического речевого ввода информации для использования в диалоговой системе анализа сигналов: словарный запас рабочего языка - 176 слов, максимальный коэффициент ветвления - 37. Акустический анализ речевого сообщения в системе обеспечивает 97$ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.

Полученные в работе результаты позволяют сделать следующие выводы:

1. Использование речевого ввода в системах и устройствах - одно из эффективных средств развития автоматизации производственных процессов.

2. Предложенная в работе архитектура системы автоматического распознавания речевого сообщения позволяет решать задачи речевого ввода информации в системы и устройства более эффективно: с большей надежностью и с минимальными затратами по времени принятия решения.

3. Сформулированные принципы построения тестового материала и требования к тестам для систем APP. позволят разработать целую систему тестов для проверки и диагностики рече-распознающих систем. Предложенный конкретный вариант теста используется в настоящее время во многих организациях.

Предложенная архитектура системы АРР и разработанное матобеспечение отдельных блоков могут использоваться при решении разнообразных практических задач.

5. Проведенная оптимизация информативных признаков речевого сигнала позволила выделить надежную и удобную в практическом использовании и аппаратурной реализации систему параметров, обеспечивающую точность распознавания изолированных слов на словаре из 80 слов, близкую к 100$.

6. Выбранный алгоритм нелинейного по времени сравнения эталонной и входной реализаций речевого сигнала обеспечивает на выбранном первичном описании высокую надежность распознающей системы.

7. Разработанная модель системы АРР на ЭВМ ЕС 1033, основанная на бионическом подходе к процессу распознавания речевого сообщения и использующая сегментно-целостный анализ произнесения с включением просодических характеристик, позволяет проводить сквозные эксперименты со сменными блоками выделения признаков и сменными блоками принятия решения и обучения системы и используется для дальнейших речевых исследований.

Заключение

1. Разработанное матобеспечение для модели неадаптивного микропроцессорного устройства распознавания, ориентированное на голосовой набор номера телефона, обеспечивает надежность распознавания семизначного номера телефона > 96$.

2. Разработано матобеспечение для распознавания слов, произносимых в нестандартных атмосферах. Точность распознавания для 15 слов составила в среднем 92$, в то время как слуховая разборчивость <30$.

3. Разработано матобеспечение автоматического речевого запроса для использования в диалоговой системе анализа сигналов. Словарь - 176 слов,максимальный коэффициент ветвления -37. Акустический анализ речевого сообщения в системе обеспечивает 97$ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.

- 157 -

 
Список источников диссертации и автореферата по математике, кандидата технических наук, Орлова, Маргарита Изикиельевна, Москва

1. Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП.- Киев-Одесса, 1982, с.556.

2. Альдефельд Б., Рабинер Л.Р., Розенберг Э.Э., Уилтон Д.Г. Автоматическая справочно-поисковая система, основанная на распознавании изолированных слов. В сб.: ТИИЭР, 1980, т.68, № II, с.7-25.

3. Амирезашвили Н.З., Чикоидзе Г.Б. Анализ данных в речевых командах. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.500-502.

4. Беллман Р. Динамическое программирование. М., ИЛ, i960 , 400 с.

5. Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. М., Наука, 1969, 183 с.

6. Бондарко Л.В., Загоруйко Н.Г., Кожевников В.А., Молчанов А.П., Чистович Л.А. Модель восприятия речи человеком.- Новосибирск, 1968, 48 с.

7. Брановицкий В.И., Довгялло A.B. Диалог человека и ЭВМ: основные понятия и определения. В сб.: Управляющие системы и машины. - Киевт 1978, К 4, с.28-35.

8. Васильев A.B., Кринов С.Н., Савельев В.П., Цемель Г.И., Чижков В.М. Распознавание чисел от нуля до 100. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI.- Ереван, 1980, с.269-273.'

9. Великовский А.Е. Современные устройства распознавания речи. Обзор В сб.: Радиоэлектроника за рубежом, 1983, № 23, с.1-31.

10. Величко Б.М., Загоруйко Н.Г. Автоматическое распознавание ограниченного набора устных команд. В сб.: Вычислительные системы. - Новосибирск, 1969, вып.36, с.101-110.

11. Величко В.М., Загоруйко Н.Г. Распознавание больших словарей. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 8-го Всесоюзного семинара АРСО-УШ. -Львов, 1974, с.9-13.

12. Величко В.М., Загоруйко Н.Г. Система распознавания речевых команд. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с.173-176.

13. Винцюк Т.К. О математических моделях речевого сигнала, используемых в распознавании речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.34-38.

14. Винцюк Т.К. Перспективы практического использования систем речевого диалога. 'Гам же, с.38-40.

15. Винцюк Т.К., Гринчук В.М., Калмыков В.Г. Автоматизированное рабочее место (АРМ) конструктора, использующее систему речевого диалога СРД "Речь-Г1. Там же,с.512-516.

16. Винцюк Т.К., Куляс А.И., Людовик Е.К., Шинкаж А.Г. Эксперименты с кооперативной системой распознавания речи. -Там же, с.298-300.

17. Винцюк Т.К., Лобанов Б.М., Шинкаж А.Г. Система распознавания речи и система устного диалога СРД "Речь-I" на основе микро-ЭВМ. Там же, с.516-521.

18. Винцюк Т.К., Шинкаж А.Г. Распознавание 1000 слов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с.180.

19. Галунов В.И., Акустическая коммуникация, речь и передача смысловой информации. В сб.: Звуковая коммуникация, эхолокация и слух. - Д., ЛГУ, 1980, с.22-37.

20. Галунов В.И. Бионическая модель системы распознавания речи. В сб.: Исследование моделей речеобразования и речевосприятия. - Л., 1981, с.36-52.

21. Галунов В.И. Язык и системы автоматического понимания речи. В сб.: Восприятие языкового значения. - Калининград, Калининградский государственный университет, 1980, с.10-21.

22. Галунов В.И., Гарбарук В.И. Факторный анализ спектрального представления речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 13-го Всесоюзного семинара АРС0-ХШ. - Новосибирск, 1984, с.66-67.

23. Галунов В.И., Орлова М.И. Архитектура диалоговой системы, построенной на основе модели восприятия речи человеком. -Там же, с.16-18.

24. Галунов В.И., Орлова 14.И., Шнейдер В.К1. Экспериментальные исследования системы автоматического распознавания слитной речи. Тезисы докладов IX Всесоюзной акустической конференции. М., 1977, с.65-66.

25. Галунов В.И., Коваль С.Л., Тампель И.Б., Проблемы акустической теории речеобразования. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. - М., АН СССР, 1981, с.60-75.

26. Галунов В.И., Орлова М.И., Ягунова H.H. Использование метода динамического программирования при распознавании речевых образов. В сб.: Техника средств связи, серия ТПС,вып,3(2). М., 1981, с.114-122.

27. Галунов В.К., Сомин Н.В., Тарасов А.И., Трунин-Донской Б.Н., Якушенков Г.Л. Спектральные методы выделения основного тона. В сб.: Вопросы кибернетики. - М., Наука, 1976,с.28-38.

28. Галунов В.И., Орлова М.И., Щукин В.Г. Разработка тестов для систем автоматического распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.305-307.

29. Гельфанд С.А. Слух. Введение в психологическую и физиологическую акустику. М., Медицина, 1984, 350 с.

30. Григорян П.А., Григорян H.A., Лазарян Л.М. Сегментация речевых сигналов. В кн.: Автоматическое распознавание речевых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. - Ереван, 1980, с.95-101.

31. Демков М.Г. Об унификации методики испытаний устройств распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.472-474.

32. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. М., Мир, 1972, 288 с.

33. Дюран Б., Оделл П. Кластерный анализ. Пер.с англ. Деми-денко. М., Статистика, 1977, 128 с.

34. Емельянов В.Н., Трунин-Донекой В.Н. Современное состояние отечественных разработок в области автоматического распознавания и синтеза речи. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. - М-,1. АН СССР, 1981, с.3-17.

35. Занченко Ю.А. Система распознавания ограниченного набора слов в условиях сильного внешнего шума. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. - Тбилиси, 1978, с.205-207.

36. Зиновьева Н.В., Захаров J1.M., Ампилова Б.В. Методика чтения "слепых" сонограмм. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.351-354.

37. Кельманов A.B. Экспериментальное исследование 18 систем первичного описания речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. - Ереван, 1980, с.112-113.

38. Кельманов A.B. О выборе числа и границ спектральных полос при распознавании речевых сигналов. Там же, с.313-315.

39. Кельманов A.B. Сравнительное исследование двух алгоритмов динамического программирования. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев-Одесса, 1982, с.474-476.

40. Коваль С Л - Речевая связь при глубоководных погружениях. -В сб.: Техника средств связи, серия ТИС. - М., вып.9, 1976, с.88-112.

41. Кольцова A.A. Расширение библиотеки процедур системы ГРАФ*. В сб.: Техническая кибернетика, № 5. - М., 1978.

42. Копейкин А.Б. Исследование структур и вычислительных процессов в системе ввода устных команд, построенных с использованием микро-ЭВМ. Автореферат. . кандидата технических наук. М., 1980, 22 с.

43. Кринов С.Н., Цемель Г.И. Сегментация речевых сигналов.

44. В сб.: Речевое общение в автоматизированных системах. М., Наука, 1975.

45. Кулагин М.В., Пажитнов А.Л. Ввод и обработка акустического сигнала на микро-ЭВМ "Электроника-бО". В кн.: Автоматическое распознавание слуховых образов. Тезисы докладови сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев1. Одесса, 1982, с.180-181.

46. Лебедев Б.Г. Кривые маскировки в распознавании речевых сигналов. 3 кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ц-го Всесоюзного семинара АРС0-Х1. - Ереван, 1980, с.381-382.

47. Лебосс Б. Промышленность осваивает системы синтеза и распознавания речи. Электроника, 1980, № 12, с.79-89.

48. Мазур В.Н., Марчук Д.С., Сапелюк Б.М. Элементы речевого управления в подсистеме АСУП на базе мини-ЗВМ. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. -Ереван, 1980, с.336-332.

49. Макхол Дж. Линейное предсказание. Обзор. В сб.: ТИИЭР, № 4, т.63, 1975, с.20-44.

50. Маркел Дж.Д., Грей А.Х. Линейное предсказание речи. Пер. с англ. М., Связь, 1980, 308 с.

51. Мартин Т. Практическое применение речевого ввода в вычислительную машину. В сб.: ТИИЭР, № 4, т.64, 1976, с.80-95.

52. Методы автоматического распознавания речи. В 2-х книгах, под редакцией У.Ли. Пер.с англ. М., Мир, 1983, 716 с.

53. Мясников Л.Л. Объективное распознавание звуков речи. дТг, 1943, К 3, с.12-25.

54. Нефф р. Внедрение систем распознавания речи в Японии. -Электроника. ;,ь, Мир, 1982, т.5, № 3, с.89-91.

55. Орлова М.И. Бионическая модель системы автоматического распознавания речи. В сб.: Техника средств связи, серия ТПС, вып.12(45 ), - М., 1979, с.108-112.

56. Орлова М.И. Модель распознавания речевых образов, построенная на бионическом принципе. В кн.: Модели речевого процесса в норме и патологии. Тезисы докладов Всесоюзного симпозиума. Гродно, 1979, с.24.

57. Паташюс Ю.В. Система распознавания слов на базе ЭВМ "Злект-роника-60". В кн.: "Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.324-326.

58. Петров Г.М., Аврин С.Б., Копейкин А.Б., Малыгина Т.М., Москаленко Г.В. Система ввода речевых сигналов для ЭВМ. -Там же, с.280-283.

59. Плотников В.Н., Суханов В.А., Кузнецов C.B., Белинский A.B. Индивидуальный канал речевого диалогового управления.

60. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.539-542.

61. Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов симпозиума. -Ji., 1983, 43 с.

62. Рабинер JI., Гоулд Б. Теория и применение цифровой обработки сигналов. Пер. с англ. т., Мир, 1978, 848 с.

63. Рабинер Ji., Шафер Р. Цифровая обработка речевых сигналов. Пер.с англ. М., Радио и связь, 1981, 496 с.

64. Редди Д.Р. Машинное распознавание речи. Обзор. В сб.: ТИИЭР, I 4, т.64, 1976, с.95-130.

65. Речевая связь с машинами. Тематический выпуск. Сб. ТИИЭР, № 4, т.64, 1976, 182 с.

66. Рамишвили Г.С., Сердюков В.Д. Комплексная система автоматического распознавания речевых сигналов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. - Тбилиси, 1978, с.229-231.

67. Сапожков М.А., Михайлов В.Г. Бокодерная связь. Ц., Радио и связь, 1983, 248 с.

68. Серединский А., Ванде-Кирков В.А., Буздалина И.А., Окунев И.В., Орлова М.И., Солонина А.И. Применение рекурентных сплайнов для обработки видео- и речевых сигналов. -Электросвязь. 1982, № с, с.60-64.

69. Система распознавания связной речи фирмы NEC . Зарубежная радиоэлектроника, № 4, 1980, с.108-120.

70. Слуцкер Г.С. Нелинейный метод анализа речевых сигналов. -В кн.: Труды НИИРадио, 1968, № 2, с.28-34.

71. Спрингер С., Дейч Г. Левый мозг, правый мозг. М., Мир, 1983, 256 с.

72. СомиН Н.В. Пакет прикладных программ для исследованияречевых сигналов. В кн.: Анализ и распознавание речевых сигналов на ЭВМ. - М., ВЦ АН СССР, 1975, с. 3-19.

73. Сомин Н.В. Разработка пакета прикладных программ для анализа акустических сигналов и его применение к задачам исследования речи. Диссертация. . кандидата физико-математических наук. М., ВЦ АН СССР, 1973, 154 с.

74. Сомин Н.В., Трунин-Донской В.Н. Применение логических методов для выделения основного тона в условиях помех. Отчет лаборатории технической кибернетики ВЦ АН СССР. М., 1973, с.27.

75. Трунин-Донской В.Н. Дискретная обработка речевых сигналов. М., ВЦ АН СССР, 1978, 52 с.

76. Трунин-Донской В.Н. Современное состояние проблемы автоматического распознавания и синтеза речи. В сб.: Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов. - JI., 1983, с.5-9.

77. Форш Б.Н. Разработка метода автоматического выделения основного тона с повышенной разрешающей способностью. -В сб.: Техника средств связи, серия ТПС, вып.1(34). -М., 1979, с.91-94.

78. Фланаган Д.Л. Анализ, синтез и восприятие речи. М., Связь, 1968, 392 с.

79. Фролов Г.Д. Эксперимент по распознаванию речевых образов.-Программирование. М., 1976, К 2, с.94.

80. Фу К.С. Лингвистический подход к распознаванию образов. -В кн.: Классификация и кластер. Пер.с англ. под ред. Журавлева К.И. М., Мир, 1980, 389 с.

81. Цемель Г.И. Опознавание речевых сигналов. М., Наука, 1971, 148 с.

82. Чабан М.Е. О динамике основных фонемных тембров гласных, содержащихся в спектральных описаниях слогов типа ГСГ. -В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. Ереван, 1980, с.7-9.

83. Чучупал В.Я. Реализация метода вычитания спектров для повышения качества и разборчивости речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.155-158.

84. Чымбаев А.Ж. Предварительная сегментация и маркировка слитной речи. М., ВЦ АН СССР, 1979, 23 с.

85. Шафер Р., Рабинер Р. Цифровое представление речевых сигналов. В сб.: ТИИЭР, 1975, т.63, }Ь 4, с.141-159.

86. Ackroyd M.H. Isolated Word Recognition Using the Weighted Levenshtein Distance.-IEEE Trans. ASSP, 1980,v.28,N2,pp.243-244.

87. Baker J.K. The Dragon System. An Overview.-IEEE Trans. ASSP,1975,v.23,pp.24-29.

88. Beek B.,Neuberg E.P.,Hodge D.C, An Assessment of the Technology of Automatic Speech Recognition for Military Applications.-IEEE Trans. ASSP,1977, v.24,N4, pp.310-322. . .

89. Bell O.G.,Fujisaki H.,Heinz J.M.,Stevens K.N.,House A.S. Reduction of Speech Spectra by Analysis by Synthesis Techniques.-JASA,1961,v.33,N12,pp.1725-1736.

90. Brown M.K.,Rabiner L.R. An Adaptive »Ordered,Graph Search Technique for Dynamic Time Warping for Isolated Word Recognition.-IEEE Trans. ASSP,1982,v.30,N4,1. PP.535-544.

91. Chiba S.,Watari M. and Watanabe. A Speaker-independent Word Recognition System.-Speech Acoustics Society of Japan,S 76-25,1976,pp.995-999.

92. Cohen J.R.»Segmenting Speech Using Dynamic Programming.-JASA,1981,v.69,N5,pp.1430-1438.

93. Cose Earl E.,Wu F.B. An Evaluation of Some Feature Selection Techniques.-Joint "Workshop Pattern Recognition and Artif.Intell. ,New Iork,1976,pp.58-65.

94. Das S.K. Some Experiments in Discrete Utterance Recognition. -Pro c. IEEE ICASSP,1980,pp.178-181.

95. Dautrich B.A.,Rabiner L.R. On the Erfects of Varying Filter Bank Parameters on Isolated Word Recognition.-IEEE Trans. ASSP,1983,v.31,N4,pp.793-806.

96. De Delara Gertrudis Kurz, Guzman Justino. Perceived Probabilities.-Progr.Cybern.and Syst.Res.Vd.L., Washington,1975,PP.253-263.

97. Ganvain J.L.,Mariani I.,Li J.S. On the Use of Time Compression FOr Word Based Recognition.-Proc. IEEE ICASSP,Boston,1983,v.3,pp.1029-1032.

98. Grady M.W. Advances Speech Technology the Natural Man/Machine Interface.-Proc.Int.Conf.Cybern, and Soc. San Francisco,Calif.,1975,pp.296-299.

99. ICASSP-83 (Proceedings).-IEEE International Conference on Acoustics, Speech and Signal Proccesing, Boston, 1983, vol.1,2,3.,1459p.

100. Itakura F. Minimum P^ecication Residual Principle Applied to Speech Recognition.-IEEE Trans. ASSP, 1975, v. 23,N1,pp.67-72.

101. Jelinek F. Continuous Speech Recognition by Statistical Methods.-Proc. IEEE,1976,N4,pp.532-556.

102. Klatt D.H. Review of the ARPA. Speech Understanding Project.-JASA,1977,v.62,N6,pp.1345-1366.

103. Kuhn M.H., Tomaschewski H., Nev H, East Nonlinear Time Alignment for Isolated Word Recognition.-Proc. IEEE ICASSP,1981,pp.736-740.

104. Lea VV.A. ,Medress M.E.,Skinner T.E. A Prosodically Guided Speech Understanding System.-IEEE Trans. ASSP, 1975,V.23,pp.30-38.

105. Lea W.A. What Cause Speech Recognizers to Make

106. Mi stakes?-Proc. IEEE ICASSP,1982, Paris, pLo .1023-1041.123» Lesser V.R. et all. Organization of the Hearsay-II Speech Understanding System,-IEEE Trans. ASSP, 1975, v.23,PP.11-24.

107. Levinson S.E.,Rabiner L.R.Rosenberg A.E. and Wilpon J.G, Interactive Clustering Techniques for Selecting Speaker Independent Reference Templates for Isolated Word Recognition.-IEEE Trans. ASSP, 1979,v.27,N2,pp.82-89.

108. Lowerre B.T. The Harpy Speech Recognition System.-SIGART Newslett, 1976,N60,p.23.

109. Mayers C.S.»Levinson S.E. Connected Word Recognition Using a Syntax-Directed Dynamic Programming Temporal Alignment Procedure.-Proc. IEEE ICASSP,1981,pp.956-959.

110. Mayers C.S.,Rabiner L.R. A Level Building Dynamic Time Warping Algorithm for Connected Word Recognition.- IEEE Trans. ASSP, 1981,v.29,N2,pp.284-301.

111. Moore R.K.,Russel M.J.»Tolinson M.J. The Discriminative Network : A Mechanism for Focusing Recognition in Whole-Word Pattern Mathing,-Proc. IEEE ICASSP,Boston,1983,v.3,pp.1041-1044.

112. Noll A.M. Short-time Spectrum and "cepstrum". Techniques for Vocal-Pitch Detection.-JASA,1964, v.36,N2,pp.238-243.

113. Rabiner L.R.,Levinson S.E.,Rosenberg A.E. and Wilpon J.G. Speaker Independent Recognition of Isolated Word Using Clustering Techniques.-IEEE Trans. ASSP,1979,v.27,pp.336-349.

114. Rabiner L.R.,Wilpon J.G. A Two-Pass Pattern-Recognition Approach to Isolated Word Recognition.-The Bell System Technical Journal,May-June,1981,pp.739-765.

115. Rabiner L.R.,WilPon J.G. Considerations in Applying Clustering Techniques to Speaker Independent Word Recognition.-Proc.IEEE ICASSP,Washington,1979,PP.578-582.

116. Rabiner L.R.,Wilpon J.G. Isolated Word Recognition Using A Two-Pass Pattern Recognition Approach.-Proc. IEEE ICASSP,1981,pp.724-727.

117. Rabiner L.R.,Wilpon J.G. Speaker Independent Isolated Word Recognition for a Moderated Size (54 word) Vocabulary.- Proc. IEEE ASSP,1979,v.27,pp.583-587.

118. Reddy D.R.,Vicens P.S. A Procedure for the Segmentation of Connected Speech.-J.Audio Eng.Soc.,1968,v.16, N4,pp.38-46.

119. Rosenberg A.E. and Schmidt C.E. Automatic Recognition of Spoken Spelled Names for Obtaining Directory listing.-Bell Syst.Tech.J.,1979,v.58,N8,pp.1797-1823.

120. Russel M.J., Moore R.K. ,Tomltnson M.J. Some Techniques Incorporating Local Timescale Variability Information into a Dynamic Time-Warping Algorithm for Automatic Speech Recognition,-Proc. IEEE IGASSP,1983,pp.10J7-1040.

121. Sakai T.,Nakagawa S. Continuous Speech Understanding System LITHA.N.-Tech .Report. »Dept.Information Science, Kyoto Univ.,Kyoto,Japan,1975.

122. Sakoe H. and Chiba S.A Dynamic Programming Approach to Continuous Speech Recognition.- 7 International Congress on Acoustics,Budapest,1971,pp.65-68.

123. Sakoe H.,Chiba S. Dynamic Programming Algorithm Optimization for Spoken Word Recognition.-IEEE Trans.1. ASSP,1978,v.36,pp.43-49.

124. Schmidt-Neelsen A. Indelligibility of VCV Segments Excized from connected Speech.-JASA,1983,v.74,N3, pp.726-738.

125. Segalowitz S.,Gruber F. Lauguage Development and Neurological Theory.-NV Academic Press,1977.

126. Seneff S.,Klatt D.,Zue V. Design Consideration.for Optimizing the Intelligibility of DFT-based. Piched-excited,Critical band Spectrum Speech. Analisis/resynthesis System.-JASA ,1981 ,v.69,N1 ,pp.17 .

127. Sumbur M.R.,Rabiner L.R. A Speaker Independent Digit-Recognition System.-BSTJ,1975,54,1,pp.81-102.

128. Soudhi M. New Methods of Pitch Extraction.-IEEE Trans, of Audio and Electroacoustics,1968,v.16,N2.

129. Stevens K.N. Constrains Imposed by the Auditory System on the Properties Used to Classify Speech Sounds s Data From Phonoligy»Acoustics and Psychoa-coustics."The Cognituve Representation of Speech", ed Mayers,e.a.,Amsterdam,1981,pp.61-74.

130. Kawaguchi Eyi. A Simulation of a Recognition System for Connected Speech Sounds Using Linguistic Information. -Trans. Inst .Electron and Commun.Eng.Jap., 1973,N9,513-520.

131. Tappert C.C.,Das S.K. Memory and Time Inprovements in a Dynamic Programming Algoritm for Matching Speech Patt erns.-Proc.IEEE ICASSP,1978,pp.583-586.

132. Velichko V.M. ,Zagoruilco N.G. Automatic Recognition of 200-words.-Int.J.Man-Machine Studies,1970,v.2, pp.223-234.

133. Walker Donald E. Speech Understanding Through Syntacsis and Semantic Analysis.-IEEE Trans.Comput., 1976,v.25,N4,pp.432-439.

134. Walker D.E. The SRI Speech Understanding System.-IEEE Trans.ASSP,1975,N5,pp.387-416.

135. Watanade Akira,Sakai Hisao J.Inst.Telev.Eng.Jap., 1975,v.29,N11,pp.850-859.

136. Wolf Z. Speech Recognition and Understanding.- In Commun. and Cybern.,1976,v.10.pp.167-203.

137. White G.M., Dynamic Programming, the Viterbi Algorithm and Low Cost Speech Recognition.-Proc. IilEE ICASSP, 1978,Oklahoma, v.r.pp.729-731.

138. White G.M., Neely R.B. Speech Recognition Experiments with Linear Predication, Band Pass Filtering and Dynamic Programming . -IEEE Trans .ASSP, 1976, v.24 ,pp .183-188.

139. J.G,Wilpon,L.R.Rabiner and A.Bergh Speaker-Independent Isolated Word Recognition Using a 129-Word Airline Vocabulary.-JASA,1982,v.72pp.390-396.

140. Yau S.S.,Chang S.C. A Direct Method for Cluster Analysis.-Pattern Recogn.,1975,v.7,N4,pp.215-224.

141. Zelinski R.,Class E. A Learning Procedure for Speaker-Dependen Word Recognition Systems Based on Sequental Processing of Inpu Tokens.-Proc.IEEE ICASSP,1983,Boston,pp.1053 -10^6.