Математическое обеспечение систем и устройств с речевым вводом информации тема автореферата и диссертации по математике, 01.01.10 ВАК РФ
Орлова, Маргарита Изикиельевна
АВТОР
|
||||
кандидата технических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1984
ГОД ЗАЩИТЫ
|
|
01.01.10
КОД ВАК РФ
|
||
|
ВВЕДЕНИЕ
ГЛАВА I. Проблема организации речевого ввода в диалоговых системах.
1.1. Общее состояние проблемы
1.2. Современные системы автоматического распознавания речи и особенности их эксплуатации.
1.3. Основные принципы построения систем автоматического распознавания речи.
1.4. Анализ известных методов построения матобеспечения распознающих систем
1.5. Принципы построения тестов для проверки и диагностики систем и устройств распознавания речи
Разработка систем автоматического распознавания и синтеза речи является в настоящее время одним из основных направлений развития средств автоматизации. Такие системы позволяют повысить эффективность технического обслуживания различных систем в народном хозяйстве и допустить широкий круг пользователей, не обладающих специальной подготовкой, к эксплуатации сложных технических комплексов, в частности, вычислительных машин.
Диапазон потенциального практического использования устройств, воспринимающих речевые команды и выдающих информацию или управляющие сигналы голосом, необычайно широк [бЗ, 59, 66, 74, 105, 130] .
Широта возможных практических применений таких устройств определяется рядом специфических свойств речевого способа передачи информации Ы :
- речь является для человека естественным способом обмена информацией, не требует специального обучения, относительно устойчива к изменению психофизиологического состояния оператора ;
- речевой обмен информацией и речевое управление оставляют свободными глаза и руки, которые зачастую оказываются перегруженными в процессе практической деятельности ;
- речевой обмен информацией и речевое управление возможны в условиях пониженной (или нулевой) освещенности и при физических перегрузках ;
- для речевого управления и обмена информацией возможно использование стандартных каналов связи и стандартного периферийного оборудования.
Кроме того, системы распознавания речи могут работать от голоса конкретного пользователя ("санкционированный" доступ к органам управления), а также от речи, генерируемой в условиях искусственнои дыхательной среды (например, "гелиевая речь").
С перечисленных выше позиций разработка практических устройств распознавания речевых сигналов, включающая в себя математическое и программное обеспечение всех блоков этих устройств, является актуальной задачей, важной как с научной, так и с прикладной точек зрения.
Несмотря на очевидные преимущества систем автоматического распознавания речи и многолетние исследования в этой области, достигнутые успехи пока недостаточны. Связано это с чрезвычайной сложностью структуры речевого сигнала. Во-первых, элементы речевого потока весьма изменчивы, что определяется индивидуальными особенностями говорящего, его психофизиологическим состоянием, контекстом и просто мгновенно сложившейся артикуляторно-акустической ситуацией. Во-вторых, при общении человека с человеком речь включена в широкий неречевой контекст и чаще всего предполагает контрольный ответ (диалог). Система же автоматического распознавания речи имеет дело только с этим сообщением и редуцированность сигнала становится труднопреодолимой [24] .
Наиболее широкое развитие и применение нашли способы автоматического распознавания речи, основанные на использовании точных математических методов при сравнении входных и эталонных реализаций, которые рассматривают речевой сигнал, ке учитывая его биологическую природу, выражающуюся в неопределенности описания и многовариантности сигнала, отражающего не только смысл сказанного, но и эмоции говорящего, его индивидуальность и т.д. Это делает системы, основанные на отношении к речевому сигналу, несущему одно смысловое содержание, очень зависящими от диктора и условий, в которых он находится при произнесении высказывания. Большинство современных реальных промышленных систем не учитывают природу речи из-за трудностей ее моделирования. В отличие от более общего математического направления исследований в настоящей работе предлагается бионический подход, базирующийся на изучении основных закономерностей речевосприятия. Такой подход позволяет создавать системы, наиболее полно учитывающие способности человеческого мышления к восприятию реальных речевых сигналов.
Системы автоматического распознавания речи - это в первую очередь программные системы, которые должны работать в реальных условиях (в акустических шумах помещения, с множеством дикторов, не являющихся профессиональными пользователями вычислительных машин и т.д.). Реальные условия накладывают свои требования на системы речевого ввода и на их математическое обеспечение. Кроме того, современные системы распознавания должны быть экономичными с точки зрения памяти и вычислительных ресурсов. Вследствие этого актуальной проблемой построения таких систем является выбор модели распознавания, для которой развивается матобеспечение, связанной с выбором алгоритмов отдельных этапов дешифрации речи.
Цель данной работы - разработать специализированное программное обеспечение для систем и устройств с речевым вводом информации, обеспечивающим работу этих устройств в условиях акустических помех и искажений, характерных для практических задач. Ставилась задача совместить достоинства бионической модели процесса восприятия речи человеком и модели, на которой основываются большинство современных практических систем распознавания речи, не обладающих достаточной для применения в реальной практике устойчивостью.
Для решения этих задач было необходимо:
- определить архитектуру системы распознавания речевого сигнала, реализующей бионический подход к распознаванию речевого сообщения ;
- проанализировать старые и разработать новые методики и алгоритмы анализа и распознавания речи (включая оптимизацию признаков первичного описания) ;
- разработать математическое и программное обеспечение систем и устройств, работающих в реальных условиях ;
- экспериментально проверить работу предложенных алгоритмов и программ.
В диссертации, посвященной разработке специализированного матобеспечения речевого ввода информации, рассматриваются следующие вопросы:
- исследуется общая структура блоков речевого ввода в диалоговых системах ;
- анализируются методы и алгоритмы первичной обработки речи и методики автоматического распознавания речевых сигналов ;
- формулируются принципы построения тестов для проверки и диагностики систем и устройств распознавания речи ;
- предлагается бионический подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными статистическими методами обработки речевого сигнала учитывает основные принципы восприятия речи человеком ;
- разрабатывается матобеспечение для систем автоматического распознавания речи, основанной на бионическом принципе ;
- оптимизируется система различительных признаков речевого сигнала ;
- выбираются оптимальные параметры алгоритма нелинейного сравнения входной речевой реализации и эталонных произнесений ;
- разрабатывается специализированное матобеспечение для систем распознавания речевых образов, ориентированных на произвольного диктора ;
- предлагается модель системы автоматического распознавания изолированных слов на ЭВМ типа ЕС, основанная на бионическом принципе, позволяющая проводить сквозные эксперименты по выбору оптимальных параметров распознающей системы;
- проведена проверка работы системы в шумах ;
- предлагается матобеспечение для автоматического телефонного номеронабирателя, работающего с голоса произвольного диктора ;
- разрабатывается специализированное матобеспечение для обработки искаженных гелиевой средой сигналов для осуществления связи с акванавтами ;
- разрабатывается матобеспечение для диалоговой системы анализа речевых сигналов.
Общая методика проведения исследований в данной работе направлена на поиск оптимальных алгоритмов отдельных блоков матобеспечения речевого ввода и предусматривает:
- использование результатов биологических, психологических, психолингвистических исследований процесса восприятия речи человеком ;
- использование статистических методов обработки информации ;
- использование спектральных методов для анализа речевого сигнала ;
- использование метода динамического программирования для решения задач распознавания речевых образов;
- применение методов кластерного анализа для формирования эталонных реализаций речевых сигналов ;
- использование методов теории алгоритмов и организации банков данных для представления знаний в памяти ЭВМ.
Научная новизна работы заключается:
- в разработке и программной реализации новых алгоритмов анализа и распознавания речевых сигналов для систем, работающих в сложных условиях ;
- в оптимизации параметрического представления речевых сигналов для систем с речевым вводом информации ;
- в выборе оптимального варианта процедуры нелинейной деформации масштаба времени при сравнении распознаваемого и эталонного речевых сигналов методом динамического программирования ;
- в разработке специализированного математического и программного обеспечения для систем автоматического телефонного номеронабирателя, работающего от голоса произвольного диктора;
- в разработке матобеспечения для системы связи с акванавтами, находящимися в гелиево-кислородной дыхательной среде ;
- в разработке математического и программного обеспечения диалоговой системы анализа акустических сигналов с речевым запросом информации ;
- в формировании тестов для проверки и диагностики систем автоматического распознавания речи с целью исследования их применимости в сложных условиях.
Практическая ценность работы, подтвержденная актами использования результатов диссертации, определяется тем, что разработанные методики, алгоритмы и программы используются в конкретных системах и устройствах автоматического распознавания речи и в отдельных узлах таких систем, работающих, как правило, в сложных условиях (в шумах производственного помещения, в гелиевой среде, в телефонном канале).
Диссертация состоит из введения, четырех глав и заключения.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
В работе получены следующие основные результаты:
- предложен подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными методами анализа речевого сигнала учитывает некоторые принципы восприятия речи человеком;
- разработана структура системы автоматического распознавания речи, основанная на бионическом принципе и использующая сегментно-целостный анализ произнесения с учетом просодических характеристик. Система учитывает: наличие параллельных путей анализа речевого сообщения; взаимодействие этих путей на любом этапе распознавания ; обработку речевого сообщения не только "снизу- вверх", но и "сверху - вниз", т.е. возможность генерации системой гипотезы о классе входного сигнала и сравнении гипотезы с входным сигналом ;
- разработано математическое и программное обеспечение для основных блоков этой системы ;
- сформулированы основные принципы построения тестов для проверки и диагностики систем автоматического распознавания речи и разработан вариант конкретного теста ;
- исследованы и выбраны оптимальные параметры анализа и обработки речевого сигнала в системах распознавания речи ;
- разработано специализированное матобеспечение для системы распознавания, ориентированное на голосовой набор номера телефона и работающей с произвольным диктором, которое при тестировании на 30 дикторах обеспечило надежность распознавания семизначного номера телефона>96$;
- разработано матобеспечение для автоматического распознавания слов, произносимых в нестандартных атмосферах с надежностыо»-92$ ;
- разработано матобеспечение автоматического речевого ввода информации для использования в диалоговой системе анализа сигналов: словарный запас рабочего языка - 176 слов, максимальный коэффициент ветвления - 37. Акустический анализ речевого сообщения в системе обеспечивает 97$ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.
Полученные в работе результаты позволяют сделать следующие выводы:
1. Использование речевого ввода в системах и устройствах - одно из эффективных средств развития автоматизации производственных процессов.
2. Предложенная в работе архитектура системы автоматического распознавания речевого сообщения позволяет решать задачи речевого ввода информации в системы и устройства более эффективно: с большей надежностью и с минимальными затратами по времени принятия решения.
3. Сформулированные принципы построения тестового материала и требования к тестам для систем APP. позволят разработать целую систему тестов для проверки и диагностики рече-распознающих систем. Предложенный конкретный вариант теста используется в настоящее время во многих организациях.
Предложенная архитектура системы АРР и разработанное матобеспечение отдельных блоков могут использоваться при решении разнообразных практических задач.
5. Проведенная оптимизация информативных признаков речевого сигнала позволила выделить надежную и удобную в практическом использовании и аппаратурной реализации систему параметров, обеспечивающую точность распознавания изолированных слов на словаре из 80 слов, близкую к 100$.
6. Выбранный алгоритм нелинейного по времени сравнения эталонной и входной реализаций речевого сигнала обеспечивает на выбранном первичном описании высокую надежность распознающей системы.
7. Разработанная модель системы АРР на ЭВМ ЕС 1033, основанная на бионическом подходе к процессу распознавания речевого сообщения и использующая сегментно-целостный анализ произнесения с включением просодических характеристик, позволяет проводить сквозные эксперименты со сменными блоками выделения признаков и сменными блоками принятия решения и обучения системы и используется для дальнейших речевых исследований.
Заключение
1. Разработанное матобеспечение для модели неадаптивного микропроцессорного устройства распознавания, ориентированное на голосовой набор номера телефона, обеспечивает надежность распознавания семизначного номера телефона > 96$.
2. Разработано матобеспечение для распознавания слов, произносимых в нестандартных атмосферах. Точность распознавания для 15 слов составила в среднем 92$, в то время как слуховая разборчивость <30$.
3. Разработано матобеспечение автоматического речевого запроса для использования в диалоговой системе анализа сигналов. Словарь - 176 слов,максимальный коэффициент ветвления -37. Акустический анализ речевого сообщения в системе обеспечивает 97$ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.
- 157 -
1. Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП.- Киев-Одесса, 1982, с.556.
2. Альдефельд Б., Рабинер Л.Р., Розенберг Э.Э., Уилтон Д.Г. Автоматическая справочно-поисковая система, основанная на распознавании изолированных слов. В сб.: ТИИЭР, 1980, т.68, № II, с.7-25.
3. Амирезашвили Н.З., Чикоидзе Г.Б. Анализ данных в речевых командах. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.500-502.
4. Беллман Р. Динамическое программирование. М., ИЛ, i960 , 400 с.
5. Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. М., Наука, 1969, 183 с.
6. Бондарко Л.В., Загоруйко Н.Г., Кожевников В.А., Молчанов А.П., Чистович Л.А. Модель восприятия речи человеком.- Новосибирск, 1968, 48 с.
7. Брановицкий В.И., Довгялло A.B. Диалог человека и ЭВМ: основные понятия и определения. В сб.: Управляющие системы и машины. - Киевт 1978, К 4, с.28-35.
8. Васильев A.B., Кринов С.Н., Савельев В.П., Цемель Г.И., Чижков В.М. Распознавание чисел от нуля до 100. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI.- Ереван, 1980, с.269-273.'
9. Великовский А.Е. Современные устройства распознавания речи. Обзор В сб.: Радиоэлектроника за рубежом, 1983, № 23, с.1-31.
10. Величко Б.М., Загоруйко Н.Г. Автоматическое распознавание ограниченного набора устных команд. В сб.: Вычислительные системы. - Новосибирск, 1969, вып.36, с.101-110.
11. Величко В.М., Загоруйко Н.Г. Распознавание больших словарей. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 8-го Всесоюзного семинара АРСО-УШ. -Львов, 1974, с.9-13.
12. Величко В.М., Загоруйко Н.Г. Система распознавания речевых команд. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с.173-176.
13. Винцюк Т.К. О математических моделях речевого сигнала, используемых в распознавании речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.34-38.
14. Винцюк Т.К. Перспективы практического использования систем речевого диалога. 'Гам же, с.38-40.
15. Винцюк Т.К., Гринчук В.М., Калмыков В.Г. Автоматизированное рабочее место (АРМ) конструктора, использующее систему речевого диалога СРД "Речь-Г1. Там же,с.512-516.
16. Винцюк Т.К., Куляс А.И., Людовик Е.К., Шинкаж А.Г. Эксперименты с кооперативной системой распознавания речи. -Там же, с.298-300.
17. Винцюк Т.К., Лобанов Б.М., Шинкаж А.Г. Система распознавания речи и система устного диалога СРД "Речь-I" на основе микро-ЭВМ. Там же, с.516-521.
18. Винцюк Т.К., Шинкаж А.Г. Распознавание 1000 слов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с.180.
19. Галунов В.И., Акустическая коммуникация, речь и передача смысловой информации. В сб.: Звуковая коммуникация, эхолокация и слух. - Д., ЛГУ, 1980, с.22-37.
20. Галунов В.И. Бионическая модель системы распознавания речи. В сб.: Исследование моделей речеобразования и речевосприятия. - Л., 1981, с.36-52.
21. Галунов В.И. Язык и системы автоматического понимания речи. В сб.: Восприятие языкового значения. - Калининград, Калининградский государственный университет, 1980, с.10-21.
22. Галунов В.И., Гарбарук В.И. Факторный анализ спектрального представления речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 13-го Всесоюзного семинара АРС0-ХШ. - Новосибирск, 1984, с.66-67.
23. Галунов В.И., Орлова М.И. Архитектура диалоговой системы, построенной на основе модели восприятия речи человеком. -Там же, с.16-18.
24. Галунов В.И., Орлова 14.И., Шнейдер В.К1. Экспериментальные исследования системы автоматического распознавания слитной речи. Тезисы докладов IX Всесоюзной акустической конференции. М., 1977, с.65-66.
25. Галунов В.И., Коваль С.Л., Тампель И.Б., Проблемы акустической теории речеобразования. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. - М., АН СССР, 1981, с.60-75.
26. Галунов В.И., Орлова М.И., Ягунова H.H. Использование метода динамического программирования при распознавании речевых образов. В сб.: Техника средств связи, серия ТПС,вып,3(2). М., 1981, с.114-122.
27. Галунов В.К., Сомин Н.В., Тарасов А.И., Трунин-Донской Б.Н., Якушенков Г.Л. Спектральные методы выделения основного тона. В сб.: Вопросы кибернетики. - М., Наука, 1976,с.28-38.
28. Галунов В.И., Орлова М.И., Щукин В.Г. Разработка тестов для систем автоматического распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.305-307.
29. Гельфанд С.А. Слух. Введение в психологическую и физиологическую акустику. М., Медицина, 1984, 350 с.
30. Григорян П.А., Григорян H.A., Лазарян Л.М. Сегментация речевых сигналов. В кн.: Автоматическое распознавание речевых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. - Ереван, 1980, с.95-101.
31. Демков М.Г. Об унификации методики испытаний устройств распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.472-474.
32. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. М., Мир, 1972, 288 с.
33. Дюран Б., Оделл П. Кластерный анализ. Пер.с англ. Деми-денко. М., Статистика, 1977, 128 с.
34. Емельянов В.Н., Трунин-Донекой В.Н. Современное состояние отечественных разработок в области автоматического распознавания и синтеза речи. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. - М-,1. АН СССР, 1981, с.3-17.
35. Занченко Ю.А. Система распознавания ограниченного набора слов в условиях сильного внешнего шума. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. - Тбилиси, 1978, с.205-207.
36. Зиновьева Н.В., Захаров J1.M., Ампилова Б.В. Методика чтения "слепых" сонограмм. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.351-354.
37. Кельманов A.B. Экспериментальное исследование 18 систем первичного описания речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. - Ереван, 1980, с.112-113.
38. Кельманов A.B. О выборе числа и границ спектральных полос при распознавании речевых сигналов. Там же, с.313-315.
39. Кельманов A.B. Сравнительное исследование двух алгоритмов динамического программирования. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев-Одесса, 1982, с.474-476.
40. Коваль С Л - Речевая связь при глубоководных погружениях. -В сб.: Техника средств связи, серия ТИС. - М., вып.9, 1976, с.88-112.
41. Кольцова A.A. Расширение библиотеки процедур системы ГРАФ*. В сб.: Техническая кибернетика, № 5. - М., 1978.
42. Копейкин А.Б. Исследование структур и вычислительных процессов в системе ввода устных команд, построенных с использованием микро-ЭВМ. Автореферат. . кандидата технических наук. М., 1980, 22 с.
43. Кринов С.Н., Цемель Г.И. Сегментация речевых сигналов.
44. В сб.: Речевое общение в автоматизированных системах. М., Наука, 1975.
45. Кулагин М.В., Пажитнов А.Л. Ввод и обработка акустического сигнала на микро-ЭВМ "Электроника-бО". В кн.: Автоматическое распознавание слуховых образов. Тезисы докладови сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев1. Одесса, 1982, с.180-181.
46. Лебедев Б.Г. Кривые маскировки в распознавании речевых сигналов. 3 кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ц-го Всесоюзного семинара АРС0-Х1. - Ереван, 1980, с.381-382.
47. Лебосс Б. Промышленность осваивает системы синтеза и распознавания речи. Электроника, 1980, № 12, с.79-89.
48. Мазур В.Н., Марчук Д.С., Сапелюк Б.М. Элементы речевого управления в подсистеме АСУП на базе мини-ЗВМ. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. -Ереван, 1980, с.336-332.
49. Макхол Дж. Линейное предсказание. Обзор. В сб.: ТИИЭР, № 4, т.63, 1975, с.20-44.
50. Маркел Дж.Д., Грей А.Х. Линейное предсказание речи. Пер. с англ. М., Связь, 1980, 308 с.
51. Мартин Т. Практическое применение речевого ввода в вычислительную машину. В сб.: ТИИЭР, № 4, т.64, 1976, с.80-95.
52. Методы автоматического распознавания речи. В 2-х книгах, под редакцией У.Ли. Пер.с англ. М., Мир, 1983, 716 с.
53. Мясников Л.Л. Объективное распознавание звуков речи. дТг, 1943, К 3, с.12-25.
54. Нефф р. Внедрение систем распознавания речи в Японии. -Электроника. ;,ь, Мир, 1982, т.5, № 3, с.89-91.
55. Орлова М.И. Бионическая модель системы автоматического распознавания речи. В сб.: Техника средств связи, серия ТПС, вып.12(45 ), - М., 1979, с.108-112.
56. Орлова М.И. Модель распознавания речевых образов, построенная на бионическом принципе. В кн.: Модели речевого процесса в норме и патологии. Тезисы докладов Всесоюзного симпозиума. Гродно, 1979, с.24.
57. Паташюс Ю.В. Система распознавания слов на базе ЭВМ "Злект-роника-60". В кн.: "Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.324-326.
58. Петров Г.М., Аврин С.Б., Копейкин А.Б., Малыгина Т.М., Москаленко Г.В. Система ввода речевых сигналов для ЭВМ. -Там же, с.280-283.
59. Плотников В.Н., Суханов В.А., Кузнецов C.B., Белинский A.B. Индивидуальный канал речевого диалогового управления.
60. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.539-542.
61. Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов симпозиума. -Ji., 1983, 43 с.
62. Рабинер JI., Гоулд Б. Теория и применение цифровой обработки сигналов. Пер. с англ. т., Мир, 1978, 848 с.
63. Рабинер Ji., Шафер Р. Цифровая обработка речевых сигналов. Пер.с англ. М., Радио и связь, 1981, 496 с.
64. Редди Д.Р. Машинное распознавание речи. Обзор. В сб.: ТИИЭР, I 4, т.64, 1976, с.95-130.
65. Речевая связь с машинами. Тематический выпуск. Сб. ТИИЭР, № 4, т.64, 1976, 182 с.
66. Рамишвили Г.С., Сердюков В.Д. Комплексная система автоматического распознавания речевых сигналов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. - Тбилиси, 1978, с.229-231.
67. Сапожков М.А., Михайлов В.Г. Бокодерная связь. Ц., Радио и связь, 1983, 248 с.
68. Серединский А., Ванде-Кирков В.А., Буздалина И.А., Окунев И.В., Орлова М.И., Солонина А.И. Применение рекурентных сплайнов для обработки видео- и речевых сигналов. -Электросвязь. 1982, № с, с.60-64.
69. Система распознавания связной речи фирмы NEC . Зарубежная радиоэлектроника, № 4, 1980, с.108-120.
70. Слуцкер Г.С. Нелинейный метод анализа речевых сигналов. -В кн.: Труды НИИРадио, 1968, № 2, с.28-34.
71. Спрингер С., Дейч Г. Левый мозг, правый мозг. М., Мир, 1983, 256 с.
72. СомиН Н.В. Пакет прикладных программ для исследованияречевых сигналов. В кн.: Анализ и распознавание речевых сигналов на ЭВМ. - М., ВЦ АН СССР, 1975, с. 3-19.
73. Сомин Н.В. Разработка пакета прикладных программ для анализа акустических сигналов и его применение к задачам исследования речи. Диссертация. . кандидата физико-математических наук. М., ВЦ АН СССР, 1973, 154 с.
74. Сомин Н.В., Трунин-Донской В.Н. Применение логических методов для выделения основного тона в условиях помех. Отчет лаборатории технической кибернетики ВЦ АН СССР. М., 1973, с.27.
75. Трунин-Донской В.Н. Дискретная обработка речевых сигналов. М., ВЦ АН СССР, 1978, 52 с.
76. Трунин-Донской В.Н. Современное состояние проблемы автоматического распознавания и синтеза речи. В сб.: Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов. - JI., 1983, с.5-9.
77. Форш Б.Н. Разработка метода автоматического выделения основного тона с повышенной разрешающей способностью. -В сб.: Техника средств связи, серия ТПС, вып.1(34). -М., 1979, с.91-94.
78. Фланаган Д.Л. Анализ, синтез и восприятие речи. М., Связь, 1968, 392 с.
79. Фролов Г.Д. Эксперимент по распознаванию речевых образов.-Программирование. М., 1976, К 2, с.94.
80. Фу К.С. Лингвистический подход к распознаванию образов. -В кн.: Классификация и кластер. Пер.с англ. под ред. Журавлева К.И. М., Мир, 1980, 389 с.
81. Цемель Г.И. Опознавание речевых сигналов. М., Наука, 1971, 148 с.
82. Чабан М.Е. О динамике основных фонемных тембров гласных, содержащихся в спектральных описаниях слогов типа ГСГ. -В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. Ереван, 1980, с.7-9.
83. Чучупал В.Я. Реализация метода вычитания спектров для повышения качества и разборчивости речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.155-158.
84. Чымбаев А.Ж. Предварительная сегментация и маркировка слитной речи. М., ВЦ АН СССР, 1979, 23 с.
85. Шафер Р., Рабинер Р. Цифровое представление речевых сигналов. В сб.: ТИИЭР, 1975, т.63, }Ь 4, с.141-159.
86. Ackroyd M.H. Isolated Word Recognition Using the Weighted Levenshtein Distance.-IEEE Trans. ASSP, 1980,v.28,N2,pp.243-244.
87. Baker J.K. The Dragon System. An Overview.-IEEE Trans. ASSP,1975,v.23,pp.24-29.
88. Beek B.,Neuberg E.P.,Hodge D.C, An Assessment of the Technology of Automatic Speech Recognition for Military Applications.-IEEE Trans. ASSP,1977, v.24,N4, pp.310-322. . .
89. Bell O.G.,Fujisaki H.,Heinz J.M.,Stevens K.N.,House A.S. Reduction of Speech Spectra by Analysis by Synthesis Techniques.-JASA,1961,v.33,N12,pp.1725-1736.
90. Brown M.K.,Rabiner L.R. An Adaptive »Ordered,Graph Search Technique for Dynamic Time Warping for Isolated Word Recognition.-IEEE Trans. ASSP,1982,v.30,N4,1. PP.535-544.
91. Chiba S.,Watari M. and Watanabe. A Speaker-independent Word Recognition System.-Speech Acoustics Society of Japan,S 76-25,1976,pp.995-999.
92. Cohen J.R.»Segmenting Speech Using Dynamic Programming.-JASA,1981,v.69,N5,pp.1430-1438.
93. Cose Earl E.,Wu F.B. An Evaluation of Some Feature Selection Techniques.-Joint "Workshop Pattern Recognition and Artif.Intell. ,New Iork,1976,pp.58-65.
94. Das S.K. Some Experiments in Discrete Utterance Recognition. -Pro c. IEEE ICASSP,1980,pp.178-181.
95. Dautrich B.A.,Rabiner L.R. On the Erfects of Varying Filter Bank Parameters on Isolated Word Recognition.-IEEE Trans. ASSP,1983,v.31,N4,pp.793-806.
96. De Delara Gertrudis Kurz, Guzman Justino. Perceived Probabilities.-Progr.Cybern.and Syst.Res.Vd.L., Washington,1975,PP.253-263.
97. Ganvain J.L.,Mariani I.,Li J.S. On the Use of Time Compression FOr Word Based Recognition.-Proc. IEEE ICASSP,Boston,1983,v.3,pp.1029-1032.
98. Grady M.W. Advances Speech Technology the Natural Man/Machine Interface.-Proc.Int.Conf.Cybern, and Soc. San Francisco,Calif.,1975,pp.296-299.
99. ICASSP-83 (Proceedings).-IEEE International Conference on Acoustics, Speech and Signal Proccesing, Boston, 1983, vol.1,2,3.,1459p.
100. Itakura F. Minimum P^ecication Residual Principle Applied to Speech Recognition.-IEEE Trans. ASSP, 1975, v. 23,N1,pp.67-72.
101. Jelinek F. Continuous Speech Recognition by Statistical Methods.-Proc. IEEE,1976,N4,pp.532-556.
102. Klatt D.H. Review of the ARPA. Speech Understanding Project.-JASA,1977,v.62,N6,pp.1345-1366.
103. Kuhn M.H., Tomaschewski H., Nev H, East Nonlinear Time Alignment for Isolated Word Recognition.-Proc. IEEE ICASSP,1981,pp.736-740.
104. Lea VV.A. ,Medress M.E.,Skinner T.E. A Prosodically Guided Speech Understanding System.-IEEE Trans. ASSP, 1975,V.23,pp.30-38.
105. Lea W.A. What Cause Speech Recognizers to Make
106. Mi stakes?-Proc. IEEE ICASSP,1982, Paris, pLo .1023-1041.123» Lesser V.R. et all. Organization of the Hearsay-II Speech Understanding System,-IEEE Trans. ASSP, 1975, v.23,PP.11-24.
107. Levinson S.E.,Rabiner L.R.Rosenberg A.E. and Wilpon J.G, Interactive Clustering Techniques for Selecting Speaker Independent Reference Templates for Isolated Word Recognition.-IEEE Trans. ASSP, 1979,v.27,N2,pp.82-89.
108. Lowerre B.T. The Harpy Speech Recognition System.-SIGART Newslett, 1976,N60,p.23.
109. Mayers C.S.»Levinson S.E. Connected Word Recognition Using a Syntax-Directed Dynamic Programming Temporal Alignment Procedure.-Proc. IEEE ICASSP,1981,pp.956-959.
110. Mayers C.S.,Rabiner L.R. A Level Building Dynamic Time Warping Algorithm for Connected Word Recognition.- IEEE Trans. ASSP, 1981,v.29,N2,pp.284-301.
111. Moore R.K.,Russel M.J.»Tolinson M.J. The Discriminative Network : A Mechanism for Focusing Recognition in Whole-Word Pattern Mathing,-Proc. IEEE ICASSP,Boston,1983,v.3,pp.1041-1044.
112. Noll A.M. Short-time Spectrum and "cepstrum". Techniques for Vocal-Pitch Detection.-JASA,1964, v.36,N2,pp.238-243.
113. Rabiner L.R.,Levinson S.E.,Rosenberg A.E. and Wilpon J.G. Speaker Independent Recognition of Isolated Word Using Clustering Techniques.-IEEE Trans. ASSP,1979,v.27,pp.336-349.
114. Rabiner L.R.,Wilpon J.G. A Two-Pass Pattern-Recognition Approach to Isolated Word Recognition.-The Bell System Technical Journal,May-June,1981,pp.739-765.
115. Rabiner L.R.,WilPon J.G. Considerations in Applying Clustering Techniques to Speaker Independent Word Recognition.-Proc.IEEE ICASSP,Washington,1979,PP.578-582.
116. Rabiner L.R.,Wilpon J.G. Isolated Word Recognition Using A Two-Pass Pattern Recognition Approach.-Proc. IEEE ICASSP,1981,pp.724-727.
117. Rabiner L.R.,Wilpon J.G. Speaker Independent Isolated Word Recognition for a Moderated Size (54 word) Vocabulary.- Proc. IEEE ASSP,1979,v.27,pp.583-587.
118. Reddy D.R.,Vicens P.S. A Procedure for the Segmentation of Connected Speech.-J.Audio Eng.Soc.,1968,v.16, N4,pp.38-46.
119. Rosenberg A.E. and Schmidt C.E. Automatic Recognition of Spoken Spelled Names for Obtaining Directory listing.-Bell Syst.Tech.J.,1979,v.58,N8,pp.1797-1823.
120. Russel M.J., Moore R.K. ,Tomltnson M.J. Some Techniques Incorporating Local Timescale Variability Information into a Dynamic Time-Warping Algorithm for Automatic Speech Recognition,-Proc. IEEE IGASSP,1983,pp.10J7-1040.
121. Sakai T.,Nakagawa S. Continuous Speech Understanding System LITHA.N.-Tech .Report. »Dept.Information Science, Kyoto Univ.,Kyoto,Japan,1975.
122. Sakoe H. and Chiba S.A Dynamic Programming Approach to Continuous Speech Recognition.- 7 International Congress on Acoustics,Budapest,1971,pp.65-68.
123. Sakoe H.,Chiba S. Dynamic Programming Algorithm Optimization for Spoken Word Recognition.-IEEE Trans.1. ASSP,1978,v.36,pp.43-49.
124. Schmidt-Neelsen A. Indelligibility of VCV Segments Excized from connected Speech.-JASA,1983,v.74,N3, pp.726-738.
125. Segalowitz S.,Gruber F. Lauguage Development and Neurological Theory.-NV Academic Press,1977.
126. Seneff S.,Klatt D.,Zue V. Design Consideration.for Optimizing the Intelligibility of DFT-based. Piched-excited,Critical band Spectrum Speech. Analisis/resynthesis System.-JASA ,1981 ,v.69,N1 ,pp.17 .
127. Sumbur M.R.,Rabiner L.R. A Speaker Independent Digit-Recognition System.-BSTJ,1975,54,1,pp.81-102.
128. Soudhi M. New Methods of Pitch Extraction.-IEEE Trans, of Audio and Electroacoustics,1968,v.16,N2.
129. Stevens K.N. Constrains Imposed by the Auditory System on the Properties Used to Classify Speech Sounds s Data From Phonoligy»Acoustics and Psychoa-coustics."The Cognituve Representation of Speech", ed Mayers,e.a.,Amsterdam,1981,pp.61-74.
130. Kawaguchi Eyi. A Simulation of a Recognition System for Connected Speech Sounds Using Linguistic Information. -Trans. Inst .Electron and Commun.Eng.Jap., 1973,N9,513-520.
131. Tappert C.C.,Das S.K. Memory and Time Inprovements in a Dynamic Programming Algoritm for Matching Speech Patt erns.-Proc.IEEE ICASSP,1978,pp.583-586.
132. Velichko V.M. ,Zagoruilco N.G. Automatic Recognition of 200-words.-Int.J.Man-Machine Studies,1970,v.2, pp.223-234.
133. Walker Donald E. Speech Understanding Through Syntacsis and Semantic Analysis.-IEEE Trans.Comput., 1976,v.25,N4,pp.432-439.
134. Walker D.E. The SRI Speech Understanding System.-IEEE Trans.ASSP,1975,N5,pp.387-416.
135. Watanade Akira,Sakai Hisao J.Inst.Telev.Eng.Jap., 1975,v.29,N11,pp.850-859.
136. Wolf Z. Speech Recognition and Understanding.- In Commun. and Cybern.,1976,v.10.pp.167-203.
137. White G.M., Dynamic Programming, the Viterbi Algorithm and Low Cost Speech Recognition.-Proc. IilEE ICASSP, 1978,Oklahoma, v.r.pp.729-731.
138. White G.M., Neely R.B. Speech Recognition Experiments with Linear Predication, Band Pass Filtering and Dynamic Programming . -IEEE Trans .ASSP, 1976, v.24 ,pp .183-188.
139. J.G,Wilpon,L.R.Rabiner and A.Bergh Speaker-Independent Isolated Word Recognition Using a 129-Word Airline Vocabulary.-JASA,1982,v.72pp.390-396.
140. Yau S.S.,Chang S.C. A Direct Method for Cluster Analysis.-Pattern Recogn.,1975,v.7,N4,pp.215-224.
141. Zelinski R.,Class E. A Learning Procedure for Speaker-Dependen Word Recognition Systems Based on Sequental Processing of Inpu Tokens.-Proc.IEEE ICASSP,1983,Boston,pp.1053 -10^6.