Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Фізико-математичні науки / Математичне моделювання та обчислювальні методи


Грищук Тетяна Вікторівна. Моделювання процесу аналізу і класифікації голосових команд : дис... канд. техн. наук: 01.05.02 / Вінницький національний технічний ун-т. - Вінниця, 2006.



Анотація до роботи:

Грищук Т.В. Моделювання процесу аналізу і класифікації голосових команд. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.02 – математичне моделювання та обчислювальні методи. – Вінницький національний технічний університет, Вінниця, 2006.

Дисертація присвячена розв’язанню задачі моделювання процесу аналізу і класифікації голосових команд.

Для моделювання процесу аналізу і класифікації голосових команд розроблено математичну модель оптимізації даного процесу у вигляді дерева класифікації. В якості критерію оптимізації обрано узагальнений функціонально-статистичний критерій, модифікований для задачі класифікації голосових команд, що можуть формально описуватись складними синтаксичними структурами. Для моделювання процесу аналізу мовного сигналу на рівні попередньої обробки розроблено “квазічастотну” модель мовоутворення, в якій мовний тракт вважається джерелом інформаційного сигналу, передача повідомлення в якому здійснюється шляхом модуляції трьох несучих частот. Розроблено метод класифікації голосових команд та математичну модель синтаксичного аналізу і класифікації голосових команд на граматичних марковських мережах. Запропонована математична модель узагальнює процеси синтаксичного аналізу формальної граматики та класифікації вхідних голосових команд, що дає можливість проводити скорочення граматичних ланцюжків в процесі класифікації без втрат в достовірності класифікації. В розробленому методі класифікації голосових команд використовується інформація про тривалість звучання окремих фонем мови, за рахунок чого досягається підвищення швидкодії процесу класифікації голосових команд. Запропоновано спосіб кодування мовних образів ранговими конфігураціями та модель нейтронної мережі, призначеної для класифікації.

На основі запропонованих моделей та методів розроблено методичні, алгоритмічні та програмні засоби для моделювання та оптимізації систем розпізнавання мови.

У дисертаційній роботі наведено теоретичне узагальнення і нове вирішення актуальної наукової задачі, яка полягає в розробці математичних моделей та методів, призначених для моделювання процесу аналізу і класифікації голосових команд, на основі яких можна підвищити ефективність даного процесу.

Основні наукові та практичні результати дисертаційної роботи такі.

1. Виконано аналіз відомих підходів до моделювання процесу аналізу і класифікації голосових команд.

2. Вперше розроблено математичну модель оптимізації процесу класифікації голосових команд, яка, на відміну від існуючих, враховує ієрархічну будову мовного сигналу та дозволяє оптимізувати параметри модульних систем розпізнавання голосових команд. За критерій оптимізації було обрано узагальнений функціонально-статистичний критерій оцінки ефективності складних систем, який було модифіковано для задачі класифікації голосових команд. В модель потенціальної системи розпізнавання була введена оцінка впливу шумів навколишнього середовища на достовірність класифікації звукотипів мови. Адекватність розробленої моделі забезпечуються коректністю та строгістю постановки задачі і коректністю використаних методів при доведенні наукових положень.

3. У результаті математичного моделювання отримані аналітичні залежності достовірності класифікації звукотипів української мови від впливу шуму навколишнього середовища.

4. Вперше запропоновано математичну модель мовного сигналу на рівні параметричної обробки, в якій, на відміну від існуючих, процес мовоутворення базується на принципі “квазічастотної” модуляції голосового тракту, що дозволяє підвищити дикторонезалежність ознак, що виділяються, та збільшити швидкість і достовірність класифікації. Адекватність “квазічастотної” моделі мовного сигналу підтверджується збігом теоретичних результатів, що отримані в дисертації, з результатами, які були отримані з використанням відомих моделей сегментації мовних сигналів на звукотипи, та з експертними даними. Проведені дослідження “квазічастотної” моделі мовного сигналу показали, що ефективність процесу сегментації мовного повідомлення на основі даної моделі є більшою на 2,6% в порівнянні з існуючими математичними моделями сегментації мовного сигналу.

5. Вперше розроблено математичну модель синтаксичного аналізу і класифікації голосових команд, яка, на відміну від існуючих, дозволяє врахувати інформацію про синтаксичну структуру голосових команд і представити її у вигляді орієнтованого графа. Запропонована модель дає можливість збільшити швидкодію класифікації на синтаксичному рівні без втрат в якості класифікації. Адекватність даної математичної моделі підтверджується збігом теоретичних результатів, що отримані в дисертації, з результатами, які були отримані з використанням відомих методів класифікації голосових команд. Експериментальні дослідження розробленої моделі показали, що застосування даної моделі до процесу класифікації голосових команд дає можливість збільшити швидкість класифікації на 12% в порівнянні з класичними моделями процесу класифікації голосових команд.

6. Запропоновано модифікований спосіб запису контекстно-вільних граматик та процедуру граматичного виводу фраз граматики. На відміну від існуючих підходів до генерації фраз контекстно-вільної граматики, запропонований підхід відрізняється простотою реалізації та забезпечує можливість паралельного виводу всіх фраз формальної граматики.

7. Вперше розроблено метод класифікації голосових команд, використання якого дозволяє збільшити швидкодію процесу класифікації на прихованих марковських мережах. На відміну від існуючих, в запропонованому методі враховується інформація про тривалість звучання окремих фонем дискурсу, що дозволяє зменшити час класифікації навіть для СРМ з невеликими за обсягом словниками.

8. Отримано аналітичний вираз функції динамічного скорочення варіантів перебору в процесі класифікації голосових команд на базі прихованих марковських мереж.

9. Вперше запропоновано спосіб кодування мовних образів ранговими кодами та математичну модель нейронної мережі, призначеної для класифікації, на основі рангових структур, які, на відміну від існуючих, враховують інформацію про ранги відстаней між елементами класифікації і дозволяють підвищити швидкість і достовірність класифікації.

10. Розроблено методику проектування та оптимізації систем розпізнавання голосових команд.

11. Розроблено алгоритми сегментації та маркування мовного сигналу на звукотипи, що використовують “квазічастотну” модель мовоутворення, та алгоритми класифікації голосових команд, які ґрунтуються на використанні розроблених методів та моделей класифікації голосових команд на граматичних марковських мережах.

12. На базі розроблених моделей, методів і алгоритмів процесу аналізу і класифікації голосових команд були створені програмні середовища для розробки контекстно-вільних граматик та систем розпізнавання голосових команд.

Публікації автора:

1. Биков М.М., Грищук Т.В. Ієрархічна стратегія розпізнавання мови // Вісник Технологічного університету Поділля. - 2004. - №2. – Т. 2. – С.58-61.

2. Биков М.М., Грищук Т.В. Підвищення швидкодії розпізнавання мови прихованими марковськими моделями // Комп’ютерні технології друкарства. – Львів: Українська академія друкарства, 2005. – №13. – С. 99-107.

3. Биков М.М., Грищук Т.В. Розробка методів оцінки ефективності автоматизованих систем розпізнавання мови // Вісник Технологічного університету Поділля. – 2003. – №3. Т. 1 - С.122-125.

4. Биков М.М., Грищук Т.В., Раїмі А.А. Використання нейронних мереж для розпізнавання звуків мови // Оптикоелектронні інформаційно-енергетичні технології. – 2001. - №2. – С.92-97.

5. Грищук Т.В. Методи зменшення перебору в процесі розпізнавання мови на граматичних марковських мережах // Вісник Вінницького політехнічного інституту. – 2003. - №6. – С.250-255.

6. Грищук Т.В. Розпізнавання природної мови на граматичних марковських мережах // Наукові праці Донецького національного технічного університету. Серія: “Обчислювальна техніка та автоматика”. – Донецьк: ДонНТУ, 2005. – С. 181-187.

7. Биков М.М., Грищук Т.В. Методи підвищення дикторонезалежності опису і розпізнавання мовної інформації в мережі INTERNET // Третя міжнародна конференція “Інтернет-Освіта-Наука-2002” (ІОН – 2002). – Вінниця: УНІВЕРСУМ - Вінниця, 2002. – Т. 2.– С.329-332.

8. Биков М.М., Грищук Т.В. Оцінка впливу рівня шумів на ефективність систем розпізнавання слів української мови // Матеріали сьомої міжнародної науково-технічної конференції “Контроль і управління в складних системах” (КУСС – 2003). – Вінниця: УНІВЕРСУМ - Вінниця, 2003. – С. 65-70.

9. Биков М.М., Грищук Т.В. Розпізнавання мовних образів з використанням нейромережевого підходу // Праці міжнародної конференції з індуктивного моделювання (МКІМ-2002.). – Львів: Державний НДІ інформаційної інфраструктури, 2002. – Т. 1., Ч. 2.- С. 203-207.

10. Биков М.М., Кузьмін І.В., Грищук Т.В. Структурування фонетичної інформації в акустичному сигналі в задачах дикторонезалежного розпізнавання мови // Сборник научных трудов 1-го международного радио-электронного форума “Прикладная радиоэлектроника. Состояние и перспективы развития” (МРФ-2002). – Харьков: АН ПРЭ, ХНУРЭ, 2002. – С.134-138.

11. Деклараційний патент 66184А України, МПК G06E1/04. Спосіб розпізнавання мовних образів / Биков М.М., Грищук Т.В. (Україна) - №2003087546; Заявлено 11.08.2003; Опубл. 15.04.2004, Бюл.№4. – 3 с.

12. Биков М.М., Грищук Т.В. Оптимізація процесу пошуку в задачі розпізнавання мовних образів // Тези доповідей восьмої міжнародної науково-технічної конференції “Контроль і управління в складних системах” (КУСС – 2005). – Вінниця: УНІВЕРСУМ - Вінниця, 2005. – С. 263.