Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Фізико-математичні науки / Математичне моделювання та обчислювальні методи


Дубова Юлія Володимирівна. Модель оцінки якості каналу передавання голосової інформації : Дис... канд. наук: 01.05.02 - 2007.



Анотація до роботи:

Дубова Ю.В. Модель оцінки якості каналу передавання голосової інформації. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.02 – математичне моделювання та обчислювальні методи. – Вінницький національний технічний університет, Вінниця - 2007.

Дисертацію присвячено розв’язанню задачі моделювання та дослідження передавання голосу цифровими телекомунікаційними системами з метою автоматизації комплексного оцінювання якості каналу передавання голосової інформації.

Запропоновано новий підхід до оцінювання якості каналу передавання голосової інформації, який дозволяє оцінювати якість за допомогою автоматичної системи розпізнавання мови, що наближує оцінку якості голосової інформації до природної. Оцінка якості відбувається шляхом порівняння еталонного набору розпізнаних фраз із спотвореним набором. Вдосконалено метод моделювання фонем у просторі ознак, який відрізняється структурою прихованої марківської моделі фонеми, а також виразом відстані між фонемами у фонемному просторі, що дозволяє підвищити ефективність оцінювання якості каналу і навчання системи розпізнавання мови. Запропоновано нову метричну модель якості голосової інформації, що дозволяє здійснювати кількісне оцінювання якості. Вдосконалено метод навчання моделі розпізнавання, що дозволяє підвищити достовірність розпізнавання мови при оцінці якості каналу.

На основі запропонованих моделей та методів розроблено методичні, алгоритмічні та програмні засоби для автоматизації комплексного оцінювання якості каналу передавання голосової інформації.

В результаті виконання роботи зроблено внесок у розв’язання задачі моделювання та дослідження передавання голосу цифровими телекомунікаційними системами з метою автоматизації комплексного оцінювання якості каналу передавання голосової інформації.

Існуючі підходи до розв’язання задачі ґрунтуються або на залученні людини-експерта для оцінювання розбірливості мови на виході каналу, що пов’язане з великою трудомісткістю і витратами, або на вимірюванні окремих характеристик каналу, що не завжди є адекватним експертній оцінці. Тому перспективним підходом є автоматизація експертного оцінювання якості на основі моделі оцінки якості каналу і застосування систем розпізнавання мови.

В ході розв’язання поставлених задач було отримано нові наукові результати:

  1. Запропоновано новий підхід до оцінювання якості каналу передавання голосової інформації, який відрізняється застосуванням автоматичної системи розпізнавання тестової голосової інформації, що максимально наближує оцінку якості каналу передавання голосової інформації до природної. Оцінка якості відбувається шляхом порівняння результатів розпізнавання тестової голосової інформації із спотвореною інформацією, утвореною в результаті передавання, що забезпечує зменшення залежності оцінки якості від особливостей системи розпізнавання мови.

  2. Вдосконалено метод моделювання фонем у просторі ознак, який відрізняється структурою прихованої марківської моделі фонеми, а також виразом відстані між фонемами у фонемному просторі, що дозволяє підвищити ефективність оцінювання якості каналу і навчання системи розпізнавання мови.

  3. Запропоновано нову метричну модель якості голосової інформації, що дозволяє здійснювати кількісне оцінювання якості каналу передавання голосової інформації. Досліджено зв’язок між ймовірністю розпізнавання мови, відстанню між фонемами і експертною оцінкою MOS. Проведені дослідження показали, що діапазону оцінок MOS від 5 до 1 відповідає погіршення ймовірності розпізнавання від 0 до 12% і зменшення відстані між моделями від 1,19 до 1.

  4. Вдосконалено метод навчання моделі розпізнавання, який відрізняється модифікованою структурою моделі, що дозволяє підвищити достовірність розпізнавання мови при оцінці якості каналу передавання голосової інформації. Проведені експерименти показали, що модифікація моделі дозволяє зменшити ризик сплутування на 2%. Вдосконалено алгоритм навчання системи тестування, який реалізує модель і дозволяє скоротити часові затрати на процес навчання.

  5. Розроблено алгоритми моделювання голосової інформації, які ґрунтуються на використанні розроблених методів та моделей топологічного фонемного простору. Алгоритм здійснює класифікацію ПММ мовних елементів (фонем) у багатовимірному просторі і знаходження e-околів фонем, що необхідно для оптимізації покриття простору ознак і навчання системи розпізнавання.

  6. Розроблено алгоритми синтезу тестів на основі моделі багатовимірного простору фонем, які дозволяють отримати вибірку тестової голосової інформації, яка є необхідною та достатньою для достовірного оцінювання якості каналу передавання голосової інформації. Алгоритм використовує словник TIMIT і синтезує тест, який забезпечує покриття простору ознак з статистикою не менше 36 даних на кожний вектор ознак.

  7. Проведені експериментальні дослідження відстаней між фонемами для обраної системи ознак показали, що відстані між фонемами лінійно зростають при зростанні кількості ознак до 5, що свідчить про незалежність цих ознак. Далі відбувається уповільнення зростання, що свідчить про появу кореляційних зв’язків між ознаками. При аналізі моделей наговорів декількох дикторів для досягнення аналогічних результатів необхідно збільшити кількість ознак на 20%.

  8. На базі розроблених моделей, методів і алгоритмів процесу оцінювання якості каналу передавання голосової інформації було створено програмні середовища для навчання системи розпізнавання, синтезу тестів та оцінювання якості каналу передавання голосової інформації. Вони використані для експериментальних досліджень моделі оцінки якості каналів передавання голосової інформації.

  9. Результати дисертаційних досліджень впроваджено на підприємствах Flextronics Design Ukraine, ТОВ «Майндспід Технолоджіз Україна» та у навчальний процес кафедри автоматики та інформаційно-вимірювальної техніки Вінницького національного технічного університету. Впровадження результатів дисертаційних досліджень підтверджено відповідними актами. Результати впровадження дозволяють зробити висновок про правильність принципових положень, що лягли в основу роботи.

Публікації автора:

1. Дубова Ю.В., Колова С.Б. Психолексикологія та проблема інтерпретації даних в комп’ютерних системах // Вісник Вінницького політехнічного інституту. – 2001. – №6. – С. 115-118.

2. Грузман М.З., Дубова Ю.В. Проблема розпізнавання голосових команд з точки зору автоматичної класифікації об’єктів // Вісник Технологічного університету Поділля.– 2003. – Технічні науки,. Т. 1, №3. – С. 116–119.

3. Грузман М.З., Дубова Ю.В. Розпізнавання голосових команд як точок метричного простору // Вісник Вінницького політехнічного інституту. – 2003. – №6. – С. 262-268.

4. Дубова Ю.В., Квєтний Р.Н. Удосконалення структури прихованих марківських моделей на етапі тренування // Вісник Технологічного університету Поділля. – 2004. – Технічні науки, Ч.1, Т.2, №2. – С. 30–33.

5. Дубова Ю.В., Квєтний Р.Н. Модель множини фонем як топологічного простору // Інформаційні технології та комп’ютерна інженерія. – 2005. - №3. – С.124-127.

6. Ю.В.Дубова. Точність моделі контролю якості каналів передавання голосової інформації // Вісник Вінницького політехнічного інституту. – 2006. – №6. – С. 27-29.

7. Дубовой В., Дубовая Ю. Адаптивный подход к распознаванию графических образов // Оптоелектронні інформаційні технології «Фотоніка – ОДС 2002»: Друга міжнар. науково-технічної конференція. Вінниця, 23-25 квіт. 2002 р. – Вінниця, 2002. – С. 27.

  1. Дубова Ю.В. Алгоритм автоматичної класифікації марківських моделей при розпізнаванні природної мови // Информационные технологии в ХХI веке: I Молодежный научно-практ. форум. Днепропетровск 23-24 апреля 2003 г. – Днепропетровск, 2003. – С. 90-91.

  2. Грищук Т.В., Дубова Ю.В. Новий підхід до підвищення ймовірності розпізнавання мови в дикторонезалежних системах // Интеллектуальный анализ информации ИАИ-2004: Четвертый российско-украинский научный семинар. Киев, 19-21 мая 2004 г.– К., 2004. – С. 88-94.

  3. Дубова Ю.В. Модифікована схема створення прихованих марківських моделей для розпізнавання природної мови. // Автоматика-2004: 11 Міжнародна конференція по автоматичному управлінню. Київ, 27-30 верес. 2004 р.– К., 2004. – Т.4. - С.38.