Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Фізико-математичні науки / Теоретичні основи інформатики та кібернетики


Васильєв Сергій В'ячеславович. Складність задач та ефективність процедур розпізнавання : Дис... канд. наук: 01.05.01 - 2008.



Анотація до роботи:

Васильєв С.В. Складність задач та ефективність процедур розпізнавання. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата фізико-математичних наук за спеціальністю 01.05.01 – теоретичні основи інформатики та кібернетики. – Інститут кібернетики ім. В.М. Глушкова НАН України, Київ, 2008.

У дисертаційній роботі виведено детерміновані нижні і верхні оцінки похибки байєсівської процедури розпізнавання у дискретному випадку для незалежних ознак. Отримані оцінки є поліноміальними від таких вхідних параметрів задачі розпізнавання, як розміри класів навчаючої вибірки, кількості ознак та числа значень ознак. Побудовано і експериментально підтверджено ефективний метод розпізнавання вторинної структури білків на основі байєсівської процедури розпізнавання на моделях ланцюгів Маркова. Як навчаюча вибірка взята інформація з відкритих баз даних генетики та біології NCBI. Визначено порядок моделі ланцюга Маркова шляхом розв’язання гіпотез із використанням критерію . Проведено статистичний аналіз ДНК людини, отримано та підтверджено за допомогою кластерних комп’ютерів нові співвідношення комплементарності у записі основ для моделей ланцюгів Маркова.

У дисертаційній роботі проведено детальний аналіз методів мінімізації емпіричного ризику і байєсівських процедур розпізнавання, а також побудованих похибок для цих методів. Виведено детерміновані нижні і верхні оцінки похибки байєсівської процедури розпізнавання у дискретному випадку для незалежних ознак. На основі критерію розв’язано серію задач розпізнавання гіпотез щодо стаціонарності або нестаціонарності ланцюгів Маркова, а також визначення порядку ланцюга Маркова. Побудовано байєсівську процедуру розпізнавання на нестаціонарних ланцюгах Маркова. Проведено статистичний аналіз запису генетичної інформації у послідовностях ДНК людини та вищих організмів. На кластерному комп’ютері проведено обчислювальні експерименти розпізнавання вторинної структури білків на реальних даних з Всесвітнього банку даних білкових сполук.

Основні наукові результати дисертаційної роботи такі:

- отримано нижню оцінку складності класу задач розпізнавання у дискретному випадку в залежності від розмірів класів навчаючої вибірки, кількості ознак та числа значень ознак;

- на основі байєсівської процедури розпізнавання у булевому випадку побудована оптимальна процедура розпізнавання, яка ґрунтується на використанні відокремлюючої гіперплощини;

- розроблено апарат розпізнавання гіпотез щодо стаціонарності (нестаціонарності) перехідних ймовірностей у моделях ланцюгів Маркова, а також визначення порядку ланцюга Маркова;

- обґрунтовано байєсівську процедуру розпізнавання на нестаціонарних ланцюгах Маркова. Отримано верхню оцінку похибки процедури від вхідних параметрів моделі;

- розроблено алгоритми розпізнавання вторинної структури білків на основі байєсівської процедури розпізнавання на нестаціонарних ланцюгах Маркова;

- встановлено комплементарні закономірності в записі генетичної інформації у послідовностях ДНК людини та вищих організмів;

- створено програмне забезпечення і проведено обчислювальні експерименти на реальних даних з метою підтвердження теоретичних результатів, отриманих у дисертації;

- розроблено інформаційну технологію розпізнавання вторинної структури білків на кластерному комп’ютері.