У дисертаційній роботі проведено детальний аналіз методів мінімізації емпіричного ризику і байєсівських процедур розпізнавання, а також побудованих похибок для цих методів. Виведено детерміновані нижні і верхні оцінки похибки байєсівської процедури розпізнавання у дискретному випадку для незалежних ознак. На основі критерію розв’язано серію задач розпізнавання гіпотез щодо стаціонарності або нестаціонарності ланцюгів Маркова, а також визначення порядку ланцюга Маркова. Побудовано байєсівську процедуру розпізнавання на нестаціонарних ланцюгах Маркова. Проведено статистичний аналіз запису генетичної інформації у послідовностях ДНК людини та вищих організмів. На кластерному комп’ютері проведено обчислювальні експерименти розпізнавання вторинної структури білків на реальних даних з Всесвітнього банку даних білкових сполук. Основні наукові результати дисертаційної роботи такі: - отримано нижню оцінку складності класу задач розпізнавання у дискретному випадку в залежності від розмірів класів навчаючої вибірки, кількості ознак та числа значень ознак; - на основі байєсівської процедури розпізнавання у булевому випадку побудована оптимальна процедура розпізнавання, яка ґрунтується на використанні відокремлюючої гіперплощини; - розроблено апарат розпізнавання гіпотез щодо стаціонарності (нестаціонарності) перехідних ймовірностей у моделях ланцюгів Маркова, а також визначення порядку ланцюга Маркова; - обґрунтовано байєсівську процедуру розпізнавання на нестаціонарних ланцюгах Маркова. Отримано верхню оцінку похибки процедури від вхідних параметрів моделі; - розроблено алгоритми розпізнавання вторинної структури білків на основі байєсівської процедури розпізнавання на нестаціонарних ланцюгах Маркова; - встановлено комплементарні закономірності в записі генетичної інформації у послідовностях ДНК людини та вищих організмів; - створено програмне забезпечення і проведено обчислювальні експерименти на реальних даних з метою підтвердження теоретичних результатів, отриманих у дисертації; - розроблено інформаційну технологію розпізнавання вторинної структури білків на кластерному комп’ютері. |