Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Філологічні науки / Перекладознавство


Бірюков Артем Валентинович. Оцінка якості машинного перекладу. : Дис... канд. наук: 10.02.16 - 2008.



Анотація до роботи:

Бірюков А.В. Оцінка якості машинного перекладу. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата філологічних наук за спеціальністю 10.02.16 – перекладознавство. – Київський національний університет імені Тараса Шевченка. – Київ, 2007.

Дисертацію присвячено оцінці якості систем машинного перекладу (СМП) „Плай 4.0” і „Прагма 4.4” в межах німецько-українського та російсько-українського мовних напрямків.

Визначено основні методи оцінки якості та запропоновано власний підхід до оцінки електронних перекладачів з урахуванням вагомості конкретної помилки та її впливу на загальну якість перекладу.

Досліджено ефективність застосування систем машинного перекладу для підвищення продуктивності перекладацької праці в межах німецько-української мовної пари. Для цього ж мовного напрямку виконано аналіз помилок машинного перекладу, встановлено можливі причини їх виникнення та подекуди запропоновано шляхи їх усунення. Машинний переклад системи „Прагма 4.4” (німецько-український напрямок перекладу) не відповідає визначеним у роботі вимогам щодо якості. Навіть за такої умови він дає змогу перекладачеві заощаджувати час, якщо використовується як чернетка для виготовлення якісного перекладу. Детальний аналіз помилок МП надає можливість з’ясувати хибні рішення розробників та запропонувати можливі шляхи їх усунення.

У межах російсько-українського напрямку перекладу якісніший переклад виконує система „Прагма 4.4”. Найгіршим етапом роботи обох систем є автоматичний аналіз. Найбільша кількість помилок припадає на лексичний і контекстуальний рівні.

У дисертації запропоновано вирішення актуального наукового завдання, що полягає в оцінці мовної якості перекладів, виконаних вітчизняними СМП, та визначенні користі від їх застосування для кінцевого користувача. Отримані результати дають змогу глибше зрозуміти можливості електронних перекладачів та з’ясувати недоліки, виправлення яких має покращити загальну якість перекладу.

Внаслідок проведеного дослідження отримано такі наукові результати:

1. Наукові дослідження оцінки якості лінгвістично-перекладацького потенціалу СМП мають будуватися в межах мікрооцінки на основі штучних тестових збірок та реальних текстів. Експерименти з оцінки якості, спрямовані на визначення користі від застосування машинного перекладу та ефективності задоволення специфічних вимог користувача, відбуваються у межах макрооцінки, де на перший план виходить не безпосередня якість перекладу, а ступінь задоволення потреб користувачів.

2. Споживач, який дослідив лінгвістичний потенціал системи, тобто принципову можливість її покращення на основі поповнення словників або (рідше) за рахунок подальшого програмування/вдосконалення правил, може отримати достатню інформацію щодо перспективності системи машинного перекладу, яка, можливо, абсолютно не задовольняє його потреби в пакетному режимі, проте має непогані шанси на поліпшення якості перекладу за умови її тривалої експлуатації.

3. На сучасному етапі розвитку „Прагма 4.4” з німецько-українською мовною парою має досить низький лінгвістичний потенціал, а значна кількість граматичних конструкцій розробниками не опрацьована взагалі. Головним недоліком системи як інструменту для покращення продуктивності перекладацької роботи, на наш погляд, є обмежені можливості кодування словника користувача. Лексичний рівень у межах німецько-українського мовного напрямку хоч і є досить вагомим для здійснення правильного перекладу, проте значно більше ускладнюють розуміння перекладеного тексту помилки синтаксичного характеру. Контекстуальний рівень для німецько-української мовної пари також має суттєве значення. Помилки електронних перекладачів на цьому рівні нерідко ускладнюють розуміння перекладеного речення, особливо у випадках омонімії.

4. У межах російсько-українського мовного напрямку системи МП „Плай 4.0” і „Прагма 4.4” мають значний лінгвістичний потенціал, що дає їм змогу перекладати майже всі граматичні феномени. Для обох систем із цим напрямком перекладу робота „вшир” уже завершена, на часі робота „вглиб”. В межах російсько-українського мовного напрямку вирішальне значення має лексичний рівень. Сурядні та підрядні зв’язки між реченнями в межах синтаксичного рівня не складні для систем і майже завжди перекладаються бездоганно. Контекстуальний рівень є суттєвою проблемою для цієї мовної пари лише з точки зору кількості помилок. Щодо їх впливу на розуміння перекладеного тексту, то маємо зазначити: помилки контекстуального рівня, незважаючи на їх численність, рідко спотворюють зміст першотвору і в цьому аспекті є суттєвими лише для лінгвістично орієнтованої оцінки.

5. Жодна з проаналізованих СМП не визнана кращою за всіма показниками. „Плай 4.0” має якісніший автоматичний словник і вдаліше застосовує перекладацькі трансформації, робить менше грубих помилок на всіх мовних рівнях, які суттєво впливають на розуміння перекладеного тексту. Основним чинником, завдяки якому „Прагма 4.4” все ж випереджає свою конкурентку, є її якісніший автоматичний аналіз, що має вирішальне значення для здійснення вдалого перекладу. Саме покращення якості автоматичного аналізу має стати, на нашу думку, пріоритетним напрямком подальших теоретичних та практичних розвідок розробників обох систем.

6. Використання машинного перекладу пробандами жодного разу не призвело до втрати часу. Випадки, коли редагування машинного перекладу потребувало стільки ж часу, як і виконання мануального перекладу, не численні і становлять 25%. Середній показник часу, який було заощаджено завдяки використанню систем машинного перекладу, становить 31,44%. Проведення експерименту з досвідченими пробандами, обізнаними з проблематикою машинного перекладу та особливостями функціонування конкретної системи, чіткіше окреслить картину щодо заощадження часу завдяки використанню СМП.

7. Докладний лінгвістичний аналіз, або мікрооцінка, практично завжди наштовхує користувача на певні припущення щодо причини виникнення помилки, що в поєднанні з додатковими тестовими реченнями на перевірку цієї гіпотези досить часто призводить до з’ясування причин її виникнення та визначення можливих шляхів усунення. Таким чином, навіть звичайні користувачі з базовою лінгвістичною освітою можуть покращувати якість машинного перекладу за умови, якщо виявлені ними помилки та їх причини враховані розробниками з метою внесення відповідних змін до системи.

Публікації автора:

  1. Підвищення ефективності та якості перекладацької праці як результат використання текстових та мовленнєвих лінгвістичних процесорів // Вісник Запорізького державного університету. Серія: Філологічні науки. – Запоріжжя: ЗДУ, 2004. – № 1. – С. 20-27.

  2. Система оцінки якості машинного перекладу // Вісник Сумського державного університету. Серія: Філологічні науки. – Суми: СумДУ, 2004. – № 3. – С. 42-48.

  3. Розробка методів оцінки якості машинного перекладу на основі результатів досліджень з оцінки якості перекладу традиційного // Культура народов Причерноморья. Серия: Филологические науки. – Симферополь: ТНУ, 2004. – № 55. – С. 100-105.

  4. Оцінка якості вітчизняних систем машинного перекладу з українсько-російською мовною парою // Гуманітарний вісник. Серія: Іноземна філологія: Всеукр. зб. наук. праць. – Черкаси: ЧДТУ, 2005. – № 9. – С. 352-356.

  5. Оцінка якості системи машинного перекладу „Прагма 4.4” з німецько-українською мовною парою // Studia Methodologica. – Тернопіль: Ред.-видавн. відділ ТНПУ, 2006. – № 18. – С. 61-64.