Наукова періодика України Проблеми програмування


Кривий С. Л. 
Онтологоподібні системи аналізу природномовних текстів / С. Л. Кривий, Н. П. Дарчук, О. І. Провотар // Проблеми програмування. - 2018. - № 2-3. - С. 132-139. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2018_2-3_17
Розглянуто підхід до побудови онтологоподібних систем для аналізу текстів на природній мові (на разі тільки українською мовою). Такі системи будуються на основі формальних визначень онтології О = (X, R, F, A(D, Re)) та синтаксичного і семантичного аналізу за допомогою елементів дескриптивної логіки. Під час побудови онтології вказується предметна область, до якої відносяться поняття з X і відношення із R. Фіксація області необхідна, оскільки сенс понять та відношень може бути різним в різних предметних областях. Специфікація області необхідна також для точнішого визначення інтерпретації F. Додаткові обмеження F описуються аксіоми А цієї області та обмеженнями Re, які мають форму додаткових визначень (уточнення, обмеження на можливі значення і т. д.) властивостей області інтерпретації D. Вхідний текст розглядається як область інтерпретації D(T). З дескриптивної логіки використовуються визначення синтаксису понять та відношень. Використовуючи цей синтаксис, визначається тип логічної мови, яка в даному випадку є логікою предикатів першого порядку і стає можливим проводити логічне виведення та одержувати висновки з інформації, одержаної з вхідного тексту. Вхідний текст Т розглядається як область інтерпретації F для понять X та відношень R, які з нього одержані. Результати синтактико-семантичного аналізу використовуються як вхідні дані для побудови онтології. В результаті такого аналізу відбувається розбиття об'єктів на групи, які відповідають частинам мови. Використовуючи цю інформацію та додаткові обмеження, будується онтологія даної предметної області. З точки зору користувача D(T) виглядає як об'єкт реляційної бази даних, який складається лише з унарних та бінарних відношень. Різниця полягає в тому, що в класичних БД відношення замкнуті в межах даної бази даних, в той час як D(T), як база даних, є відкритою для даної ПО, тому що нормалізоване представлення знань виконується в ситуації, коли немає припущення про повноту цих знань. Крім того, D(T) зв'язує семантичними відношеннями концепти C і відношення R із R, що немає аналогу в семантиці реляційних БД.
  Повний текст PDF - 985.022 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Кривий С.
  • Дарчук Н.
  • Провотар О.

  • Бібліографічний опис для цитування:

    Кривий С. Л. Онтологоподібні системи аналізу природномовних текстів / С. Л. Кривий, Н. П. Дарчук, О. І. Провотар // Проблеми програмування. - 2018. - № 2-3. - С. 132-139. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2018_2-3_17.

    Додаткова інформація про автора(ів) публікації:
    (cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці)
  • Провотар Олександр Іванович (1958–) (фізико-математичні науки)
  •   Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського