Наукова періодика України | Проблеми програмування | ||
Кривий С. Л. Онтологоподібні системи аналізу природномовних текстів / С. Л. Кривий, Н. П. Дарчук, О. І. Провотар // Проблеми програмування. - 2018. - № 2-3. - С. 132-139. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2018_2-3_17 Розглянуто підхід до побудови онтологоподібних систем для аналізу текстів на природній мові (на разі тільки українською мовою). Такі системи будуються на основі формальних визначень онтології О = (X, R, F, A(D, Re)) та синтаксичного і семантичного аналізу за допомогою елементів дескриптивної логіки. Під час побудови онтології вказується предметна область, до якої відносяться поняття з X і відношення із R. Фіксація області необхідна, оскільки сенс понять та відношень може бути різним в різних предметних областях. Специфікація області необхідна також для точнішого визначення інтерпретації F. Додаткові обмеження F описуються аксіоми А цієї області та обмеженнями Re, які мають форму додаткових визначень (уточнення, обмеження на можливі значення і т. д.) властивостей області інтерпретації D. Вхідний текст розглядається як область інтерпретації D(T). З дескриптивної логіки використовуються визначення синтаксису понять та відношень. Використовуючи цей синтаксис, визначається тип логічної мови, яка в даному випадку є логікою предикатів першого порядку і стає можливим проводити логічне виведення та одержувати висновки з інформації, одержаної з вхідного тексту. Вхідний текст Т розглядається як область інтерпретації F для понять X та відношень R, які з нього одержані. Результати синтактико-семантичного аналізу використовуються як вхідні дані для побудови онтології. В результаті такого аналізу відбувається розбиття об'єктів на групи, які відповідають частинам мови. Використовуючи цю інформацію та додаткові обмеження, будується онтологія даної предметної області. З точки зору користувача D(T) виглядає як об'єкт реляційної бази даних, який складається лише з унарних та бінарних відношень. Різниця полягає в тому, що в класичних БД відношення замкнуті в межах даної бази даних, в той час як D(T), як база даних, є відкритою для даної ПО, тому що нормалізоване представлення знань виконується в ситуації, коли немає припущення про повноту цих знань. Крім того, D(T) зв'язує семантичними відношеннями концепти C і відношення R із R, що немає аналогу в семантиці реляційних БД. Цитованість авторів публікації: Бібліографічний опис для цитування: Кривий С. Л. Онтологоподібні системи аналізу природномовних текстів / С. Л. Кривий, Н. П. Дарчук, О. І. Провотар // Проблеми програмування. - 2018. - № 2-3. - С. 132-139. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2018_2-3_17.Додаткова інформація про автора(ів) публікації: (cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці) Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
|
|
Всі права захищені © Національна бібліотека України імені В. І. Вернадського |