Наукова періодика України Control systems & computers


Savchenko M. 
Automatic Generation of Semantic Knowledge Networks from an Unstructured Text / M. Savchenko, O. Kriachok // Управляющие системы и машины. - 2018. - № 1. - С. 71-78. - Режим доступу: http://nbuv.gov.ua/UJRN/USM_2018_1_9
У сучасному інформаційному просторі через величезну кількість неструктурованої текстової інформації існує потреба пошуку, вилучення, формалізації та обробки найбільш суттєвих знань, закладених автором у текст. Такими знаннями можуть бути концепти, представлені в документах, та характерні відносини між ними. Кожний текст будь-якого текстового корпусу несе певний унікальний зміст, характерний лише для даного тексту. Актуальною задачею є розробка алгоритмічної та програмної бази, яка надавала б змогу обробляти лише найбільш змістовну частину текстів та вилучати з неї знання, релевантні для даного контексту. Мета роботи - створення алгоритмічної і програмної бази для побудови семантичних мереж знань з найбільш релевантної інформації відносно контексту документів. Запропоновано комплексну методику, алгоритм та його реалізацію для побудови семантичної мережі знань з найбільш значної інформації у заданих текстах. Запропонований комплексний алгоритм поєднує роботу кількох алгоритмів на основі нейронних мереж і статистичного аналізу. Комбінація даних алгоритмів надає змогу розпізнавати концепти в тексті, знаходити між ними зв'язки та визначати, які з концептів мають бути включені до результуючої семантичної мережі шляхом оцінки їх ваги. Проведено аналіз великого текстового корпусу, загальною чисельністю близько мільйона слів. На основі зібраної інформації за використання розробленого алгоритму і рекурсивної граматики природної мови побудовано семантичну мережу знань для декількох текстів і окрему поєднану семантичну мережу знань. Проведено порівняння недоліків і переваг розробленого алгоритму відносно кількох існуючих підходів вилучення знань з текстів. Продемонстровано результати. Висновок: комплексний метод побудови семантичних мереж поєднує всі переваги описаних в роботі методів і не наслідує їх основних недоліків. За допомогою комплексного методу можна будувати семантичні мережі (графи знань) з текстів у повністю автоматичному режимі та без втручання експертів. Результати вилучення з текстів основної, найбільш релевантної інформації, представленої у вигляді графу знань можна використовувати в подальшому, наприклад, для розробки систем автоматичного інтелектуального аналізу будь-яких текстових даних.
  Повний текст PDF - 753.204 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Savchenko M.
  • Kriachok O.

  • Бібліографічний опис для цитування:

    Savchenko M. Automatic Generation of Semantic Knowledge Networks from an Unstructured Text / M. Savchenko, O. Kriachok // Управляющие системы и машины. - 2018. - № 1. - С. 71-78. - Режим доступу: http://nbuv.gov.ua/UJRN/USM_2018_1_9.

      Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського