Наукова періодика України Радіоелектроніка, інформатика, управління


Davydov M. V. 
Effective algorithm for parsing sentences using semantically attributed weighted affix context free / M. V. Davydov, O. V. Lozynska, V. V. Pasichnyk // Радіоелектроніка, інформатика, управління. - 2017. - № 4. - С. 124-130. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2017_4_16
Розглянуто задачу підвищення ефективності афіксних граматик над скінченною граткою (AGFL). AGFL - це контекстно-вільна граматика з гнучкими і компактними формами для розбору текстів на природних мовах. Мета роботи - підвищення ефективності розбору речень за допомогою модифікації AGFL, яка додає семантичні атрибути в продукції граматики і вводить нову форму продукцій під назвою "шаблонна продукція". Ця модифікація допомагає зменшити кількість продукцій, необхідних для опису мови, і дозволяє зменшити обчислювальну складність алгоритму синтаксичного аналізу. Розроблено математичну модель шаблонної продукції і доведено теорему про те, що існує нормальна форма шаблонних продукцій, а процедура нормалізації породжує еквівалентну граматику. Нормальна форма використовується для підвищення ефективності розбору українських речень. Шаблонні продукції допомагають описувати правила на основі онтології в короткій і обчислювально ефективній формі. Вивчено нормальну форму шаблонних продукцій і пропонується ефективний алгоритм для розбору речень. У найгіршому випадку обчислювальна складність запропонованого алгоритму становить O(<$E n sup 3 ~cdot~m sub p sup 3 ~cdot~ m sub r>), де n - довжина вхідного рядка терміналів, mp - максимальне число комбінацій символів і атрибутів, які можуть породжувати один і той самий рядок терміналів, mr - максимальне число продукцій, які мають той самий стартовий нетермінальний символ в правій частині. Час синтаксичного аналізу виявився майже лінійною функцією від кількості слів у реченні при розборі тестової бази речень української художньої літератури. Розроблений метод був реалізований в програмному забезпеченні UkrParser, яке доступне з відкритим вихідним кодом на GitHub. Висновки: розроблений алгоритм був протестований на базі даних українських речень і продемонстрував в десять разів більшу швидкість розбору, ніж аналізатор "Stanford Parser". Майбутні дослідження можуть бути сфокусовані на розробці граматично доповнених онтологій для більш широкого набору предметних областей, що має поліпшити результати семантичного аналізу речень.
  Повний текст PDF - 501.337 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Davydov M.
  • Lozynska O.
  • Pasichnyk V.

  • Бібліографічний опис для цитування:

    Davydov M. V. Effective algorithm for parsing sentences using semantically attributed weighted affix context free / M. V. Davydov, O. V. Lozynska, V. V. Pasichnyk // Радіоелектроніка, інформатика, управління. - 2017. - № 4. - С. 124-130. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2017_4_16.

      Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського