Наукова періодика України Радіоелектроніка, інформатика, управління


Бісікало О. В. 
Застосування методу синтаксичного аналізу речень для визначення ключових слів україномовного тексту / О. В. Бісікало, В. А. Висоцька // Радіоелектроніка, інформатика, управління. - 2016. - № 3. - С. 54-65. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2016_3_9
Викладено особливості застосування породжувальних граматик у лінгвістичному моделюванні. Опис моделювання синтаксису речення застосовують для автоматизації процесів аналізу та синтезу природномовних текстів. Розкрито особливості процесу синтезу речень різних мов із застосуванням породжувальних граматик. Розглянуто вплив норм та правил мови на хід побудови граматик. Зазначено, що застосування породжувальних граматик має широкі можливості у розробленні та створенні автоматизованих систем опрацювання текстового контенту, для лінгвістичного забезпечення комп'ютерних лінгвістичних систем тощо. В природних мовах є ситуації, коли явища, залежні від контексту, описані як незалежні від контексту, тобто в термінах контекстно-вільних граматик. При цьому опис ускладнений через утворення нових категорій і правил. Наведено особливості процесу введення нових обмежень на класи таких граматик через введення нових правил. За кількості символів в правій частині правил, не меншій за ліву, одержано нескорочені граматики. Після заміни лише одного символу одержали контекстно-залежні граматики. За наявності в лівій частині правила лише одного символу одержали контекстно-вільні граматики. Жодних наступних природних обмежень на ліві частини правил накласти вже не можна. Зважаючи на важливість забезпечення автоматичного опрацювання текстового контенту в сучасних інформаційних засобах (наприклад, інформаційно-пошукових системах, системах машинного перекладу, семантичного, статистичного, оптичного та акустичного аналізу і синтезу мови, автоматизованого редагування, екстракції знань з текстового контенту, реферування та анотування текстового контенту, індексування текстового контенту, навчально-дидактичних, менеджменту лінгвістичних корпусів, інструментальні засоби укладання словників різних типів тощо), фахівці інтенсивно шукають нові моделі, способи їх опису та методи автоматичного опрацювання текстового контенту. Одним із таких способів є розроблення загальних принципів побудови лексикографічних систем синтаксичного типу та побудови за цими принципами зазначених систем опрацювання текстового контенту для конкретних мов. Будь-які засоби синтаксичного аналізу складаються з двох частин: бази знань про конкретну природну мову і алгоритму синтаксичного аналізу, тобто набору стандартних операторів опрацювання текстового контенту на основі цих знань. Джерелом граматичних знань є дані з морфологічного аналізу та різні заповнені таблиці понять та лінгвістичних одиниць. Вони є результатом емпіричного опрацювання текстового контенту на природній мові експертами з метою виділення основних закономірностей для синтаксичного аналізу.
  Повний текст PDF - 2.479 Mb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Бісікало О.
  • Висоцька В.

  • Бібліографічний опис для цитування:

    Бісікало О. В. Застосування методу синтаксичного аналізу речень для визначення ключових слів україномовного тексту / О. В. Бісікало, В. А. Висоцька // Радіоелектроніка, інформатика, управління. - 2016. - № 3. - С. 54-65. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2016_3_9.

    Додаткова інформація про автора(ів) публікації:
    (cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці)
  • Бісікало Олег Володимирович (технічні науки)
  • Висоцька Вікторія Анатоліївна (технічні науки)
  •   Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського