Наукова періодика України Вісник Національного університету "Львівська політехніка"


Дорожинська А. В. 
Парсинг тексту термінологічних словників / А. В. Дорожинська // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. - 2019. - Вип. 5. - С. 90-100. - Режим доступу: http://nbuv.gov.ua/UJRN/VNULPICM_2019_5_11
Окреслено коло завдань, підходів та етапів розроблення технології парсинга тексту багатомовного тлумачного термінологічного словника. Дослідження проведено для "Словника української біологічної термінології". Серед усього словникового розмаїття цей словник обрано тому, що термінологічні словники надають лексико-семантичну базу для подальшого створення систем інтелектуального опрацювання фахових текстів, у яких подається інформація з тих чи інших предметних галузей. Ця термінографічна праця обіймає нормативну загальнонаукову та широковживану термінологію біологічних наук, зафіксовану в сучасних енциклопедичних, загальномовних і спеціальних словниках, у науковій, науково-популярній, навчальній та інформативно-реферативній літературі. Дослідивши обраний словник, можна узагальнити модель його лексикографічної системи на інші предметні галузі, що створить передумови для формування цілісного багатогалузевого цифрового лексикографічного простору. Робота зі словниками, переведеними у комп'ютерні текстові формати, є дуже неефективною і потребує конвертування їх у формати лексикографічних баз даних, що є спеціальним завданням, не відомим класичній лексикографії. Це і складає зміст терміна "парсинг словників". У процесі роботи побудовано модель лексикографічної системи, яку покладено в основу XML. Подальша робота з перетворення паперової версії словника на онлайн-систему будується на XML-файлі. Проаналізовано поліграфічне оформлення, організацію та структуру друкованого тексту словника з метою ідентифікації елементів концептуальної моделі Л-системи СУБТ. На базі концептуальної моделі побудовано структуру XML-документа, який пропонується використовувати як посередника між паперовою версією словника та його реалізацією як онлайнової лексикографічної системи. Надалі планується побудова універсальної процедури парсингу з удосконаленням структури XML-документа.
  Повний текст PDF - 250.451 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Дорожинська А.

  • Бібліографічний опис для цитування:

    Дорожинська А. В. Парсинг тексту термінологічних словників / А. В. Дорожинська // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. - 2019. - Вип. 5. - С. 90-100. - Режим доступу: http://nbuv.gov.ua/UJRN/VNULPICM_2019_5_11.

      Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського