Наукова періодика України Проблеми програмування


Кудим К. А. 
Методы и средства извлечения данных о персоналиях из авторефератов диссертаций / К. А. Кудим, Г. Ю. Проскудина // Проблеми програмування. - 2019. - № 2. - С. 38-46. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2019_2_6
Рассмотрены подходы к решению задачи сбора и извлечения разрозненных данных о персоналиях из слабоструктурированных и неструктурированных документов, представленных в общедоступных каталогах авторефератов диссертаций. На языке PHP с применением XPath разработана система, которая позволяет автоматически собирать первичные документы из электронного каталога Национальной библиотеки Украины им. В. И. Вернадского, извлекать из этих документов данные и сохранять их в локальном хранилище. Для хранения выбрана модель данных RDF с учетом особенностей данных и возможностью последующего представления в семантической сети.
  Повний текст PDF - 704.08 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Кудим К.
  • Проскудина Г.

  • Бібліографічний опис для цитування:

    Кудим К. А. Методы и средства извлечения данных о персоналиях из авторефератов диссертаций / К. А. Кудим, Г. Ю. Проскудина // Проблеми програмування. - 2019. - № 2. - С. 38-46. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2019_2_6.

      Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського