Наукова періодика України | Проблеми програмування | ||
Кудим К. А. Методы и средства извлечения данных о персоналиях из авторефератов диссертаций / К. А. Кудим, Г. Ю. Проскудина // Проблеми програмування. - 2019. - № 2. - С. 38-46. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2019_2_6 Рассмотрены подходы к решению задачи сбора и извлечения разрозненных данных о персоналиях из слабоструктурированных и неструктурированных документов, представленных в общедоступных каталогах авторефератов диссертаций. На языке PHP с применением XPath разработана система, которая позволяет автоматически собирать первичные документы из электронного каталога Национальной библиотеки Украины им. В. И. Вернадского, извлекать из этих документов данные и сохранять их в локальном хранилище. Для хранения выбрана модель данных RDF с учетом особенностей данных и возможностью последующего представления в семантической сети. Цитованість авторів публікації: Бібліографічний опис для цитування: Кудим К. А. Методы и средства извлечения данных о персоналиях из авторефератов диссертаций / К. А. Кудим, Г. Ю. Проскудина // Проблеми програмування. - 2019. - № 2. - С. 38-46. - Режим доступу: http://nbuv.gov.ua/UJRN/Progr_2019_2_6. Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
|
|
Всі права захищені © Національна бібліотека України імені В. І. Вернадського |