Наукова періодика України Радіоелектроніка, інформатика, управління


Dyvak M. P. 
System for web resources content structuring and recognizing with the machine learning elements / M. P. Dyvak, A. V. Kovbasistyi, A. M. Melnyk, L. Y. Turchyn, Y. O. Маrtsenyuk // Радіоелектроніка, інформатика, управління. - 2018. - № 3. - С. 128-134. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2018_3_16
Наявність великої кількості веб-ресурсів різних організацій вимагає перевірки актуальності та достовірності контенту, зокрема, який стосується характеристик організації, персоналу і т.д. Для цього необхідно розробити систему автоматизованого аналізу контенту. Зазначена задача породжує потребу у розробці методу та програмного забезпечення для структурування та розпізнавання вмісту веб-ресурсів. Існуючі системи парсингу не забезпечують розв'язування зазначеного завдання, оскільки не містять елементів машинного навчання. Об'єктом дослідження є процес автоматизованого аналізу вмісту веб-ресурсів. Мета роботи - створення системи структурування та розпізнавання вмісту веб-ресурсів з елементами машинного навчання. Розглянута система структурування та розпізнавання текстового вмісту веб-ресурсів із елементами машинного навчання. Запропоновані моделі функціонування системи. Розроблено архітектуру для реалізації програмної системи для структурування та розпізнавання текстового вмісту веб-ресурсів. Наведено приклад реалізації моделі розробленої системи для структурування, визнання та виявлення застарілих та невірних відомостей про персонал на веб-ресурсі навчального закладу. Розроблено формалізований опис елементів машинного навчання та на його основі програмне забезпечення може використовуватися службою підтримки для оновлення та виправлення контенту веб-ресурсів різних організацій. Висновки: розглянута система структурування та розпізнавання вмісту веб-ресурсів із елементами машинного навчання. Запропонована система в порівнянні з відомими, забезпечує автоматичне структурування вмісту, визнання застарілої, недостовірної або неправильної інформації. Представлений приклад структурування та визнання застарілої та некоректної інформації на веб-сайті навчального закладу підтверджує ефективність запропонованої системи.
  Повний текст PDF - 749.086 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Dyvak M.
  • Kovbasistyi A.
  • Melnyk A.
  • Turchyn L.
  • Маrtsenyuk Y.

  • Бібліографічний опис для цитування:

    Dyvak M. P. System for web resources content structuring and recognizing with the machine learning elements / M. P. Dyvak, A. V. Kovbasistyi, A. M. Melnyk, L. Y. Turchyn, Y. O. Маrtsenyuk // Радіоелектроніка, інформатика, управління. - 2018. - № 3. - С. 128-134. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2018_3_16.

      Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського