Наукова періодика України Радіоелектроніка, інформатика, управління


Babichev S. 
Implementation of dbscan clustering algorithm within the framework of the objective clustering inductive technology based on r and knime tools / S. Babichev, S. Vyshemyrska, V. Lytvynenko // Радіоелектроніка, інформатика, управління. - 2019. - № 1. - С. 77-88. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2019_1_10
Досліджено проблему кластеризації складних даних у межах індуктивної технології об'єктивної кластеризації. Зроблено практичну реалізацію запропонованої гібридної моделі кластеризації даних на основі комплексного застосування програмних засобів R і KNIME. Об'єкт дослідження - гібридна модель кластеризації даних на основі комплексного застосування алгоритму кластеризації DBSCAN і індуктивної технології об'єктивної кластеризації. Мета роботи - створення гібридної моделі об'єктивної кластеризації на основі алгоритму кластеризації DBSCAN та практична реалізація моделі на основі комплексного застосування програмних засобів R і KNIME. Індуктивні методи моделювання складних систем було використано як основу для визначення оптимальних параметрів алгоритму кластеризації DBSCAN в межах індуктивної технології об'єктивної кластеризації. Практична реалізація даної технології передбачає: застосування рівнопотужніх підмножин даних, які містять однакову кількість попарно близьких об'єктів; розрахунок внутрішнього та зовнішнього критеріїв якості кластеризації; розрахунок комплексного критерія балансу, максимальне значення якого відповідає найкращій кластеризації з точки зору критеріїв, що використовуються. Реалізація процесу визначення оптимальних параметрів алгоритму DBSCAN передбачає два етапи. Першим етапом є визначення оптимального значення параметра EPS в межах діапазону зміни значень параметру minPts. Результатом реалізації даного етапу є одержання діаграм залежності комплексного критерію балансу від відповідних значень EPS для кожного значення minPts. Проведено аналіз одержаних проміжних результатів для визначення оптимального рішення, що відповідає максимальному значенню комплексного критерію балансу залежно від мети поставленої задачі. Розроблено гібридну модель індуктивної технології об'єктивної кластеризації на основі алгоритму DBSCAN, яка практично реалізована на основі програмних засобів KNIME R. Виконано оцінку ефективності моделі з використанням різних типів даних: низькорозмірних даних школи обчислень університету східної Фінляндії; ірисів Фішера; профілів експресії генів пацієнтів, які досліджувалися на рак легенів. Результати моделювання показали високу ефективність запропонованої технології. Досліджені об'єкти було розподілено у кластери коректно в усіх випадках. Запропонований метод надає змогу зменшити значення похибки відтворюваності, оскільки остаточне рішення щодо визначення оптимальних параметрів алгоритму кластеризації приймається на основі паралельного аналізу результатів кластеризації, одержаних на рівнопотужніх підмножинах даних, так і на основі аналізу різниці результатів кластеризації, одержаних на даних підмножинах.
  Повний текст PDF - 1.035 Mb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Babichev S.
  • Vyshemyrska S.
  • Lytvynenko V.

  • Бібліографічний опис для цитування:

    Babichev S. Implementation of dbscan clustering algorithm within the framework of the objective clustering inductive technology based on r and knime tools / S. Babichev, S. Vyshemyrska, V. Lytvynenko // Радіоелектроніка, інформатика, управління. - 2019. - № 1. - С. 77-88. - Режим доступу: http://nbuv.gov.ua/UJRN/riu_2019_1_10.

      Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського