Наукова періодика України Наукові вісті КПІ


Kuznietsova N. V. 
Business intelligence techniques for missing data imputation / N. V. Kuznietsova, P. I. Bidyuk // Наукові вісті Національного технічного університету України "Київський політехнічний інститут". - 2015. - № 5. - С. 47-56. - Режим доступу: http://nbuv.gov.ua/UJRN/NVKPI_2015_5_8
Належним чином спроектовані системи підтримки прийняття рішень для моделювання і прогнозування поведінки динамічних систем надають можливість врахування невизначеностей ймовірнісного, статистичного і структурного типів. Це сприяє підвищенню якості розроблюваних моделей та оцінок прогнозів. Мета роботи - розглянути загальні причини втрати даних при розв'язанні задач їх статистичного аналізу; виконати категоризацію пропусків даних на кілька груп та виявити причини появи пропусків; запропонувати системну методологію аналізу невизначеностей та вибору методів заповнення пропусків; розглянути деякі популярні методи заповнення пропусків та можливості їх застосування. Для розв'язання поставлених задач використано такі методи: підхід до категоризації пропусків даних з практичної та ділової точок зору з метою виявлення причин появи систематичних або випадкових втрат даних; сучасна методологія системного аналізу для встановлення причин появи невизначеностей та розв'язання задачі заповнення пропусків; процедури заповнення пропусків даних за допомогою дерев рішень; алгоритм ЕМ та підхід до заповнення пропусків за допомогою функцій прогнозування, що будуються на основі регресійних моделей. Основними результатами дослідження є такі: категоризація пропущених даних на групи; розробка системної методології аналізу причини появи невизначеностей та розв'язання задачі заповнення пропусків; аналіз процедур заповнення пропусків за допомогою дерев рішень, алгоритму ЕМ та регресійних моделей. Наведено ілюстрацію застосування деяких перспективних методів заповнення пропусків. Висновки: запропоновано методику заповнення пропусків даних із шести кроків, яка підкреслює, що вибір коректного методу заповнення тісно пов'язаний із докладним аналізом причин появи пропусків. Результати заповнення пропусків іноді істотно відрізняються від фактичних даних, а тому їх необхідно згладжувати або навіть видаляти з вибірки внаслідок їх некоректності. У таких випадках необхідно використовувати ймовірнісно-регресійні процедури, які надають можливість визначати параметри ймовірнісних інтервалів регресії при генеруванні кандидатів на заповнення. Обчислювальні експерименти, виконані із застосуванням алгоритму ЕМ, оцінок прогнозів, отриманих на основі регресійних моделей та деяких інших методів, свідчать про те, що існують можливості для одержання високоякісних результатів обробки даних з пропусками.
  Повний текст PDF - 260.92 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Kuznietsova N.
  • Bidyuk P.

  • Бібліографічний опис для цитування:

    Kuznietsova N. V. Business intelligence techniques for missing data imputation / N. V. Kuznietsova, P. I. Bidyuk // Наукові вісті Національного технічного університету України "Київський політехнічний інститут". - 2015. - № 5. - С. 47-56. - Режим доступу: http://nbuv.gov.ua/UJRN/NVKPI_2015_5_8.

    Додаткова інформація про автора(ів) публікації:
    (cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці)
  • Кузнєцова Наталія Володимирівна (технічні науки)
  • Бідюк Петро Іванович (1949–) (технічні науки)
  •   Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського