Наукова періодика України | Радіоелектронні і комп’ютерні системи | ||
Сидоренко А. Л. Методы быстрого поиска похожих строк / А. Л. Сидоренко, С. А. Раков, А. С. Кулик, А. Г. Чухрай, А. Ю. Завгородний // Радіоелектронні і комп’ютерні системи. - 2008. - № 4. - С. 51–59. - Режим доступу: http://nbuv.gov.ua/UJRN/recs_2008_4_10 Проблема обнаружения строк, не являющихся дубликатами, но представляющих одну сущность реального мира, часто встречается в системах повышения качества данных информационных систем. Такие похожие строки могут появляться в результате ошибок при вводе данных или использования аббревиатур. Исследуемая в работе проблема также тесно связана с проблемой слияния баз данных и является сложно решаемой, если требования высокой точности и скорости получения решения выдвигаются одновременно. Предложены два высокоточных метода поиска похожих строк для случаев, когда возможность использования аббревиатур может либо учитываться, либо нет. Показаны результаты применения методов на реальных данных, подтверждающие целесообразность их в системах повышения качества данных информационных систем. Цитованість авторів публікації: Бібліографічний опис для цитування: Сидоренко А. Л. Методы быстрого поиска похожих строк / А. Л. Сидоренко, С. А. Раков, А. С. Кулик, А. Г. Чухрай, А. Ю. Завгородний // Радіоелектронні і комп’ютерні системи. - 2008. - № 4. - С. 51–59. - Режим доступу: http://nbuv.gov.ua/UJRN/recs_2008_4_10.Додаткова інформація про автора(ів) публікації: (cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці) Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
|
|
Всі права захищені © Національна бібліотека України імені В. І. Вернадського |