Бази даних

Автореферати дисертацій - результати пошуку

Mozilla Firefox Для швидкої роботи та реалізації всіх функціональних можливостей пошукової системи використовуйте браузер
"Mozilla Firefox"

Вид пошуку
Формат представлення знайдених документів:
повнийстислий
 Знайдено в інших БД:Реферативна база даних (6)
Пошуковий запит: (<.>A=Кириченко О. Л.$<.>)
Загальна кількість знайдених документів : 1

      
1.

Кириченко О. Л. 
Дослідження статистичних характеристик складних мереж методами інтелектуального аналізу даних: автореферат дис. ... д.філософ : 121 / О. Л. Кириченко. — Б.м., 2024 — укp.

Дисертаційна робота присвячена дослідженню статистичних характеристик складних мереж та кластерної структури веб-простору з використанням методів інтелектуального аналізу даних, зокрема розробці інформаційної технології для кластеризації даних великого розміру, які були зібрані й оброблені спеціально створеним програмним забезпеченням. Також вивчено стохастичні матриці, які завдяки особливостям своїх спектральних властивостей є основним математичним об’єктом при дослідженні кластерної структури веб-простору. Дисертацiя складається зі вступу, чотирьох роздiлiв, висновкiв, перелiку використаних джерел та додаткiв. У вступi обґрунтовано актуальнiсть дослiдження, сформульовано мету, завдання, предмет, об’єкт та методи дослiдження, вказано наукову новизну, теоретичне та практичне значення отриманих результатiв, проаналізовано зв’язок роботи з науковими темами. Зазначено особистий внесок здобувача, а також наведено відомості про апробацію та публікації основних результатів дисертації.Перший роздiл містить ключові вiдомостi з теорії складних мереж, опис основних напрямів досліджень та завдання, якими займається теорія складних мереж. Проведено огляд та опис основних моделей (Ердоша–Рені, Уаттса–Строґаца, Барабашi–Альберт). Розглянуто та проаналізовано приклади реальних складних мереж та їх особливості Здійснено класифікацію та огляд методів однієї з важливих технік інтелектуального аналізу складних мереж – кластерного аналізу.У другому розділі дисертаційного дослідження описано концепцію кроулінгу як одного із засобів збирання інформації, проведено огляд існуючих програмних засобів для збирання інформації у веб-просторі. Другий розділ має прикладне значення, основним його результатом є розроблене спеціалізоване програмне забезпечення – кроулер з вбудованим аналітичним модулем для інтелектуальної обробки інформації.Третій розділ присвячений дослідженню освітніх сегментів веб-простору (українського (edu.ua), ізраїльського (ac.il) та польського (edu.pl), інформація про які була зібрана та оброблена за допомогою самостійно розробленої інформаційної технології. Застосування даної розробки дозволило отримати статистичні характеристики та кластерну структуру вказаних вище сегментів веб-простору та здійснити порівняльний аналіз.У четвертому розділі розглянуто питання кластеризації в графі на основі матриці суміжності. Основним об’єктом дослідження є стохастична матриця, що задає ймовірності переходу на графі та визначається із матриці суміжності. У розділі проаналізовано спектральні властивості стохастичної матриці із врахуванням кластерної структури графу.Основні теоретичні результати розділу наступні:?доведено факт збіжності власних значень матриці P за умов, накладених на елементи матриці суміжності A (теорема 4.3.1);?встановлений факт про асимптотичну еквівалентність спектрів матриць та дозволяє використовувати стохастичну матрицю із незалежними елементами замість відповідної стохастичної матриці P, елементи якої не є незалежними (лема 4.4.1);?розглянуто частинний підхід до оцінки розподілу елементів матриці P за умови показникового розподілу елементів матриці A (лемах 4.5.1 та 4.5.2). Розроблено новий алгоритм перевірки належності елементів (вершин графу) до одного кластеру;?побудовано критерій оцінки оптимальної кількості кластерів k_opt.На основі методу Монте-Карло проведено порівняння розробленого методу оцінки кількості кластерів із деякими класичними алгоритмами, в результаті чого встановлено ряд його переваг та недоліків.У висновках підсумовано основні результати дисертаційного дослідження.У додатках подано наукові публікації, відомості про апробацію результатів дисертації.Теоретичне значення. Результати теоретичних досліджень, а саме розвитку теорії графових досліджень, сформульовані та доведені леми і теореми, можуть використовуватися для подальших досліджень у цій галузі, а також у навчальних курсах кафедр математичних проблем управління і кібернетики та програмного забезпечення комп’ютерних систем Чернівецького національного університету імені Юрія Федьковича (та інших ЗВО), пов'язаних з інтелектуальним аналізом даних, методичних розробках, навчальних посібниках для освітнього процесу та науково-дослідної роботи студентів, аспірантів.Практичне значення. Розроблені у дисертаційній роботі кроулер, інформаційна технологія та метод визначення оптимальної кількості кластерів можуть в подальшому використовуватися для практичного дослідження складних мереж. Запропоновані підходи, результати використовуються компаніями «Квант Азимут» та «Qlicks B.V.».Ключові слова: модель (математична, економічна), моделювання, динаміка, інтелектуальний аналіз даних, кластеризація, k-means, інформаційна система, інформаційна технологія, інтелектуальна система, програмне забезпечення, тестування програмного забезпечення, рівні тестування програмного забезпечення, специфікація вимог до програмного забезпечення, функціональні та нефункціональні вимоги до програмного забезпечення, статистичні методи.^UThe dissertation deals with the study of statistical characteristics of complex networks and the cluster structure of the web space using methods of intelligent data analysis, in particular, the development of information technology for the clustering of large data, which were collected and processed by specially created software. In addition, stochastic matrices have been studied, which, due to their specific spectral properties, are the main mathematical object in the study of the cluster structure of the web space.The dissertation contains an introduction, four chapters, conclusions, a list of literature, and appendices. The introduction substantiates the relevance of the research topic, formulates the goal, task, subject, object and research methods; indicates the scientific novelty, theoretical and practical significance of the obtained results; presents and analyzes the link between the current research and scientific topics. The personal contribution of the candidate, as well as information about the approval and publication of the main results of the research are shown. Chapter 1 contains key information on the theory of complex networks, a description of the main areas of research and tasks that the theory of complex networks deals with. An overview and description of the main models (the Erdős–Rényi, Watts-Strogatz, Barabási–Albert models) are provided. The methods of cluster analysis, an important technique of intellectual analysis of complex networks, are classified and reviewed.Chapter 2 of the dissertation describes the concept of crawling as one of the means of gathering information, and provides an overview of existing software tools for collecting information in the web space. Chapter 2 has a practical value; its main result is the developed specialized software – a crawler with a built-in analytical module for intelligent information processing.Chapter 3 deals with the study of following educational segments of the web space: Ukrainian (edu.ua), Israeli (ac.il) and Polish (edu.pl). The information on these segments was collected and processed using a personally developed information technology. The application of this development enables to obtain the statistical characteristics and cluster structure of the above-mentioned segments of the web space and to carry out a comparative analysis.Chapter 4 deals with the issue of clustering in a graph based on the adjacency matrix. The main object of research is the stochastic matrix, which specifies the transition probabilities on the graph and is determined from the adjacency matrix. In this chapter, the spectral properties of the stochastic matrix are analyzed, taking into account the cluster structure of the graph.The main theoretical results of this chapter are follows:?the fact of the convergence of the eigenvalues of the matrix P under the conditions imposed on the elements of the adjacency matrix A is proved (theorem 4.3.1);?the established fact about the asymptotic equivalence of the spectra of the matrices and allows using a stochastic matrix with independent elements instead of the corresponding stochastic matrix P, the elements of which are not independent (lemma 4.4.1);?a partial approach to the estimation of the distribution of the elements of matrix P is considered under the condition of the indicative distribution of matrix A elements (lemmas 4.5.1 and 4.5.2). A new algorithm has been developed for checking whether elements (graph vertices) belong to one cluster.?a criterion for estimating the optimal number of clusters k_opt is built.. On the basis of the Monte Carlo method, a comparison of the developed method for estimating the number of clusters with some classical algorithms was carried out.The main results of the dissertation research are summarized in the conclusions.The appendices present scientific publications, information on the approval of the results of the dissertation.Theoretical significance. The results of theoretical research, namely the development of the theory of graph research, formulated and proven lemmas and theorems, can be used for further research in this field. They can also be applied in the educational courses in Yuriy Fedkovych Chernivtsi National University, related to teaching aids for the educational process and research.Practical significance. The crawler, information technology, and method for determining the optimal number of clusters developed in the dissertation can be used for further practical research of complex networks. The proposed approaches are used by the companies "Kvant Azimuth" and "Qlicks B.V.".Keywords: model (mathematical, economic), simulation, dynamics, intelligent data analysis, clustering, k-means, information system, information technology, intelligent system, software, software testing, software testing levels, specification of software requirements, functional and non-functional software requirements, statistical methods.


Шифр НБУВ: 05 Пошук видання у каталогах НБУВ 
 

Всі права захищені © Національна бібліотека України імені В. І. Вернадського