Бази даних

Автореферати дисертацій - результати пошуку

Mozilla Firefox Для швидкої роботи та реалізації всіх функціональних можливостей пошукової системи використовуйте браузер
"Mozilla Firefox"

Вид пошуку
Формат представлення знайдених документів:
повнийстислий
 Знайдено в інших БД:Наукова електронна бібліотека (1)Реферативна база даних (1)
Пошуковий запит: (<.>K=АНТИПЛАГІАТ$<.>)
Загальна кількість знайдених документів : 1

      
1.

Куроп'ятник О. С. 
Конструктивно-продукційні моделі природомовних текстів для виявлення запозичень у структурованих документах / О. С. Куроп'ятник. — Б.м., 2020 — укp.

Дисертаційну роботу присвячено вирішенню актуальної науково-прикладної задачі розробки моделей природомовних текстів для виявлення запозичень у структурованих документах На основі розроблених конструктивно-продукційних моделей мови, мовних конструкцій (текстів) та їх графового представлення запропоновано метод і алгоритми зіставлення текстів та структурованих документів для виявлення за-позичень. Запропонована модель процесу маскування запозичень дозволила формалізувати сценарії маскування, створити платформу для моделювання нових змін тексту, автоматизувати побудову тестів для систем антиплагіату. Розроблено програмні засоби виявлення запозичень у текстових фрагментах та структурованих документах. Розроблено програмний засіб автоматизованого формування тестів для перевірки здатності демаскування запозичень систем анти плагіату. Комплексне використання отриманих у роботі результатів дозволяє виконувати автоматизовану перевірку текстових фрагментів і структурованих документів на наявність запозичень; тестувати системи антиплагіату та постійно збільшувати тестову базу, будуючи нові сценарії маскувань.^UThe dissertation is devoted to solving the relevant scientific applied problem of development natural language texts models for detecting borrowings in structured documents. The dissertation reviews and analyzes existing models of natural languages, methods for processing language constructions (texts) and comparing natural language texts. Most models do not take into account the performer model and its features, and ignore human thinking processes. Most methods for preprocessing text do not allow restoring the input data after working with them. Methods based on simple comparisons (fingerprints, greedy comparisons, etc.) are sensitive to borrowings disguise mechanisms. Existing software, including those developed using these methods and algorithms, does not take into account the structure of the docu-ment to which the text belongs, when checking for borrowings. According to the results of the analysis of the current state and tendencies of development of linguistic constructions formalization methods and constructions comparison, the necessity of developing effective models and methods of natural language texts for borrowings detection in structured documents is shown. Constructive-synthesizing modeling (CSM) based on the use of formal languages and grammar apparatus, graph theory, methods and means of set theory, regression analysis were used to solve tasks of developed models of natural language texts and methods for its processing. In the framework of the CSM constructors and methods of their transformation (specialization, concretization, interpretation and realization) are used. Formalization of the forming human images processes by means of object-oriented modeling was performed. That allowed constructing a hierarchy of images based on the commonality of attributes in order to represent the meaning of the word and to reflect its connection with the objects of reality within the concept of word semantics. It was used in constructing the constructive-synthesizing languages model. Constructive-synthesizing and object-oriented models of the natural language and text, structured document model, process model of disguise of borrowings text were developed. Based on the developed models of the language, language constructions (texts) and their graph representation, method and algorithms are proposed for compare text fragments and structured documents to borrowings detection. Computer implementations of models the text graph representation and processes of disguise was created. The text-weighted graph compression method was developed to improve the performance of the computer implementation of the graph representation model, which made it possible to use the object serialization mechanism to form a structured documents database. These implementations are software for detecting borrowings in text fragments and structured documents and automated test generation to test the ability to unmask borrowings of anti-plagiarism systems. The developed models and tools form a single complex, which covers: language and speech - the creation of language constructions; lexical, syntactic, semantic components of language constructions; processes of disguise and detection of borrowings text. The time effectiveness of the implementation of models the graphical representation text is investigated. The check time for one document was from 11 to 65 sec for the database from 0.6 to 3.8 million characters. Restore graphs spent about 94% of the time. The influence of masking borrowings on increasing the originality of documents amounted to about 0.007%. Functional effectiveness metrics of developed software for borrowing in text-unstructured documents was compared to its counterpart (WCopyfind). The difference does not exceed 5%. The factors that cause the difference in the performance of the programs have been identified. The proposed model of the borrowing disguise process allows formalizing masking scenarios, creating a platform for modeling new text changes, and automating the construction of tests for anti-plagiarism systems. The integrated use obtained results allows performing an automated borrowings check of text fragments and structured documents; performing test anti-plagiarism systems and constantly increasing the test base by building new disguise scenarios. The developed software allows completing the requirement of the Law of Ukraine "On Higher Education" regarding the academic plagiarism detection in the diploma works of students in the specialty 121 "Software Engineering" at Dnipro National University of Railway Transport named after Acad. V. Lazaryan.


Шифр НБУВ: 05 Пошук видання у каталогах НБУВ 
 

Всі права захищені © Національна бібліотека України імені В. І. Вернадського