АВТОМАТИЗАЦІЯ ПОШУКУ НЕЧІТКИХ ДУБЛІКАТІВ ЕЛЕКТРОННИХ ТЕКСТОВИХ ДОКУМЕНТІВ
DOI:
https://doi.org/10.36910/775.24153966.2022.74.4Ключові слова:
автоматизація, програмне забезпечення, алгоритм, шингли, дублікати, порівнянняАнотація
У роботі автоматизовано процес пошуку дублікатів текстових документів українською мовою.
Проаналізовано існуючі підходи до визначення дублікатів текстових документів. Здійснена програмна реалізація
основних покажчиків подібності текстів. Представлено алгоритм шинглу та його програмна реалізація.
Програмно реалізовано алгоритм автоматизації пошуку нечітких дублікатів. Отримане програмне забезпечення
перевірено на тестових прикладах.