АВТОМАТИЗАЦІЯ ПОШУКУ НЕЧІТКИХ ДУБЛІКАТІВ ЕЛЕКТРОННИХ ТЕКСТОВИХ ДОКУМЕНТІВ

  • Л.О. Гуменюк
  • В.В. Лотиш
  • Ю.З. Вашкурак
  • П.О. Гуменюк
Ключові слова: автоматизація, програмне забезпечення, алгоритм, шингли, дублікати, порівняння

Анотація

У роботі автоматизовано процес пошуку дублікатів текстових документів українською мовою.
Проаналізовано існуючі підходи до визначення дублікатів текстових документів. Здійснена програмна реалізація
основних покажчиків подібності текстів. Представлено алгоритм шинглу та його програмна реалізація.
Програмно реалізовано алгоритм автоматизації пошуку нечітких дублікатів. Отримане програмне забезпечення
перевірено на тестових прикладах.

Опубліковано
2023-02-27
Розділ
Статті