Скрипт для поиска похожих файлов в двух различных директориях.
Программа разработана и протестирована только на операционной системе Linux. Она может не работать на других платформах.
git clone https://github.com/tarminik/directory_comparator.git
cd directory_comparator
python3 main.py
Алгоритм сравнивает каждый файл из 1-й директории с каждым файлом из 2-й директории. Это необходимо, чтобы найти все возможные пары похожих файлов.
Сравнение файлов происходит побайтно. За счет этого обеспечивается корректная работа с любыми форматами. Файлы считаются одинаковыми, если они побайтно равны. Похожими, если имеют не менее 80% (этот параметр можно настраивать) одинаковых байт. В остальных случаях -- различными.