File | Date | Author | Commit |
---|---|---|---|
scripts | 2025-04-21 |
![]() |
[3d7e90] poprawa estetyki |
.gitignore | 2025-04-21 |
![]() |
[4a6543] Naprawienie wszystkich aktualnie znanych błędów |
README.md | 2025-04-21 |
![]() |
[3d7e90] poprawa estetyki |
main.py | 2025-04-21 |
![]() |
[ac1aed] Drobne poprawki |
requirements.txt | 2025-04-21 |
![]() |
[66b1d1] Drobne poprawki, usunięcie nieużywanych funkcji... |
Zastosowanie: Głównym celem projektu jest optymalizacja wykorzystania pamięci w graficznych bazach danych poprzez analizę podobieństwa cosinusowego wektorów cech obrazów. Umożliwia identyfikację duplikatów (obrazów bardzo do siebie podobnych), co prowadzi do efektywniejszego zarządzania zasobami.
Program W chwili obecnej program przeszukuje obrazy w katalogu, do którego ścieżka została zapisana w pliku 'Data\settings.txt'. Program zapisuje w katalogu 'Data' wektory cech obrazów, dlatego wymaga dodatkowej pamięci (~1GB na 100 000 obrazów)
Użycie: Program obsługuje się w terminalu. Po piewszym wykonaniu programu, zostaje utworzony katalog Data, w miejscu gdzie zapisany jest program. Aby wybrać ścieżkę do katalogu z obrazami należy w pliku 'settings.txt' zapisać ścieżkę.
Następnie można wykonywać program z: -an, -mnb, -c, -i
-an - Przeszukuje katalog w celu znalezienia nowych obrazów i zapisania ich ścieżek
-mnb - Tworzy serie wektorów cech ze zapisanych ścieżek
-c - Wykonuje sprawdzenie zapisanych serii i kopiuje duplikaty z informacjami do katalogu 'Data\Duplicates'
-i - Wyświetla informacje o programie
Struktura plików
.
├── Data/
│ ├── batch/
│ ├── batch_archives/
│ ├── Duplicates/
│ ├── paths/
│ └── settings.txt
└── Duplicate Finder.exe
numpy
, Pillow
, scikit-learn
, tensorflow
pip install -r requirements.txt
)https://sourceforge.net/projects/duplicate-finder-nkn/
Wszystkie pytania proszę pisać na b.gabka.nkn@gmail.com