Wprowadzenie: convert_imageset to narzędzie do konwersji obrazów dostarczane przez Caffe, które umożliwia konwersję zestawów obrazów treningowych i walidacyjnych na zbiory danych lmdb lub leveldb, które Caffe może łatwo przetwarzać.
Metoda aplikacji: Narzędzie jest używane w formie wiersza poleceń, sformatowane następująco: convert_imageset [FLAGI] ROOTFOLDER/ LISTFILE DB_NAME Wśród nich DB_NAME możesz także ustawić opcjonalne parametry, zobacz "Sekcję ustawień parametrów opcjonalnych" dla konkretnych parametrów gdzie ROOTFOLDER jest katalogiem głównym zbioru obrazów LISTFILE to ścieżka pliku, która rejestruje ścieżkę oraz odpowiadające im adnotacje każdego wzorca w zbiorze obrazów DB_NAME nazwę bazy danych, którą ma się wygenerować
Na przykład: convert_imageset ImgSetRootDir/ ImgFileList.txt imgSet.lmdb Żadna z linii w ImgFileList.txt (czyli LISTFILE) nie zawiera informacji o obrazie, na przykład: podfolder1/plik1. JPEG 7 gdzie podfolder1/plik1. JPEG to ścieżka obrazu, 7 to kategoria obrazu, a w środku jest spacja
Opcjonalne ustawienia parametrów
- gray:bool type, domyślnie false, jeśli ustawiono na true, oznacza to, że obraz jest traktowany jako obraz w skali szarości, w przeciwnym razie jako obraz kolorowy
- Tasowanie:Bool type, domyślnie false, a jeśli ustawione na true, oznacza losowe tasowanie kolejności obrazów w zbiorze obrazów
- backend:string type, zbiór wartości, które można przyjąć, to {"lmdb", "leveldb"}, a domyślnie "lmdb", co reprezentuje formę, w jakiej przechowywane są przekonwertowane dane
- resize_width: typ int32, domyślna wartość to 0, jeśli jest to wartość nie-0, oznacza to, że szerokość obrazu zostanie zmniejszona do resize_width
- resize_height: int32 type, domyślna wartość to 0, jeśli jest to wartość nie-0, oznacza to, że wysokość obrazu zostanie zmniejszona do resize_height
- check_size:bool type, domyślna wartość jest fałszywa; jeśli wartość jest prawdziwa, dane zostaną sprawdzone, czy każdy element danych ma ten sam rozmiar podczas przetwarzania danych
- zakodowany:typ bool, wartość domyślna jest fałszywa, jeśli jest prawdziwa, oznacza to, że zakodowany obraz zostanie zapisany, a konkretna metoda kodowania jest określana przez parametr encode_type
- encode_type: typ ciągu znaków, domyślna wartość to "", która służy do określenia zakodowanego obrazu do przechowywania, a wartość ta to sufiks metody kodowania (np. 'png', 'jpg',...)
Polecenia z parametrami: convert_imageset ImgSetRootDir/ ImgFileList.txt imgSet.lmdb --gray=true --resize_width=160 --resize_height=160
Na koniec dołącz skrypt nietoperza:
make-lmdb.bat
(875 Bytes, Liczba pobranych plików: 0)
|