Einleitung: convert_imageset ist ein von Caffe bereitgestelltes Bildkonvertierungstool, das Trainings- und Validierungsbildsets in LMDB- oder Leveldb-Datensätze umwandelt, die Caffe leicht verarbeiten kann.
Anwendungsmethode: Das Werkzeug wird in einer Kommandozeile verwendet, die wie folgt formatiert ist: convert_imageset [MARKIERUNGEN] ROOTORDNER/ LISTENFILE DB_NAME Unter anderem DB_NAME du auch einige optionale Parameter festlegen kannst, siehe den Abschnitt "Optionale Parametereinstellungen" für spezifische optionale Parameter wobei ROOTFOLDER das Root-Verzeichnis des Bildsets ist LISTFILE ist der Pfad einer Datei, der den Pfad und die entsprechenden Annotationen jedes Musters im Bildsatz aufzeichnet DB_NAME den Namen der zu generierenden Datenbank
Zum Beispiel: convert_imageset ImgSetRootDir/ ImgFileList.txt imgSet.lmdb Keine der Zeilen im ImgFileList.txt (d. h. LISTFILE) gibt Informationen über ein Bild an, wie zum Beispiel: subfolder1/file1. JPEG 7 wobei Unterordner1/Datei1. JPEG ist der Bildpfad, 7 ist die Kategorie des Bildes, und es gibt einen Leerraum in der Mitte
Optionale Parametereinstellungen
- Grau:Bool-Typ, standardmäßig auf False, wenn auf true gesetzt, bedeutet das, dass das Bild als Graustufenbild behandelt wird, andernfalls als Farbbild
- Shuffle:bool type, standardmäßig auf false gesetzt, und wenn auf true gesetzt, bedeutet das, dass die Reihenfolge der Bilder im Bildset zufällig gemischt wird
- Backend:String-Typ, die Sammlung der Werte, die genommen werden kann, ist {"lmdb", "leveldb"}, und der Standard ist "lmdb", was die Form darstellt, in der die konvertierten Daten gespeichert sind
- resize_width: int32-Typ, der Standardwert ist 0, wenn es sich um einen Nicht-0-Wert handelt, bedeutet das, dass die Bildbreite auf resize_width
- resize_height: int32-Typ, der Standardwert ist 0, wenn es sich um einen Nicht-0-Wert handelt, bedeutet das, dass die Bildhöhe auf resize_height
- check_size:bool-Typ, der Standardwert ist falsch; wenn der Wert wahr ist, werden die Daten überprüft, um zu sehen, ob jedes Datenstück bei der Verarbeitung die gleiche Größe hat
- Encoded:Bool-Typ, der Standardwert ist falsch; wenn wahr, bedeutet das, dass das codierte Bild gespeichert wird und die spezifische Kodierungsmethode durch den Parameter encode_type angegeben wird
- encode_type: Zeichenkettentyp, der Standardwert ist "", der verwendet wird, um das zu speichernde codierte Bild zu spezifizieren, und der Wert ist das Suffix der Codierungsmethode (z. B. 'png', 'jpg',...)
Befehle mit Parametern: convert_imageset ImgSetRootDir/ ImgFileList.txt imgSet.lmdb --gray=true --resize_width=160 --resize_height=160
Zum Schluss fügen Sie das Fledermausskript an:
make-lmdb.bat
(875 Bytes, Anzahl der Downloads: 0)
|