Αυτό το άρθρο είναι ένα άρθρο καθρέφτη της αυτόματης μετάφρασης, κάντε κλικ εδώ για να μεταβείτε στο αρχικό άρθρο.

Άποψη: 1664|Απάντηση: 3

Δύο σύνολα δεδομένων που χρησιμοποιούνται συνήθως για την ανίχνευση αντικειμένων, το COCO και το VOC

[Αντιγραφή συνδέσμου]
Δημοσιεύτηκε στις 30/10/2024 10:35:37 μ.μ. | | |
Προβλήματα προς επίλυση:

Τι είναι ένα σύνολο δεδομένων;
Τι είναι το COCO και οι πτητικές οργανικές ενώσεις;
Τι μορφή έχουν;

Ε1: Τι είναι ένα σύνολο δεδομένων;

Ένα σύνολο δεδομένων, κυριολεκτικά, είναι μια συλλογή δεδομένων.
Τα σύνολα δεδομένων συνήθως περιέχουν δείγματα δεδομένων που χρησιμοποιούνται για την εκπαίδευση και την επικύρωση του μοντέλου, τα οποία μπορεί να έχουν τη μορφή αριθμών, κειμένου, εικόνων, ήχου ή βίντεο.
Τα σύνολα δεδομένων χρησιμοποιούνται για την εκπαίδευση αλγοριθμικών μοντέλων, επιτρέποντας στο μοντέλο να μάθει μοτίβα και μοτίβα στα δεδομένα.
Τα σύνολα δεδομένων συνήθως χωρίζονται σε:Σετ εκπαίδευσης, σύνολο επικύρωσης και σύνολο δοκιμώνΤρία υποσύνολα.
Το σύνολο εκπαίδευσης χρησιμοποιείται για την εκπαίδευση του μοντέλου μηχανικής μάθησης, το σύνολο επικύρωσης χρησιμοποιείται για την επιλογή και προσαρμογή των υπερπαραμέτρων και της δομής του μοντέλου και το σύνολο δοκιμής χρησιμοποιείται για την αξιολόγηση της απόδοσης και της ακρίβειας του μοντέλου.
Τα σετ εκπαίδευσης, τα σύνολα επικύρωσης και τα σύνολα δοκιμών είναι συνήθως κατανοητά:
Σετ εκπαίδευσης: Ακριβώς όπως ένα μάθημα για μαθητές, χρησιμοποιούμε αυτά τα δεδομένα για να διδάξουμε στα μοντέλα μηχανικής μάθησης πώς να αναγνωρίζουν και να επεξεργάζονται πληροφορίες.
Σετ επικύρωσης: Είναι σαν να δίνετε στους μαθητές ένα κουίζ για να ελέγξουν πόσο καλά μαθαίνει το μοντέλο και να δουν τι πρέπει να προσαρμοστεί.
Σετ δοκιμής: Είναι σαν να δίνετε στους μαθητές μια τελική εξέταση, χρησιμοποιώντας αυτά τα δεδομένα για να αξιολογήσετε τελικά την απόδοση του μοντέλου για να δείτε αν μαθαίνει καλά.

Ε2: Τι είναι το COCO και το VOC;

Το COCO (Common Objects in Context) και το VOC (Visual Object Classes) είναι δύο γνωστά σύνολα δεδομένων στον τομέα της όρασης υπολογιστών, τα οποία χρησιμοποιούνται ευρέως σε εργασίες αναγνώρισης εικόνας και ανίχνευσης αντικειμένων.


Δημιουργώ:


Το σύνολο δεδομένων COCO δημιουργήθηκε από τη Microsoft Research.
Το σύνολο δεδομένων VOC δημιουργήθηκε από την ομάδα υπολογιστικής όρασης στο Πανεπιστήμιο της Οξφόρδης στο Ηνωμένο Βασίλειο.


Εισάγω:


Το COCO είναι ένα σύνολο δεδομένων μεγάλης κλίμακας για την αναγνώριση εικόνων, την τμηματοποίηση και τη δημιουργία λεζάντας.
Περιέχει πάνω από 91,000 εικόνες, η καθεμία με λεπτομερή επισήμανση και τμηματοποίηση.
Το σύνολο δεδομένων COCO δίνει έμφαση στο πλαίσιο των αντικειμένων σε φυσικές σκηνές, δηλαδή, τα αντικείμενα εμφανίζονται συχνά με άλλα αντικείμενα και έχουν πολύπλοκες σκηνές και φόντο.
Τα σύνολα δεδομένων COCO χρησιμοποιούνται συνήθως για την αξιολόγηση της απόδοσης εργασιών όπως η ανίχνευση αντικειμένων, η τμηματοποίηση εικόνων και η δημιουργία λεζάντας εικόνων.
Το VOC είναι ένα παλαιότερο σύνολο δεδομένων αναγνώρισης εικόνας και ανίχνευσης αντικειμένων.
Περιέχει 20.000 εικόνες σε περίπου 20 κατηγορίες, καθεμία με ακριβείς επεξηγήσεις περιοχής και ετικέτες κατηγοριών.
Τα σύνολα δεδομένων VOC εστιάζουν περισσότερο στην αναγνώριση κατηγοριών και στην ανίχνευση αντικειμένων παρά στο πλαίσιο των εικόνων.
Το VOC Challenge είναι ένας σημαντικός διαγωνισμός στον τομέα της όρασης υπολογιστών, ο οποίος προωθεί την ανάπτυξη της τεχνολογίας ανίχνευσης αντικειμένων και αναγνώρισης εικόνας.

Ιδιορρυθμία:

Τα σύνολα δεδομένων VOC χαρακτηρίζονται από το γεγονός ότι παρέχουν πολύ ακριβή σχολιασμό, ειδικά σε εργασίες ανίχνευσης αντικειμένων. Τα αντικείμενα σε κάθε εικόνα επισημαίνονται με ακρίβεια με ένα ορθογώνιο πλαίσιο και κάθε αντικείμενο έχει μια ετικέτα κατηγορίας. Αυτός ο ακριβής σχολιασμός καθιστά τα σύνολα δεδομένων VOC ιδανικά για εκπαίδευση και δοκιμή αλγορίθμων ανίχνευσης αντικειμένων, καθώς μπορούν να μάθουν πώς να αναγνωρίζουν και να εντοπίζουν με ακρίβεια αντικείμενα σε εικόνες.
Ενώ το σύνολο δεδομένων COCO παρέχει επίσης λεπτομερείς σχολιασμούς, εστιάζει στην ευρύτερη αναγνώριση εικόνας και στην κατανόηση σκηνής. Οι σχολιασμοί στο COCO περιλαμβάνουν ανίχνευση αντικειμένων, τμηματοποίηση και δημιουργία υποτίτλων. Αυτό σημαίνει ότι τα δεδομένα της COCO περιλαμβάνουν όχι μόνο το ορθογώνιο πλαίσιο του αντικειμένου, αλλά και πιο σύνθετες πληροφορίες σκηνής και σχέσεις μεταξύ αντικειμένων. Επομένως, το σύνολο δεδομένων COCO είναι πιο κατάλληλο για εκπαίδευση και δοκιμή πιο προηγμένων εργασιών όρασης υπολογιστή, όπως η κατανόηση σκηνής, η δημιουργία λεζάντας εικόνας κ.λπ.

Περίληψη: Το VOC μπορεί να αναγνωριστεί και να εντοπιστεί πιο γρήγορα και με ακρίβεια, κυρίως επειδή η μέθοδος σχολιασμού του είναι πολύ κατάλληλη για εργασίες ανίχνευσης αντικειμένων, ενώ το COCO παρέχει πλουσιότερες πληροφορίες σκηνής και είναι κατάλληλο για πιο σύνθετες οπτικές εργασίες. Και τα δύο έχουν τις δικές τους εστίες και είναι πολύ σημαντικά σύνολα δεδομένων στην έρευνα της όρασης υπολογιστών.

Ε3: Ποιες είναι οι μορφές τους;

  • Η μορφή επισήμανσης των συνόλων δεδομένων VOC είναι XML. Κάθε εικόνα αντιστοιχεί σε ένα αρχείο XML.
  • Η μορφή επισήμανσης του συνόλου δεδομένων COCO είναι JSON ή txt. Όλοι οι σχολιασμοί του πλαισίου προορισμού είναι στο ίδιο JSON ή txt.


Αρχικός:Η σύνδεση με υπερσύνδεσμο είναι ορατή.




Προηγούμενος:Τα Windows εγκαθιστούν το εργαλείο διαχείρισης περιβάλλοντος Conda
Επόμενος:Το MikroTik (2) απαγορεύει σε μια συσκευή να έχει πρόσβαση στο εξωτερικό δίκτυο, μόνο στην πρόσβαση στο εσωτερικό δίκτυο
 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 1/11/2024 11:39:47 π.μ. |
Το σύνολο δεδομένων Coco είναι ένα αρχείο JSON που περιέχει συνολικά 5 μέρη.

{
    "info": πληροφορίες, # βασικές πληροφορίες σχετικά με το σύνολο δεδομένων
    "licenses": [άδεια], # άδεια
    "images": [εικόνα], # πληροφορίες εικόνας, όνομα και ύψος
    "annotations": [σχολιασμός], # σχολιασμός
    "categories": [κατηγορία] # πληροφορίες ετικέτας
}
info{ # Περιγραφή πληροφοριών συνόλου δεδομένων
    "year": int, # έτος συνόλου δεδομένων
    "version": str, # έκδοση συνόλου δεδομένων
    "description": str, # περιγραφή συνόλου δεδομένων
    "contributor": str, # πάροχος συνόλου δεδομένων
    "url": str, # σύνδεσμος λήψης συνόλου δεδομένων
    "date_created": ημερομηνία/ώρα, # ημερομηνία δημιουργίας συνόλου δεδομένων
}
άδεια{
    "id": int,
    "όνομα": str,
    "url": str,
}
image{ # images είναι μια λίστα που αποθηκεύει όλες τις πληροφορίες εικόνας (dict). Η εικόνα είναι μια υπαγόρευση που αποθηκεύει πληροφορίες για μια μεμονωμένη εικόνα
    "id": int, # αναγνωριστικός αριθμός της εικόνας (μοναδικός για κάθε αναγνωριστικό εικόνας)
    "width": int, # πλάτος εικόνας
    "height": int, # ύψος εικόνας
    "file_name": str, # όνομα εικόνας
    "license": int, # συμφωνία
    "flickr_url": str, # διεύθυνση συνδέσμου flickr
    "coco_url": str, # διεύθυνση σύνδεσης δικτύου
    "date_captured": ημερομηνία/ώρα, # ημερομηνία ανάκτησης συνόλου δεδομένων
}
Το Annotation{ # Annotations είναι μια λίστα που αποθηκεύει όλες τις πληροφορίες υπαγόρευσης. Ένας σχολιασμός είναι μια υπαγόρευση που αποθηκεύει πληροφορίες σχολιασμού ενός στόχου.
    "id": int, # Αναγνωριστικό αντικειμένου προορισμού (μοναδικό για κάθε αναγνωριστικό αντικειμένου), κάθε εικόνα μπορεί να έχει πολλούς στόχους
    "image_id": int, το # αντιστοιχεί στο αναγνωριστικό εικόνας
    "category_id": int, το # αντιστοιχεί στον κωδικό αναγνωριστικού κατηγορίας, που αντιστοιχεί στον κωδικό αναγνωριστικού στις κατηγορίες
    "κατάτμηση": RLE ή [πολύγωνο], # κατάτμηση στιγμιότυπου, οι συντεταγμένες του οριακού σημείου του αντικειμένου [x1,y1,x2,y2,....,xn,yn]
    "area": float, # Το εμβαδόν της περιοχής του αντικειμένου
    "bbox": [xmin,ymin,πλάτος,ύψος], # ανίχνευση αντικειμένου, περίγραμμα τοποθέτησης αντικειμένου[x,y,w,h]
    "iscrowd": 0 ή 1, # υποδηλώνει αν είναι πλήθος ή όχι
}
categories{ # Περιγραφή κατηγορίας
    "id": int, # Το αναγνωριστικό που αντιστοιχεί στην κατηγορία (0 προεπιλογή στο φόντο)
    "name": str, # όνομα υποκατηγορίας
    "supercategory": str, # όνομα κύριας κατηγορίας
}



Αναφορά:

Η σύνδεση με υπερσύνδεσμο είναι ορατή.
Η σύνδεση με υπερσύνδεσμο είναι ορατή.
Η σύνδεση με υπερσύνδεσμο είναι ορατή.
Η σύνδεση με υπερσύνδεσμο είναι ορατή.

 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 11/11/2024 9:16:46 π.μ. |
Μορφή συνόλου δεδομένων COCO:Η σύνδεση με υπερσύνδεσμο είναι ορατή.


 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 11/11/2024 11:43:50 π.μ. |
.NET/C# υπολογίζει το εμβαδόν ενός πολυγώνου
https://www.itsvse.com/thread-10870-1-1.html
Αποκήρυξη:
Όλο το λογισμικό, το υλικό προγραμματισμού ή τα άρθρα που δημοσιεύονται από το Code Farmer Network προορίζονται μόνο για μαθησιακούς και ερευνητικούς σκοπούς. Το παραπάνω περιεχόμενο δεν θα χρησιμοποιηθεί για εμπορικούς ή παράνομους σκοπούς, άλλως οι χρήστες θα υποστούν όλες τις συνέπειες. Οι πληροφορίες σε αυτόν τον ιστότοπο προέρχονται από το Διαδίκτυο και οι διαφορές πνευματικών δικαιωμάτων δεν έχουν καμία σχέση με αυτόν τον ιστότοπο. Πρέπει να διαγράψετε εντελώς το παραπάνω περιεχόμενο από τον υπολογιστή σας εντός 24 ωρών από τη λήψη. Εάν σας αρέσει το πρόγραμμα, υποστηρίξτε γνήσιο λογισμικό, αγοράστε εγγραφή και λάβετε καλύτερες γνήσιες υπηρεσίες. Εάν υπάρχει οποιαδήποτε παραβίαση, επικοινωνήστε μαζί μας μέσω email.

Mail To:help@itsvse.com