Acest articol este un articol oglindă al traducerii automate, vă rugăm să faceți clic aici pentru a sări la articolul original.

Vedere: 1664|Răspunde: 3

Două seturi de date utilizate frecvent pentru detectarea obiectelor, COCO și VOC

[Copiază linkul]
Postat pe 30.10.2024 22:35:37 | | |
Probleme de rezolvat:

Ce este un set de date?
Ce sunt COCO și COV-uri?
Ce format au?

Întrebarea 1: Ce este un set de date?

Un set de date, la propriu, este o colecție de date.
Seturile de date conțin de obicei date de probă folosite pentru antrenarea și validarea modelului, care pot fi sub formă de cifre, text, imagini, audio sau video.
Seturi de date sunt folosite pentru antrenarea modelelor algoritmice, permițând modelului să învețe tipare și tipare din date.
Seturile de date sunt de obicei împărțite în:Set de antrenament, set de validare și set de testTrei subseturi.
Setul de antrenament este folosit pentru a antrena modelul de învățare automată, setul de validare este folosit pentru a selecta și ajusta hiperparametrii și structura modelului, iar setul de testare este folosit pentru a evalua performanța și acuratețea modelului.
Seturi de antrenament, seturi de validare și seturi de test sunt înțelese în mod obișnuit:
Set de antrenament: La fel ca o lecție pentru elevi, folosim aceste date pentru a învăța modelele de învățare automată cum să recunoască și să proceseze informațiile.
Seturi de validare: Este ca și cum le-ai da elevilor un test pentru a verifica cât de bine învață modelul și ce trebuie ajustat.
Set de teste: Este ca și cum le-ai da elevilor un examen final, folosind aceste date pentru a evalua în sfârșit performanța modelului și a vedea dacă învață bine.

Întrebarea 2: Ce sunt COCO și VOC?

COCO (Common Objects in Context) și VOC (Visual Object Classes) sunt două seturi de date bine cunoscute în domeniul viziunii computerizate, utilizate pe scară largă în sarcinile de recunoaștere a imaginilor și detectarea obiectelor.


Crea:


Setul de date COCO a fost creat de Microsoft Research.
Setul de date VOC a fost creat de grupul de viziune computerizată de la Universitatea Oxford din Regatul Unit.


Prezenta:


COCO este un set de date la scară largă pentru recunoașterea imaginilor, segmentare și generarea de subtitrări.
Conține peste 91.000 de imagini, fiecare cu etichetare și segmentare detaliate.
Setul de date COCO pune accent pe contextul obiectelor din scene naturale, adică obiectele apar adesea împreună cu alte obiecte și au scene și fundaluri complexe.
Seturile de date COCO sunt utilizate frecvent pentru a evalua performanța unor sarcini precum detectarea obiectelor, segmentarea imaginilor și generarea de subtitrări imagini.
VOC este un set de date mai vechi pentru recunoașterea imaginilor și detectarea obiectelor.
Conține 20.000 de imagini în aproximativ 20 de categorii, fiecare cu apeluri precise de zonă și etichete de categorie.
Seturile de date VOC se concentrează mai mult pe identificarea categoriilor și detectarea obiectelor decât pe contextul imaginilor.
VOC Challenge este o competiție importantă în domeniul viziunii computerizate, care promovează dezvoltarea tehnologiei de detectare a obiectelor și recunoaștere a imaginilor.

Particularitate:

Seturile de date VOC se caracterizează prin faptul că oferă adnotări foarte precise, în special în sarcinile de detectare a obiectelor. Obiectele din fiecare imagine sunt etichetate precis cu o cutie dreptunghiulară, iar fiecare obiect are o etichetă de categorie. Această adnotare precisă face ca seturile de date VOC să fie ideale pentru antrenarea și testarea algoritmilor de detectare a obiectelor, deoarece acestea pot învăța cum să identifice și să localizeze cu acuratețe obiecte în imagini.
Deși setul de date COCO oferă și adnotări detaliate, el se concentrează pe recunoașterea mai largă a imaginilor și înțelegerea scenelor. Adnotările din COCO includ detectarea obiectelor, segmentarea și generarea subtitrărilor. Aceasta înseamnă că datele COCO includ nu doar cutia dreptunghiulară a obiectului, ci și informații mai complexe despre scene și relații între obiecte. Prin urmare, setul de date COCO este mai potrivit pentru antrenarea și testarea unor sarcini de viziune computerizată mai avansate, cum ar fi înțelegerea scenelor, generarea de subtitrări de imagini etc.

Rezumat: VOC poate fi identificat și localizat mai rapid și mai precis, în principal deoarece metoda sa de adnotare este foarte potrivită pentru sarcini de detectare a obiectelor, în timp ce COCO oferă informații mai bogate despre scene și este potrivit pentru sarcini vizuale mai complexe. Ambele au propriile domenii și sunt seturi de date foarte importante în cercetarea în viziunea computerizată.

Întrebarea 3: Care sunt formatele lor?

  • Formatul de etichetare al seturilor de date VOC este XML. Fiecare imagine corespunde unui fișier XML.
  • Formatul de etichetare al setului de date COCO este JSON sau txt. Toate adnotările casetelor țintă sunt în același JSON sau txt.


Original:Autentificarea cu hyperlink este vizibilă.




Precedent:Windows instalează instrumentul de gestionare a mediului Conda
Următor:MikroTik (2) interzice accesul unui dispozitiv la rețeaua externă, doar accesul la rețeaua internă
 Proprietarul| Postat pe 01.11.2024 11:39:47 |
Setul de date Coco este un fișier JSON care conține în total 5 părți.

{
    "info": info, # informații de bază despre setul de date
    "Licențe": [Licență], # Licență
    "Imagini": [Imagine], # Informații despre imagine, nume și înălțime
    "adnotări": [adnotare], # adnotare
    "Categorii": [Categorie] # Informații despre etichetă
}
info{ # Descrierea informațiilor setului de date
    "an": int, # set year
    "version": str, # dataset version
    "Descriere": STR, # descrierea setului de date
    "contributor": str, # furnizor de seturi de date
    "URL": str, # link de descărcare setul de date
    "date_created": data-oră, # data creării setului de date
}
license{
    "id": int,
    "Nume": strâng,
    "URL": str,
}
Image{ # Images este o listă care stochează toate informațiile despre imagine (dict). Imaginea este un dict care stochează informații despre o singură imagine
    "id": int, # numărul ID al imaginii (unic pentru fiecare ID de imagine)
    "lățime": int, # lățimea imaginii
    "înălțime": int, # înălțimea imaginii
    "file_name": str, # nume imagine
    "Licență": int, # Acord
    "flickr_url": str, # adresa linkului flickr
    "coco_url": str, # adresa conexiunii de rețea
    "date_captured": data-oră, # data de preluare a setului de date
}
Annotation{ # Annotations este o listă care stochează toate informațiile despre dict. O adnotare este un dict care stochează o singură informație de adnotare țintă.
    "id": int, # ID obiect țintă (unic pentru fiecare ID de obiect), fiecare imagine poate avea mai multe ținte
    "image_id": int, # corespunde ID-ului imaginii
    "category_id": int, # corespunde ID-ului categoriei, corespunzând ID-ului din categorii
    "segmentare": RLE sau [poligon], segmentarea instanței #, coordonatele punctului de frontieră ale obiectului [x1,y1,x2,y2,....,xn,yn]
    "arie": plutind, # Aria zonei obiectului
    "bbox": [xmin,ymin,width,height], # detectare obiect, poziționare a obiectului[x,y,w,h]
    "iscrowd": 0 sau 1, # indică dacă este o mulțime sau nu
}
categorii{ # Descriere de categorie
    "id": int, # ID-ul corespunzător categoriei (0 este implicit în fundal)
    "name": str, # nume subcategorie
    "supercategorie": str, # numele categoriei principale
}



Referință:

Autentificarea cu hyperlink este vizibilă.
Autentificarea cu hyperlink este vizibilă.
Autentificarea cu hyperlink este vizibilă.
Autentificarea cu hyperlink este vizibilă.

 Proprietarul| Postat pe 11.11.2024 09:16:46 |
 Proprietarul| Postat pe 11.11.2024 11:43:50 |
.NET/C# calculează aria unui poligon
https://www.itsvse.com/thread-10870-1-1.html
Disclaimer:
Tot software-ul, materialele de programare sau articolele publicate de Code Farmer Network sunt destinate exclusiv scopurilor de învățare și cercetare; Conținutul de mai sus nu va fi folosit în scopuri comerciale sau ilegale, altfel utilizatorii vor suporta toate consecințele. Informațiile de pe acest site provin de pe Internet, iar disputele privind drepturile de autor nu au legătură cu acest site. Trebuie să ștergi complet conținutul de mai sus de pe calculatorul tău în termen de 24 de ore de la descărcare. Dacă îți place programul, te rugăm să susții software-ul autentic, să cumperi înregistrarea și să primești servicii autentice mai bune. Dacă există vreo încălcare, vă rugăm să ne contactați prin e-mail.

Mail To:help@itsvse.com