Tento článok je zrkadlovým článkom o strojovom preklade, kliknite sem pre prechod na pôvodný článok.

Pohľad: 1664|Odpoveď: 3

Dve bežne používané dátové sady na detekciu objektov, COCO a VOC

[Kopírovať odkaz]
Zverejnené 30. 10. 2024 22:35:37 | | |
Problémy na riešenie:

Čo je to dataset?
Čo sú COCO a VOC?
Aký formát to je?

Otázka 1: Čo je to dataset?

Dátová sada je doslova zbierka dát.
Dátové súbory zvyčajne obsahujú ukážkové dáta používané na trénovanie a validáciu modelu, ktoré môžu mať podobu čísel, textu, obrázkov, zvuku alebo videa.
Dátové súbory sa používajú na trénovanie algoritmických modelov, čo umožňuje modelu učiť sa vzory a vzory v dátach.
Dátové súbory sa zvyčajne delia na:Trénovací súbor, validačný súbor a testovací súborTri podmnožiny.
Trénovací súbor sa používa na trénovanie modelu strojového učenia, validačný súbor na výber a úpravu hyperparametrov a štruktúry modelu a testovací súbor sa používa na hodnotenie výkonu a presnosti modelu.
Trénovacie množiny, validačné množiny a testovacie množiny sa bežne chápu:
Tréningová sada: Rovnako ako lekcia pre študentov, používame tieto dáta na výučbu strojového učenia modelov, ako rozpoznávať a spracovávať informácie.
Validačné množiny: Je to ako dať študentom kvíz, aby ste zistili, ako dobre sa model učí a čo je potrebné upraviť.
Testovací súbor: Je to ako dať študentom záverečnú skúšku a použiť tieto dáta na konečné vyhodnotenie výkonu modelu a zistiť, či sa učí dobre.

Otázka 2: Čo sú COCO a VOC?

COCO (Common Objects in Context) a VOC (Visual Object Classes) sú dve dobre známe dátové sady v oblasti počítačového videnia, ktoré sa široko používajú pri rozpoznávaní obrazov a detekcii objektov.


Vytvoriť:


Dátová sada COCO bola vytvorená spoločnosťou Microsoft Research.
Súbor VOC vytvorila skupina počítačového videnia na Oxfordskej univerzite vo Veľkej Británii.


Zavádzať:


COCO je veľkoformátový dataset na rozpoznávanie obrázkov, segmentáciu a generovanie titulkov.
Obsahuje viac ako 91 000 obrázkov, každý s podrobným označením a segmentáciou.
COCO dataset kladie dôraz na kontext objektov v prírodných scénach, t. j. objekty sa často objavujú spolu s inými objektmi a majú zložité scény a pozadia.
COCO datasety sa bežne používajú na hodnotenie výkonu úloh, ako je detekcia objektov, segmentácia obrázkov a generovanie popisov obrázkov.
VOC je staršia dátová sada na rozpoznávanie obrázkov a detekciu objektov.
Obsahuje 20 000 obrázkov v približne 20 kategóriách, z ktorých každá má presné označenie oblastí a označenia kategórií.
Dátové súbory VOC sa viac zameriavajú na identifikáciu kategórií a detekciu objektov než na kontext obrázkov.
VOC Challenge je dôležitá súťaž v oblasti počítačového videnia, ktorá podporuje vývoj technológií detekcie objektov a rozpoznávania obrazu.

Zvláštnosť:

Dátové súbory VOC sa vyznačujú tým, že poskytujú veľmi presnú anotáciu, najmä pri úlohách detekcie objektov. Objekty na každom obrázku sú presne označené obdĺžnikovým rámčekom a každý objekt má kategóriu označenie. Táto presná anotácia robí dátové súbory VOC ideálnymi na trénovanie a testovanie algoritmov detekcie objektov, pretože sa môžu naučiť presne identifikovať a lokalizovať objekty na obrázkoch.
Hoci COCO dataset tiež poskytuje podrobné poznámky, zameriava sa na širšie rozpoznávanie obrázkov a porozumenie scénam. Anotácie v COCO zahŕňajú detekciu objektov, segmentáciu a generovanie titulkov. To znamená, že dáta COCO zahŕňajú nielen obdĺžnikový box objektu, ale aj zložitejšie informácie o scéne a vzťahy medzi objektmi. Preto je COCO dataset vhodnejší na trénovanie a testovanie pokročilejších úloh počítačového videnia, ako je porozumenie scénam, generovanie popisov obrázkov a podobne.

Zhrnutie: VOC je možné identifikovať a lokalizovať rýchlejšie a presnejšie, hlavne preto, že jeho metóda anotácie je veľmi vhodná pre úlohy detekcie objektov, zatiaľ čo COCO poskytuje bohatšie informácie o scéne a je vhodný pre zložitejšie vizuálne úlohy. Obe majú svoje vlastné zamerania a sú veľmi dôležitými dátovými súbormi vo výskume počítačového videnia.

Otázka 3: Aké majú formáty?

  • Formát označovania VOC dátových súborov je XML. Každý obrázok zodpovedá XML súboru.
  • Formát označovania COCO datasetu je JSON alebo txt. Všetky anotácie cieľových políčok sú v tom istom JSON alebo txt.


Originál:Prihlásenie na hypertextový odkaz je viditeľné.




Predchádzajúci:Windows nainštalujú nástroj na správu prostredia Conda
Budúci:MikroTik (2) zakazuje zariadeniu prístup do externej siete, iba prístup do internej siete
 Prenajímateľ| Zverejnené 1. 11. 2024 11:39:47 |
Dataset Coco je JSON súbor, ktorý obsahuje celkovo 5 častí.

{
    "info": info, # základné informácie o datasete
    "licencie": [licencia], # licencia
    "obrázky": [obrázok], # informácie o obrázku, názov a výška
    "anotácie": [anotácia], # anotácia
    "kategórie": [kategória] # informácie o značkách
}
info{ # Opis informácií o datasete
    "rok": int, # rok datasetu
    "version": str, # dataset version
    "Description": str, # Popis dátovej sady
    "Contributor": str, # Dataset Provider
    "URL": str, # odkaz na stiahnutie datasetu
    "date_created": dátum času, # dátum vytvorenia dátovej sady
}
licencia{
    "id": int,
    "meno": str,
    "URL": str,
}
image{ # images je zoznam, ktorý uchováva všetky informácie o obrázku (dict). obraz je diktát, ktorý uchováva informácie o jednom obrázku
    "id": int, # ID číslo obrázka (jedinečné pre každé ID obrázka)
    "width": int, # image width
    "výška": int, # výška obrazu
    "file_name": str, # názov obrázka
    "licencia": int, # dohoda
    "flickr_url": str, # Flickr odkazová adresa
    "coco_url": str, # adresa sieťového pripojenia
    "date_captured": dátumčas, # dátum načítania dátovej sady
}
Annotation{ # Annotations je zoznam, ktorý uchováva všetky informácie o dikte. Anotácia je diktát, ktorý uchováva jednu cieľovú informáciu anotácie.
    "id": int, # ID cieľového objektu (jedinečné pre každé ID objektu), každý obrázok môže mať viacero cieľov
    "image_id": int, # zodpovedá ID obrazu
    "category_id": int, # zodpovedá ID kategórie, ktoré zodpovedá ID v kategóriách
    "segmentácia": RLE alebo [polygon], # inštancia segmentácie, hraničné súradnice objektu [x1,y1,x2,y2,....,xn,yn]
    "area": float, # Plocha objektovej oblasti
    "bbox": [xmin,ymin,width,height], # detekcia objektov, okraj polohovania objektu [x,y,w,h]
    "iscrowd": 0 alebo 1, # označuje, či ide o dav alebo nie
}
kategórie{ # Popis kategórie
    "id": int, # ID zodpovedajúce kategórii (0 predvolene na pozadie)
    "meno": str, # názov podkategórie
    "superkategória": str, # hlavný názov kategórie
}



Referencia:

Prihlásenie na hypertextový odkaz je viditeľné.
Prihlásenie na hypertextový odkaz je viditeľné.
Prihlásenie na hypertextový odkaz je viditeľné.
Prihlásenie na hypertextový odkaz je viditeľné.

 Prenajímateľ| Zverejnené 11. 11. 2024 9:16:46 |
 Prenajímateľ| Zverejnené 11. 11. 2024 11:43:50 |
.NET/C# vypočíta plochu mnohouholníka
https://www.itsvse.com/thread-10870-1-1.html
Vyhlásenie:
Všetok softvér, programovacie materiály alebo články publikované spoločnosťou Code Farmer Network slúžia len na vzdelávacie a výskumné účely; Vyššie uvedený obsah nesmie byť použitý na komerčné alebo nezákonné účely, inak nesú všetky následky používateľmi. Informácie na tejto stránke pochádzajú z internetu a spory o autorské práva s touto stránkou nesúvisia. Musíte úplne vymazať vyššie uvedený obsah zo svojho počítača do 24 hodín od stiahnutia. Ak sa vám program páči, podporte originálny softvér, zakúpte si registráciu a získajte lepšie originálne služby. Ak dôjde k akémukoľvek porušeniu, kontaktujte nás prosím e-mailom.

Mail To:help@itsvse.com