Tento článek je zrcadlovým článkem o strojovém překladu, klikněte zde pro přechod na původní článek.

Pohled: 1664|Odpověď: 3

Dvě běžně používané datové sady pro detekci objektů, COCO a VOC

[Kopírovat odkaz]
Zveřejněno 30.10.2024 22:35:37 | | |
Problémy k vyřešení:

Co je to datová sada?
Co jsou COCO a VOC?
Jaký formát to je?

Otázka 1: Co je to datová sada?

Datová sada je doslova sbírka dat.
Datové sady obvykle obsahují vzorková data používaná k trénování a validaci modelu, což může být ve formě čísel, textu, obrázků, zvuku nebo videa.
Datové sady se používají k trénování algoritmických modelů, což umožňuje modelu naučit se vzory a vzory v datech.
Datové sady se obvykle dělí na:Tréninková sada, validační sada a testovací sadaTři podmnožiny.
Trénovací sada slouží k trénování modelu strojového učení, validační sada k výběru a úpravě hyperparametrů a struktury modelu a testovací sada k hodnocení výkonu a přesnosti modelu.
Trénovací sady, validační sady a testovací sady jsou běžně chápány:
Tréninková sada: Stejně jako lekce pro studenty používáme tato data k tomu, abychom strojové modely naučili, jak rozpoznávat a zpracovávat informace.
Validační sady: Je to jako dát studentům kvíz, abyste zjistili, jak dobře se model učí a co je potřeba upravit.
Testovací sada: Je to jako dát studentům závěrečnou zkoušku a použít tato data k konečnému hodnocení výkonu modelu a zjistit, zda se učí dobře.

Otázka 2: Co jsou COCO a VOC?

COCO (Common Objects in Context) a VOC (Visual Object Classes) jsou dvě známé datové sady v oblasti počítačového vidění, které se široce používají při rozpoznávání obrazů a detekci objektů.


Vytvářet:


Datová sada COCO byla vytvořena společností Microsoft Research.
Datová sada VOC byla vytvořena skupinou pro počítačové vidění na Oxfordské univerzitě ve Spojeném království.


Představit:


COCO je rozsáhlá datová sada pro rozpoznávání obrázků, segmentaci a generování popisků.
Obsahuje přes 91 000 obrázků, každý s podrobným označením a segmentací.
Datová sada COCO klade důraz na kontext objektů v přírodních scénách, tj. objekty se často objevují spolu s jinými objekty a mají složité scény a pozadí.
Datové sady COCO se běžně používají k hodnocení výkonu úkolů, jako je detekce objektů, segmentace obrázků a generování popisků obrázků.
VOC je starší datová sada pro rozpoznávání obrazů a detekci objektů.
Obsahuje 20 000 obrázků v přibližně 20 kategoriích, z nichž každá má přesné označení oblastí a kategorie.
Datové sady VOC se více zaměřují na identifikaci kategorií a detekci objektů než na kontext obrázků.
VOC Challenge je důležitá soutěž v oblasti počítačového vidění, která podporuje vývoj technologie detekce objektů a rozpoznávání obrazu.

Zvláštnost:

Datové sady VOC se vyznačují tím, že poskytují velmi přesnou anotaci, zejména při úkolech detekce objektů. Objekty na každém obrázku jsou přesně označeny obdélníkovým rámečkem a každý objekt má kategorizační štítek. Tato přesná anotace činí datové sady VOC ideálními pro trénink a testování algoritmů detekce objektů, protože se mohou naučit přesně identifikovat a lokalizovat objekty na obrázcích.
Zatímco dataset COCO také poskytuje podrobné poznámky, zaměřuje se na širší rozpoznávání obrázků a porozumění scénám. Anotace v COCO zahrnují detekci objektů, segmentaci a generování titulků. To znamená, že data COCO zahrnují nejen obdélníkový box objektu, ale také složitější informace o scéně a vztahy mezi objekty. Proto je dataset COCO vhodnější pro trénink a testování pokročilejších úloh počítačového vidění, jako je porozumění scénám, generování popisků obrázků atd.

Shrnutí: VOC lze identifikovat a lokalizovat rychleji a přesněji, hlavně díky tomu, že jeho metoda anotace je velmi vhodná pro úkoly detekce objektů, zatímco COCO poskytuje bohatší informace o scéně a je vhodný pro složitější vizuální úkoly. Oba mají své vlastní zaměření a jsou velmi důležitými datovými sadami ve výzkumu počítačového vidění.

Otázka 3: Jaké mají formáty?

  • Formát označování VOC datových sad je XML. Každý obrázek odpovídá XML souboru.
  • Formát označování COCO datové sady je JSON nebo txt. Všechny anotace cílových políček jsou ve stejném JSON nebo txt.


Původní:Přihlášení k hypertextovému odkazu je viditelné.




Předchozí:Windows instalují nástroj pro správu prostředí Conda
Další:MikroTik (2) zakazuje zařízení přístup do externí sítě, pouze interní přístup do sítě
 Pronajímatel| Zveřejněno 01.11.2024 11:39:47 |
Datová sada Coco je JSON soubor, který obsahuje celkem 5 částí.

{
    "info": info, # základní informace o datové sadě
    "licence": [licence], # licence
    "obrázky": [obrázek], # informace o obrázku, název a výška
    "anotace": [anotace], # anotace
    "kategorie": [kategorie] # informace o značce
}
info{ # Popis informací datové sady
    "rok": int, # rok datové sady
    "verze": str, # dataset verze
    "Description": str, # Popis datové sady
    "Contributor": str, # Dataset Provider
    "URL": str, # odkaz ke stažení datové sady
    "date_created": datetime, # datum vytvoření datové sady
}
license{
    "id": int,
    "Jméno": str,
    "URL": str,
}
image{ # images je seznam, který uchovává všechny informace o image (dict). Image je diktát, který uchovává informace o jednom obrázku
    "id": int, # ID číslo obrázku (unikátní pro každé ID obrázku)
    "width": int, # image width
    "výška": int, # výška obrazu
    "file_name": str, # název obrázku
    "licence": int, # dohoda
    "flickr_url": str, # Flickr odkazová adresa
    "coco_url": str, # síťová adresa připojení
    "date_captured": datetime, # dataset fetch date
}
Annotation{ # Annotations je seznam, který uchovává veškeré informace o dict. Anotace je diktát, který uchovává jedinou cílovou anotační informaci.
    "id": int, # ID cílového objektu (unikátní pro každé ID objektu), každý obrázek může mít více cílů
    "image_id": int, # odpovídá ID obrazu
    "category_id": int, # odpovídá kategorii ID, odpovídající ID v kategoriích
    "segmentace": RLE nebo [polygon], # instance segmentace, hraniční souřadnice objektu [x1,y1,x2,y2,....,xn,yn]
    "oblast": float, # Plocha objektové oblasti
    "bbox": [xmin,ymin,width,height], # detekce objektů, hranice polohování objektu [x,y,w,h]
    "iscrowd": 0 nebo 1, # označuje, zda jde o dav nebo ne
}
categories{ # Popis kategorie
    "id": int, # ID odpovídající kategorii (0 výchozí na pozadí)
    "Name": str, # název podkategorie
    "Superkategorie": str, # Hlavní název kategorie
}



Odkaz:

Přihlášení k hypertextovému odkazu je viditelné.
Přihlášení k hypertextovému odkazu je viditelné.
Přihlášení k hypertextovému odkazu je viditelné.
Přihlášení k hypertextovému odkazu je viditelné.

 Pronajímatel| Zveřejněno 11.11.2024 9:16:46 |
 Pronajímatel| Zveřejněno 11.11.2024 11:43:50 |
.NET/C# vypočítá plochu mnohoúhelníku
https://www.itsvse.com/thread-10870-1-1.html
Zřeknutí se:
Veškerý software, programovací materiály nebo články publikované organizací Code Farmer Network slouží pouze k učení a výzkumu; Výše uvedený obsah nesmí být používán pro komerční ani nelegální účely, jinak nesou všechny důsledky uživatelé. Informace na tomto webu pocházejí z internetu a spory o autorská práva s tímto webem nesouvisí. Musíte výše uvedený obsah ze svého počítače zcela smazat do 24 hodin od stažení. Pokud se vám program líbí, podporujte prosím originální software, kupte si registraci a získejte lepší skutečné služby. Pokud dojde k jakémukoli porušení, kontaktujte nás prosím e-mailem.

Mail To:help@itsvse.com