Kaksi yleisesti käytettyä aineistoa objektien tunnistamiseen, COCO ja VOC

Pikku roisto · Julkaistu 30.10.2024 22.35.37

Ratkaistavia ongelmia:

Mikä on aineisto?
Mitä ovat COCO ja VOC:t?
Mikä formaatti ne ovat?

K1: Mikä on aineisto?

Aineisto on kirjaimellisesti kokoelma dataa.
Aineistot sisältävät tyypillisesti näytedataa, jota käytetään mallin kouluttamiseen ja validointiin; se voi olla numeroita, tekstiä, kuvia, ääntä tai videota.
Aineistoja käytetään algoritmisten mallien kouluttamiseen, jolloin malli voi oppia kaavoja ja kuvioita datasta.
Aineistot jaetaan yleensä seuraaviin ryhmiin:Harjoitusjoukko, validointisetti ja testisettiKolme alaryhmää.
Harjoitusjoukkoa käytetään koneoppimismallin kouluttamiseen, validointijoukkoa käytetään mallin hyperparametrien ja rakenteen valintaan ja säätämiseen, ja testijoukkoa käytetään mallin suorituskyvyn ja tarkkuuden arviointiin.
Koulutussetit, validointisetit ja testijoukot ovat yleisesti ymmärrettyjä:
Koulutussetti: Aivan kuten oppitunti opiskelijoille, käytämme tätä dataa opettaaksemme koneoppimismalleille tiedon tunnistamista ja käsittelyä.
Validointisetit: Se on kuin antaisi opiskelijoille kokeen, jossa tarkistetaan, kuinka hyvin malli oppii ja mitä pitää säätää.
Testisarja: Se on kuin antaisi opiskelijoille loppukokeen, käyttäen tätä dataa mallin suorituskyvyn arviointiin ja nähdäksesi, oppiiko se hyvin.

K2: Mitä ovat COCO ja VOC?

COCO (Common Objects in Context) ja VOC (Visual Object Classes) ovat kaksi tunnettua tietoaineistoa konenäön alalla, joita käytetään laajasti kuvantunnistuksessa ja objektien tunnistuksessa.

Luoda:

COCO-aineiston loi Microsoft Research.
VOC-aineiston loi Oxfordin yliopiston tietokonenäköryhmä Yhdistyneessä kuningaskunnassa.

Esitellä:

COCO on laajamittainen aineisto kuvantunnistukseen, segmentointiin ja kuvatekstien generointiin.
Se sisältää yli 91 000 kuvaa, joista jokaisella on yksityiskohtainen merkintä ja segmentointi.
COCO-aineisto korostaa objektien kontekstia luonnollisissa kohtauksissa, eli objektit esiintyvät usein muiden objektien kanssa ja niillä on monimutkaisia kohtauksia ja taustoja.
COCO-tietoaineistoja käytetään yleisesti arvioimaan tehtävien, kuten objektien tunnistuksen, kuvien segmentoinnin ja kuvatekstien generoinnin suorituskykyä.
VOC on vanhempi kuvantunnistus- ja objektientunnistusaineisto.
Se sisältää 20 000 kuvaa noin 20 kategoriassa, joista jokaisessa on tarkat alueviittaukset ja kategoriamerkinnät.
VOC-aineistot keskittyvät enemmän kategorioiden tunnistamiseen ja kohteiden tunnistamiseen kuin kuvien kontekstiin.
VOC Challenge on tärkeä kilpailu konenäön alalla, joka edistää kohteiden tunnistus- ja kuvantunnistusteknologian kehitystä.

Erikoisuus:

VOC-aineistot ovat luonteenomaisia erittäin tarkan annotoinnin tarjoamisella, erityisesti objektien tunnistustehtävissä. Jokaisen kuvan objektit on merkitty tarkasti suorakaiteen muotoisella laatikolla, ja jokaisella objektilla on kategoriatunniste. Tämä tarkka annotaatio tekee VOC-aineistoista ihanteellisia kohteiden tunnistusalgoritmien koulutukseen ja testaukseen, sillä ne voivat oppia tunnistamaan ja paikantamaan kohteita kuvissa tarkasti.
Vaikka COCO-aineisto tarjoaa myös yksityiskohtaisia merkintöjä, se keskittyy laajempaan kuvantunnistukseen ja kohtausten ymmärtämiseen. COCO:n merkintöihin kuuluvat objektien tunnistus, segmentointi ja tekstityksen generointi. Tämä tarkoittaa, että COCO:n aineisto sisältää paitsi objektin suorakaiteen muotoisen laatikon, myös monimutkaisemman kohtaustiedon ja objektien väliset suhteet. Siksi COCO-aineisto soveltuu paremmin kehittyneempien tietokonenäkötehtävien koulutukseen ja testaamiseen, kuten kohtauksen ymmärtämiseen, kuvatekstien luomiseen jne.

Yhteenveto: VOC voidaan tunnistaa ja paikantaa nopeammin ja tarkemmin, pääasiassa siksi, että sen annotaatiomenetelmä sopii erittäin hyvin kohteiden tunnistustehtäviin, kun taas COCO tarjoaa rikkaampaa kohtaustietoa ja sopii monimutkaisempiin visuaalisiin tehtäviin. Molemmilla on omat painopisteensä ja ne ovat erittäin tärkeitä tietoaineistoja konenäön tutkimuksessa.

K3: Mitkä ovat heidän formaattinsa?

VOC-aineistojen merkintämuoto on XML. Jokainen kuva vastaa XML-tiedostoa.
COCO-aineiston merkintämuoto on JSON tai txt. Kaikki kohdelaatikon merkinnät ovat samassa JSON- tai txt-muodossa.

Alkuperäinen:Hyperlinkin kirjautuminen on näkyvissä.

Pikku roisto · Julkaistu 1.11.2024 11.39.47

Coco-aineisto on JSON-tiedosto, joka sisältää yhteensä viisi osaa.

{
"info": info, # perustiedot aineistosta
"lisenssit": [lisenssi], # lisenssi
"kuvat": [kuva], # kuvatiedot, nimi ja korkeus
"annotations": [annotaatio], # annotaatio
"categories": [category] # tunnistetiedot
}
info{ # Tietoaineiston kuvaus
"year": int, # dataset vuosi
"version": str, # dataset versio
"description": STR, # tietoaineiston kuvaus
"contributor": str, # tietoaineiston tarjoaja
"URL": str, # datasetin latauslinkki
"date_created": datetime, # aineiston luontipäivämäärä
}
license{
"id": int,
"nimi": str,
"url": str,
}
image{ # images on lista, joka tallentaa kaiken image (dict) -tiedot. Kuva on dikti, joka tallentaa tietoa yhdestä kuvasta
"id": int, # kuvan ID-numero (yksilöllinen jokaiselle kuvan ID:lle)
"leveys": int, # kuvan leveys
"korkeus": int, # kuvan korkeus
"file_name": voima, # kuvan nimi
"lisenssi": int, # sopimus
"flickr_url": str, # flickr-linkkiosoite
"coco_url": str, # verkkoyhteysosoite
"date_captured": datetime, # datasetin hakupäivämäärä
}
annotation{ # annotations on lista, joka tallentaa kaiken dict-tiedon. Annotaatio on diktti, joka tallentaa yhden kohteen merkintätiedot.
"id": int, # Kohdeobjektin ID (yksilöllinen jokaiselle objekti-ID:lle), jokaisella kuvalla voi olla useita kohteita
"image_id": int, # vastaa kuvan ID:tä
"category_id": int, # vastaa kategorian ID:tä, joka vastaa kategorioiden ID:tä
"segmentointi": RLE tai [monikulmio], # instanssisegmentointi, objektin rajapistekoordinaatit [x1,y1,x2,y2,....,xn,yn]
"alue": float, # Objektialueen pinta-ala
"bbox": [xmin,ymin,width,height], # objektin tunnistus, objektien sijoittamisen raja[x,y,w,h]
"iscrowd": 0 tai 1, # osoittaa, onko kyseessä väkijoukko vai ei
}
categories{ # Kategorian kuvaus
"id": int, # Kategoriaa vastaava ID (0 on oletuksena taustalla)
"name": str, # alikategorian nimi
"supercategory": voima, # pääkategorian nimi
}

Viittaus:

Hyperlinkin kirjautuminen on näkyvissä.
Hyperlinkin kirjautuminen on näkyvissä.
Hyperlinkin kirjautuminen on näkyvissä.
Hyperlinkin kirjautuminen on näkyvissä.

Pikku roisto · Julkaistu 11.11.2024 9.16.46

Data COCO -setin muoto:Hyperlinkin kirjautuminen on näkyvissä.

Pikku roisto · Julkaistu 11.11.2024 11.43.50

.NET/C# laskee monikulmion pinta-alan
https://www.itsvse.com/thread-10870-1-1.html

Kaksi yleisesti käytettyä aineistoa objektien tunnistamiseen, COCO ja VOC

Aiheeseen liittyvät julkaisut

Katsotut osuudet