Ta članek je zrcalni članek strojnega prevajanja, kliknite tukaj za skok na izvirni članek.

Pogled: 1664|Odgovoriti: 3

Dva pogosto uporabljena podatkovna niza za zaznavanje objektov, COCO in VOC

[Kopiraj povezavo]
Objavljeno na 30. 10. 2024 22:35:37 | | |
Težave za reševanje:

Kaj je podatkovni niz?
Kaj sta COCO in VOC?
Kakšen format so?

V1: Kaj je podatkovni niz?

Podatkovna zbirka je dobesedno zbirka podatkov.
Podatkovni nizi običajno vsebujejo vzorčne podatke, ki se uporabljajo za učenje in validacijo modela, in sicer v obliki številk, besedila, slik, zvoka ali videa.
Podatkovni nizi se uporabljajo za učenje algoritmičnih modelov, kar modelu omogoča učenje vzorcev in vzorcev v podatkih.
Podatkovni nizi so običajno razdeljeni na:Učni nabor, validacijski nabor in testni naborTri podskupine.
Učni nabor se uporablja za učenje modela strojnega učenja, validacijski nabor za izbiro in prilagajanje hiperparametrov in strukture modela, testni nabor pa za ocenjevanje zmogljivosti in natančnosti modela.
Učni nabori, validacijski nabori in testni nabori so običajno razumljeni:
Učni nabor podatkov: Tako kot lekcija za učence, te podatke uporabljamo za učenje modelov strojnega učenja, kako prepoznati in obdelovati informacije.
Validacijske množice: To je kot da bi učencem dali kviz, s katerim preverite, kako dobro se model uči in kaj je treba prilagoditi.
Testni nabor je: To je kot da bi študentom dali končni izpit in uporabili te podatke, da končno ocenimo uspešnost modela in ugotovimo, ali se dobro uči.

V2: Kaj sta COCO in VOC?

COCO (Common Objects in Context) in VOC (Visual Object Classes) sta dva dobro znana podatkovna niza na področju računalniškega vida, ki se široko uporabljata pri prepoznavanju slik in nalogah zaznavanja objektov.


Ustvariti:


Podatkovni niz COCO je ustvaril Microsoft Research.
Podatkovni niz VOC je ustvarila skupina za računalniški vid na Univerzi v Oxfordu v Združenem kraljestvu.


Uvesti:


COCO je velik nabor podatkov za prepoznavanje slik, segmentacijo in generiranje napisov.
Vsebuje več kot 91.000 slik, vsaka s podrobnimi oznakami in segmentacijo.
Podatkovni nabor COCO poudarja kontekst objektov v naravnih prizorih, tj. objekti se pogosto pojavljajo skupaj z drugimi objekti in imajo kompleksne prizore ter ozadja.
COCO podatkovni nizi se pogosto uporabljajo za ocenjevanje uspešnosti nalog, kot so zaznavanje objektov, segmentacija slik in generiranje podnapisov slik.
VOC je starejši nabor podatkov za prepoznavanje slik in zaznavanje objektov.
Vsebuje 20.000 slik v približno 20 kategorijah, vsaka z natančnimi označitvami območij in oznakami kategorij.
Podatkovni nizi VOC se bolj osredotočajo na identifikacijo kategorij in zaznavanje predmetov kot na kontekst slik.
VOC Challenge je pomembno tekmovanje na področju računalniškega vida, ki spodbuja razvoj tehnologije zaznavanja predmetov in prepoznavanja slik.

Posebnost:

Podatkovni nizi VOC so značilni po tem, da zagotavljajo zelo natančno anotacijo, zlasti pri nalogah zaznavanja objektov. Objekti na vsaki sliki so natančno označeni s pravokotnim okvirjem, vsak predmet pa ima oznako kategorije. Ta natančna anotacija naredi nabore VOC idealne za učenje in testiranje algoritmov za zaznavanje objektov, saj se lahko naučijo natančno prepoznavati in locirati objekte na slikah.
Čeprav podatkovni nabor COCO prav tako ponuja podrobne opombe, se osredotoča na širše prepoznavanje slik in razumevanje prizorov. Opombe v COCO vključujejo zaznavanje objektov, segmentacijo in generiranje podnapisov. To pomeni, da COCO-jevi podatki vključujejo ne le pravokotno škatlo objekta, temveč tudi bolj kompleksne informacije o prizoru in odnose med objekti. Zato je COCO podatkovni nabor bolj primeren za učenje in testiranje naprednejših nalog računalniškega vida, kot so razumevanje prizorov, generiranje podnapisov slik itd.

Povzetek: VOC je mogoče hitreje in natančneje prepoznati in locirati, predvsem zato, ker je njegova metoda označevanja zelo primerna za naloge zaznavanja objektov, medtem ko COCO zagotavlja bogatejše informacije o prizoru in je primeren za zahtevnejše vizualne naloge. Obe imata svoje usmeritve in sta zelo pomembni podatkovni nizi v raziskavah računalniškega vida.

V3: Kakšni so njihovi formati?

  • Format označevanja podatkovnih nizov VOC je XML. Vsaka slika ustreza XML datoteki.
  • Format označevanja COCO podatkovnega niza je JSON ali txt. Vse označbe ciljnih polj so v istem JSON-u ali txt-u.


Izvirno:Prijava do hiperpovezave je vidna.




Prejšnji:Windows namesti orodje za upravljanje okolja Conda
Naslednji:MikroTik (2) prepoveduje napravam dostop do zunanjega omrežja, le dostop do notranjega omrežja
 Najemodajalec| Objavljeno na 1. 11. 2024 11:39:47 |
Nabor podatkov Coco je JSON datoteka, ki vsebuje skupaj 5 delov.

{
    "info": info, # osnovne informacije o podatkovnem nizu
    "licence": [licenca], # licenca
    "slike": [slika], # informacije o sliki, ime in višina
    "opombe": [opombe], # opombe
    "kategorije": [kategorija] # informacije o oznakah
}
info{ # Opis informacij nabora podatkov
    "leto": int, # leto podatkovne zbirke
    "version": str, # dataset version
    "opis": str, # opis podatkovnega niza
    "contributor": str, # ponudnik podatkovnega nabora
    "URL": str, # povezava za prenos podatkovnega nabora
    "date_created": datumčas za datum, # datum ustvarjanja zbirke podatkov
}
license{
    "id": int,
    "ime": str,
    "URL": str,
}
image{ # images je seznam, ki shranjuje vse informacije o sliki (dict). slika je diktat, ki shranjuje informacije o eni sami sliki
    "id": int, # ID številka slike (edinstvena za vsak ID slike)
    "širina": int, # širina slike
    "višina": int, # višina slike
    "file_name": str, # ime slike
    "licenca": int, # dogovor
    "flickr_url": str, # Flickr povezava naslov
    "coco_url": str, # naslov omrežne povezave
    "date_captured": datetime, # dataset fetch date
}
Annotation{ # Annotations je seznam, ki hrani vse informacije o diktih. Anotacija je diktat, ki shranjuje eno ciljno informacijo o anotaciji.
    "id": int, # ID ciljnega objekta (edinstven za vsak ID objekta), vsaka slika lahko vsebuje več ciljev
    "image_id": int, # ustreza ID-ju slike
    "category_id": int, # ustreza ID-ju kategorije, ki ustreza ID-ju v kategorijah
    "segmentacija": RLE ali [poligon], # segmentacija primerkov, koordinate robne točke objekta [x1,y1,x2,y2,....,xn,yn]
    "area": float, # Površina objektnega območja
    "bbox": [xmin,ymin,width,height], # zaznavanje objektov, rob pozicioniranja objekta[x,y,w,h]
    "iscrowd": 0 ali 1, # označuje, ali gre za množico ali ne
}
categories{ # Opis kategorije
    "id": int, # ID, ki ustreza kategoriji (0 privzeto ozadje)
    "ime": str, # ime podkategorije
    "superkategorija": str, # glavno ime kategorije
}



Referenčni:

Prijava do hiperpovezave je vidna.
Prijava do hiperpovezave je vidna.
Prijava do hiperpovezave je vidna.
Prijava do hiperpovezave je vidna.

 Najemodajalec| Objavljeno na 11. 11. 2024 09:16:46 |
Format podatkovnega COCO seta:Prijava do hiperpovezave je vidna.


 Najemodajalec| Objavljeno na 11. 11. 2024 11:43:50 |
.NET/C# izračuna površino poligona
https://www.itsvse.com/thread-10870-1-1.html
Disclaimer:
Vsa programska oprema, programski materiali ali članki, ki jih izdaja Code Farmer Network, so namenjeni zgolj učnim in raziskovalnim namenom; Zgornja vsebina ne sme biti uporabljena v komercialne ali nezakonite namene, sicer uporabniki nosijo vse posledice. Informacije na tej strani prihajajo z interneta, spori glede avtorskih pravic pa nimajo nobene zveze s to stranjo. Zgornjo vsebino morate popolnoma izbrisati z računalnika v 24 urah po prenosu. Če vam je program všeč, podprite pristno programsko opremo, kupite registracijo in pridobite boljše pristne storitve. Če pride do kakršne koli kršitve, nas prosimo kontaktirajte po elektronski pošti.

Mail To:help@itsvse.com