Šis straipsnis yra veidrodinis mašininio vertimo straipsnis, spauskite čia norėdami pereiti prie originalaus straipsnio.

Rodinys: 1664|Atsakyti: 3

Du dažniausiai naudojami objektų aptikimo duomenų rinkiniai – COCO ir LOJ

[Kopijuoti nuorodą]
Paskelbta 2024-10-30 22:35:37 | | |
Problemos, kurias reikia išspręsti:

Kas yra duomenų rinkinys?
Kas yra COCO ir LOJ?
Koks jų formatas?

1 klausimas: kas yra duomenų rinkinys?

Duomenų rinkinys, tiesiogine prasme, yra duomenų rinkinys.
Duomenų rinkiniuose paprastai yra pavyzdinių duomenų, naudojamų modeliui mokyti ir patvirtinti, kurie gali būti skaičių, teksto, vaizdų, garso ar vaizdo įrašų pavidalu.
Duomenų rinkiniai naudojami algoritminiams modeliams mokyti, todėl modelis gali išmokti duomenų modelius ir modelius.
Duomenų rinkiniai paprastai skirstomi į:Mokymo rinkinys, tikrinimo rinkinys ir testavimo rinkinysTrys poaibiai.
Mokymo rinkinys naudojamas mašininio mokymosi modeliui mokyti, patvirtinimo rinkinys naudojamas modelio hiperparametrams ir struktūrai pasirinkti ir koreguoti, o bandymo rinkinys naudojamas modelio našumui ir tikslumui įvertinti.
Mokymo rinkiniai, patvirtinimo rinkiniai ir testavimo rinkiniai paprastai suprantami:
Mokymo rinkinys: kaip ir pamoka mokiniams, šiuos duomenis naudojame mašininio mokymosi modeliams mokyti atpažinti ir apdoroti informaciją.
Patvirtinimo rinkiniai: Tai tarsi viktorina, skirta mokiniams patikrinti, kaip gerai modelis mokosi, ir pamatyti, ką reikia koreguoti.
Testų rinkinys: Tai tarsi baigiamasis egzaminas mokiniams, naudojant šiuos duomenis, kad galiausiai įvertintų modelio našumą ir pamatytų, ar jis gerai mokosi.

2 klausimas: kas yra COCO ir LOJ?

COCO (Common Objects in Context) ir VOC (Visual Object Classes) yra du gerai žinomi kompiuterinės regos srities duomenų rinkiniai, plačiai naudojami atliekant vaizdo atpažinimo ir objektų aptikimo užduotis.


Kurti:


COCO duomenų rinkinį sukūrė "Microsoft Research".
LOJ duomenų rinkinį sukūrė Oksfordo universiteto (Jungtinė Karalystė) kompiuterinės vizijos grupė.


Pristatyti:


COCO yra didelio masto duomenų rinkinys, skirtas vaizdų atpažinimui, segmentavimui ir antraščių generavimui.
Jame yra daugiau nei 91 000 vaizdų, kurių kiekvienas yra išsamiai pažymėtas ir segmentuotas.
COCO duomenų rinkinyje pabrėžiamas objektų kontekstas natūraliose scenose, t. y. objektai dažnai pasirodo kartu su kitais objektais ir turi sudėtingas scenas bei fonus.
COCO duomenų rinkiniai dažniausiai naudojami tokių užduočių kaip objektų aptikimas, vaizdo segmentavimas ir vaizdo antraščių generavimas atlikimui įvertinti.
LOJ yra senesnis vaizdo atpažinimo ir objektų aptikimo duomenų rinkinys.
Jame yra 20 000 vaizdų iš maždaug 20 kategorijų, kurių kiekviena turi tikslias srities išnašas ir kategorijų etiketes.
LOJ duomenų rinkiniai daugiau dėmesio skiria kategorijų identifikavimui ir objektų aptikimui, o ne vaizdų kontekstui.
LOJ iššūkis yra svarbus konkursas kompiuterinės regos srityje, skatinantis objektų aptikimo ir vaizdo atpažinimo technologijų plėtrą.

Ypatumas:

LOJ duomenų rinkiniai pasižymi tuo, kad jie pateikia labai tikslią anotaciją, ypač atliekant objektų aptikimo užduotis. Kiekviename paveikslėlyje esantys objektai yra tiksliai pažymėti stačiakampiu langeliu, o kiekvienas objektas turi kategorijos etiketę. Dėl šios tikslios anotacijos LOJ duomenų rinkiniai idealiai tinka objektų aptikimo algoritmų mokymui ir testavimui, nes jie gali išmokti tiksliai atpažinti ir nustatyti objektus vaizduose.
Nors COCO duomenų rinkinyje taip pat pateikiami išsamūs komentarai, jame daugiausia dėmesio skiriama platesniam vaizdo atpažinimui ir scenos supratimui. COCO komentarai apima objektų aptikimą, segmentavimą ir subtitrų generavimą. Tai reiškia, kad COCO duomenys apima ne tik stačiakampį objekto langelį, bet ir sudėtingesnę scenos informaciją bei ryšius tarp objektų. Todėl COCO duomenų rinkinys labiau tinka sudėtingesnėms kompiuterinės regos užduotims, tokioms kaip scenos supratimas, vaizdų antraščių generavimas ir kt., mokymui ir testavimui.

Santrauka: LOJ galima greičiau ir tiksliau atpažinti ir nustatyti, daugiausia dėl to, kad jo anotacijos metodas yra labai tinkamas objektų aptikimo užduotims atlikti, o COCO suteikia turtingesnę scenos informaciją ir tinka sudėtingesnėms vaizdinėms užduotims atlikti. Abu turi savo dėmesį ir yra labai svarbūs kompiuterinės regos tyrimų duomenų rinkiniai.

3 klausimas: kokie yra jų formatai?

  • LOJ duomenų rinkinių ženklinimo formatas yra XML. Kiekvienas vaizdas atitinka XML failą.
  • COCO duomenų rinkinio žymėjimo formatas yra JSON arba txt. Visi paskirties laukelio komentarai yra tame pačiame JSON arba txt.


Originalus:Hipersaito prisijungimas matomas.




Ankstesnis:"Windows" diegia "Conda" aplinkos valdymo įrankį
Kitą:"MikroTik" (2) draudžia įrenginiui prisijungti prie išorinio tinklo, tik vidinę prieigą prie tinklo
 Savininkas| Paskelbta 2024-11-01 11:39:47 |
"Coco" duomenų rinkinys yra JSON failas, kurį sudaro iš viso 5 dalys.

{
    "info": informacija, # pagrindinė informacija apie duomenų rinkinį
    "licencijos": [licencija], # licencija
    "images": [vaizdas], # vaizdo informacija, pavadinimas ir aukštis
    "anotacijos": [anotacija], # anotacija
    "kategorijos": [kategorija] # žymos informacija
}
info{ # Duomenų rinkinio informacijos aprašymas
    "metai": int, # duomenų rinkinio metai
    "version": str, # duomenų rinkinio versija
    "description": str, # duomenų rinkinio aprašymas
    "bendraautorius": str, # duomenų rinkinio teikėjas
    "url": str, # duomenų rinkinio atsisiuntimo nuoroda
    "date_created": datatime, # duomenų rinkinio sukūrimo data
}
licencija{
    "id": int,
    "pavadinimas": str,
    "URL": STR,
}
image{ # images yra sąrašas, kuriame saugoma visa vaizdo (diktato) informacija. vaizdas yra diktatas, kuriame saugoma informacija apie vieną vaizdą
    "id": int, # vaizdo ID numeris (unikalus kiekvienam vaizdo ID)
    "width": int, # vaizdo plotis
    "aukštis": int, # vaizdo aukštis
    "file_name": str, # vaizdo pavadinimas
    "licencija": int, # susitarimas
    "flickr_url": str, # flickr nuorodos adresas
    "coco_url": str, # tinklo ryšio adresas
    "date_captured": datatime, # duomenų rinkinio gavimo data
}
anotacija{ # anotacijos yra sąrašas, kuriame saugoma visa diktavimo informacija. Anotacija yra diktatas, kuriame saugoma viena tikslinė anotacijos informacija.
    "id": int, # Target object ID (unikalus kiekvienam objekto ID), kiekvienas vaizdas gali turėti kelis taikinius
    "image_id": int, # atitinka vaizdo ID
    "category_id": int, # atitinka kategorijos ID, atitinkantį kategorijų ID
    "segmentacija": RLE arba [daugiakampis], # egzemplioriaus segmentavimas, objekto ribinio taško koordinatės [x1,y1,x2,y2,....,xn,yn]
    "plotas": plūduriuojantis, # objekto srities plotas
    "bbox": [xmin,ymin,width,height], # objekto aptikimas, objekto padėties nustatymo kraštinė[x,y,w,h]
    "iscrowd": 0 arba 1, # rodo, ar tai minia, ar ne
}
categories{ # Kategorijos aprašymas
    "id": int, # ID, atitinkantis kategoriją (0 numatytasis fonas)
    "name": str, # subkategorijos pavadinimas
    "superkategorija": str, # pagrindinės kategorijos pavadinimas
}



Nuoroda:

Hipersaito prisijungimas matomas.
Hipersaito prisijungimas matomas.
Hipersaito prisijungimas matomas.
Hipersaito prisijungimas matomas.

 Savininkas| Paskelbta 2024-11-11 09:16:46 |
Duomenų COCO rinkinio formatas:Hipersaito prisijungimas matomas.


 Savininkas| Paskelbta 2024-11-11 11:43:50 |
.NET/C# apskaičiuoja daugiakampio plotą
https://www.itsvse.com/thread-10870-1-1.html
Atsakomybės apribojimas:
Visa programinė įranga, programavimo medžiaga ar straipsniai, kuriuos skelbia Code Farmer Network, yra skirti tik mokymosi ir mokslinių tyrimų tikslams; Aukščiau nurodytas turinys negali būti naudojamas komerciniais ar neteisėtais tikslais, priešingu atveju vartotojai prisiima visas pasekmes. Šioje svetainėje pateikiama informacija gaunama iš interneto, o ginčai dėl autorių teisių neturi nieko bendra su šia svetaine. Turite visiškai ištrinti aukščiau pateiktą turinį iš savo kompiuterio per 24 valandas nuo atsisiuntimo. Jei jums patinka programa, palaikykite autentišką programinę įrangą, įsigykite registraciją ir gaukite geresnes autentiškas paslaugas. Jei yra kokių nors pažeidimų, susisiekite su mumis el. paštu.

Mail To:help@itsvse.com