Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 1664|Atbildi: 3

Divas bieži izmantotas datu kopas objektu noteikšanai, COCO un GOS

[Kopēt saiti]
Publicēts 30.10.2024 22:35:37 | | |
Risināmās problēmas:

Kas ir datu kopa?
Kas ir COCO un GOS?
Kāds formāts tie ir?

Q1: Kas ir datu kopa?

Datu kopa burtiski ir datu kolekcija.
Datu kopas parasti satur parauga datus, ko izmanto modeļa apmācīšanai un validācijai, kas var būt skaitļu, teksta, attēlu, audio vai video veidā.
Datu kopas tiek izmantotas, lai apmācītu algoritmiskos modeļus, ļaujot modelim apgūt modeļus un modeļus datos.
Datu kopas parasti iedala:Apmācības kopa, validācijas kopa un testa kopaTrīs apakškopas.
Apmācības kopa tiek izmantota, lai apmācītu mašīnmācīšanās modeli, validācijas kopa tiek izmantota, lai atlasītu un pielāgotu modeļa hiperparametrus un struktūru, un testa kopa tiek izmantota, lai novērtētu modeļa veiktspēju un precizitāti.
Apmācības kopas, validācijas kopas un testa kopas parasti tiek saprastas:
Apmācības komplekts: tāpat kā stunda studentiem, mēs izmantojam šos datus, lai iemācītu mašīnmācīšanās modeļiem, kā atpazīt un apstrādāt informāciju.
Validācijas komplekti: Tas ir tāpat kā dot studentiem viktorīnu, lai pārbaudītu, cik labi modelis mācās, un redzētu, kas ir jāpielāgo.
Testa komplekts: Tas ir tāpat kā studentiem gala eksāmens, izmantojot šos datus, lai beidzot novērtētu modeļa veiktspēju, lai redzētu, vai tas labi mācās.

Q2: Kas ir COCO un GOS?

COCO (Common Objects in Context) un VOC (Visual Object Classes) ir divas labi zināmas datu kopas datorredzes jomā, kuras plaši izmanto attēlu atpazīšanas un objektu noteikšanas uzdevumos.


Radīt:


COCO datu kopu izveidoja Microsoft Research.
GOS datu kopu izveidoja datorredzes grupa Oksfordas universitātē Apvienotajā Karalistē.


Ieviest:


COCO ir liela mēroga datu kopa attēlu atpazīšanai, segmentēšanai un parakstu ģenerēšanai.
Tajā ir vairāk nekā 91 000 attēlu, katrs ar detalizētu marķējumu un segmentāciju.
COCO datu kopa uzsver objektu kontekstu dabas ainās, t.i., objekti bieži parādās kopā ar citiem objektiem un tiem ir sarežģītas ainas un foni.
COCO datu kopas parasti izmanto, lai novērtētu tādu uzdevumu izpildi kā objektu noteikšana, attēlu segmentēšana un attēlu parakstu ģenerēšana.
GOS ir vecāka attēlu atpazīšanas un objektu noteikšanas datu kopa.
Tajā ir 20 000 attēlu aptuveni 20 kategorijās, katrai no tām ir precīzas apgabala norādes un kategoriju etiķetes.
GOS datu kopas vairāk koncentrējas uz kategoriju identifikāciju un objektu noteikšanu, nevis uz attēlu kontekstu.
VOC izaicinājums ir nozīmīgs konkurss datorredzes jomā, kas veicina objektu noteikšanas un attēlu atpazīšanas tehnoloģijas attīstību.

Īpatnība:

GOS datu kopas raksturo fakts, ka tās nodrošina ļoti precīzu anotāciju, īpaši objektu noteikšanas uzdevumos. Objekti katrā attēlā ir precīzi apzīmēti ar taisnstūra lodziņu, un katram objektam ir kategorijas etiķete. Šī precīzā anotācija padara GOS datu kopas ideāli piemērotas objektu noteikšanas algoritmu apmācībai un testēšanai, jo tās var iemācīties precīzi identificēt un atrast objektus attēlos.
Lai gan COCO datu kopa sniedz arī detalizētas anotācijas, tā koncentrējas uz plašāku attēlu atpazīšanu un ainas izpratni. COCO anotācijas ietver objektu noteikšanu, segmentēšanu un subtitru ģenerēšanu. Tas nozīmē, ka COCO dati ietver ne tikai objekta taisnstūra lodziņu, bet arī sarežģītāku ainas informāciju un attiecības starp objektiem. Tāpēc COCO datu kopa ir vairāk piemērota sarežģītāku datorredzes uzdevumu apmācībai un testēšanai, piemēram, ainas izpratnei, attēlu parakstu ģenerēšanai utt.

Kopsavilkums: GOS var identificēt un atrast ātrāk un precīzāk, galvenokārt tāpēc, ka tā anotācijas metode ir ļoti piemērota objektu noteikšanas uzdevumiem, savukārt COCO nodrošina bagātīgāku informāciju par ainu un ir piemērota sarežģītākiem vizuāliem uzdevumiem. Abiem ir savi fokusi, un tie ir ļoti svarīgas datu kopas datorredzes pētījumos.

Q3: Kādi ir to formāti?

  • GOS datu kopu marķēšanas formāts ir XML. Katrs attēls atbilst XML failam.
  • COCO datu kopas marķēšanas formāts ir JSON vai txt. Visas mērķa lodziņa anotācijas ir vienā JSON vai txt.


Sākotnējā:Hipersaites pieteikšanās ir redzama.




Iepriekšējo:Windows instalē Conda vides pārvaldības rīku
Nākamo:MikroTik (2) aizliedz ierīcei piekļūt ārējam tīklam, tikai iekšējam tīklam
 Saimnieks| Publicēts 01.11.2024 11:39:47 |
Coco datu kopa ir JSON fails, kas kopā satur 5 daļas.

{
    "info": informācija, # pamatinformācija par datu kopu
    "licences": [licence], # licence
    "images": [attēls], # attēla informācija, nosaukums un augstums
    "anotācijas": [anotācija], # anotācija
    "kategorijas": [kategorija] # taga informācija
}
info{ # Datu kopas informācijas apraksts
    "gads": int, # datu kopas gads
    "versija": str, # datu kopas versija
    "apraksts": str, # datu kopas apraksts
    "līdzstrādnieks": str, # datu kopas nodrošinātājs
    "url": str, # datu kopas lejupielādes saite
    "date_created": datetime, # datu kopas izveides datums
}
licence{
    "id": int,
    "Nosaukums": STR,
    "URL": STR,
}
image{ # images ir saraksts, kurā tiek glabāta visa attēla (dikta) informācija. attēls ir diktāts, kas glabā informāciju par vienu attēlu
    "id": int, # attēla ID numurs (unikāls katram attēla ID)
    "width": int, # attēla platums
    "augstums": int, # attēla augstums
    "file_name": str, # attēla nosaukums
    "licence": int, # līgums
    "flickr_url": str, # flickr saites adrese
    "coco_url": str, # tīkla savienojuma adrese
    "date_captured": datetime, # datu kopas iegūšanas datums
}
anotācija{ # anotācijas ir saraksts, kurā tiek glabāta visa diktāta informācija. Anotācija ir dikts, kas glabā vienu mērķa anotācijas informāciju.
    "id": int, # mērķa objekta ID (unikāls katram objekta ID), katram attēlam var būt vairāki mērķi
    "image_id": int, # atbilst attēla ID
    "category_id": int, # atbilst kategorijas ID, kas atbilst ID kategorijās
    "segmentācija": RLE vai [daudzstūris], # instances segmentācija, objekta robežpunkta koordinātas [x1,y1,x2,y2,....,xn,yn]
    "apgabals": pludiņš, # objekta laukuma laukums
    "bbox": [xmin,ymin,width,height], # objekta noteikšana, objekta pozicionēšanas robeža[x,y,w,h]
    "iscrowd": 0 vai 1, # norāda, vai tas ir pūlis vai nē
}
categories{ # Kategorijas apraksts
    "id": int, # ID, kas atbilst kategorijai (0 pēc noklusējuma ir fons)
    "nosaukums": str, # apakškategorijas nosaukums
    "superkategorija": str, # galvenās kategorijas nosaukums
}



Atsauce:

Hipersaites pieteikšanās ir redzama.
Hipersaites pieteikšanās ir redzama.
Hipersaites pieteikšanās ir redzama.
Hipersaites pieteikšanās ir redzama.

 Saimnieks| Publicēts 11.11.2024 09:16:46 |
Datu COCO komplekta formāts:Hipersaites pieteikšanās ir redzama.


 Saimnieks| Publicēts 11.11.2024 11:43:50 |
.NET/C# aprēķina daudzstūra laukumu
https://www.itsvse.com/thread-10870-1-1.html
Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com