Dit artikel is een spiegelartikel van machinevertaling, klik hier om naar het oorspronkelijke artikel te gaan.

Bekijken: 1664|Antwoord: 3

Twee veelgebruikte datasets voor objectdetectie, COCO en VOC

[Link kopiëren]
Geplaatst op 30-10-2024 22:35:37 | | |
Problemen om op te lossen:

Wat is een dataset?
Wat zijn COCO en VOS?
In welk formaat zijn ze?

V1: Wat is een dataset?

Een dataset is letterlijk een verzameling data.
Datasets bevatten doorgaans voorbeeldgegevens die worden gebruikt om het model te trainen en te valideren, wat kan bestaan uit cijfers, tekst, afbeeldingen, audio of video.
Datasets worden gebruikt om algoritmische modellen te trainen, waardoor het model patronen en patronen in de data kan leren.
Datasets worden meestal onderverdeeld in:Trainingsset, validatieset en testsetDrie subsets.
De trainingsset wordt gebruikt om het machine learning-model te trainen, de validatieset wordt gebruikt om de hyperparameters en structuur van het model te selecteren en aan te passen, en de testset wordt gebruikt om de prestaties en nauwkeurigheid van het model te evalueren.
Trainingssets, validatiesets en testsets worden algemeen begrepen:
Trainingspakket: Net als een les voor studenten gebruiken we deze data om machine learning-modellen te leren hoe ze informatie kunnen herkennen en verwerken.
Validatiesets: Het is alsof je studenten een quiz geeft om te zien hoe goed het model leert en wat er aangepast moet worden.
Testset: Het is alsof je studenten een eindexamen geeft, waarbij deze data wordt gebruikt om uiteindelijk de prestaties van het model te evalueren en te zien of het goed leert.

V2: Wat zijn COCO en VOC?

COCO (Common Objects in Context) en VOC (Visual Object Classes) zijn twee bekende datasets op het gebied van computer vision, die veel worden gebruikt bij beeldherkenning en objectdetectietaken.


Scheppen:


De COCO-dataset is gemaakt door Microsoft Research.
De VOC-dataset is ontwikkeld door de computer vision-groep aan de Universiteit van Oxford in het Verenigd Koninkrijk.


Voorstellen:


COCO is een grootschalige dataset voor beeldherkenning, segmentatie en het genereren van bijschriften.
Het bevat meer dan 91.000 afbeeldingen, elk met gedetailleerde etikettering en segmentatie.
De COCO-dataset benadrukt de context van objecten in natuurlijke scènes, d.w.z. objecten verschijnen vaak samen met andere objecten en hebben complexe scènes en achtergronden.
COCO-datasets worden vaak gebruikt om de prestaties van taken zoals objectdetectie, beeldsegmentatie en het genereren van beeldonderschriften te evalueren.
VOC is een oudere dataset voor beeldherkenning en objectdetectie.
Het bevat 20.000 afbeeldingen in ongeveer 20 categorieën, elk met precieze gebiedsaanduidingen en categorielabels.
VOC-datasets richten zich meer op categorie-identificatie en objectdetectie dan op de context van afbeeldingen.
De VOC Challenge is een belangrijke wedstrijd op het gebied van computer vision, die de ontwikkeling van objectdetectie- en beeldherkenningstechnologie bevordert.

Eigenaardigheid:

VOC-datasets worden gekenmerkt doordat ze zeer nauwkeurige annotatie bieden, vooral bij objectdetectietaken. De objecten in elke afbeelding zijn precies gelabeld met een rechthoekig vakje, en elk object heeft een categorielabel. Deze precieze annotatie maakt VOC-datasets ideaal voor het trainen en testen van objectdetectie-algoritmen, omdat ze kunnen leren objecten nauwkeurig te identificeren en te lokaliseren in afbeeldingen.
Hoewel de COCO-dataset ook gedetailleerde annotaties biedt, richt deze zich op bredere beeldherkenning en het begrijpen van taferelen. Annotaties in COCO omvatten objectdetectie, segmentatie en ondertitelgeneratie. Dit betekent dat de data van COCO niet alleen de rechthoekige doos van het object omvatten, maar ook complexere scène-informatie en relaties tussen objecten. Daarom is de COCO-dataset geschikter voor het trainen en testen van meer geavanceerde computer vision-taken, zoals het begrijpen van scènes, het genereren van beeldonderschriften, enzovoort.

Samenvatting: VOC kan sneller en nauwkeuriger worden geïdentificeerd en gelokaliseerd, voornamelijk omdat de annotatiemethode zeer geschikt is voor objectdetectietaken, terwijl COCO rijkere scène-informatie biedt en geschikt is voor complexere visuele taken. Beide hebben hun eigen aandachtspunten en zijn zeer belangrijke datasets in computervisieonderzoek.

V3: Wat zijn hun formaten?

  • Het labelformaat van VOC-datasets is XML. Elke afbeelding komt overeen met een XML-bestand.
  • Het labelformaat van de COCO-dataset is JSON of txt. Alle doelbox-annotaties zijn in dezelfde JSON of txt.


Origineel:De hyperlink-login is zichtbaar.




Vorig:Windows installeert de Conda omgevingsbeheertool
Volgend:MikroTik (2) verbiedt een apparaat toegang te krijgen tot het externe netwerk, alleen tot interne netwerktoegang
 Huisbaas| Geplaatst op 01-11-2024 11:39:47 |
De Coco-dataset is een JSON-bestand dat in totaal 5 delen bevat.

{
    "info": info, # basisinformatie over de dataset
    "licenties": [licentie], # licentie
    "afbeeldingen": [afbeelding], # afbeeldingsinformatie, naam en hoogte
    "Annotaties": [Annotatie], # Annotatie
    "Categorieën": [Categorie] # Taginformatie
}
info{ # Dataset-informatiebeschrijving
    "jaar": int, # datasetjaar
    "versie": STR, # Datasetversie
    "Beschrijving": STR, # Datasetbeschrijving
    "Contributor": STR, # Datasetprovider
    "URL": STR, # Dataset download link
    "date_created": datum, # datum van datasetcreatie
}
license{
    "id": int,
    "naam": str,
    "URL": STR,
}
image{ # images is een lijst die alle image (dict) informatie opslaat. afbeelding is een dict dat informatie over één afbeelding opslaat
    "id": int, # ID-nummer van de afbeelding (uniek voor elke afbeeldings-ID)
    "breedte": int, # beeldbreedte
    "hoogte": int, # beeldhoogte
    "file_name": STR, # Afbeeldingsnaam
    "Licentie": int, # overeenkomst
    "flickr_url": str, # flickr-linkadres
    "coco_url": STR, # netwerkverbindingsadres
    "date_captured": datum en tijd, # dataset haaldatum
}
Annotation{ # Annotaties is een lijst die alle dict-informatie opslaat. Een annotatie is een dict dat informatie over één doelannotatie opslaat.
    "id": int, # Doelobject-ID (uniek voor elke object-ID), elke afbeelding kan meerdere doelen hebben
    "image_id": int, # komt overeen met de afbeeldings-ID
    "category_id": int, # komt overeen met de categorie-ID, die overeenkomt met de ID in de categorieën
    "segmentatie": RLE of [polygon], # instantiesegmentatie, de grenspuntcoördinaten van het object [x1,y1,x2,y2,....,xn,yn]
    "gebied": float, # Het oppervlak van het objectgebied
    "bbox": [xmin,ymin,breedte,hoogte], # objectdetectie, objectpositioneringsrand[x,y,w,h]
    "iscrowd": 0 of 1, # geeft aan of het een menigte is of niet
}
categorieën{ # Categoriebeschrijving
    "id": int, # De ID die overeenkomt met de categorie (0 staat standaard op de achtergrond)
    "naam": str, # subcategorienaam
    "Supercategorie": STR, # Hoofdcategorienaam
}



Referentie:

De hyperlink-login is zichtbaar.
De hyperlink-login is zichtbaar.
De hyperlink-login is zichtbaar.
De hyperlink-login is zichtbaar.

 Huisbaas| Geplaatst op 11-11-2024 09:16:46 |
Data COCO Set Formaat:De hyperlink-login is zichtbaar.


 Huisbaas| Geplaatst op 11-11-2024 11:43:50 |
.NET/C# berekent de oppervlakte van een veelhoek
https://www.itsvse.com/thread-10870-1-1.html
Disclaimer:
Alle software, programmeermaterialen of artikelen die door Code Farmer Network worden gepubliceerd, zijn uitsluitend bedoeld voor leer- en onderzoeksdoeleinden; De bovenstaande inhoud mag niet worden gebruikt voor commerciële of illegale doeleinden, anders dragen gebruikers alle gevolgen. De informatie op deze site komt van het internet, en auteursrechtconflicten hebben niets met deze site te maken. Je moet bovenstaande inhoud volledig van je computer verwijderen binnen 24 uur na het downloaden. Als je het programma leuk vindt, steun dan de echte software, koop registratie en krijg betere echte diensten. Als er sprake is van een inbreuk, neem dan contact met ons op via e-mail.

Mail To:help@itsvse.com