Cet article est un article miroir de traduction automatique, veuillez cliquer ici pour accéder à l’article original.

Vue: 1664|Répondre: 3

Deux ensembles de données couramment utilisés pour la détection d’objets, COCO et COV

[Copié le lien]
Publié sur 30/10/2024 22:35:37 | | |
Problèmes à résoudre :

Qu’est-ce qu’un jeu de données ?
Qu’est-ce que le COCO et les COV ?
Quel format ont-ils ?

Q1 : Qu’est-ce qu’un jeu de données ?

Un jeu de données, littéralement, est un ensemble de données.
Les ensembles de données contiennent généralement des données d’échantillons utilisées pour entraîner et valider le modèle, qui peuvent prendre la forme de chiffres, de texte, d’images, d’audio ou de vidéo.
Les ensembles de données sont utilisés pour entraîner des modèles algorithmiques, permettant au modèle d’apprendre les motifs et les motifs dans les données.
Les ensembles de données sont généralement divisés en :Ensemble d’entraînement, ensemble de validation et ensemble de testTrois sous-groupes.
L’ensemble d’entraînement sert à entraîner le modèle d’apprentissage automatique, l’ensemble de validation sert à sélectionner et ajuster les hyperparamètres et la structure du modèle, et l’ensemble de test sert à évaluer les performances et la précision du modèle.
Les ensembles d’entraînement, les ensembles de validation et les ensembles de tests sont couramment compris :
Ensemble d’entraînement : Tout comme une leçon pour les élèves, nous utilisons ces données pour enseigner aux modèles d’apprentissage automatique comment reconnaître et traiter l’information.
Ensembles de validation : C’est comme donner un quiz aux élèves pour vérifier la qualité d’apprentissage du modèle et ce qui doit être ajusté.
Ensemble de tests : C’est comme donner un examen final aux élèves, utiliser ces données pour enfin évaluer la performance du modèle afin de voir s’il apprend.

Q2 : Qu’est-ce que le COCO et les COV ?

COCO (Common Objects in Context) et VOC (Visual Object Classes) sont deux ensembles de données bien connus dans le domaine de la vision par ordinateur, largement utilisés dans la reconnaissance d’images et la détection d’objets.


Créer:


Le jeu de données COCO a été créé par Microsoft Research.
L’ensemble de données VOC a été créé par le groupe de vision par ordinateur de l’Université d’Oxford au Royaume-Uni.


Introduire:


COCO est un jeu de données à grande échelle pour la reconnaissance d’images, la segmentation et la génération de légendes.
Il contient plus de 91 000 images, chacune avec un étiquetage et une segmentation détaillés.
Le jeu de données COCO met l’accent sur le contexte des objets dans les scènes naturelles, c’est-à-dire que les objets apparaissent souvent avec d’autres objets et ont des scènes et des arrière-plans complexes.
Les ensembles de données COCO sont couramment utilisés pour évaluer la performance de tâches telles que la détection d’objets, la segmentation d’images et la génération de légendes d’images.
VOC est un jeu de données plus ancien de reconnaissance d’images et de détection d’objets.
Il contient 20 000 images réparties dans environ 20 catégories, chacune avec des indications précises de zones et des étiquettes de catégorie.
Les ensembles de données VOC se concentrent davantage sur l’identification des catégories et la détection d’objets que sur le contexte des images.
Le VOC Challenge est une compétition importante dans le domaine de la vision par ordinateur, qui favorise le développement de technologies de détection d’objets et de reconnaissance d’images.

Particularité:

Les ensembles de données COV se caractérisent par leur annotation très précise, notamment dans les tâches de détection d’objets. Les objets de chaque image sont précisément étiquetés avec une boîte rectangulaire, et chaque objet possède une étiquette de catégorie. Cette annotation précise rend les ensembles de données COV idéaux pour entraîner et tester des algorithmes de détection d’objets, car ils peuvent apprendre à identifier et localiser avec précision des objets dans des images.
Bien que le jeu de données COCO fournisse également des annotations détaillées, il se concentre sur la reconnaissance plus large des images et la compréhension des scènes. Les annotations dans COCO incluent la détection d’objets, la segmentation et la génération de sous-titres. Cela signifie que les données de COCO incluent non seulement la boîte rectangulaire de l’objet, mais aussi des informations de scène plus complexes et des relations entre objets. Par conséquent, le jeu de données COCO est plus adapté à l’entraînement et au test de tâches de vision par ordinateur plus avancées, telles que la compréhension des scènes, la génération de légendes d’images, etc.

Résumé : Les COV peuvent être identifiés et localisés plus rapidement et avec plus de précision, principalement parce que sa méthode d’annotation est très adaptée aux tâches de détection d’objets, tandis que le COCO fournit des informations de scène plus riches et convient à des tâches visuelles plus complexes. Les deux ont leurs propres axes et constituent des ensembles de données très importants dans la recherche en vision par ordinateur.

Q3 : Quels sont leurs formats ?

  • Le format d’étiquetage des jeux de données COV est XML. Chaque image correspond à un fichier XML.
  • Le format d’étiquetage du jeu de données COCO est JSON ou txt. Toutes les annotations de la boîte cible sont dans le même JSON ou text.


Langue source:La connexion hyperlientérée est visible.




Précédent:Windows installe l’outil de gestion de l’environnement Conda
Prochain:MikroTik (2) interdit à un appareil d’accéder au réseau externe, uniquement l’accès interne
 Propriétaire| Publié sur 01/11/2024 11:39:47 |
Le jeu de données Coco est un fichier JSON qui contient un total de 5 parties.

{
    « info » : info, # informations de base sur le jeu de données
    « Licences » : [Licence], # Licence
    « images » : [image], # informations sur l’image, nom et hauteur
    « annotations » : [annotation], # annotation
    « catégories » : [catégorie] # informations sur les tags
}
info{ # Description de l’information du jeu de données
    « year » : int, # année du jeu de données
    « version » : str, # dataset version
    « description » : STR, # description du jeu de données
    « contributeur » : STR, # fournisseur de jeux de données
    « URL » : str, # lien de téléchargement du jeu de données
    « date_created » : datetime, # date de création du jeu de données
}
license{
    « id » : int,
    « nom » : Str,
    « URL » : str,
}
Image{ # Images est une liste qui stocke toutes les informations d’image (dict). L’image est un dict qui stocke des informations sur une seule image
    « id » : int, # numéro d’identification de l’image (unique pour chaque identifiant d’image)
    « largeur » : int, # largeur d’image
    « hauteur » : int, # hauteur d’image
    « file_name » : str, # nom de l’image
    « licence » : int, # accord
    « flickr_url » : str, # adresse de lien flickr
    « coco_url » : str, # adresse de connexion réseau
    « date_captured » : datetime, # date de récupération du jeu de données
}
Annotation{ # Annotations est une liste qui stocke toutes les informations sur le dict. Une annotation est un dict qui stocke une information d’annotation à cible unique.
    « id » : int, # ID d’objet cible (unique pour chaque identifiant d’objet), chaque image peut avoir plusieurs cibles
    « image_id » : int, # correspond à l’ID de l’image
    « category_id » : int, # correspond à l’ID de catégorie, correspondant à l’ID dans les catégories
    « segmentation » : RLE ou [polygone], segmentation d’instance #, coordonnées du point frontière de l’objet [x1,y1,x2,y2,....,xn,yn]
    « zone » : flotter, # La zone de l’objet
    « bbox » : [xmin,ymin,largeur,hauteur], # détection d’objets, bordure de positionnement des objets[x,y,w,h]
    « iscrowd » : 0 ou 1, # indique si c’est une foule ou non
}
catégories{ # Description de catégorie
    « id » : int, # L’ID correspondant à la catégorie (0 passe par défaut à l’arrière-plan)
    « name » : STR, # nom de la sous-catégorie
    « supercatégorie » : STR, # nom principal de la catégorie
}



Référence:

La connexion hyperlientérée est visible.
La connexion hyperlientérée est visible.
La connexion hyperlientérée est visible.
La connexion hyperlientérée est visible.

 Propriétaire| Publié sur 11/11/2024 09:16:46 |
Format de l’ensemble COCO de données :La connexion hyperlientérée est visible.


 Propriétaire| Publié sur 11/11/2024 11:43:50 |
.NET/C# calcule la surface d’un polygone
https://www.itsvse.com/thread-10870-1-1.html
Démenti:
Tous les logiciels, supports de programmation ou articles publiés par Code Farmer Network sont uniquement destinés à l’apprentissage et à la recherche ; Le contenu ci-dessus ne doit pas être utilisé à des fins commerciales ou illégales, sinon les utilisateurs assumeront toutes les conséquences. Les informations sur ce site proviennent d’Internet, et les litiges de droits d’auteur n’ont rien à voir avec ce site. Vous devez supprimer complètement le contenu ci-dessus de votre ordinateur dans les 24 heures suivant le téléchargement. Si vous aimez le programme, merci de soutenir un logiciel authentique, d’acheter l’immatriculation et d’obtenir de meilleurs services authentiques. En cas d’infraction, veuillez nous contacter par e-mail.

Mail To:help@itsvse.com