Este artigo é um artigo espelhado de tradução automática, por favor clique aqui para ir para o artigo original.

Vista: 1664|Resposta: 3

Dois conjuntos de dados comumente usados para detecção de objetos, COCO e VOC

[Copiar link]
Publicado em 30/10/2024 22:35:37 | | |
Problemas a serem resolvidos:

O que é um conjunto de dados?
O que são COCO e COVs?
Qual é o formato deles?

P1: O que é um conjunto de dados?

Um conjunto de dados, literalmente, é um conjunto de dados.
Conjuntos de dados normalmente contêm dados de amostra usados para treinar e validar o modelo, que podem estar na forma de números, texto, imagens, áudio ou vídeo.
Conjuntos de dados são usados para treinar modelos algorítmicos, permitindo que o modelo aprenda padrões e padrões nos dados.
Os conjuntos de dados geralmente são divididos em:Conjunto de treinamento, conjunto de validação e conjunto de testeTrês subconjuntos.
O conjunto de treinamento é usado para treinar o modelo de aprendizado de máquina, o conjunto de validação é usado para selecionar e ajustar os hiperparâmetros e a estrutura do modelo, e o conjunto de teste é usado para avaliar o desempenho e a precisão do modelo.
Conjuntos de treinamento, conjuntos de validação e conjuntos de teste são comumente entendidos:
Conjunto de treinamento: Assim como uma aula para os alunos, usamos esses dados para ensinar modelos de aprendizado de máquina a reconhecer e processar informações.
Conjuntos de validação: É como dar aos alunos um teste para verificar o quão bem o modelo está aprendendo e ver o que precisa ser ajustado.
Conjunto de testes: É como dar aos alunos uma prova final, usando esses dados para finalmente avaliar o desempenho do modelo e ver se ele aprende bem.

P2: O que são COCO e VOC?

COCO (Common Objects in Context) e VOC (Visual Object Classes) são dois conjuntos de dados bem conhecidos no campo da visão computacional, amplamente utilizados em tarefas de reconhecimento de imagens e detecção de objetos.


Criar:


O conjunto de dados COCO foi criado pela Microsoft Research.
O conjunto de dados VOC foi criado pelo grupo de visão computacional da Universidade de Oxford, no Reino Unido.


Apresentar:


COCO é um conjunto de dados em grande escala para reconhecimento de imagens, segmentação e geração de legendas.
Ele contém mais de 91.000 imagens, cada uma com rotulagem detalhada e segmentação.
O conjunto de dados COCO enfatiza o contexto dos objetos em cenas naturais, ou seja, objetos frequentemente aparecem junto com outros objetos e possuem cenas e fundos complexos.
Conjuntos de dados COCO são comumente usados para avaliar o desempenho de tarefas como detecção de objetos, segmentação de imagens e geração de legendas de imagens.
VOC é um conjunto de dados mais antigo de reconhecimento de imagens e detecção de objetos.
Ele contém 20.000 imagens em cerca de 20 categorias, cada uma com indicações de área precisas e rótulos de categoria.
Os conjuntos de dados de VOC focam mais na identificação de categorias e detecção de objetos do que no contexto das imagens.
O Desafio VOC é uma competição importante no campo da visão computacional, que promove o desenvolvimento de tecnologia de detecção de objetos e reconhecimento de imagens.

Peculiaridade:

Conjuntos de dados de VOC são caracterizados pelo fato de fornecerem anotações muito precisas, especialmente em tarefas de detecção de objetos. Os objetos em cada imagem são rotulados com precisão com uma caixa retangular, e cada objeto possui um rótulo de categoria. Essa anotação precisa torna os conjuntos de dados de VOC ideais para treinar e testar algoritmos de detecção de objetos, pois eles podem aprender a identificar e localizar objetos com precisão em imagens.
Embora o conjunto de dados COCO também forneça anotações detalhadas, ele foca no reconhecimento mais amplo de imagens e na compreensão da cena. As anotações no COCO incluem detecção de objetos, segmentação e geração de legendas. Isso significa que os dados do COCO incluem não apenas a caixa retangular do objeto, mas também informações mais complexas da cena e relações entre os objetos. Portanto, o conjunto de dados COCO é mais adequado para treinar e testar tarefas de visão computacional mais avançadas, como compreensão de cenas, geração de legendas de imagens, etc.

Resumo: O COV pode ser identificado e localizado de forma mais rápida e precisa, principalmente porque seu método de anotação é muito adequado para tarefas de detecção de objetos, enquanto o COCO fornece informações de cena mais ricas e é adequado para tarefas visuais mais complexas. Ambos têm seus próprios focos e são conjuntos de dados muito importantes em pesquisa em visão computacional.

P3: Quais são os formatos deles?

  • O formato de rotulagem dos conjuntos de dados de COV é XML. Cada imagem corresponde a um arquivo XML.
  • O formato de rotulagem do conjunto de dados COCO é JSON ou txt. Todas as anotações da caixa de destino estão no mesmo JSON ou txt.


Original:O login do hiperlink está visível.




Anterior:O Windows instale a ferramenta de gerenciamento de ambientes Conda
Próximo:O MikroTik (2) proíbe que um dispositivo acesse a rede externa, apenas o acesso interno à rede
 Senhorio| Publicado em 01/11/2024 11:39:47 |
O conjunto de dados Coco é um arquivo JSON que contém um total de 5 partes.

{
    "Info": Info, # Informação básica sobre o conjunto de dados
    "Licenças": [Licença], # Licença
    "Imagens": [Imagem], # Informação da imagem, nome e altura
    "Anotações": [Anotação], # Anotação
    "Categorias": [Categoria] # Informações da Tag
}
info{ # Descrição da informação do conjunto de dados
    "Ano": int, # Ano do Conjunto de Dados
    "version": str, # dataset version
    "Descrição": STR, # Descrição do Conjunto de Dados
    "Contributor": STR, # Fornecedor de Dataset
    "URL": STR, # link para download do conjunto de dados
    "date_created": data-hora, # data de criação do conjunto de dados
}
license{
    "id": int,
    "nome": Str,
    "URL": str,
}
image{ # images é uma lista que armazena todas as informações da imagem (dict). Imagem é um ditado que armazena informações sobre uma única imagem
    "id": int, # número de ID da imagem (único para cada ID de imagem)
    "width": int, # largura da imagem
    "altura": int, # altura da imagem
    "file_name": força, # nome da imagem
    "Licença": int, # Acordo
    "flickr_url": str, # endereço do link do flickr
    "coco_url": força, # endereço de conexão de rede
    "date_captured": data-hora, # data de busca do conjunto de dados
}
Anotação{ # Anotações é uma lista que armazena todas as informações do ditado. Uma anotação é um ditto que armazena uma informação de anotação de alvo único.
    "id": int, # ID de objeto alvo (único para cada ID de objeto), cada imagem pode ter múltiplos alvos
    "image_id": int, # corresponde ao ID da imagem
    "category_id": int, # corresponde ao ID da categoria, correspondente ao ID nas categorias
    "segmentação": RLE ou [polígono], segmentação de instância #, as coordenadas do ponto de fronteira do objeto [x1,y1,x2,y2,....,xn,yn]
    "área": flutuar, # A área da área do objeto
    "bbox": [xmin,ymin,width,height], # detecção de objetos, borda de posicionamento do objeto[x,y,w,h]
    "iscrowd": 0 ou 1, # indica se é uma multidão ou não
}
categorias{ # Descrição da categoria
    "id": int, # O ID correspondente à categoria (0 por padrão fica em segundo plano)
    "nome": STR, # nome da subcategoria
    "Supercategoria": Str, # Nome da Categoria Principal
}



Referência:

O login do hiperlink está visível.
O login do hiperlink está visível.
O login do hiperlink está visível.
O login do hiperlink está visível.

 Senhorio| Publicado em 11/11/2024 09:16:46 |
Formato do Conjunto COCO de Dados:O login do hiperlink está visível.


 Senhorio| Publicado em 11/11/2024 11:43:50 |
.NET/C# calcula a área de um polígono
https://www.itsvse.com/thread-10870-1-1.html
Disclaimer:
Todo software, material de programação ou artigos publicados pela Code Farmer Network são apenas para fins de aprendizado e pesquisa; O conteúdo acima não deve ser usado para fins comerciais ou ilegais, caso contrário, os usuários terão todas as consequências. As informações deste site vêm da Internet, e disputas de direitos autorais não têm nada a ver com este site. Você deve deletar completamente o conteúdo acima do seu computador em até 24 horas após o download. Se você gosta do programa, por favor, apoie um software genuíno, compre o registro e obtenha serviços genuínos melhores. Se houver qualquer infração, por favor, entre em contato conosco por e-mail.

Mail To:help@itsvse.com