Эта статья является зеркальной статьёй машинного перевода, пожалуйста, нажмите здесь, чтобы перейти к оригиналу.

Вид: 1664|Ответ: 3

Два широко используемых набора данных для обнаружения объектов — COCO и VOC

[Скопировать ссылку]
Опубликовано 30.10.2024 22:35:37 | | |
Проблемы для решения:

Что такое набор данных?
Что такое COCO и VOC?
Какой у них формат?

Вопрос 1: Что такое набор данных?

Набор данных, буквально, — это совокупность данных.
Наборы данных обычно содержат примерные данные, используемые для обучения и валидации модели, которые могут быть в виде чисел, текста, изображений, аудио или видео.
Наборы данных используются для обучения алгоритмических моделей, позволяя модели изучать закономерности и шаблоны в данных.
Наборы данных обычно делятся на:Обучающий набор, набор валидации и тестовый наборТри подмножества.
Обучающий набор используется для обучения модели машинного обучения, валидационный набор — для выбора и корректировки гиперпараметров и структуры модели, а тестовый набор — для оценки производительности и точности модели.
Обучающие наборы, валидационные наборы и тестовые наборы обычно понимаются:
Учебный набор: Как урок для учеников, мы используем эти данные, чтобы научить модели машинного обучения распознавать и обрабатывать информацию.
Валидационные наборы: Это как дать студентам викторину, чтобы проверить, насколько хорошо модель учится, и понять, что нужно скорректировать.
Тестовый набор: Это как давать студентам финальный экзамен, используя эти данные, чтобы наконец оценить результаты модели и понять, хорошо ли она учится.

Вопрос 2: Что такое COCO и VOC?

COCO (Common Objects in Context) и VOC (Visual Object Classes) — два хорошо известных набора данных в области компьютерного зрения, которые широко используются в задачах распознавания изображений и обнаружения объектов.


Создавать:


Набор данных COCO был создан компанией Microsoft Research.
Набор данных VOC был создан группой компьютерного зрения Оксфордского университета в Великобритании.


Представлять:


COCO — это крупномасштабный набор данных для распознавания, сегментации изображений и генерации субтитров.
В нём более 91 000 изображений, каждое из которых имеет подробную маркировку и сегментацию.
Набор данных COCO акцентирует внимание на контексте объектов в естественных сценах, то есть объекты часто появляются вместе с другими объектами и имеют сложные сцены и фоны.
Наборы данных COCO обычно используются для оценки эффективности задач, таких как обнаружение объектов, сегментация изображений и генерация подписей к изображениям.
VOC — это старый набор данных для распознавания изображений и обнаружения объектов.
Он содержит 20 000 изображений примерно в 20 категориях, каждая из которых имеет чёткие выделения областей и метки категорий.
Наборы данных VOC больше сосредоточены на идентификации категорий и обнаружении объектов, чем на контексте изображений.
VOC Challenge — это важный конкурс в области компьютерного зрения, который способствует развитию технологий обнаружения объектов и распознавания изображений.

Особенность:

Наборы данных VOC характеризуются тем, что обеспечивают очень точную аннотацию, особенно в задачах обнаружения объектов. Объекты на каждом изображении точно помечены прямоугольным рамком, и каждый объект имеет метку категории. Такая точная аннотация делает наборы данных VOC идеальными для обучения и тестирования алгоритмов обнаружения объектов, поскольку они могут научиться точно идентифицировать и находить объекты на изображениях.
Хотя набор данных COCO также содержит подробные аннотации, он сосредоточен на более широком распознавании изображений и понимании сцен. Аннотации в COCO включают обнаружение объектов, сегментацию и генерацию субтитров. Это означает, что данные COCO включают не только прямоугольную коробку объекта, но и более сложную информацию о сцене и отношения между объектами. Поэтому набор данных COCO больше подходит для обучения и тестирования более сложных задач компьютерного зрения, таких как понимание сцен, генерация подписей к изображениям и т.д.

Резюме: ЛОС можно быстрее и точно идентифицировать и локализировать, главным образом потому, что его метод аннотирования очень подходит для задач обнаружения объектов, тогда как COCO предоставляет более богатую информацию о сцене и подходит для более сложных визуальных задач. Оба направления имеют свои направления и являются очень важными наборами данных в исследованиях компьютерного зрения.

Вопрос 3: Какие у них форматы?

  • Формат маркировки наборов данных VOC — XML. Каждое изображение соответствует XML-файлу.
  • Формат маркировки набора данных COCO — JSON или txt. Все аннотации целевых боксов находятся в одном JSON или txt.


Исходный текст:Вход по гиперссылке виден.




Предыдущий:Windows установите инструмент управления окружением Conda
Следующий:MikroTik (2) запрещает устройству получать доступ только к внешней сети
 Хозяин| Опубликовано 01.11.2024 11:39:47 |
Набор данных Coco — это JSON-файл, содержащий всего 5 частей.

{
    "info": info, # базовая информация о наборе данных
    «лицензии»: [лицензия], # лицензия
    «изображения»: [изображение], # информация о изображении, название и высота
    «аннотации»: [аннотации], # аннотации
    "Категории": [категория] # Информация о тегах
}
info{ # Описание информации о наборе данных
    "year": int, # год набора данных
    "version": str, # dataset version
    "описание": str, # описание набора данных
    "contributor": str, # dataset provider
    "url": str, # ссылка на загрузку набора данных
    "date_created": datetime, # дата создания набора данных
}
лицензия{
    "id": int,
    "name": str,
    "url": str,
}
Image{ # images — это список, в котором хранится вся информация о изображениях (DICT). Image — это дикт, который хранит информацию об одном изображении
    "id": int, # ID номер изображения (уникальный для каждого ID изображения)
    "width": int, # ширина изображения
    "высота": интеллект, # высота изображения
    "file_name": str, # название изображения
    "Лицензия": INT, # Соглашение
    "flickr_url": str, # адрес ссылки на Flickr
    "coco_url": str, # адрес сетевого соединения
    "date_captured": datetime, # дата получения данных
}
Аннотация{ # Аннотации — это список, в котором хранится вся информация о диктате. Аннотация — это дикт, который хранит одну целевой аннотационную информацию.
    "id": int, # Target object ID (уникальный для каждого объекта), каждое изображение может иметь несколько целей
    "image_id": int, # соответствует идентификатору изображения
    "category_id": int, # соответствует идентификатору категории, соответствующему идентификатору в категориях
    "сегментация": RLE или [многоугольник], # сегментация экземпляра, пограничные координаты объекта [x1,y1,x2,y2,....,xn,yn]
    "area": float, # Площадь объектной области
    "bbox": [xmin,ymin,width,height], # обнаружение объектов, граница позиционирования объекта[x,y,w,h]
    «iscrowd»: 0 или 1, # указывает, является ли это толпой или нет
}
категории{ # Описание категории
    "id": int, # ID, соответствующий категории (0 по умолчанию относится к фону)
    "name": str, # название подкатегории
    «суперкатегория»: STR, # Основное название категории
}



Ссылка:

Вход по гиперссылке виден.
Вход по гиперссылке виден.
Вход по гиперссылке виден.
Вход по гиперссылке виден.

 Хозяин| Опубликовано 11.11.2024 9:16:46 |
Формат набора данных COCO:Вход по гиперссылке виден.


 Хозяин| Опубликовано 11.11.2024 11:43:50 |
.NET/C# вычисляет площадь многоугольника
https://www.itsvse.com/thread-10870-1-1.html
Отказ:
Всё программное обеспечение, программные материалы или статьи, публикуемые Code Farmer Network, предназначены исключительно для учебных и исследовательских целей; Вышеуказанный контент не должен использоваться в коммерческих или незаконных целях, иначе пользователи несут все последствия. Информация на этом сайте взята из Интернета, и споры по авторским правам не имеют отношения к этому сайту. Вы должны полностью удалить вышеуказанный контент с компьютера в течение 24 часов после загрузки. Если вам нравится программа, пожалуйста, поддержите подлинное программное обеспечение, купите регистрацию и получите лучшие подлинные услуги. Если есть нарушение, пожалуйста, свяжитесь с нами по электронной почте.

Mail To:help@itsvse.com