Тази статия е огледална статия за машинен превод, моля, кликнете тук, за да преминете към оригиналната статия.

Изглед: 1664|Отговор: 3

Два често използвани набора от данни за откриване на обекти – COCO и VOC

[Копирай линк]
Публикувано в 30.10.2024 г. 22:35:37 ч. | | |
Проблеми за решаване:

Какво е набор от данни?
Какво представляват COCO и VOC?
Какъв формат са?

Въпрос 1: Какво е набор от данни?

Наборът от данни, буквално, е колекция от данни.
Наборите от данни обикновено съдържат примерни данни, използвани за обучение и валидиране на модела, които могат да бъдат под формата на числа, текст, изображения, аудио или видео.
Наборите от данни се използват за обучение на алгоритмични модели, което позволява на модела да научава модели и модели в данните.
Наборите от данни обикновено се разделят на:Тренировъчен набор, валидационен набор и тестов наборТри подмножества.
Обучителният набор се използва за обучение на модела за машинно обучение, валидационният набор се използва за избор и настройка на хиперпараметрите и структурата на модела, а тестовият набор се използва за оценка на производителността и точността на модела.
Обучителните комплекти, валидационните и тестовите комплекти са често разбрани:
Тренировъчен набор: Точно като урок за учениците, използваме тези данни, за да учим модели за машинно обучение как да разпознават и обработват информация.
Валидационни набори: Това е като да дадеш на учениците тест, за да проверят колко добре моделът учи и какво трябва да се коригира.
Тестов комплект: Това е като да дадеш на учениците финален изпит, използвайки тези данни, за да оцениш представянето на модела и да видиш дали учи добре.

В2: Какво представляват COCO и VOC?

COCO (Common Objects in Context) и VOC (Visual Object Classes) са два добре познати набора от данни в областта на компютърното зрение, които се използват широко в задачи за разпознаване на изображения и откриване на обекти.


Създавам:


Наборът от данни COCO е създаден от Microsoft Research.
Наборът от данни VOC е създаден от групата за компютърно зрение в Оксфордския университет, Обединеното кралство.


Представям:


COCO е голям набор от данни за разпознаване, сегментиране на изображения и генериране на надписи.
Съдържа над 91 000 изображения, всяко с детайлно етикетиране и сегментиране.
Наборът от данни COCO подчертава контекста на обектите в естествени сцени, т.е. обектите често се появяват заедно с други обекти и имат сложни сцени и фонове.
COCO наборите от данни често се използват за оценка на изпълнението на задачи като откриване на обекти, сегментиране на изображения и генериране на субтитри на изображения.
VOC е по-стар набор от данни за разпознаване на изображения и откриване на обекти.
Той съдържа 20 000 изображения в около 20 категории, всяка с прецизни зони и етикети на категории.
VOC наборите от данни се фокусират повече върху идентифициране на категории и откриване на обекти, отколкото върху контекста на изображенията.
VOC Challenge е важно състезание в областта на компютърното зрение, което насърчава развитието на технологии за откриване на обекти и разпознаване на изображения.

Особеност:

VOC наборите от данни се характеризират с това, че предоставят много прецизни анотации, особено при задачи за откриване на обекти. Обектите във всяко изображение са прецизно означени с правоъгълна кутия, а всеки обект има категория. Тази прецизна анотация прави наборите от данни VOC идеални за обучение и тестване на алгоритми за откриване на обекти, тъй като те могат да научат как точно да идентифицират и локализират обекти в изображенията.
Докато наборът от данни COCO също предоставя подробни анотации, той се фокусира върху по-широко разпознаване на изображения и разбиране на сцени. Анотациите в COCO включват откриване на обекти, сегментиране и генериране на субтитри. Това означава, че данните на COCO включват не само правоъгълната кутия на обекта, но и по-сложна информация за сцените и връзките между обектите. Затова наборът от данни COCO е по-подходящ за обучение и тестване на по-напреднали задачи за компютърно зрение, като разбиране на сцени, генериране на надписи към изображения и др.

Резюме: VOC може да бъде идентифициран и локализиран по-бързо и точно, главно защото методът му на анотиране е много подходящ за задачи за откриване на обекти, докато COCO предоставя по-богата информация за сцените и е подходящ за по-сложни визуални задачи. И двете имат свои собствени фокуси и са много важни набори от данни в изследванията на компютърното зрение.

Въпрос 3: Какви са техните формати?

  • Форматът за етикетиране на наборите от данни за VOC е XML. Всяко изображение съответства на XML файл.
  • Форматът за етикетиране на набора от данни COCO е JSON или txt. Всички анотации на целеви кутии са в един и същи JSON или txt.


Оригинален:Входът към хиперлинк е видим.




Предишен:Windows инсталирай инструмента за управление на средата Conda
Следващ:MikroTik (2) забранява на устройство достъп до външната мрежа, само до вътрешния мрежов достъп
 Хазяин| Публикувано в 1.11.2024 г. 11:39:47 ч. |
Наборът от данни Coco е JSON файл, който съдържа общо 5 части.

{
    "info": информация, # основна информация за набора от данни
    "лицензи": [лиценз], # лиценз
    "изображения": [изображение], # информация за изображението, име и височина
    "анотации": [анотация], # анотация
    "Категории": [категория] # Информация за тагове
}
info{ # Описание на информацията за набора от данни
    "year": интелигентност, # година от набор от данни
    "version": str, # dataset version
    "описание": str, # описание на набор от данни
    "contributor": str, # dataset provider
    "URL": STR, # Линк за изтегляне на набор от данни
    "date_created": datetime, # дата на създаване на набор от данни
}
лиценз{
    "id": int,
    "Име": Str,
    "url": str,
}
Image{ # images е списък, който съхранява цялата информация за изображението (дикт). Image е дикт, който съхранява информация за едно изображение
    "id": int, # ID номер на изображението (уникален за всяко изображение ID)
    "width": int, # ширина на изображението
    "height": int, # височина на изображението
    "file_name": str, # име на изображението
    "Лиценз": INT, # Споразумение
    "flickr_url": str, # адрес на линк за Flickr
    "coco_url": str, # адрес за мрежова връзка
    "date_captured": datetime, # дата за вземане на набор от данни
}
Анотация{ # Анотации е списък, който съхранява цялата информация за дикта. Анотацията е дикт, който съхранява една целева анотация информация.
    "id": int, # Target object ID (уникален за всеки обектен ID), всяко изображение може да има няколко цели
    "image_id": int, # съответства на ID-то на изображението
    "category_id": int, # съответства на ID-а на категорията, съответстващ на ID-то в категориите
    "сегментация": RLE или [полигон], # сегментация на екземпляра, граничните координати на обекта [x1,y1,x2,y2,....,xn,yn]
    "area": float, # Площта на обектната област
    "bbox": [xmin,ymin,ширина,височина], # откриване на обекти, граница на позициониране на обекти[x,y,w,h]
    "iscrowd": 0 или 1, # показва дали е тълпа или не
}
категории{ # Описание на категорията
    "id": int, # ID-то, съответстващо на категорията (0 по подразбиране е на фона)
    "Име": Str, # Име на подкатегория
    "Суперкатегория": STR, # Основно име на категорията
}



Препратка:

Входът към хиперлинк е видим.
Входът към хиперлинк е видим.
Входът към хиперлинк е видим.
Входът към хиперлинк е видим.

 Хазяин| Публикувано в 11.11.2024 г. 9:16:46 ч. |
Формат на набор от данни COCO:Входът към хиперлинк е видим.


 Хазяин| Публикувано в 11.11.2024 г. 11:43:50 ч. |
.NET/C# изчислява площта на многоъгълник
https://www.itsvse.com/thread-10870-1-1.html
Отричане:
Целият софтуер, програмни материали или статии, публикувани от Code Farmer Network, са само за учебни и изследователски цели; Горното съдържание не трябва да се използва за търговски или незаконни цели, в противен случай потребителите ще понесат всички последствия. Информацията на този сайт идва от интернет, а споровете за авторски права нямат нищо общо с този сайт. Трябва напълно да изтриете горното съдържание от компютъра си в рамките на 24 часа след изтеглянето. Ако ви харесва програмата, моля, подкрепете оригинален софтуер, купете регистрация и получете по-добри услуги. Ако има нарушение, моля, свържете се с нас по имейл.

Mail To:help@itsvse.com