Ця стаття є дзеркальною статтею машинного перекладу, будь ласка, натисніть тут, щоб перейти до оригінальної статті.

Вид: 1664|Відповідь: 3

Два поширені набори даних для виявлення об'єктів — COCO та VOC

[Копіювати посилання]
Опубліковано 30.10.2024 22:35:37 | | |
Проблеми для розв'язання:

Що таке набір даних?
Що таке COCO та VOC?
Який у них формат?

Питання 1: Що таке набір даних?

Набір даних, буквально, — це сукупність даних.
Набори даних зазвичай містять зразкові дані, які використовуються для навчання та перевірки моделі, які можуть бути у вигляді чисел, тексту, зображень, аудіо або відео.
Набори даних використовуються для навчання алгоритмічних моделей, що дозволяє моделі вивчати закономірності та шаблони в даних.
Набори даних зазвичай поділяються на:Навчальний набір, валідаційний набір і тестовий набірТри підмножини.
Навчальний набір використовується для навчання моделі машинного навчання, валідаційний набір — для вибору та коригування гіперпараметрів і структури моделі, а тестовий набір — для оцінки продуктивності та точності моделі.
Навчальні набори, валідаційні набори та тестові набори зазвичай розуміють:
Тренувальний набір: Як урок для учнів, ми використовуємо ці дані для навчання моделей машинного навчання розпізнаванню та обробці інформації.
Набори валідації: Це як дати студентам тест, щоб перевірити, наскільки добре модель навчається, і визначити, що потрібно підкоригувати.
Тестовий набір: Це як дати учням фінальний іспит, використовуючи ці дані, щоб нарешті оцінити ефективність моделі і перевірити, чи добре вона навчається.

Питання 2: Що таке COCO та VOC?

COCO (Common Objects in Context) та VOC (Visual Object Classes) — це два добре відомі набори даних у галузі комп'ютерного зору, які широко використовуються у завданнях розпізнавання зображень та виявлення об'єктів.


Творити:


Набір даних COCO був створений компанією Microsoft Research.
Набір даних VOC був створений групою комп'ютерного зору Оксфордського університету у Великій Британії.


Ввести:


COCO — це великомасштабний набір даних для розпізнавання зображень, сегментації та генерації субтитрів.
Він містить понад 91 000 зображень, кожне з детальним маркуванням і сегментацією.
Набір даних COCO підкреслює контекст об'єктів у природних сценах, тобто об'єкти часто з'являються разом з іншими об'єктами та мають складні сцени та фони.
Набори даних COCO зазвичай використовуються для оцінки виконання завдань, таких як виявлення об'єктів, сегментація зображень та генерація підписів до зображень.
VOC — це старіший набір даних для розпізнавання зображень та виявлення об'єктів.
Вона містить 20 000 зображень приблизно у 20 категоріях, кожна з яких має точні позначення областей і категорійні мітки.
Набори даних VOC більше зосереджені на ідентифікації категорій і виявленні об'єктів, ніж на контексті зображень.
VOC Challenge — це важливий конкурс у сфері комп'ютерного зору, який сприяє розвитку технологій виявлення об'єктів і розпізнавання зображень.

Особливість:

Набори даних VOC характеризуються тим, що вони забезпечують дуже точне анотування, особливо у завданнях виявлення об'єктів. Об'єкти на кожному зображенні точно позначені прямокутним квадратом, і кожен об'єкт має категорійну мітку. Ця точна анотація робить набори даних VOC ідеальними для навчання та тестування алгоритмів виявлення об'єктів, оскільки вони можуть навчитися точно ідентифікувати та знаходити об'єкти на зображеннях.
Хоча набір даних COCO також містить детальні анотації, він зосереджується на ширшому розпізнаванні зображень і розумінні сцен. Анотації в COCO включають виявлення об'єктів, сегментацію та генерацію субтитрів. Це означає, що дані COCO включають не лише прямокутну коробку об'єкта, а й складнішу інформацію про сцену та взаємозв'язки між об'єктами. Тому набір даних COCO більше підходить для навчання та тестування більш складних завдань комп'ютерного зору, таких як розуміння сцен, генерація підписів до зображень тощо.

Резюме: VOC можна ідентифікувати та локалізувати швидше та точніше, головним чином тому, що його метод анотації дуже підходить для завдань виявлення об'єктів, тоді як COCO надає більш глибоку інформацію про сцену і підходить для складніших візуальних завдань. Обидва мають власні напрямки і є дуже важливими наборами даних у дослідженнях комп'ютерного зору.

Питання 3: Які у них формати?

  • Формат маркування наборів даних VOC — XML. Кожне зображення відповідає XML-файлу.
  • Формат маркування набору даних COCO — JSON або txt. Усі анотації цільових коробок розміщені в одному JSON або txt.


Оригінальний:Вхід за гіперпосиланням видно.




Попередній:Встановіть інструмент управління середовищем Conda для Windows.
Наступний:MikroTik (2) забороняє пристрою отримувати доступ до зовнішньої мережі, лише внутрішній доступ до мережі
 Орендодавець| Опубліковано 01.11.2024 11:39:47 |
Набір даних Coco — це JSON-файл, який містить загалом 5 частин.

{
    "info": інформація, # базова інформація про набір даних
    "ліцензії": [ліцензія], # ліцензія
    "зображення": [зображення], # інформація про зображення, ім'я та висота
    "анотації": [анотація], # анотація
    "категорії": [категорія] # інформація про теги
}
info{ # Опис інформації про набор даних
    "рік": int, # рік набору даних
    "версія": str, # версія набору даних
    "description": str, # data set description
    "contributor": str, # provider dataset
    "url": посилання на завантаження STR, # Dataset
    "date_created": datetime, # дата створення набору даних
}
ліцензія{
    "id": int,
    "name": str,
    "url": str,
}
Image{ # images — це список, який зберігає всю інформацію про зображення (dict). Image — це дикт, який зберігає інформацію про одне зображення
    "id": int, # ID номер зображення (унікальний для кожного ID зображення)
    "width": int, # ширина зображення
    "height": int, # image height
    "file_name": str, # назва зображення
    "Ліцензія": INT, # Угода
    "flickr_url": str, # адреса посилання на Flickr
    "coco_url": str, # адреса мережевого з'єднання
    "date_captured": datetime, # дата завантаження dataset
}
Анотація{ # Анотації — це список, який зберігає всю інформацію про диктати. Анотація — це дикт, який зберігає одну інформацію про цільову анотацію.
    "id": int, # Target object ID (унікальний для кожного об'єкта), кожне зображення може мати кілька цілей
    "image_id": int, # відповідає ідентифікатору зображення
    "category_id": int, # відповідає ID категорії, що відповідає ID у категоріях
    "сегментація": RLE або [полігон], # сегментація екземпляра, координати граничних точок об'єкта [x1,y1,x2,y2,....,xn,yn]
    "area": float, # Площа об'єктної області
    "bbox": [xmin,ymin,width,height], # визначення об'єктів, межа позиціонування об'єктів[x,y,w,h]
    "iscrowd": 0 або 1, # вказує, чи є це натовпом
}
категорії{ # Опис категорії
    "id": int, # ID, що відповідає категорії (0 за замовчуванням відображається на фоні)
    "name": str, # назва підкатегорії
    "Суперкатегорія": STR, # Основна назва категорії
}



Посилання:

Вхід за гіперпосиланням видно.
Вхід за гіперпосиланням видно.
Вхід за гіперпосиланням видно.
Вхід за гіперпосиланням видно.

 Орендодавець| Опубліковано 11.11.2024 09:16:46 |
Формат набору даних COCO:Вхід за гіперпосиланням видно.


 Орендодавець| Опубліковано 11.11.2024 11:43:50 |
.NET/C# обчислює площу багатокутника
https://www.itsvse.com/thread-10870-1-1.html
Застереження:
Усе програмне забезпечення, програмні матеріали або статті, опубліковані Code Farmer Network, призначені лише для навчання та досліджень; Вищезазначений контент не повинен використовуватися в комерційних чи незаконних цілях, інакше користувачі несуть усі наслідки. Інформація на цьому сайті надходить з Інтернету, і спори щодо авторських прав не мають до цього сайту. Ви повинні повністю видалити вищезазначений контент зі свого комп'ютера протягом 24 годин після завантаження. Якщо вам подобається програма, будь ласка, підтримуйте справжнє програмне забезпечення, купуйте реєстрацію та отримайте кращі справжні послуги. Якщо є будь-яке порушення, будь ласка, зв'яжіться з нами електронною поштою.

Mail To:help@itsvse.com