Nesne tespiti için yaygın olarak kullanılan iki veri seti COCO ve VOC

Küçük · Yayınlandı 30.10.2024 22:35:37

Çözülmesi gereken sorunlar:

Veri seti nedir?
COCO ve VOC'ler nedir?
Hangi formattalar?

S1: Veri seti nedir?

Bir veri seti, kelimenin tam anlamıyla, bir veri koleksiyonudur.
Veri setleri genellikle modeli eğitmek ve doğrulamak için kullanılan örnek veriler içerir; bunlar sayılar, metinler, görseller, ses veya video şeklinde olabilir.
Veri setleri, algoritmik modelleri eğitmek için kullanılır ve modelin verilerdeki kalıpları ve desenleri öğrenmesini sağlar.
Veri setleri genellikle şu şekilde ayrılır:Eğitim seti, doğrulama seti ve test setiÜç alt küme.
Eğitim seti makine öğrenimi modelini eğitmek için kullanılır, doğrulama seti modelin hiperparametrelerini ve yapısını seçip ayarlamak için kullanılır ve test seti modelin performansı ve doğruluğunu değerlendirmek için kullanılır.
Eğitim setleri, doğrulama setleri ve test setleri yaygın olarak şu şekilde anlaşılır:
Eğitim seti: Öğrenciler için bir ders gibi, bu veriyi makine öğrenimi modellerine bilgiyi tanımağı ve işlemeyi öğretmek için kullanıyoruz.
Doğrulama setleri: Bu, öğrencilere modelin ne kadar iyi öğrendiğini kontrol etmek ve neyin ayarlanması gerektiğini görmek için bir test vermek gibidir.
Test seti: Bu, öğrencilere final sınavı vermek gibidir; bu verileri kullanarak modelin performansını nihayet değerlendirip iyi öğrenip öğrenmediğini görmek gibidir.

S2: COCO ve VOC nedir?

COCO (Common Objects in Context) ve VOC (Visual Object Classes), bilgisayar görme alanında yaygın olarak kullanılan ve görüntü tanıma ve nesne algılama görevlerinde yaygın olarak kullanılan iki tanınmış veri setidir.

Yaratmak:

COCO veri seti Microsoft Research tarafından oluşturuldu.
VOC veri seti, Birleşik Krallık'taki Oxford Üniversitesi'ndeki bilgisayar görme grubu tarafından oluşturuldu.

Tanıtmak:

COCO, görüntü tanıma, segmentasyon ve başlık oluşturma için büyük ölçekli bir veri setidir.
Her biri ayrıntılı etiketleme ve segmentasyona sahip 91.000'den fazla görsel içermektedir.
COCO veri seti, doğal sahnelerdeki nesnelerin bağlamını vurgular; yani nesneler genellikle diğer nesnelerle birlikte görünür ve karmaşık sahneler ve arka planlara sahiptir.
COCO veri setleri, nesne algılama, görüntü segmentasyonu ve resim başlığı oluşturma gibi görevlerin performansını değerlendirmek için yaygın olarak kullanılır.
VOC, daha eski bir görüntü tanıma ve nesne algılama veri setidir.
Yaklaşık 20 kategoride 20.000 görsel içerir ve her biri kesin alan çağrıları ve kategori etiketleri içerir.
VOC veri setleri, görüntülerin bağlamından çok kategori tanımlama ve nesne tespitine odaklanır.
VOC Challenge, bilgisayar görme alanında önemli bir yarışmadır ve nesne algılama ile görüntü tanıma teknolojisinin gelişimini teşvik eder.

Özellik:

VOC veri setleri, özellikle nesne tespit görevlerinde çok hassas bir açıklama sağlamalarıyla karakterize edilir. Her görseldeki nesneler dikdörtgen bir kutu ile tam olarak etiketlenmiştir ve her nesnenin bir kategori etiketi vardır. Bu hassas açıklama, VOC veri setlerini nesne algılama algoritmalarının eğitimi ve testi için ideal kılar; çünkü nesneleri fotoğraflarda doğru şekilde tanımlamayı ve konumlandırmayı öğrenebilirler.
COCO veri seti ayrıca ayrıntılı açıklamalar sunarken, daha geniş görüntü tanıma ve sahne anlayışına odaklanır. COCO'daki açıklamalar arasında nesne algılama, segmentasyon ve altyazı oluşturma yer alır. Bu, COCO'nun verilerinin sadece nesnenin dikdörtgen kutusunu değil, aynı zamanda daha karmaşık sahne bilgisi ve nesneler arasındaki ilişkileri de içerdiği anlamına gelir. Bu nedenle, COCO veri seti, sahne anlama, resim başlığı oluşturma gibi daha gelişmiş bilgisayar görme görevlerinin eğitimi ve test edilmesi için daha uygundur.

Özet: VOC daha hızlı ve doğru tanımlanabilir ve konumlandırılabilir, çünkü annotasyon yöntemi nesne algılama görevleri için çok uygundur; COCO ise daha zengin sahne bilgisi sağlar ve daha karmaşık görsel görevler için uygundur. Her ikisinin de kendi odak noktaları vardır ve bilgisayar görme araştırmalarında çok önemli veri setleridir.

S3: Formatları nedir?

VOC veri setlerinin etiketleme formatı XML'dir. Her görüntü bir XML dosyasına karşılık gelir.
COCO veri setinin etiketleme formatı JSON veya txt'dir. Tüm hedef kutusu notları aynı JSON veya txt'de yer alır.

Özgün:Bağlantı girişi görünür.

Küçük · Yayınlandı 1.11.2024 11:39:47

Coco veri seti, toplam 5 parçadan oluşan bir JSON dosyasıdır.

{
"bilgi": bilgi, # veri seti hakkında temel bilgiler
"lisanslar": [lisans], # lisans
"images": [image], # image information, name ve boy
"Annotations": [Açıklama], # Açıklama
"kategoriler": [kategori] # etiket bilgisi
}
info{ # Veri kümesi bilgi açıklaması
"yıl": int, # veri seti yılı
"version": str, # veri seti versiyonu
"açıklama": str, # veri seti açıklaması
"katkı sağlayıcı": str, # veri seti sağlayıcısı
"URL": str, # veri seti indirme linki
"date_created": datetime, # veri seti oluşturulma tarihi
}
license{
"id": int,
"isim": str,
"URL": str,
}
image{ # images, tüm görüntü (dikt) bilgilerini saklayan bir listedir. Image, tek bir görüntü hakkında bilgi saklayan bir dikttir
"id": int, # Görselin ID numarası (her görüntü kimliği için benzersiz)
"width": int, # resim genişliği
"yükseklik": int, # resim yüksekliği
"file_name": str, # resim adı
"lisans": int, # anlaşma
"flickr_url": str, # flickr bağlantı adresi
"coco_url": str, # ağ bağlantı adresi
"date_captured": datetime, # veri seti getirme tarihi
}
annotation{ # annotations, tüm dikt bilgilerini saklayan bir listedir. Bir notasyon, tek bir hedef notasyon bilgisini saklayan bir dikttir.
"id": int, # Hedef nesne kimliği (her nesne kimliği için benzersiz), her görüntünün birden fazla hedefi olabilir
"image_id": int, # resim kimliğine karşılık gelir
"category_id": int, #, kategorilerdeki ID'ye karşılık gelen kategori ID'ye karşılık gelir
"segmentasyon": RLE veya [çokgen], # örnek segmentasyon, nesnenin sınır nokta koordinatları [x1,y1,x2,y2,....,xn,yn]
"alan": float, # Nesne alanının alanı
"bbox": [xmin,ymin,width,height], # nesne algılama, nesne konumlandırma sınırı[x,y,w,h]
"iscrowd": 0 veya 1, # kalabalık olup olmadığını gösterir
}
kategoriler{ # Kategori tanımı
"id": int, # Kategoriye karşılık gelen ID (0 arka planda varsayılan olur)
"name": str, # alt kategori adı
"süper kategori": str, # ana kategori adı
}

Referans:

Bağlantı girişi görünür.
Bağlantı girişi görünür.
Bağlantı girişi görünür.
Bağlantı girişi görünür.

Küçük · Yayınlandı 11.11.2024 09:16:46

Veri COCO Kümesi Formatı:Bağlantı girişi görünür.

Küçük · Yayınlandı 11.11.2024 11:43:50

.NET/C# bir çokgenin alanını hesaplar
https://www.itsvse.com/thread-10870-1-1.html

Nesne tespiti için yaygın olarak kullanılan iki veri seti COCO ve VOC

İlgili Yazılar

Görüntülenen bölümler