Artikel ini adalah artikel cermin dari terjemahan mesin, silakan klik di sini untuk melompat ke artikel aslinya.

Melihat: 1664|Jawab: 3

Dua kumpulan data yang umum digunakan untuk deteksi objek, COCO dan VOC

[Salin tautan]
Diposting pada 30/10/2024 22.35.37 | | |
Masalah yang harus dipecahkan:

Apa itu kumpulan data?
Apa itu COCO dan VOC?
Format apa itu?

Q1: Apa itu kumpulan data?

Himpunan data, secara harfiah, adalah kumpulan data.
Himpunan data biasanya berisi data sampel yang digunakan untuk melatih dan memvalidasi model, yang dapat berupa angka, teks, gambar, audio, atau video.
Himpunan data digunakan untuk melatih model algoritmik, memungkinkan model mempelajari pola dan pola dalam data.
Himpunan data biasanya dibagi menjadi:Set pelatihan, set validasi, dan set pengujianTiga subset.
Set pelatihan digunakan untuk melatih model pembelajaran mesin, set validasi digunakan untuk memilih dan menyesuaikan hiperparameter dan struktur model, dan set pengujian digunakan untuk mengevaluasi kinerja dan akurasi model.
Set pelatihan, set validasi, dan set pengujian umumnya dipahami:
Set pelatihan: Sama seperti pelajaran untuk siswa, kami menggunakan data ini untuk mengajarkan model pembelajaran mesin cara mengenali dan memproses informasi.
Set validasi: Ini seperti memberi siswa kuis untuk memeriksa seberapa baik model belajar dan melihat apa yang perlu disesuaikan.
Set tes: Ini seperti memberi siswa ujian akhir, menggunakan data ini untuk akhirnya mengevaluasi kinerja model untuk melihat apakah model belajar dengan baik.

Q2: Apa itu COCO dan VOC?

COCO (Common Objects in Context) dan VOC (Visual Object Classes) adalah dua kumpulan data terkenal di bidang visi komputer, yang banyak digunakan dalam tugas pengenalan gambar dan deteksi objek.


Menciptakan:


Himpunan data COCO dibuat oleh Microsoft Research.
Kumpulan data VOC dibuat oleh kelompok visi komputer di University of Oxford di Inggris.


Memperkenalkan:


COCO adalah kumpulan data skala besar untuk pengenalan gambar, segmentasi, dan pembuatan teks.
Ini berisi lebih dari 91.000 gambar, masing-masing dengan pelabelan dan segmentasi terperinci.
Himpunan data COCO menekankan konteks objek dalam pemandangan alami, yaitu objek sering muncul dengan objek lain dan memiliki pemandangan dan latar belakang yang kompleks.
Himpunan data COCO biasanya digunakan untuk mengevaluasi kinerja tugas seperti deteksi objek, segmentasi gambar, dan pembuatan keterangan gambar.
VOC adalah kumpulan data pengenalan gambar dan deteksi objek yang lebih lama.
Ini berisi 20.000 gambar dalam sekitar 20 kategori, masing-masing dengan info area dan label kategori yang tepat.
Himpunan data VOC lebih berfokus pada identifikasi kategori dan deteksi objek daripada pada konteks gambar.
VOC Challenge adalah kompetisi penting di bidang visi komputer, yang mempromosikan pengembangan teknologi deteksi objek dan pengenalan gambar.

Keganjilan:

Himpunan data VOC ditandai dengan fakta bahwa mereka memberikan anotasi yang sangat tepat, terutama dalam tugas deteksi objek. Objek dalam setiap gambar diberi label tepat dengan kotak persegi panjang, dan setiap objek memiliki label kategori. Anotasi yang tepat ini membuat kumpulan data VOC ideal untuk melatih dan menguji algoritme deteksi objek, karena mereka dapat mempelajari cara mengidentifikasi dan menemukan objek dalam gambar secara akurat.
Meskipun kumpulan data COCO juga menyediakan anotasi terperinci, kumpulan data ini berfokus pada pengenalan gambar dan pemahaman pemandangan yang lebih luas. Anotasi di COCO mencakup deteksi objek, segmentasi, dan pembuatan subtitle. Ini berarti bahwa data COCO tidak hanya mencakup kotak persegi panjang objek, tetapi juga informasi pemandangan yang lebih kompleks dan hubungan antar objek. Oleh karena itu, kumpulan data COCO lebih cocok untuk melatih dan menguji tugas-tugas visi komputer yang lebih canggih, seperti pemahaman adegan, pembuatan keterangan gambar, dll.

Ringkasan: VOC dapat diidentifikasi dan ditemukan dengan lebih cepat dan akurat, terutama karena metode anotasinya sangat cocok untuk tugas deteksi objek, sedangkan COCO memberikan informasi pemandangan yang lebih kaya dan cocok untuk tugas visual yang lebih kompleks. Keduanya memiliki fokusnya sendiri dan merupakan kumpulan data yang sangat penting dalam penelitian visi komputer.

Q3: Apa formatnya?

  • Format pelabelan himpunan data VOC adalah XML. Setiap gambar sesuai dengan file XML.
  • Format pelabelan himpunan data COCO adalah JSON atau txt. Semua anotasi kotak target berada dalam JSON atau txt yang sama.


Asli:Login hyperlink terlihat.




Mantan:Windows menginstal alat manajemen lingkungan Conda
Depan:MikroTik (2) melarang perangkat mengakses jaringan eksternal, hanya akses jaringan internal
 Tuan tanah| Diposting pada 01/11/2024 11.39.47 |
Kumpulan data Coco adalah file JSON yang berisi total 5 bagian.

{
    "info": info, # informasi dasar tentang kumpulan data
    "lisensi": [lisensi], # lisensi
    "images": [gambar], # informasi gambar, nama, dan tinggi
    "anotasi": [anotasi], # anotasi
    "categories": [category] # Informasi tag
}
info{ # Deskripsi informasi himpunan data
    "tahun": int, # tahun kumpulan data
    "version": str, # versi dataset
    "deskripsi": str, # deskripsi himpunan data
    "kontributor": str, # penyedia himpunan data
    "URL": str, # tautan unduhan dataset
    "date_created": tanggalwaktu, # tanggal pembuatan himpunan data
}
lisensi{
    "id": int,
    "nama": str,
    "url": str,
}
image{ # images adalah daftar yang menyimpan semua informasi gambar (dict). image adalah dict yang menyimpan informasi tentang satu gambar
    "id": int, # Nomor ID gambar (unik untuk setiap ID gambar)
    "width": int, # lebar gambar
    "height": int, # tinggi gambar
    "file_name": str, # nama gambar
    "License": int, # perjanjian
    "flickr_url": str, # alamat tautan flickr
    "coco_url": str, # alamat koneksi jaringan
    "date_captured": tanggalwaktu, # tanggal pengambilan himpunan data
}
annotation{ # annotations adalah daftar yang menyimpan semua informasi dikte. Anotasi adalah dikte yang menyimpan informasi anotasi target tunggal.
    "id": int, # ID objek target (unik untuk setiap ID objek), setiap gambar mungkin memiliki beberapa target
    "image_id": int, # sesuai dengan ID gambar
    "category_id": int, # sesuai dengan ID kategori, sesuai dengan ID dalam kategori
    "segmentasi": RLE atau [poligon], # segmentasi instans, koordinat titik batas objek [x1,y1,x2,y2,....,xn,yn]
    "area": float, # Luas area objek
    "bbox": [xmin,ymin,lebar,tinggi], # deteksi objek, batas pemosisian objek[x,y,w,h]
    "iscrowd": 0 atau 1, # menunjukkan apakah itu kerumunan atau tidak
}
kategori{ # Deskripsi kategori
    "id": int, # ID yang sesuai dengan kategori (0 default ke latar belakang)
    "name": str, # nama subkategori
    "supercategory": str, # nama kategori utama
}



Referensi:

Login hyperlink terlihat.
Login hyperlink terlihat.
Login hyperlink terlihat.
Login hyperlink terlihat.

 Tuan tanah| Diposting pada 11/11/2024 09.16.46 |
Format Set COCO Data:Login hyperlink terlihat.


 Tuan tanah| Diposting pada 11/11/2024 11.43.50 |
.NET/C# menghitung luas poligon
https://www.itsvse.com/thread-10870-1-1.html
Sanggahan:
Semua perangkat lunak, materi pemrograman, atau artikel yang diterbitkan oleh Code Farmer Network hanya untuk tujuan pembelajaran dan penelitian; Konten di atas tidak boleh digunakan untuk tujuan komersial atau ilegal, jika tidak, pengguna akan menanggung semua konsekuensi. Informasi di situs ini berasal dari Internet, dan sengketa hak cipta tidak ada hubungannya dengan situs ini. Anda harus sepenuhnya menghapus konten di atas dari komputer Anda dalam waktu 24 jam setelah pengunduhan. Jika Anda menyukai program ini, harap dukung perangkat lunak asli, pembelian pendaftaran, dan dapatkan layanan asli yang lebih baik. Jika ada pelanggaran, silakan hubungi kami melalui email.

Mail To:help@itsvse.com