Tautan asli:Login hyperlink terlihat. Tautan kode asli:Login hyperlink terlihat. Reproduksi lebih baik:Login hyperlink terlihat.
Saat ini, deteksi teks secara kasar dapat dibagi menjadi dua kategori: metode berbasis regresi dan metode berbasis segmentasi. Proses metode umum berdasarkan segmentasi ditunjukkan pada panah biru pada gambar di bawah ini: pertama, hasil segmentasi teks gambar dikeluarkan melalui jaringan (grafik probabilitas, apakah setiap piksel adalah sampel positif), ambang batas prasetel digunakan untuk mengubah grafik hasil segmentasi menjadi plot biner, dan akhirnya beberapa operasi agregasi seperti menghubungkan domain digunakan untuk mengubah hasil tingkat piksel menjadi hasil deteksi.
Dari uraian di atas, dapat dilihat bahwa karena ada operasi yang menggunakan ambang batas untuk menentukan latar depan dan latar belakang, operasi ini tidak dapat dibedakan, sehingga tidak mungkin menggunakan jaringan untuk memasukkan bagian proses ini ke dalam jaringan untuk pelatihan. Prosesnya ditunjukkan oleh panah merah pada gambar di atas.
1. Struktur jaringan
Struktur jaringan dalam makalah ini ditunjukkan pada gambar berikut, selama proses pelatihan, setelah gambar dimasukkan ke dalam jaringan, peta fitur biru pada gambar di atas disebut F setelah ekstraksi fitur dan upsampling fusi dan operasi concat, dan kemudian peta probabilitas (peta probabilitas) diprediksi oleh F yang disebut P dan peta ambang batas (peta ambang batas) diprediksi oleh F disebut T, dan akhirnya perkiraan peta biner B ^ dihitung melalui P dan T. Kotak teks proses inferensi dapat diperoleh dengan grafik biner perkiraan atau grafik probabilitas.
2. Biner
2.1 Binarisasi standar
2.2 Binarisasi yang dapat dibedakan
Metode binarisasi di atas tidak dapat dibedakan, sehingga tidak dapat dioptimalkan dalam pembelajaran jaringan. Untuk mengatasi masalah ini, makalah ini mengusulkan fungsi langkah perkiraan:
Output dari persamaan B ^ di atas mewakili grafik biner perkiraan, T adalah grafik ambang batas pembelajaran jaringan, dan k adalah faktor, dan makalah ini diatur ke 50. Diagram fungsi ini sangat mirip dengan fungsi langkah di atas, seperti yang ditunjukkan pada gambar A pada gambar di bawah ini.
3. Ambang batas adaptif
Di atas menjelaskan cara membinar P menjadi grafik biner perkiraan B ^ setelah mendapatkan grafik probabilitas P dan grafik ambang batas T. Bagian ini menjelaskan cara mendapatkan label Probabilitas P, Ambang Batas T, dan Grafik Biner B^.
3.1 Konvolusi deformasi
Karena bidang reseptif yang besar mungkin diperlukan, artikel ini menerapkan konvolusi deformasi ke jaringan ResNet-18 atau ResNet-50.
fungsi kerugian
Rumus untuk fungsi kerugian yang digunakan dalam teks adalah sebagai berikut:
Menyimpulkan
Asli:Login hyperlink terlihat.
|