Ta članek je zrcalni članek strojnega prevajanja, kliknite tukaj za skok na izvirni članek.

Pogled: 1800|Odgovoriti: 0

Osnovna načela globokega učenja DBNet

[Kopiraj povezavo]
Objavljeno 19. 1. 2025 ob 12:26:21 | | | |
Izvirna povezava:Prijava do hiperpovezave je vidna.
Izvirna povezava do kode:Prijava do hiperpovezave je vidna.
Razmnoževanje je boljše:Prijava do hiperpovezave je vidna.

Trenutno lahko zaznavanje besedila približno razdelimo v dve kategoriji: metode, ki temeljijo na regresiji, in metode, ki temeljijo na segmentaciji. Splošni postopek metode, ki temelji na segmentaciji, je prikazan v modri puščici na spodnji sliki: najprej se rezultat segmentacije besedila slike izpiše skozi omrežje (graf verjetnosti, ali je vsak piksel pozitiven vzorec), nastavljen prag se uporabi za pretvorbo grafa rezultatov segmentacije v binarni graf, nazadnje pa se uporabijo nekatere agregacijske operacije, kot so povezovanje domen, za pretvorbo rezultatov na ravni pikslov v rezultate zaznave.



Iz zgornjega opisa je razvidno, da ker obstaja operacija, ki uporablja pragove za določanje ospredja in ozadja, je ta operacija indiferenciabilna, zato ni mogoče uporabiti omrežja za vključitev tega dela procesa v omrežje za učenje. Postopek je prikazan z rdečo puščico na zgornji sliki.

1. Struktura omrežja

Struktura omrežja v tem članku je prikazana na naslednji sliki: med postopkom učenja, potem ko je slika vnesena v omrežje, se modra mapa značilnosti na zgornji sliki imenuje F po ekstrakciji značilnosti in povečanju vzorčenja fuzije in konkatne operacije, nato pa verjetnostna preslikava (verjetnostna preslikava) napovedana s F, nato pa pragovna preslikava (pragovna preslikava) napovedana s F, imenovana T, nazadnje pa se izračuna približna binarna preslikava B ^ skozi P in T. Besedilno polje za sklepni proces lahko dobimo z približnim binarnim grafom ali verjetnostnim grafom.



2. Binarno


2.1 Binarizacija standardov



2.2 Diferencirna binarizacija


Zgornja metoda binarizacije ni diferenciabilna, zato je ni mogoče optimizirati pri omrežnem učenju. Za rešitev tega problema ta članek predlaga približno funkcijo korakov:



Izhod zgornje enačbe B ^ predstavlja približen binarni graf, T je pragovni graf učenja, k je faktor, ta članek pa je nastavljen na 50. Diagram te funkcije je zelo podoben zgornji korakalni funkciji, kot je prikazano na sliki A na spodnji sliki.



3. Prilagodljivi prag

Zgoraj opisuje, kako binarno vgraditi P v približen binarni graf B ^ po pridobitvi verjetnostnega grafa P in pragovnega grafa T. Ta razdelek pojasnjuje, kako pridobiti oznake verjetnosti P, praga T in binarnega grafa B^.

3.1 Deformacijska konvolucija

Ker so lahko potrebna velika receptivna polja, članek uporablja deformacijsko konvolucijo na omrežje ResNet-18 ali ResNet-50.



Funkcija izgube

Formula za funkcijo izgube, uporabljena v besedilu, je naslednja:



Sklepajte




Izvirno:Prijava do hiperpovezave je vidna.




Prejšnji:Serija Angular 18 (trideset) ustvari delovni prostor
Naslednji:Pretvorite model lopatic v format modela ONNX
Disclaimer:
Vsa programska oprema, programski materiali ali članki, ki jih izdaja Code Farmer Network, so namenjeni zgolj učnim in raziskovalnim namenom; Zgornja vsebina ne sme biti uporabljena v komercialne ali nezakonite namene, sicer uporabniki nosijo vse posledice. Informacije na tej strani prihajajo z interneta, spori glede avtorskih pravic pa nimajo nobene zveze s to stranjo. Zgornjo vsebino morate popolnoma izbrisati z računalnika v 24 urah po prenosu. Če vam je program všeč, podprite pristno programsko opremo, kupite registracijo in pridobite boljše pristne storitve. Če pride do kakršne koli kršitve, nas prosimo kontaktirajte po elektronski pošti.

Mail To:help@itsvse.com