Šis straipsnis yra veidrodinis mašininio vertimo straipsnis, spauskite čia norėdami pereiti prie originalaus straipsnio.

Rodinys: 1800|Atsakyti: 0

Pagrindiniai gilaus mokymosi DBNet principai

[Kopijuoti nuorodą]
Publikuota: 2025-1-19 12:26:21 | | | |
Originali nuoroda:Hipersaito prisijungimas matomas.
Originali kodo nuoroda:Hipersaito prisijungimas matomas.
Dauginimas yra geresnis:Hipersaito prisijungimas matomas.

Šiuo metu teksto aptikimą galima apytiksliai suskirstyti į dvi kategorijas: regresija pagrįstus metodus ir segmentavimu pagrįstus metodus. Bendras metodo procesas, pagrįstas segmentavimu, parodytas mėlynoje rodyklėje žemiau esančiame paveikslėlyje: pirma, vaizdo teksto segmentavimo rezultatas išvedamas per tinklą (tikimybės grafikas, ar kiekvienas pikselis yra teigiamas pavyzdys), iš anksto nustatytas slenkstis naudojamas segmentavimo rezultatų grafikui konvertuoti į dvejetainį grafiką, ir galiausiai kai kurios agregavimo operacijos, tokios kaip domenų sujungimas, naudojamos pikselių lygio rezultatams paversti aptikimo rezultatais.



Iš aukščiau pateikto aprašymo matyti, kad kadangi yra operacija, kuri naudoja slenksčius priekiniam planui ir fonui nustatyti, ši operacija yra neatskiriama, todėl neįmanoma naudoti tinklo, kad ši proceso dalis būtų įtraukta į tinklą mokymui. Procesą rodo raudona rodyklė aukščiau esančiame paveikslėlyje.

1. Tinklo struktūra

Tinklo struktūra šiame straipsnyje parodyta šiame paveikslėlyje, mokymo proceso metu, po to, kai paveikslėlis įvedamas į tinklą, mėlynas funkcijų žemėlapis aukščiau esančiame paveikslėlyje vadinamas F po funkcijų ištraukimo ir atrankos sintezės ir sujungimo operacijos, o tada tikimybių žemėlapis (tikimybių žemėlapis) yra prognozuojamas F, vadinamas P, o slenksčio žemėlapis (slenksčio žemėlapis) yra prognozuojamas F vadinamas T, ir galiausiai apytikslis dvejetainis žemėlapis B ^ apskaičiuojamas per P ir T. Išvados proceso teksto laukelį galima gauti apytiksliu dvejetainiu grafiku arba tikimybių grafiku.



2. Dvejetainis


2.1 Standartų binarizavimas



2.2 Diferencijuojama binarizacija


Aukščiau pateiktas binarizacijos metodas nėra diferencijuojamas, todėl jo negalima optimizuoti mokantis tinkle. Norėdami išspręsti šią problemą, šiame straipsnyje siūloma apytikslė žingsnio funkcija:



Aukščiau pateiktos lygties B ^ išvestis reiškia apytikslį dvejetainį grafiką, T yra tinklo mokymosi slenkstinis grafikas, o k yra koeficientas, ir šis straipsnis nustatytas į 50. Šios funkcijos schema yra labai panaši į aukščiau pateiktą žingsnio funkciją, kaip parodyta paveikslėlyje A žemiau esančiame paveikslėlyje.



3. Adaptyvus slenkstis

Aukščiau aprašyta, kaip dvejetainį P paversti apytiksliu dvejetainiu grafiku B ^ gavus tikimybės grafiką P ir slenksčio grafiką T. Šiame skyriuje paaiškinama, kaip gauti tikimybės P, T slenksčio ir dvejetainio grafiko B^ etiketes.

3.1 Deformacijos konvoliucija

Kadangi gali prireikti didelių imlių laukų, straipsnyje taikoma deformacinė konvoliucija ResNet-18 arba ResNet-50 tinklui.



Nuostolių funkcija

Tekste naudojama nuostolių funkcijos formulė yra tokia:



Išvesti




Originalus:Hipersaito prisijungimas matomas.




Ankstesnis:"Angular 18" serija (trisdešimt) sukuria darbo vietą
Kitą:Konvertuokite irklo modelį į ONNX modelio formatą
Atsakomybės apribojimas:
Visa programinė įranga, programavimo medžiaga ar straipsniai, kuriuos skelbia Code Farmer Network, yra skirti tik mokymosi ir mokslinių tyrimų tikslams; Aukščiau nurodytas turinys negali būti naudojamas komerciniais ar neteisėtais tikslais, priešingu atveju vartotojai prisiima visas pasekmes. Šioje svetainėje pateikiama informacija gaunama iš interneto, o ginčai dėl autorių teisių neturi nieko bendra su šia svetaine. Turite visiškai ištrinti aukščiau pateiktą turinį iš savo kompiuterio per 24 valandas nuo atsisiuntimo. Jei jums patinka programa, palaikykite autentišką programinę įrangą, įsigykite registraciją ir gaukite geresnes autentiškas paslaugas. Jei yra kokių nors pažeidimų, susisiekite su mumis el. paštu.

Mail To:help@itsvse.com