Originali nuoroda:Hipersaito prisijungimas matomas. Originali kodo nuoroda:Hipersaito prisijungimas matomas. Dauginimas yra geresnis:Hipersaito prisijungimas matomas.
Šiuo metu teksto aptikimą galima apytiksliai suskirstyti į dvi kategorijas: regresija pagrįstus metodus ir segmentavimu pagrįstus metodus. Bendras metodo procesas, pagrįstas segmentavimu, parodytas mėlynoje rodyklėje žemiau esančiame paveikslėlyje: pirma, vaizdo teksto segmentavimo rezultatas išvedamas per tinklą (tikimybės grafikas, ar kiekvienas pikselis yra teigiamas pavyzdys), iš anksto nustatytas slenkstis naudojamas segmentavimo rezultatų grafikui konvertuoti į dvejetainį grafiką, ir galiausiai kai kurios agregavimo operacijos, tokios kaip domenų sujungimas, naudojamos pikselių lygio rezultatams paversti aptikimo rezultatais.
Iš aukščiau pateikto aprašymo matyti, kad kadangi yra operacija, kuri naudoja slenksčius priekiniam planui ir fonui nustatyti, ši operacija yra neatskiriama, todėl neįmanoma naudoti tinklo, kad ši proceso dalis būtų įtraukta į tinklą mokymui. Procesą rodo raudona rodyklė aukščiau esančiame paveikslėlyje.
1. Tinklo struktūra
Tinklo struktūra šiame straipsnyje parodyta šiame paveikslėlyje, mokymo proceso metu, po to, kai paveikslėlis įvedamas į tinklą, mėlynas funkcijų žemėlapis aukščiau esančiame paveikslėlyje vadinamas F po funkcijų ištraukimo ir atrankos sintezės ir sujungimo operacijos, o tada tikimybių žemėlapis (tikimybių žemėlapis) yra prognozuojamas F, vadinamas P, o slenksčio žemėlapis (slenksčio žemėlapis) yra prognozuojamas F vadinamas T, ir galiausiai apytikslis dvejetainis žemėlapis B ^ apskaičiuojamas per P ir T. Išvados proceso teksto laukelį galima gauti apytiksliu dvejetainiu grafiku arba tikimybių grafiku.
2. Dvejetainis
2.1 Standartų binarizavimas
2.2 Diferencijuojama binarizacija
Aukščiau pateiktas binarizacijos metodas nėra diferencijuojamas, todėl jo negalima optimizuoti mokantis tinkle. Norėdami išspręsti šią problemą, šiame straipsnyje siūloma apytikslė žingsnio funkcija:
Aukščiau pateiktos lygties B ^ išvestis reiškia apytikslį dvejetainį grafiką, T yra tinklo mokymosi slenkstinis grafikas, o k yra koeficientas, ir šis straipsnis nustatytas į 50. Šios funkcijos schema yra labai panaši į aukščiau pateiktą žingsnio funkciją, kaip parodyta paveikslėlyje A žemiau esančiame paveikslėlyje.
3. Adaptyvus slenkstis
Aukščiau aprašyta, kaip dvejetainį P paversti apytiksliu dvejetainiu grafiku B ^ gavus tikimybės grafiką P ir slenksčio grafiką T. Šiame skyriuje paaiškinama, kaip gauti tikimybės P, T slenksčio ir dvejetainio grafiko B^ etiketes.
3.1 Deformacijos konvoliucija
Kadangi gali prireikti didelių imlių laukų, straipsnyje taikoma deformacinė konvoliucija ResNet-18 arba ResNet-50 tinklui.
Nuostolių funkcija
Tekste naudojama nuostolių funkcijos formulė yra tokia:
Išvesti
Originalus:Hipersaito prisijungimas matomas.
|