Oriģinālā saite:Hipersaites pieteikšanās ir redzama. Oriģinālā koda saite:Hipersaites pieteikšanās ir redzama. Pavairošana ir labāka:Hipersaites pieteikšanās ir redzama.
Pašlaik teksta noteikšanu var aptuveni iedalīt divās kategorijās: uz regresiju balstītas metodes un uz segmentāciju balstītas metodes. Vispārējais metodes process, kas balstīts uz segmentāciju, ir parādīts zilajā bultiņā zemāk redzamajā attēlā: pirmkārt, attēla teksta segmentācijas rezultāts tiek izvadīts caur tīklu (varbūtības grafiks, vai katrs pikselis ir pozitīvs paraugs), iepriekš iestatītais slieksnis tiek izmantots, lai segmentācijas rezultātu grafiku pārvērstu binārā diagrammā, un, visbeidzot, dažas apkopošanas operācijas, piemēram, domēnu savienošana, tiek izmantotas, lai pikseļu līmeņa rezultātus pārvērstu noteikšanas rezultātos.
No iepriekš minētā apraksta var redzēt, ka, tā kā ir darbība, kas izmanto sliekšņus, lai noteiktu priekšplānu un fonu, šī darbība ir nediferencējama, tāpēc nav iespējams izmantot tīklu, lai šo procesa daļu ievietotu tīklā apmācībai. Procesu parāda sarkanā bultiņa iepriekš redzamajā attēlā.
1. Tīkla struktūra
Tīkla struktūra šajā rakstā ir parādīta nākamajā attēlā, apmācības procesa laikā, pēc attēla ievadīšanas tīklā, zilā funkciju karte iepriekš redzamajā attēlā tiek saukta par F pēc funkciju ekstrakcijas un sintēzes un savienošanas operācijas, un pēc tam varbūtības karti (varbūtības karti) prognozē F, ko sauc par P, un sliekšņa karti (sliekšņa karti) prognozē F, ko sauc par T, un visbeidzot aptuveno bināro karti B ^ aprēķina caur P un T. Secinājumu procesa tekstlodziņu var iegūt ar aptuvenu bināro grafiku vai varbūtības grafiku.
2. Binārs
2.1 Standartu binarizācija
2.2 Diferencējama binarizācija
Iepriekš minētā binarizācijas metode nav diferencējama, tāpēc to nevar optimizēt tīkla mācībās. Lai atrisinātu šo problēmu, šajā rakstā tiek piedāvāta aptuvena soļa funkcija:
Iepriekš minētā vienādojuma B ^ rezultāts ir aptuvenais binārais grafiks, T ir tīkla mācīšanās sliekšņa grafiks, un k ir koeficients, un šis dokuments ir iestatīts uz 50. Šīs funkcijas diagramma ir ļoti līdzīga iepriekš minētajai soļu funkcijai, kā parādīts attēlā A zemāk.
3. Adaptīvais slieksnis
Iepriekš aprakstīts, kā bināro P pārvērst aptuvenā binārā grafikā B ^ pēc varbūtības grafika P un sliekšņa grafika T iegūšanas. Šajā sadaļā ir paskaidrots, kā iegūt varbūtības P, sliekšņa T un binārā grafika B^ etiķetes.
3.1 Deformācijas konvolūcija
Tā kā var būt nepieciešami lieli uztverošie lauki, rakstā tiek izmantota deformācijas konvolūcija ResNet-18 vai ResNet-50 tīklam.
Zaudējumu funkcija
Tekstā izmantotās zudumu funkcijas formula ir šāda:
Secināt
Sākotnējā:Hipersaites pieteikšanās ir redzama.
|