Αρχικός σύνδεσμος:Η σύνδεση με υπερσύνδεσμο είναι ορατή. Σύνδεσμος αρχικού κωδικού:Η σύνδεση με υπερσύνδεσμο είναι ορατή. Η αναπαραγωγή είναι καλύτερη:Η σύνδεση με υπερσύνδεσμο είναι ορατή.
Προς το παρόν, η ανίχνευση κειμένου μπορεί να χωριστεί χονδρικά σε δύο κατηγορίες: μεθόδους που βασίζονται σε παλινδρόμηση και μεθόδους που βασίζονται σε τμηματοποίηση. Η διαδικασία γενικής μεθόδου που βασίζεται στην τμηματοποίηση φαίνεται στο μπλε βέλος στο παρακάτω σχήμα: πρώτον, το αποτέλεσμα τμηματοποίησης κειμένου της εικόνας εξάγεται μέσω του δικτύου (γράφημα πιθανοτήτων, εάν κάθε pixel είναι θετικό δείγμα), το προκαθορισμένο όριο χρησιμοποιείται για τη μετατροπή του γραφήματος αποτελεσμάτων τμηματοποίησης σε δυαδική γραφική παράσταση και, τέλος, ορισμένες λειτουργίες συνάθροισης, όπως η σύνδεση τομέων, χρησιμοποιούνται για τη μετατροπή των αποτελεσμάτων σε επίπεδο pixel σε αποτελέσματα ανίχνευσης.
Από την παραπάνω περιγραφή, μπορεί να φανεί ότι επειδή υπάρχει μια λειτουργία που χρησιμοποιεί κατώφλια για τον προσδιορισμό του προσκηνίου και του φόντου, αυτή η λειτουργία είναι αδιαφορίαστη, επομένως δεν είναι δυνατή η χρήση του δικτύου για την τοποθέτηση αυτού του μέρους της διαδικασίας στο δίκτυο για εκπαίδευση. Η διαδικασία φαίνεται με το κόκκινο βέλος στην παραπάνω εικόνα.
1. Δομή δικτύου
Η δομή του δικτύου σε αυτό το έγγραφο φαίνεται στο παρακάτω σχήμα, κατά τη διάρκεια της εκπαιδευτικής διαδικασίας, μετά την εισαγωγή της εικόνας στο δίκτυο, ο μπλε χάρτης χαρακτηριστικών στο παραπάνω σχήμα ονομάζεται F μετά την εξαγωγή χαρακτηριστικών και τη σύντηξη και τη λειτουργία concat και, στη συνέχεια, ο χάρτης πιθανοτήτων (χάρτης πιθανοτήτων) προβλέπεται από το F που ονομάζεται P και ο χάρτης κατωφλίου (χάρτης κατωφλίου) προβλέπεται από το F ονομάζεται T και, τέλος, ο κατά προσέγγιση δυαδικός χάρτης B ^ υπολογίζεται μέσω των P και T. Το πλαίσιο κειμένου διαδικασίας εξαγωγής συμπερασμάτων μπορεί να ληφθεί με προσεγγιστικό δυαδικό γράφημα ή γράφημα πιθανοτήτων.
2. Δυαδικό
2.1 Διναρισμός προτύπων
2.2 Διαφοροποιήσιμη δυαδοποίηση
Η παραπάνω μέθοδος δυαδοποίησης δεν είναι διαφοροποιήσιμη, επομένως δεν μπορεί να βελτιστοποιηθεί στην εκμάθηση δικτύου. Για την επίλυση αυτού του προβλήματος, αυτή η εργασία προτείνει μια κατά προσέγγιση συνάρτηση βήματος:
Η έξοδος της παραπάνω εξίσωσης B ^ αντιπροσωπεύει το κατά προσέγγιση δυαδικό γράφημα, το T είναι το γράφημα κατωφλίου της μάθησης δικτύου και το k είναι ένας παράγοντας και αυτή η εργασία έχει οριστεί στο 50. Το διάγραμμα αυτής της συνάρτησης είναι πολύ παρόμοιο με τη συνάρτηση βήματος παραπάνω, όπως φαίνεται στο σχήμα Α στο παρακάτω σχήμα.
3. Προσαρμοστικό κατώφλι
Τα παραπάνω περιγράφουν πώς να δυαδικοποιήσετε το P σε ένα κατά προσέγγιση δυαδικό γράφημα B ^ μετά τη λήψη του γραφήματος πιθανοτήτων P και του γραφήματος κατωφλίου T. Αυτή η ενότητα εξηγεί πώς να λάβετε τις ετικέτες Πιθανότητα P, Κατώφλι T και Δυαδικό γράφημα B^.
3.1 Συνέλιξη παραμόρφωσης
Επειδή μπορεί να απαιτούνται μεγάλα δεκτικά πεδία, το άρθρο εφαρμόζει συνέλιξη παραμόρφωσης σε ένα δίκτυο ResNet-18 ή ResNet-50.
συνάρτηση απώλειας
Ο τύπος για τη συνάρτηση απώλειας που χρησιμοποιείται στο κείμενο είναι ο εξής:
συμπεραίνω
Αρχικός:Η σύνδεση με υπερσύνδεσμο είναι ορατή.
|