Denne artikkelen er en speilartikkel om maskinoversettelse, vennligst klikk her for å hoppe til originalartikkelen.

Utsikt: 35533|Svare: 1

[Kilde] Grunnleggende regulære uttrykk

[Kopier lenke]
Publisert på 18.06.2019 21:38:16 | | |
Dette innlegget ble sist redigert av Kongcicada 18.06.2019 kl. 21:39

forord
Når vi gjør datamatching, regelkvalifisering og crawler-analyse i prosjektet, vil vi bruke regulære uttrykk. Følgende er en oppsummering av grunnleggende kunnskap om regelmessighet, som alle er studienotater fra de tidlige årene.

Tekst

#Grunnleggende regulære uttrykk


.           Representerer et hvilket som helst enkelt tegn annet enn \n
[ ] Tegnfiltrering
[^] Ekvivalent med non
|           betyr eller
() Endre prioriteten på operasjonen.
* kvalifikator, som indikerer at det forrige uttrykket forekommer 0 eller flere ganger.
+ kvalifikator, som indikerer at det foregående uttrykket må forekomme 1 eller flere ganger. Den må dukke opp minst én gang.
?          kvalifikatorer, som indikerer at det foregående uttrykket må forekomme 0 eller 1 ganger.
{n} kvalifikator, som kvalifiserer uttrykket som kommer før den, må forekomme n ganger.
{n,} kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger.
{n,m}-kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger og høyst m ganger.
^ $ er begynnelsen og slutten på strengen
\d tilsvarer [0-9]  
\D tilsvarer [^0-9]
\s representerer alle de hvite mellomromstegnene som er usynlige
\S er alle tegn unntatt \s.
\w Indikerer [0-9a-zA-Z_]
\w er alle de andre karakterene bortsett fra \w.
\b indikerer grensen til ordet. (Hevder, kun døm, mismatch.) )
=================================================


.    Representerer et hvilket som helst enkelt tegn annet enn \n
a.b
a,b
=========================================
[ ] Tegnfiltrering
a[0-9]b
a[a-z]b

a[0-9a-zA-Z]b
A1B
axb
aAb

A[^0-9]b betyr at kun et enkelt tegn, bortsett fra 0123456789, kan forekomme mellom A og B.

a[^0-9a-z]b

=====================================================
|  betyr eller


f|mat på grunn av| har svært lav prioritet, så dette uttrykket kan matche z eller mat. dette uttrykket matcher ikke zood

(z|f)ood betyr zood eller mat

===========================================
() Endre prioriteten på operasjonen.

Evakueringsgruppe.

=======================================
* kvalifikator, som indikerer at det forrige uttrykket forekommer 0 eller flere ganger.

zoo* betyr zo zoo zoooooooooo
(zoo)* indikerer zoozoo.......
a.*b står for AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb


================================================
+ kvalifikator, som indikerer at det foregående uttrykket må forekomme 1 eller flere ganger. Den må dukke opp minst én gang.

a.+b
A9DfjSakl3824urNJ324239FEB
==================================================
? kvalifikatorer, som indikerer at det foregående uttrykket må forekomme 0 eller 1 ganger.

a.? b
AB
axb


? En annen funksjon er å «avslutte grådighetsmodusen». Regulære uttrykk går som standard til grådighetsmodus.

======================================================================
a[0-9]+b

a0b
a00b
a09b
a99999999999999999999b


========================== andre kvalifiserte =====================
{n} kvalifikator, som kvalifiserer uttrykket som kommer før den, må forekomme n ganger.
a[0-9]{10}b
A1234567899B
======================
{n,} kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger.

1[a-z]{3,}2
1axffdsafdsafdasfdsafdsafdsafdsfdsafsfdfdsfdsfdsfdsa2



========================================
{n,m}-kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger og høyst m ganger.

a[0-9]{3,7}b
a00000000b

===========================================

^ indikerer begynnelsen av strengen

$ indikerer enden av strengen.


^ og $ representerer de to egenskapene til strengen. Den ene indikerer startelementet og den andre representerer slutten


^abc.*xyz$ ^abc122345xyz$   

^abcdefg$ ^abcdefg


fdsfdsfxyz xyz$



===========================================
a[0-9]b
a\db

\dTilsvarende [0-9]
Digitalt

\D [^0-9]


\s representerer alle de usynlige karakterene i hvitt mellomrom
a\s*b
AB
a                                            




b

\S er alle tegn unntatt \s.



=================================================
\w [0-9a-zA-Z_]  
Ord betyr ordtegn.

\w er alle de andre karakterene bortsett fra \w.

\b indikerer grensen til ordet. (Hevder, kun døm, mismatch.) )

============================================

.


Følgende metoder kan indikere at et enkelt tegn forekommer mellom abs.
a[\s\S]b
a[\d\D]b
a[\w\W]b






#Faktisk kamp

1: Lag en ny konsollapplikasjon

2: Lim inn følgende kode, du kan teste modul for modul






Epilog

Nettbasert test for regulært uttrykk   Innloggingen med hyperkoblingen er synlig.
















Foregående:MySQL Hvordan endre passordet til rotbrukeren
Neste:Java Reactor – Omorganiser Java-koden din
Publisert på 05.05.2020 16:32:41 |
En komplett liste over vanlig brukte regulære uttrykk
https://www.itsvse.com/thread-9181-1-1.html
(Kilde: Architect_Programmer)
Ansvarsfraskrivelse:
All programvare, programmeringsmateriell eller artikler publisert av Code Farmer Network er kun for lærings- og forskningsformål; Innholdet ovenfor skal ikke brukes til kommersielle eller ulovlige formål, ellers skal brukerne bære alle konsekvenser. Informasjonen på dette nettstedet kommer fra Internett, og opphavsrettstvister har ingenting med dette nettstedet å gjøre. Du må fullstendig slette innholdet ovenfor fra datamaskinen din innen 24 timer etter nedlasting. Hvis du liker programmet, vennligst støtt ekte programvare, kjøp registrering, og få bedre ekte tjenester. Hvis det foreligger noen krenkelse, vennligst kontakt oss på e-post.

Mail To:help@itsvse.com