|
|
Publisert på 18.06.2019 21:38:16
|
|
|

Dette innlegget ble sist redigert av Kongcicada 18.06.2019 kl. 21:39
forord Når vi gjør datamatching, regelkvalifisering og crawler-analyse i prosjektet, vil vi bruke regulære uttrykk. Følgende er en oppsummering av grunnleggende kunnskap om regelmessighet, som alle er studienotater fra de tidlige årene.
Tekst
#Grunnleggende regulære uttrykk
. Representerer et hvilket som helst enkelt tegn annet enn \n
[ ] Tegnfiltrering
[^] Ekvivalent med non
| betyr eller
() Endre prioriteten på operasjonen.
* kvalifikator, som indikerer at det forrige uttrykket forekommer 0 eller flere ganger.
+ kvalifikator, som indikerer at det foregående uttrykket må forekomme 1 eller flere ganger. Den må dukke opp minst én gang.
? kvalifikatorer, som indikerer at det foregående uttrykket må forekomme 0 eller 1 ganger.
{n} kvalifikator, som kvalifiserer uttrykket som kommer før den, må forekomme n ganger.
{n,} kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger.
{n,m}-kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger og høyst m ganger.
^ $ er begynnelsen og slutten på strengen
\d tilsvarer [0-9]
\D tilsvarer [^0-9]
\s representerer alle de hvite mellomromstegnene som er usynlige
\S er alle tegn unntatt \s.
\w Indikerer [0-9a-zA-Z_]
\w er alle de andre karakterene bortsett fra \w.
\b indikerer grensen til ordet. (Hevder, kun døm, mismatch.) )
=================================================
. Representerer et hvilket som helst enkelt tegn annet enn \n
a.b
a,b
=========================================
[ ] Tegnfiltrering
a[0-9]b
a[a-z]b
a[0-9a-zA-Z]b
A1B
axb
aAb
A[^0-9]b betyr at kun et enkelt tegn, bortsett fra 0123456789, kan forekomme mellom A og B.
a[^0-9a-z]b
=====================================================
| betyr eller
f|mat på grunn av| har svært lav prioritet, så dette uttrykket kan matche z eller mat. dette uttrykket matcher ikke zood
(z|f)ood betyr zood eller mat
===========================================
() Endre prioriteten på operasjonen.
Evakueringsgruppe.
=======================================
* kvalifikator, som indikerer at det forrige uttrykket forekommer 0 eller flere ganger.
zoo* betyr zo zoo zoooooooooo
(zoo)* indikerer zoozoo.......
a.*b står for AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb
================================================
+ kvalifikator, som indikerer at det foregående uttrykket må forekomme 1 eller flere ganger. Den må dukke opp minst én gang.
a.+b
A9DfjSakl3824urNJ324239FEB
==================================================
? kvalifikatorer, som indikerer at det foregående uttrykket må forekomme 0 eller 1 ganger.
a.? b
AB
axb
? En annen funksjon er å «avslutte grådighetsmodusen». Regulære uttrykk går som standard til grådighetsmodus.
======================================================================
a[0-9]+b
a0b
a00b
a09b
a99999999999999999999b
========================== andre kvalifiserte =====================
{n} kvalifikator, som kvalifiserer uttrykket som kommer før den, må forekomme n ganger.
a[0-9]{10}b
A1234567899B
======================
{n,} kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger.
1[a-z]{3,}2
1axffdsafdsafdasfdsafdsafdsafdsfdsafsfdfdsfdsfdsfdsa2
========================================
{n,m}-kvalifikator, som kvalifiserer det foregående uttrykket til å forekomme minst n ganger og høyst m ganger.
a[0-9]{3,7}b
a00000000b
===========================================
^ indikerer begynnelsen av strengen
$ indikerer enden av strengen.
^ og $ representerer de to egenskapene til strengen. Den ene indikerer startelementet og den andre representerer slutten
^abc.*xyz$ ^abc122345xyz$
^abcdefg$ ^abcdefg
fdsfdsfxyz xyz$
===========================================
a[0-9]b
a\db
\dTilsvarende [0-9]
Digitalt
\D [^0-9]
\s representerer alle de usynlige karakterene i hvitt mellomrom
a\s*b
AB
a
b
\S er alle tegn unntatt \s.
=================================================
\w [0-9a-zA-Z_]
Ord betyr ordtegn.
\w er alle de andre karakterene bortsett fra \w.
\b indikerer grensen til ordet. (Hevder, kun døm, mismatch.) )
============================================
.
Følgende metoder kan indikere at et enkelt tegn forekommer mellom abs.
a[\s\S]b
a[\d\D]b
a[\w\W]b
#Faktisk kamp
1: Lag en ny konsollapplikasjon
2: Lim inn følgende kode, du kan teste modul for modul
Epilog
Nettbasert test for regulært uttrykk Innloggingen med hyperkoblingen er synlig.
|
Foregående:MySQL Hvordan endre passordet til rotbrukerenNeste:Java Reactor – Omorganiser Java-koden din
|