|
|
Publicerad på 2019-06-18 21:38:16
|
|
|

Detta inlägg redigerades senast av Kongcicada den 2019-6-18 21:39
förord När vi gör viss datamatchning, regelkvalificering och crawleranalys i projektet kommer vi att använda reguljära uttryck. Följande är en sammanfattning av grundläggande kunskaper om regelbundenhet, som alla är studieanteckningar från de tidiga åren.
SMS
#Grunderna i reguljära uttryck
. Representerar vilken enskild karaktär som helst förutom \n
[ ] Teckenfiltrering
[^] Ekvivalent med non
| betyder eller
() Ändra operationens prioritet.
* kvalificerare, vilket indikerar att det föregående uttrycket förekommer 0 eller fler gånger.
+ kvalificerare, vilket indikerar att föregående uttryck måste förekomma 1 eller flera gånger. Den måste dyka upp minst en gång.
? kvalificeringar, vilket indikerar att föregående uttryck måste förekomma 0 eller 1 gånger.
{n} kvalificeraren, som kvalificerar uttrycket som föregår det, måste förekomma n gånger.
{n,} kvalificeraren, vilket kvalificerar att föregående uttryck ska förekomma minst n gånger.
{n,m}-kvalificeraren, som kvalificerar att föregående uttryck ska förekomma minst n gånger och högst m gånger.
^ $ är början och slutet av strängen
\d är ekvivalent med [0-9]
\D är ekvivalent med [^0-9]
\s representerar alla dessa tomma tecken som är osynliga
\s är alla tecken utom \s.
\w Indikerar [0-9a-zA-Z_]
\w är alla andra karaktärer utom \w.
\b anger gränsen för ordet. (Påstå, döm enbart, mismatch.) )
=================================================
. Representerar vilken enskild karaktär som helst förutom \n
a.b
a,b
=========================================
[ ] Teckenfiltrering
a[0-9]b
a[a-z]b
a[0-9a-zA-Z]b
A1B
axb
aAb
A[^0-9]b betyder att endast ett enskilt tecken annat än 0123456789 kan förekomma mellan A och B.
a[^0-9a-z]b
=====================================================
| betyder eller
z|mat på grund av| har en mycket låg prioritet, så detta uttryck kan matcha z eller mat. detta uttryck matchar inte zood
(z|f)ood betyder zood eller mat
===========================================
() Ändra operationens prioritet.
Extraktionsgruppen.
=======================================
* kvalificerare, vilket indikerar att det föregående uttrycket förekommer 0 eller fler gånger.
zoo* betyder zo zoo zoooooooooooo
(zoo)* indikerar zoozoo.......
a.*b står för AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb
================================================
+ kvalificerare, vilket indikerar att föregående uttryck måste förekomma 1 eller flera gånger. Den måste dyka upp minst en gång.
a.+b
A9dfjSAKL3824urNJ324239FEB
==================================================
? kvalificeringar, vilket indikerar att föregående uttryck måste förekomma 0 eller 1 gånger.
a.? b
AB
axb
? En annan funktion är att "avsluta girighetsläget". Reguljära uttryck går automatiskt in i girighetsläge.
======================================================================
a[0-9]+b
a0b
a00b
A09B
a99999999999999999999b
========================== andra kvalificerade =====================
{n} kvalificeraren, som kvalificerar uttrycket som föregår det, måste förekomma n gånger.
a[0-9]{10}b
A1234567899B
======================
{n,} kvalificeraren, vilket kvalificerar att föregående uttryck ska förekomma minst n gånger.
1[a-z]{3,}2
1axffdsafdsafdsafdasfdsafdsafdsafdsfdsfdsfdsa2
========================================
{n,m}-kvalificeraren, som kvalificerar att föregående uttryck ska förekomma minst n gånger och högst m gånger.
a[0-9]{3,7}b
a00000000b
===========================================
^ anger början på strängen
$ anger strängens ände.
^ och $ representerar strängens två egenskaper. Den ena indikerar startfunktionen och den andra representerar slutet
^abc.*xyz$ ^abc122345xyz$
^abcdefg$ ^abcdefg
fdsfdsfxyz xyz$
===========================================
a[0-9]b
a\db
\dEkvivalent med [0-9]
digitalt
\D [^0-9]
\s representerar alla dessa tomma, osynliga tecken
a\s*b
AB
a
b
\s är alla tecken utom \s.
=================================================
\w [0-9a-zA-Z_]
Ord betyder ordkaraktär.
\w är alla andra karaktärer utom \w.
\b anger gränsen för ordet. (Påstå, döm enbart, mismatch.) )
============================================
.
Följande metoder kan indikera att vilket enskilt tecken som helst förekommer mellan abs.
a[\s\S]b
a[\d\D]b
a[\w\W]b
#Faktiska striderna
1: Skapa en ny konsolapplikation
2: Klistra in följande kod, du kan testa modul för modul
Epilog
Reguljärt uttryck onlinetest Inloggningen med hyperlänken är synlig.
|
Föregående:MySQL Hur man ändrar lösenordet till root-användarenNästa:Java Reactor – Omorganisera din Java-kod
|