Denna artikel är en spegelartikel om maskinöversättning, klicka här för att hoppa till originalartikeln.

Utsikt: 35533|Svar: 1

[Källa] Grunderna i reguljära uttryck

[Kopiera länk]
Publicerad på 2019-06-18 21:38:16 | | |
Detta inlägg redigerades senast av Kongcicada den 2019-6-18 21:39

förord
När vi gör viss datamatchning, regelkvalificering och crawleranalys i projektet kommer vi att använda reguljära uttryck. Följande är en sammanfattning av grundläggande kunskaper om regelbundenhet, som alla är studieanteckningar från de tidiga åren.

SMS

#Grunderna i reguljära uttryck


.           Representerar vilken enskild karaktär som helst förutom \n
[ ] Teckenfiltrering
[^] Ekvivalent med non
|           betyder eller
() Ändra operationens prioritet.
* kvalificerare, vilket indikerar att det föregående uttrycket förekommer 0 eller fler gånger.
+ kvalificerare, vilket indikerar att föregående uttryck måste förekomma 1 eller flera gånger. Den måste dyka upp minst en gång.
?          kvalificeringar, vilket indikerar att föregående uttryck måste förekomma 0 eller 1 gånger.
{n} kvalificeraren, som kvalificerar uttrycket som föregår det, måste förekomma n gånger.
{n,} kvalificeraren, vilket kvalificerar att föregående uttryck ska förekomma minst n gånger.
{n,m}-kvalificeraren, som kvalificerar att föregående uttryck ska förekomma minst n gånger och högst m gånger.
^ $ är början och slutet av strängen
\d är ekvivalent med [0-9]  
\D är ekvivalent med [^0-9]
\s representerar alla dessa tomma tecken som är osynliga
\s är alla tecken utom \s.
\w Indikerar [0-9a-zA-Z_]
\w är alla andra karaktärer utom \w.
\b anger gränsen för ordet. (Påstå, döm enbart, mismatch.) )
=================================================


.    Representerar vilken enskild karaktär som helst förutom \n
a.b
a,b
=========================================
[ ] Teckenfiltrering
a[0-9]b
a[a-z]b

a[0-9a-zA-Z]b
A1B
axb
aAb

A[^0-9]b betyder att endast ett enskilt tecken annat än 0123456789 kan förekomma mellan A och B.

a[^0-9a-z]b

=====================================================
|  betyder eller


z|mat på grund av| har en mycket låg prioritet, så detta uttryck kan matcha z eller mat. detta uttryck matchar inte zood

(z|f)ood betyder zood eller mat

===========================================
() Ändra operationens prioritet.

Extraktionsgruppen.

=======================================
* kvalificerare, vilket indikerar att det föregående uttrycket förekommer 0 eller fler gånger.

zoo* betyder zo zoo zoooooooooooo
(zoo)* indikerar zoozoo.......
a.*b står för AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb


================================================
+ kvalificerare, vilket indikerar att föregående uttryck måste förekomma 1 eller flera gånger. Den måste dyka upp minst en gång.

a.+b
A9dfjSAKL3824urNJ324239FEB
==================================================
? kvalificeringar, vilket indikerar att föregående uttryck måste förekomma 0 eller 1 gånger.

a.? b
AB
axb


? En annan funktion är att "avsluta girighetsläget". Reguljära uttryck går automatiskt in i girighetsläge.

======================================================================
a[0-9]+b

a0b
a00b
A09B
a99999999999999999999b


========================== andra kvalificerade =====================
{n} kvalificeraren, som kvalificerar uttrycket som föregår det, måste förekomma n gånger.
a[0-9]{10}b
A1234567899B
======================
{n,} kvalificeraren, vilket kvalificerar att föregående uttryck ska förekomma minst n gånger.

1[a-z]{3,}2
1axffdsafdsafdsafdasfdsafdsafdsafdsfdsfdsfdsa2



========================================
{n,m}-kvalificeraren, som kvalificerar att föregående uttryck ska förekomma minst n gånger och högst m gånger.

a[0-9]{3,7}b
a00000000b

===========================================

^ anger början på strängen

$ anger strängens ände.


^ och $ representerar strängens två egenskaper. Den ena indikerar startfunktionen och den andra representerar slutet


^abc.*xyz$ ^abc122345xyz$   

^abcdefg$ ^abcdefg


fdsfdsfxyz xyz$



===========================================
a[0-9]b
a\db

\dEkvivalent med [0-9]
digitalt

\D [^0-9]


\s representerar alla dessa tomma, osynliga tecken
a\s*b
AB
a                                            




b

\s är alla tecken utom \s.



=================================================
\w [0-9a-zA-Z_]  
Ord betyder ordkaraktär.

\w är alla andra karaktärer utom \w.

\b anger gränsen för ordet. (Påstå, döm enbart, mismatch.) )

============================================

.


Följande metoder kan indikera att vilket enskilt tecken som helst förekommer mellan abs.
a[\s\S]b
a[\d\D]b
a[\w\W]b






#Faktiska striderna

1: Skapa en ny konsolapplikation

2: Klistra in följande kod, du kan testa modul för modul






Epilog

Reguljärt uttryck onlinetest   Inloggningen med hyperlänken är synlig.
















Föregående:MySQL Hur man ändrar lösenordet till root-användaren
Nästa:Java Reactor – Omorganisera din Java-kod
Publicerad på 2020-05-05 16:32:41 |
En komplett lista över vanligt använda reguljära uttryck
https://www.itsvse.com/thread-9181-1-1.html
(Källa: Architect_Programmer)
Friskrivning:
All programvara, programmeringsmaterial eller artiklar som publiceras av Code Farmer Network är endast för lärande- och forskningsändamål; Ovanstående innehåll får inte användas för kommersiella eller olagliga ändamål, annars kommer användarna att bära alla konsekvenser. Informationen på denna sida kommer från internet, och upphovsrättstvister har inget med denna sida att göra. Du måste helt radera ovanstående innehåll från din dator inom 24 timmar efter nedladdning. Om du gillar programmet, vänligen stöd äkta programvara, köp registrering och få bättre äkta tjänster. Om det finns något intrång, vänligen kontakta oss via e-post.

Mail To:help@itsvse.com