Este post foi editado pela última vez por Kongcicada em 2019-6-18 às 21:39
prefácio Ao realizar algumas análises de dados de correspondência, qualificação de regras e crawler no projeto, usaremos expressões regulares. A seguir está um resumo do conhecimento básico sobre regularidade, todos anotações de estudo dos primeiros anos.
Texto
#Fundamentos de expressões regulares
. Representa qualquer caractere individual que não seja \n
[ ] Filtragem de caracteres
[^] Equivalente a não
| significa ou
() Alterar a prioridade da operação.
* qualificador, que indica que a expressão anterior ocorre 0 ou mais vezes.
+ qualificativo, indicando que a expressão anterior deve aparecer 1 ou mais vezes. Deve aparecer pelo menos uma vez.
? qualificadores, indicando que a expressão anterior deve aparecer 0 ou 1 vezes.
{n}, que qualifica a expressão que o precede deve ocorrer n vezes.
{n,} qualificador, que qualifica a expressão anterior para ocorrer pelo menos n vezes.
{n,m}, que qualifica a expressão anterior para ocorrer pelo menos n vezes e no máximo m vezes.
^ $ é o início e o fim da sequência
\d é equivalente a [0-9]
\D é equivalente a [^0-9]
\s representa todos aqueles caracteres de espaço em branco que são invisíveis
\S são todos os personagens, exceto \s.
\w Indica [0-9a-zA-Z_]
\w são todos os outros personagens, exceto \w.
\b indica o limite da palavra. (Assert, apenas juiz, descomposição.) )
=================================================
. Representa qualquer caractere individual que não seja \n
A.B
a,b
=========================================
[ ] Filtragem de caracteres
a[0-9]b
a[a-z]b
a[0-9a-zA-Z]b
A1B
AXB
aAb
a[^0-9]b significa que apenas qualquer caractere além de 0123456789 pode aparecer entre a e b.
a[^0-9a-z]b
=====================================================
| significa ou
z|comida devido a| tem prioridade muito baixa, então essa expressão pode corresponder a z ou a comida. essa expressão não corresponde a zood
(z|f)ood significa zood ou alimento
===========================================
() Alterar a prioridade da operação.
Grupo de extração.
=======================================
* qualificador, que indica que a expressão anterior ocorre 0 ou mais vezes.
Zoo* significa zoológico zooooo
(zoo)* indica zoozoo.......
a.*b significa AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb
================================================
+ qualificativo, indicando que a expressão anterior deve aparecer 1 ou mais vezes. Deve aparecer pelo menos uma vez.
a.+b
a9dfjsakl3824urnj324239feb
==================================================
? qualificadores, indicando que a expressão anterior deve aparecer 0 ou 1 vezes.
um.? b
AB
AXB
? Outra função é "acabar com o modo ganância". Expressões regulares passam por padrão ao modo ganância.
======================================================================
a[0-9]+b
a0b
a00b
A09B
a99999999999999999999b
========================== outros critérios =====================
{n}, que qualifica a expressão que o precede deve ocorrer n vezes.
a[0-9]{10}b
a1234567899b
======================
{n,} qualificador, que qualifica a expressão anterior para ocorrer pelo menos n vezes.
1[a-z]{3,}2
1axffdsafdsafdasfdsafdsafdsafdsafsafsdfdsfdsfdsa2
========================================
{n,m}, que qualifica a expressão anterior para ocorrer pelo menos n vezes e no máximo m vezes.
a[0-9]{3,7}b
a0000000b
===========================================
^ indica o início da sequência
$ indica o fim da corda.
^ e $ representam as duas características da cadeia. Um indica a característica inicial e o outro representa o fim
^abc.*xyz$ ^abc122345xyz$
^abcdefg$ ^abcdefg
FDSFDSFXYZ xyz$
===========================================
a[0-9]b
a\db
\dEquivalente a [0-9]
Digital
\D [^0-9]
\s representa todos aqueles espaços em branco, caracteres invisíveis
a\s*b
AB
um
b
\S são todos os personagens, exceto \s.
=================================================
\w [0-9a-zA-Z_]
palavra significa palavra caráter.
\w são todos os outros personagens, exceto \w.
\b indica o limite da palavra. (Assert, apenas juiz, descomposição.) )
============================================
.
Os métodos a seguir podem indicar que qualquer caractere aparece entre os abdominais.
a[\s\S]b
a[\d\D]b
a[\w\W]b
#Combate real
1: Criar um novo aplicativo de console
2: Cole o código a seguir, você pode testar módulo por módulo
Epílogo
Teste online de expressão regular O login do hiperlink está visível.
|