|
|
Опубликовано 18.06.2019 21:38:16
|
|
|

Этот пост был последний раз отредактирован Kongcicada 18.06.2019 21:39
предисловие При сопоставлении данных, квалификации правил и анализа краулера в проекте мы используем регулярные выражения. Ниже приведено краткое изложение базовых знаний о регулярности, все из которых являются учебными заметками ранних лет.
СМС
#Основы регулярных выражений
. Представляет любой отдельный символ, отличный от \n
[ ] Фильтрация символов
[^] Эквивалентно non
| означает или
() Изменить приоритет операции.
* квалификатор, который указывает, что предыдущее выражение встречается 0 или более раз.
+ квалификатор, указывающий на то, что предыдущее выражение должно встречаться 1 или более раз. Он должен появиться хотя бы один раз.
? квалификаторами, указывающими, что предыдущее выражение должно встречаться 0 или 1 раза.
{n} квалификатор, который квалифицирует выражение, предшествующее ему, должно встречаться n раз.
{n,} квалификатор, который квалифицирует предшествующее выражение как минимум n раз.
{n,m} квалификатор, который квалифицирует предыдущее выражение как минимум n и не более m раз.
^ $ — это начало и конец строки
\d эквивалентен [0-9]
\D эквивалентно [^0-9]
\s обозначает все невидимые символы пробелов
\S — это все иероглифы, кроме \s.
\w указывает на [0-9a-zA-Z_]
\w — это все остальные персонажи, кроме \w.
\b указывает границу слова. (Утверждайте, только судья, несоответствие.) )
=================================================
. Представляет любой отдельный символ, отличный от \n
a.b
a,b
=========================================
[ ] Фильтрация символов
a[0-9]b
a[a-z]b
a[0-9a-zA-Z]b
A1B
AXB
aAb
a[^0-9]b означает, что между a и b может появляться только любой символ, кроме 0123456789.
a[^0-9a-z]b
=====================================================
| означает или
z|пища из-за | имеет очень низкий приоритет, поэтому это выражение может совпадать с z или едой. Это выражение не совпадает с Зодом
(z|f)ood означает zood или еда
===========================================
() Изменить приоритет операции.
Группа по извлечению.
=======================================
* квалификатор, который указывает, что предыдущее выражение встречается 0 или более раз.
Зоо* значит зо зоо зоооо
(zoo)* означает zoozoo.......
a.*b расшифровывается как AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb
================================================
+ квалификатор, указывающий на то, что предыдущее выражение должно встречаться 1 или более раз. Он должен появиться хотя бы один раз.
a.+b
a9dfjsakl3824urnj324239feb
==================================================
? квалификаторами, указывающими, что предыдущее выражение должно встречаться 0 или 1 раза.
a.? b
AB
AXB
? Ещё одна функция — «положить конец режиму жадности». Регулярные выражения по умолчанию переходят в режим жадности.
======================================================================
a[0-9]+b
a0b
a00b
a09b
a99999999999999999999b
========================== других квалификаторов =====================
{n} квалификатор, который квалифицирует выражение, предшествующее ему, должно встречаться n раз.
a[0-9]{10}b
a1234567899b
======================
{n,} квалификатор, который квалифицирует предшествующее выражение как минимум n раз.
1[a-z]{3,}2
1axffdsafdsafdasfdsafdsfdsafdsfdsa2
========================================
{n,m} квалификатор, который квалифицирует предыдущее выражение как минимум n и не более m раз.
a[0-9]{3,7}b
a0000000b
===========================================
^ указывает начало строки
$ указывает на конец строки.
^ и $ обозначают две особенности струны. Одна указывает начальную особенность, другая — конец
^abc.*xyz$ ^abc122345xyz$
^abcdefg$ ^abcdefg
fdsfdsfxyz xyz$
===========================================
a[0-9]b
a\db
\dЭквивалент [0-9]
Цифровые
\D [^0-9]
\s представляет все эти пробелы, невидимые символы
a\s*b
AB
a
b
\S — это все иероглифы, кроме \s.
=================================================
\w [0-9a-zA-Z_]
Слово означает слово персонажа.
\w — это все остальные персонажи, кроме \w.
\b указывает границу слова. (Утверждайте, только судья, несоответствие.) )
============================================
.
Следующие методы могут указывать, что между прессом появляется какой-либо отдельный символ.
a[\s\S]b
a[\d\D]b
a[\w\W]b
#Реальные бои
1: Создать новое консольное приложение
2: Вставьте следующий код, можно проверить модуль за модулем
Эпилог
Онлайн-тест регулярного выражения Вход по гиперссылке виден.
|
Предыдущий:MySQL: как изменить пароль корневого пользователяСледующий:Java Reactor — Реорганизуйте ваш Java-код
|