Эта статья является зеркальной статьёй машинного перевода, пожалуйста, нажмите здесь, чтобы перейти к оригиналу.

Вид: 35533|Ответ: 1

[Источник] Основы регулярных выражений

[Скопировать ссылку]
Опубликовано 18.06.2019 21:38:16 | | |
Этот пост был последний раз отредактирован Kongcicada 18.06.2019 21:39

предисловие
При сопоставлении данных, квалификации правил и анализа краулера в проекте мы используем регулярные выражения. Ниже приведено краткое изложение базовых знаний о регулярности, все из которых являются учебными заметками ранних лет.

СМС

#Основы регулярных выражений


.           Представляет любой отдельный символ, отличный от \n
[ ] Фильтрация символов
[^] Эквивалентно non
|           означает или
() Изменить приоритет операции.
* квалификатор, который указывает, что предыдущее выражение встречается 0 или более раз.
+ квалификатор, указывающий на то, что предыдущее выражение должно встречаться 1 или более раз. Он должен появиться хотя бы один раз.
?          квалификаторами, указывающими, что предыдущее выражение должно встречаться 0 или 1 раза.
{n} квалификатор, который квалифицирует выражение, предшествующее ему, должно встречаться n раз.
{n,} квалификатор, который квалифицирует предшествующее выражение как минимум n раз.
{n,m} квалификатор, который квалифицирует предыдущее выражение как минимум n и не более m раз.
^ $ — это начало и конец строки
\d эквивалентен [0-9]  
\D эквивалентно [^0-9]
\s обозначает все невидимые символы пробелов
\S — это все иероглифы, кроме \s.
\w указывает на [0-9a-zA-Z_]
\w — это все остальные персонажи, кроме \w.
\b указывает границу слова. (Утверждайте, только судья, несоответствие.) )
=================================================


.    Представляет любой отдельный символ, отличный от \n
a.b
a,b
=========================================
[ ] Фильтрация символов
a[0-9]b
a[a-z]b

a[0-9a-zA-Z]b
A1B
AXB
aAb

a[^0-9]b означает, что между a и b может появляться только любой символ, кроме 0123456789.

a[^0-9a-z]b

=====================================================
|  означает или


z|пища из-за | имеет очень низкий приоритет, поэтому это выражение может совпадать с z или едой. Это выражение не совпадает с Зодом

(z|f)ood означает zood или еда

===========================================
() Изменить приоритет операции.

Группа по извлечению.

=======================================
* квалификатор, который указывает, что предыдущее выражение встречается 0 или более раз.

Зоо* значит зо зоо зоооо
(zoo)* означает zoozoo.......
a.*b расшифровывается как AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb


================================================
+ квалификатор, указывающий на то, что предыдущее выражение должно встречаться 1 или более раз. Он должен появиться хотя бы один раз.

a.+b
a9dfjsakl3824urnj324239feb
==================================================
? квалификаторами, указывающими, что предыдущее выражение должно встречаться 0 или 1 раза.

a.? b
AB
AXB


? Ещё одна функция — «положить конец режиму жадности». Регулярные выражения по умолчанию переходят в режим жадности.

======================================================================
a[0-9]+b

a0b
a00b
a09b
a99999999999999999999b


========================== других квалификаторов =====================
{n} квалификатор, который квалифицирует выражение, предшествующее ему, должно встречаться n раз.
a[0-9]{10}b
a1234567899b
======================
{n,} квалификатор, который квалифицирует предшествующее выражение как минимум n раз.

1[a-z]{3,}2
1axffdsafdsafdasfdsafdsfdsafdsfdsa2



========================================
{n,m} квалификатор, который квалифицирует предыдущее выражение как минимум n и не более m раз.

a[0-9]{3,7}b
a0000000b

===========================================

^ указывает начало строки

$ указывает на конец строки.


^ и $ обозначают две особенности струны. Одна указывает начальную особенность, другая — конец


^abc.*xyz$ ^abc122345xyz$   

^abcdefg$ ^abcdefg


fdsfdsfxyz xyz$



===========================================
a[0-9]b
a\db

\dЭквивалент [0-9]
Цифровые

\D [^0-9]


\s представляет все эти пробелы, невидимые символы
a\s*b
AB
a                                            




b

\S — это все иероглифы, кроме \s.



=================================================
\w [0-9a-zA-Z_]  
Слово означает слово персонажа.

\w — это все остальные персонажи, кроме \w.

\b указывает границу слова. (Утверждайте, только судья, несоответствие.) )

============================================

.


Следующие методы могут указывать, что между прессом появляется какой-либо отдельный символ.
a[\s\S]b
a[\d\D]b
a[\w\W]b






#Реальные бои

1: Создать новое консольное приложение

2: Вставьте следующий код, можно проверить модуль за модулем






Эпилог

Онлайн-тест регулярного выражения   Вход по гиперссылке виден.
















Предыдущий:MySQL: как изменить пароль корневого пользователя
Следующий:Java Reactor — Реорганизуйте ваш Java-код
Опубликовано 05.05.2020 16:32:41 |
Полный список часто используемых регулярных выражений
https://www.itsvse.com/thread-9181-1-1.html
(Источник: Architect_Programmer)
Отказ:
Всё программное обеспечение, программные материалы или статьи, публикуемые Code Farmer Network, предназначены исключительно для учебных и исследовательских целей; Вышеуказанный контент не должен использоваться в коммерческих или незаконных целях, иначе пользователи несут все последствия. Информация на этом сайте взята из Интернета, и споры по авторским правам не имеют отношения к этому сайту. Вы должны полностью удалить вышеуказанный контент с компьютера в течение 24 часов после загрузки. Если вам нравится программа, пожалуйста, поддержите подлинное программное обеспечение, купите регистрацию и получите лучшие подлинные услуги. Если есть нарушение, пожалуйста, свяжитесь с нами по электронной почте.

Mail To:help@itsvse.com