この投稿は2019年6月18日21:39にKongcicadaによって最後に編集されました。
前書き プロジェクト内でのデータマッチング、ルールの資格付け、クローラー解析を行う際には、正規表現を使用します。 以下は、初期の学習ノートである正則性の基本知識の概要です。
テキスト
#正規表現の基本
. \n以外の任意の単一文字を表す
[ ] キャラクターフィルタリング
[^] ノンと同等
| または
() 作戦の優先順位を変える。
* 修飾子は、前の式が0回以上現れることを示します。
+修飾子は、前の表現が1回以上現れなければならないことを示します。 少なくとも一度は登場しなければなりません。
? 修飾子は、前の式が0または1回現れることを示します。
{n} 修飾子であり、その前に置かれる式を n 回出現させる必要があります。
{n,} 修飾子であり、これは前の式が少なくともn回現れることを条件にしています。
{n,m} 修飾子であり、これは前の式が少なくとも n 回、最大 m 回現れることを条件にしています。
^ $ は文字列の始まりと終わりです
\d は [0-9] に相当します。
\Dは[^0-9]と同値です。
\sは見えない空白文字すべてを表します
\Sは\s以外のすべての文字です。
\w は[0-9a-zA-Z_] を示します。
\wは\w以外のすべてのキャラクターです。
\b は単語の境界を示します。 (主張、裁判官のみ、ミスマッチ。) )
=================================================
. \n以外の任意の単一文字を表す
A.B
a、b
=========================================
[ ] キャラクターフィルタリング
a[0-9]b
a[a-z]b
a[0-9a-zA-Z]b
a1b
AXB
aAb
a[^0-9]bは、0123456789以外の任意の文字のみがAとBの間に存在できることを意味します。
a[^0-9a-z]b
=====================================================
| または
z|食品 due to| は優先度が非常に低いため、この式はZやfoodにマッチできますが、この式はZooDと一致しません。
(z|f)oodはズード(食べ物)を意味します
===========================================
() 作戦の優先順位を変える。
脱出グループ。
=======================================
* 修飾子は、前の式が0回以上現れることを示します。
Zoo*はZo zoo zoooooooooooo
(zoo)*はzoozooを示します.......
a.*b は AB AADDDDB AFJDSKLF%$#@dsklfjdsklfjdsklfjb
================================================
+修飾子は、前の表現が1回以上現れなければならないことを示します。 少なくとも一度は登場しなければなりません。
a.+b
a9dfjsakl3824urnj324239feb
==================================================
? 修飾子は、前の式が0または1回現れることを示します。
ある。。 b
AB
AXB
? もう一つの機能は「強欲モードを終わらせる」ことです。 正規表現はデフォルトで強欲モードになります。
======================================================================
a[0-9]+b
a0b
a00b
A09B
a99999999999999999999b
他の条件========================== =====================
{n} 修飾子であり、その前に置かれる式を n 回出現させる必要があります。
a[0-9]{10}b
a1234567899b
======================
{n,} 修飾子であり、これは前の式が少なくともn回現れることを条件にしています。
1[a-z]{3,}2
1axffdsafdsafdasfdsafdsafdsfdsfdsafdsafsdsfdsfdsfdsfdsfdsa2
========================================
{n,m} 修飾子であり、これは前の式が少なくとも n 回、最大 m 回現れることを条件にしています。
a[0-9]{3,7}b
a0000000b
===========================================
^ は文字列の開始を示します
$は文字列の終わりを示します。
^ と $ は文字列の2つの特徴を表します。 一方は始まりを表し、もう一方は終わりを表しています
^abc.*xyz$ ^abc122345xyz$
^abcdefg$ ^abcdefg
FDSFDSFxyz XYZ$
===========================================
a[0-9]b
a\db
\d[0-9] に相当します
デジタル
\D [^0-9]
\sはすべての空白で見えない文字を表します
a\s*b
AB
ある
b
\Sは\s以外のすべての文字です。
=================================================
\w [0-9a-zA-Z_]
「言葉」とは「キャラクター」という意味です。
\wは\w以外のすべてのキャラクターです。
\b は単語の境界を示します。 (主張、裁判官のみ、ミスマッチ。) )
============================================
.
以下の方法は、腹筋の間に任意の単一の文字が現れることを示すことができます。
a[\s\S]b
a[\d\D]b
a[\w\W]b
#実際の戦闘
1: 新しいコンソールアプリケーションを作成する
2: 次のコードを貼り付けます。モジュールごとにテストできます
エピローグ
正則表現オンラインテスト ハイパーリンクのログインが見えます。
|