JavaScript 正則表達式詳解

Posted on 2021-11-05 by WalkonNet

1. 正則表達式創建

JavaScript 有兩種方式創建正則表達式：

第一種：直接通過/正則表達式/寫出來
第二種：通過new RegExp(‘正則表達式’)創建一個RegExp對象

const re1 = /ABC\-001/;
const re2 = new RegExp('ABC\\-001');
re1; // /ABC\-001/
re2; // /ABC\-001/

註意，如果使用第二種寫法，因為字符串的轉義問題，字符串的兩個\實際上是一個\。

2. 使用模式

2.1 使用簡單模式

簡單的模式是由找到的直接匹配所構成的。比如，/abc/這個模式就匹配瞭在一個字符串中，僅僅字符 ‘abc’ 同時出現並按照這個順序。在 “Hi, do you know your abc’s?” 和 “The latest airplane designs evolved from slabcraft.” 就會匹配成功。在上面的兩個實例中，匹配的是子字符串 ‘abc’。在字符串 “Grab crab” 中將不會被匹配，因為它不包含任何的 ‘abc’ 子字符串。

2.2 使用特殊字符

例如：模式/abc/匹配瞭一個單獨的 ‘a’ 後面跟瞭零個或者多個 ‘b’（的意思是前面一項出現瞭零個或者多個），且後面跟著 ‘c’ 的任何字符組合。在字符串 “s’scbbabbbbcdebc” 中，這個模式匹配瞭子字符串 “abbbbc”。

字符	含義
\	匹配將依照下列規則：在非特殊字符之前的反斜杠表示下一個字符是特殊的，不能從字面上解釋。例如，前面沒有”的’d’通常匹配小寫’d’。如果加瞭”,這個字符變成瞭一個特殊意義的字符，意思是匹配一個數字。反斜杠也可以將其後的特殊字符，轉義為字面量。例如，模式 /a/ 代表會匹配 0 個或者多個 a。相反，模式 /a/ 將 ” 的特殊性移除，從而可以匹配像 “a” 這樣的字符串。使用 new RegExp(“pattern”) 的時候也不要忘記將 \ 進行轉義，因為 \ 在字符串裡面也是一個轉義字符。
^	匹配輸入的開始，例如，/^A/ 並不會匹配 “an A” 中的 ‘A’，但是會匹配 “An E” 中的 ‘A’。
$	匹配輸入的結束。例如，/t$/ 並不會匹配 “eater” 中的 ‘t’，但是會匹配 “eat” 中的 ‘t’。
*	匹配前一個表達式0次或多次。等價於 {0,}。例如，/bo*/會匹配 “A ghost boooooed” 中的 ‘booooo’
+	匹配前面一個表達式1次或者多次。等價於 {1,}。例如，/a+/匹配瞭在 “candy” 中的 ‘a’，和在 “caaaaaaandy” 中所有的 ‘a’。
?	匹配前面一個表達式0次或者1次。等價於 {0,1}。例如，/e?le?/ 匹配 “angel” 中的 ‘el’，和 “angle” 中的 ‘le’ 以及”oslo’ 中的’l’。如果緊跟在任何量詞 *、 +、? 或 {} 的後面，將會使量詞變為非貪婪的（匹配盡量少的字符），和缺省使用的貪婪模式（匹配盡可能多的字符）正好相反。例如，對 “123abc” 應用 /\d+/ 將會返回 “123”，如果使用 /\d+?/,那麼就隻會匹配到 “1”。
.	匹配除換行符之外的任何單個字符。例如，/.n/將會匹配 “nay, an apple is on the tree” 中的 ‘an’ 和 ‘on’，但是不會匹配 ‘nay’。
x	y
{n}	n是一個正整數，匹配瞭前面一個字符剛好發生瞭n次。比如，/a{2}/不會匹配“candy”中的’a’,但是會匹配“caandy”中所有的a，以及“caaandy”中的前兩個’a’。
{n,m}	n 和 m 都是整數。匹配前面的字符至少n次，最多m次。如果 n 或者 m 的值是0，這個值被忽略。例如，/a{1, 3}/ 並不匹配“cndy”中的任意字符，匹配“candy”中的a，匹配“caandy”中的前兩個a，也匹配“caaaaaaandy”中的前三個a。註意，當匹配”caaaaaaandy“時，匹配的值是“aaa”，即使原始的字符串中有更多的a。
[xyz]	一個字符集合。匹配方括號中的任意字符，包括轉義序列。你可以使用破折號（-）來指定一個字符范圍。對於點（.）和星號（*）這樣的特殊符號在一個字符集中沒有特殊的意義。他們不必進行轉義，不過轉義也是起作用的。例如，[abcd] 和[a-d]是一樣的。他們都匹配”brisket”中的‘b’,也都匹配“city”中的‘c’。/[a-z.]+/ 和/[\w.]+/與字符串“test.i.ng”匹配。
[^xyz]	一個反向字符集。也就是說，它匹配任何沒有包含在方括號中的字符。你可以使用破折號（-）來指定一個字符范圍。任何普通字符在這裡都是起作用的。
\b	匹配一個詞的邊界。一個詞的邊界就是一個詞不被另外一個“字”字符跟隨的位置或者沒有其他“字”字符在其前面的位置。註意，一個匹配的詞的邊界並不包含在匹配的內容中。換句話說，一個匹配的詞的邊界的內容的長度是0。例如： /\bm/匹配“moon”中的‘m’；/oo\b/並不匹配”moon”中的’oo’，因為’oo’被一個“字”字符’n’緊跟著。/oon\b/匹配”moon”中的’oon’，因為’oon’是這個字符串的結束部分。這樣他沒有被一個“字”字符緊跟著。
\d	匹配一個數字。等價於[0-9]。例如， /\d/ 或者 /[0-9]/ 匹配”B2 is the suite number.”中的’2’。
\D	匹配一個非數字字符。等價於[^0-9]。例如， /\D/ 或者 /[^0-9]/ 匹配”B2 is the suite number.”中的’B’ 。
\f	匹配一個換頁符 (U+000C)。
\n	匹配一個換行符 (U+000A)。
\r	匹配一個回車符 (U+000D)。
\s	匹配一個空白字符，包括空格、制表符、換頁符和換行符。等價於[ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]。例如, /\s\w*/ 匹配”foo bar.”中的’ bar’。
\S	匹配一個非空白字符。等價於[^ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]。例如， /\S\w*/ 匹配”foo bar.”中的’foo’。
\t	匹配一個水平制表符 (U+0009)。
\w	匹配一個單字字符（字母、數字或者下劃線）。等價於[A-Za-z0-9_]。例如, /\w/ 匹配 “apple,” 中的 ‘a’，”$5.28,”中的 ‘5’ 和 “3D.” 中的 ‘3’。
\W	匹配一個非單字字符。
\n	在正則表達式中，它返回最後的第n個子捕獲匹配的子字符串(捕獲的數目以左括號計數)。

3. 應用

3.1 切分字符串

用正則表達式切分字符串比用固定的字符更靈活，通常的切分代碼：

'a d   c'.split(' '); // ['a', 'd', '', '', 'c']

上面方法無法識別連續的空格，改用正則表達式：

'a b   c'.split(/\s+/); // ['a', 'b', 'c']

無論多少個空格都可以正常分割。再加入‘,’：

'a,b, c  d'.split(/[\s\,]+/); // ['a', 'b', 'c', 'd']

再加入;：

'a,b;; c  d'.split(/[\s\,\;]+/); // ['a', 'b', 'c', 'd']

所以，可以用正則表達式來把不規范的輸入轉化成正確的數組。

3.2 分組

除瞭判斷是否匹配之外，正則表達式還可以提取子串，用()表示的就是要提取的分組（Group）。比如：

^(\d{4})-(\d{4,9})$分別定義瞭兩個組，可以直接從匹配的字符串中提取出區號和本地號碼：

var re = /^(\d{4})-(\d{4,9})$/;
re.exec('0530-12306'); // ['010-12345', '010', '12345']
re.exec('0530 12306'); // null

exec()方法在匹配成功後，返回一個數組，第一個元素是正則表達式匹配到的整個字符串，後面的字符串表示匹配成功的子串。

exec()方法在匹配失敗時返回null。

3.3 貪婪匹配

註意，正則匹配默認是貪婪匹配，也就是匹配盡可能多的字符。如下，匹配出數字後面的0：

var re = /^(\d+)(0*)$/;
re.exec('102300'); // ['102300', '102300', '']

由於\d+采用貪婪匹配，直接把後面的0全部匹配瞭，結果0*隻能匹配空字符串瞭。

必須讓\d+采用非貪婪匹配（也就是盡可能少匹配），才能把後面的0匹配出來，加個?就可以讓\d+采用非貪婪匹配：

var re = /^(\d+?)(0*)$/;
re.exec('102300'); // ['102300', '1023', '00']

3.4 正則表達式標志

g	全局搜索。
i	不區分大小寫搜索。
m	多行搜索。
y	執行“粘性”搜索,匹配從目標字符串的當前位置開始，可以使用y標志。

3.5 test() 方法

test() 方法用於檢測一個字符串是否匹配某個模式，如果字符串中含有匹配的文本，則返回 true，否則返回 false。

var re = /^(\d{4})-(\d{4,9})$/;
re.test('0530-12321'); // true
re.test('0530-123ab'); // false
re.test('0530 12321'); // false

4. 常用正則（參考）

驗證Email地址：^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
驗證身份證號（15位或18位數字）：^\d{15}|\d{}18$
中國大陸手機號碼：1\d{10}
中國大陸固定電話號碼：(\d{4}-|\d{3}-)?(\d{8}|\d{7})
中國大陸郵政編碼：[1-9]\d{5}
IP地址：((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)
日期(年-月-日)：(\d{4}|\d{2})-((1[0-2])|(0?[1-9]))-(([12][0-9])|(3[01])|(0?[1-9]))
日期(月/日/年)：((1[0-2])|(0?[1-9]))/(([12][0-9])|(3[01])|(0?[1-9]))/(\d{4}|\d{2})
驗證數字：^[0-9]*$
驗證n位的數字：^\d{n}$
驗證至少n位數字：^\d{n,}$
驗證m-n位的數字：^\d{m,n}$
驗證零和非零開頭的數字：^(0|[1-9][0-9]*)$
驗證有1-3位小數的正實數：^[0-9]+(.[0-9]{1,3})?$
驗證非零的正整數：^\+?[1-9][0-9]*$
驗證非零的負整數：^\-[1-9][0-9]*$
驗證非負整數（正整數 + 0） ^\d+$
驗證非正整數（負整數 + 0） ^((-\d+)|(0+))$
驗證長度為3的字符：^.{3}$
驗證由26個英文字母組成的字符串：^[A-Za-z]+$
驗證由26個大寫英文字母組成的字符串：^[A-Z]+$
驗證由26個小寫英文字母組成的字符串：^[a-z]+$
驗證由數字和26個英文字母組成的字符串：^[A-Za-z0-9]+$

總結

本篇文章就到這裡瞭，希望能夠給你帶來幫助，也希望您能夠多多關註WalkonNet的更多內容！

JavaScript 正則表達式詳解

目錄

1. 正則表達式創建

2. 使用模式

2.1 使用簡單模式

2.2 使用特殊字符

3. 應用

3.1 切分字符串

3.2 分組

3.3 貪婪匹配

3.4 正則表達式標志

3.5 test() 方法

4. 常用正則（參考）

總結

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

1. 正則表達式創建

2. 使用模式

2.1 使用簡單模式

2.2 使用特殊字符

3. 應用

3.1 切分字符串

3.2 分組

3.3 貪婪匹配

3.4 正則表達式標志

3.5 test() 方法

4. 常用正則（參考）

總結

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆