正則表達式regular expression詳述(一)284278問題及解決

 正則表達式是regular expression,看來英文比中文要好理解多瞭,就是檢查表達式符
不符合規定!!正則表達式有一個功能十分強大而又十分復雜的對象RegExp,在JavaScript1.2 版本以
上提供。
    下面我們看看有關正則表達式的介紹:
    正則表達式對象用來規范一個規范的表達式(也就是表達式符不符合特定的要求,比如是不是Email
地址格式等),它具有用來檢查給出的字符串是否符合規則的屬性和方法。
    除此之外,你用RegExp構造器建立的個別正則表達式對象的屬性,就已經預先定義好瞭正則表達式
對象的靜態屬性,你可以隨時使用它們。
    核心對象:
    在JavaScript 1.2, NES 3.0以上版本提供。
    在JavaScript 1.3以後版本增加瞭toSource方法。
    建立方法:
    文字格式或RegExp構造器函數。
    文字建立格式使用以下格式:
    /pattern/flags即/模式/標記

    構造器函數方法使用方法如下:
    new RegExp(“pattern”[, “flags”])即new RegExp(“模式”[,”標記”])

    參數:
    pattern(模式)
    表示正則表達式的文本

    flags(標記)
    如果指定此項,flags可以是下面值之一:
    g: global match(全定匹配)
    i: ignore case(忽略大小寫)
    gi: both global match and ignore case(匹配所有可能的值,也忽略大小寫)

    註意:文本格式中的參數不要使用引號標記,而構造器函數的參數則要使用引號標記。所以下面的
表達式建立同樣的正則表達式:
    /ab+c/i
  new RegExp(“ab+c”, “i”)

    描述:
    當使用構造函數的時候,必須使用正常的字符串避開規則(在字符串中加入前導字符 )是必須的。
    例如,下面的兩條語句是等價的:
    re = new RegExp(“\w+”)
    re = /w+/

    下面的提供瞭在正則表達式中能夠使用的完整對特殊字符的一個完整的列表和描述。

    表1.3:正則表達式中的特殊字符:

    字符
    意義:對於字符,通常表示按字面意義,指出接著的字符為特殊字符,不作解釋。
    例如:/b/匹配字符’b’,通過在b 前面加一個反斜杠,也就是/b/,則該字符變成特殊字符,表示
匹配一個單詞的分界線。
    或者:   
    對於幾個字符,通常說明是特殊的,指出緊接著的字符不是特殊的,而應該按字面解釋。
    例如:*是一個特殊字符,匹配任意個字符(包括0個字符);例如:/a*/意味匹配0個或多個a。
    為瞭匹配字面上的*,在a前面加一個反斜杠;例如:/a*/匹配’a*’。

    字符^
    意義:表示匹配的字符必須在最前邊。
    例如:/^A/不匹配”an A,”中的’A’,但匹配”An A.”中最前面的’A’。

    字符$
    意義:與^類似,匹配最末的字符。
    例如:/t$/不匹配”eater”中的’t’,但匹配”eat”中的’t’。

    字符*
    意義:匹配*前面的字符0次或n次。
    例如:/bo*/匹配”A ghost booooed”中的’boooo’或”A bird warbled”中的’b’,但不匹配”A goat g
runted”中的任何字符。

    字符+
    意義:匹配+號前面的字符1次或n次。等價於{1,}。
    例如:/a+/匹配”candy”中的’a’和”caaaaaaandy.”中的所有’a’。

    字符?
    意義:匹配?前面的字符0次或1次。
    例如:/e?le?/匹配”angel”中的’el’和”angle.”中的’le’。

    字符.
    意義:(小數點)匹配除換行符外的所有單個的字符。
    例如:/.n/匹配”nay, an apple is on the tree”中的’an’和’on’,但不匹配’nay’。


    字符(x)
    意義:匹配’x’並記錄匹配的值。
    例如:/(foo)/匹配和記錄”foo bar.”中的’foo’。匹配子串能被結果數組中的素[1], …, [n] 返
回,或被RegExp對象的屬性$1, …, $9返回。

    字符x|y
    意義:匹配’x’或者’y’。
    例如:/green|red/匹配”green apple”中的’green’和”red apple.”中的’red’。

    字符{n}
    意義:這裡的n是一個正整數。匹配前面的n個字符。
    例如:/a{2}/不匹配”candy,”中的’a’,但匹配”caandy,” 中的所有’a’和”caaandy.”中前面的兩個
‘a’。

    字符{n,}
    意義:這裡的n是一個正整數。匹配至少n個前面的字符。
    例如:/a{2,}不匹配”candy”中的’a’,但匹配”caandy”中的所有’a’和”caaaaaaandy.”中的所有’a’

    字符{n,m}
    意義:這裡的n和m都是正整數。匹配至少n個最多m個前面的字符。
    例如:/a{1,3}/不匹配”cndy”中的任何字符,但匹配 “candy,”中的’a’,”caandy,” 中的前面兩個
‘a’和”caaaaaaandy”中前面的三個’a’,註意:即使”caaaaaaandy” 中有很多個’a’,但隻匹配前面的三
個’a’即”aaa”。

    字符[xyz]
    意義:一字符列表,匹配列出中的任一字符。你可以通過連字符-指出一個字符范圍。
    例如:[abcd]跟[a-c]一樣。它們匹配”brisket”中的’b’和”ache”中的’c’。

    字符[^xyz]
    意義:一字符補集,也就是說,它匹配除瞭列出的字符外的所有東西。 你可以使用連字符-指出一
字符范圍。
    例如:[^abc]和[^a-c]等價,它們最早匹配”brisket”中的’r’和”chop.”中的’h’。

    字符[b]
    意義:匹配一個空格(不要與b混淆)

    字符b
    意義:匹配一個單詞的分界線,比如一個空格(不要與[b]混淆)
    例如:/bnw/匹配”noonday”中的’no’,/wyb/匹配”possibly yesterday.”中的’ly’。

    字符B
    意義:匹配一個單詞的非分界線
    例如:/wBn/匹配”noonday”中的’on’,/yBw/匹配”possibly yesterday.”中的’ye’。

    字符cX
    意義:這裡的X是一個控制字符。匹配一個字符串的控制字符。
    例如:/cM/匹配一個字符串中的control-M。

    字符d
    意義:匹配一個數字,等價於[0-9]。
    例如:/d/或/[0-9]/匹配”B2 is the suite number.”中的’2’。

    字符D
    意義:匹配任何的非數字,等價於[^0-9]。
    例如:/D/或/[^0-9]/匹配”B2 is the suite number.”中的’B’。

    字符f
    意義:匹配一個表單符

    字符n
    意義:匹配一個換行符

    字符r
    意義:匹配一個回車符

    字符s
    意義:匹配一個單個white空格符,包括空格,tab,form feed,換行符,等價於[ fnrtv]。
    例如:/sw*/匹配”foo bar.”中的’ bar’。

    字符S
    意義:匹配除white空格符以外的一個單個的字符,等價於[^ fnrtv]。
    例如:/S/w*匹配”foo bar.”中的’foo’。

    字符t
    意義:匹配一個制表符

    字符v
    意義:匹配一個頂頭制表符

    字符w
    意義:匹配所有的數字和字母以及下劃線,等價於[A-Za-z0-9_]。
    例如:/w/匹配”apple,”中的’a’,”$5.28,”中的’5’和”3D.”中的’3’。

    字符W
    意義:匹配除數字、字母外及下劃線外的其它字符,等價於[^A-Za-z0-9_]。
    例如:/W/或者/[^$A-Za-z0-9_]/匹配”50%.”中的’%’。

    字符n
    意義:這裡的n是一個正整數。匹配一個正則表達式的最後一個子串的n的值(計數左圓括號)。

    例如:/apple(,)sorange1/匹配”apple, orange, cherry, peach.”中的’apple, orange’,下面
有一個更加完整的例子。
    註意:如果左圓括號中的數字比n指定的數字還小,則n取下一行的八進制escape作為描述。

    字符ooctal和xhex
    意義:這裡的ooctal是一個八進制的escape值,而xhex是一個十六進制的escape值,允許在一個
正則表達式中嵌入ASCII碼。


    當表達式被檢查的時候,文字符號提供瞭編輯正則表達式的方法。利用文字符號可以使到正則表達
式保持為常數。例如,如果你在一個循環中使用文字符號來構造一個正則表達式,正則表達式不需進行
反復編譯。
    正則表達式對象構造器,例如,new RegExp(“ab+c”),提供正則表達式的運行時編譯。當你知道正
則表達式的模式會變化的時候,應該使用構造函數,或者你不知道正則表達式的模式,而它們是從另外
的源獲得的時候,比如由用戶輸入時。一旦你定義好瞭正則表達式,該正則表達式可在任何地方使用,
並且可以改變,你可以使用編譯方法來編譯一個新的正則表達式以便重新使用。
    一個分離預先定義的RegExp對象可以在每個窗口中使用;也就是說,每個分離的JavaScript線程運
行以獲得自己的RegExp對象。因為每個腳本在一個線程中是不可中斷的,這就確保瞭不同的腳本不會覆
蓋RegExp對象的值。
    預定義的RegExp對象包含的靜態屬性:input, multiline, lastMatch,lastParen, leftContext,
rightContext, 以及從$1到$9。input和multiline屬性能被預設。其它靜態屬性的值是在執行個別正則
表達式對象的exec和test方法後,且在執行字符串的match和replace方法後設置的。

    屬性
    註意RegExp對象的幾個屬性既有長名字又有短名字(象Perl)。這些名字都是指向相同的值。Perl是
一種編程語言,而JavaScript模仿瞭它的正則表達式。

    屬性$1, …, $9
    取得匹配的子串,如果有的話

    屬性$_
    參考input

    屬性$*
    參考multiline

    屬性$&
    參考lastMatch

    屬性$+
    參考lastParen

    屬性$`
    參考leftContext

    屬性$’
    參考rightContext

    屬性constructor
    指定用來建立對象原型函

    屬性global
    決定是否測試正則表達式是否不能匹配所有的字符串,或者隻是與最先的沖突。

    屬性ignoreCase
    決定試圖匹配字符串的時候是否忽略大小寫

    屬性input
    當正則表達式被匹配的時候,為相反的字符串。

    屬性lastIndex
    決定下一次匹配從那裡開始

    屬性lastMatch
    最後一個匹配的字符

    屬性lastParen
    子串匹配的時候,最後一個parenthesized,如果有的話。

    屬性leftContext
    最近一次匹配前的子串。

    屬性multiline
    是否在串的多行中搜索。

    屬性prototype
    允許附加屬性到所有的對象

    屬性rightContext
    最近一次匹配後的的子串。

    屬性source
    模式文本


   


    方法
    compile方法
    編譯一個正則表達式對象

    exec方法
    運行正則表達式匹配

    test方法
    測試正則達式匹配

    toSource方法
    返回一個對象的文字描述指定的對象;你可以使用這個值來建立一個新的對象。不考慮Object.toS
ource方法。

    toString方法
    返回一個字符串描述指定的對象,不考慮Object.toString對象。

    valueOf方法
    返回指定對角的原始值。不考慮Object.valueOf方法。

 另外,這個對象繼承瞭對象的watch和unwatch方法




  例子:
  例1、下述示例腳本使用replace方法來轉換串中的單詞。在替換的文本中,腳本使用全局 RegExp
對象的$1和$2屬性的值。註意,在作為第二個參數傳遞給replace方法的時候,RegExp對象的$屬性的名
稱。
    <SCRIPT LANGUAGE=”JavaScript1.2″>
    re = /(w+)s(w+)/;
    str = “John Smith”;
    newstr=str.replace(re,”$2, $1″);
    document.write(newstr)
    </SCRIPT>
    顯示結果:”Smith, John”.

  例2、下述示例腳本中,RegExp.input由Change事件處理句柄設置。在getInfo函數中,exec 方法
使用RegExp.input的值作為它的參數,註意RegExp預置瞭$屬性。

   
    <SCRIPT LANGUAGE=”JavaScript1.2″>
    function getInfo(abc)
    {
    re = /(w+)s(d+)/;
    re.exec(abc.value);
    window.alert(RegExp.$1 + “, your age is ” + RegExp.$2);
    }
    </SCRIPT>

  請輸入你的姓和年齡,輸入完後按回車鍵。
  <FORM><INPUT TYPE=”TEXT” NAME=”NameAge” onChange=”getInfo(this);”></FORM>
  </HTML>


    $1, …, $9屬性
    用圓括號括著的匹配子串,如果有的話。
    是RegExp的屬性
    靜態,隻讀

    在JavaScript 1.2, NES 3.0以上版本提供
    描述:因為input是靜態屬性,不是個別正則表達式對象的屬性。你可以使用RegExp.input 訪問該
屬性。

    能加上圓括號的子串的數量不受限制,但正則表達式對象隻能保留最後9 條。如果你要訪問所有的
圓括號內的匹配字串,你可以使用返回的數組。

    這些屬性能用在RegExp.replace方法替換後的字符串(輸出結果)。當使用這種方式的時候,不用預
先考慮RegExp對象。下面給出例子。當正則表達式中沒有包含圓括號的時候,該腳本解釋成$n的字面意
義。(這裡的n是一個正整數)。


    例如:
    下例腳本使用replace 方法來交換串中單詞的位置。在替換後的文本字串中,腳本使用正則表達式
RegExp對象的$1和$2屬性的值。註意:當它們向replace方法傳遞參數的時候,這裡沒有考慮 $ 屬性的
RegExp對象的名稱。
    <SCRIPT LANGUAGE=”JavaScript1.2″>
    re = /(w+)s(w+)/;
    str = “John Smith”;
    newstr=str.replace(re,”$2, $1″);
    document.write(newstr)
    </SCRIPT>
    顯示的輸出結果為:Smith, John。

推薦閱讀: