Pattern.compile函數提取字符串中指定的字符(推薦)

Posted on 2022-12-29 by WalkonNet

最近有個需求是要提取一段字符串中特定范圍內的內容，查找資料後，使用的是Java中的Pattern.compile函數來實現對指定字符串的截取。記錄下來查找的知識和應用，方便以後的查看。

Pattern.compile函數語法

// Pattern.compile函數語法
Pattern Pattern.compile(String regex, int flag)

知識學習
Pattern.compile函數中兩個參數
1、regex 表示定義的規則
2、flag 表示設置的參數類型，主要包含以下幾種情況：
（1）Pattern.CASE_INSENSITIVE(?i) 默認情況下，大小寫不明感的匹配隻適用於US-ASCII字符集。讓表達式忽略大小寫進行匹配。
（2）Pattern.COMMENTS(?x) 此種模式下，匹配時會忽略表達式中空格字符(表達式裡的空格，tab，回車)。註釋從#開始，一直到這行結束。
（3）Pattern.UNIX_LINES(?d) 此種模式下，隻有’\n’才被認作一行的中止，並且與’.’，’^’，以及’$’進行匹配。
（4）Pattern.MULTILINE(?m) 此種模式下，上箭頭和單引號分別匹配一行的開始和結束。此外，’^‘仍然匹配字符串的開始，’’也匹配字符串的結束。默認情況下，這兩個表達式僅僅匹配字符串的開始和結束。
（5）Pattern.DOTALL：此種模式下，表達式’.‘可以匹配任意字符，包括表示一行的結束符。默認情況下，表達式’.'不匹配行的結束符。

項目中程序例子

在項目中運用的 flag 的 CASE_INSENSITIVE參數，此處主要是截取中括號中的內容，截取的實現代碼如下：

// 引入包
import java.util.regex.Matcher;
import java.util.regex.Pattern;

//需要截取的字符串
String splitStr = "[user:name] = select name from user";
// 定義規則
String pattern = "(\\[+)(\\w+)\\:(\\w+)(\\]+)";
//Pattern.compile函數
Matcher matcher = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE).matcher(splitStr);
while (matcher.find()) { //表示往下遍歷
	//截取出來的字符串 [user:name]
	String allcon = matcher.group(0);
	System.out.println("allcon匹配的結果為"+allcon);
	//截取的開始位置 [
	String tableJoin1 = matcher.group(1);
	System.out.println("tableJoin1匹配的結果為"+tableJoin1);
	//截取出來的表名 user
	String tableName = matcher.group(2);
	System.out.println("tableName匹配的結果為"+tableName);
	//截取出來的字段名 name
	String filed = matcher.group(3);
	System.out.println("filed匹配的結果為"+filed);
	//截取的結束位置 ]
	String tableJoin4 = matcher.group(4);
	System.out.println("tableJoin4匹配的結果為"+tableJoin4);
}

運行結果如下圖所示。

在這裡插入圖片描述

本程序中定義的規則表達式主要提取四個括號內的內容，以 \\ 符號為開始，後面跟截取的符號，w表示匹配的字符。按照此規則就可以提取出來相應的參數：tableName 表示提取的表名，filed 表示提取的字段名。

參考下面教程：

Pattern.compile函數的相關解釋

Pattern.compile函數：Pattern Pattern.compile(String regex, int flag)

flag的取值范圍如下：

Pattern.CANON_EQ：當且僅當兩個字符的"正規分解(canonical decomposition)"都完全相同的情況下，才認定匹配。比如用瞭這個標志之後，表達式"a\u030A"會匹配"?"。默認情況下，不考慮"規范相等性(canonical equivalence)"。

Pattern.CASE_INSENSITIVE：默認情況下，大小寫不敏感的匹配隻適用於US-ASCII字符集。這個標志能讓表達式忽略大小寫進行匹配。要想對Unicode字符進行大小不明感的匹配，隻要將UNICODE_CASE與這個標志合起來就行瞭。

Pattern.COMMENTS：在這種模式下，匹配時會忽略(正則表達式裡的)空格字符(不是指表達式裡的"\\s"，而是指表達式裡的空格，tab，回車之類)。註釋從#開始，一直到這行結束。可以通過嵌入式的標志來啟用Unix行模式。

Pattern.DOTALL：在這種模式下，表達式'.'可以匹配任意字符，包括表示一行的結束符。默認情況下，表達式'.'不匹配行的結束符。

Pattern.MULTILINE：在這種模式下，'^'和'$'分別匹配一行的開始和結束。此外，'^'仍然匹配字符串的開始，'$'也匹配字符串的結束。默認情況下，這兩個表達式僅僅匹配字符串的開始和結束。

Pattern.UNICODE_CASE：在這個模式下，如果你還啟用瞭CASE_INSENSITIVE標志，那麼它會對Unicode字符進行大小寫不明感的匹配。默認情況下，大小寫不敏感的匹配隻適用於US-ASCII字符集。

Pattern.UNIX_LINES(?d) 在這個模式下，隻有'\n'才被認作一行的中止，並且與'.'，'^'，以及'$'進行匹配。

到此這篇關於Pattern.compile函數提取字符串中指定的字符的文章就介紹到這瞭,更多相關Pattern.compile函數提取字符串指定字符內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

Pattern.compile函數提取字符串中指定的字符(推薦)

Pattern.compile函數語法

Pattern.compile函數的相關解釋

推薦閱讀：

發佈留言取消回覆

近期文章

Pattern.compile函數語法

Pattern.compile函數的相關解釋

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆