Java解析xml文件遇到特殊符號異常的情況(處理方案)

在一次Java解析xml文件的開發過程中,使用SAX解析時,出現瞭這樣一個異常信息:

Error on line 60 of document : 對實體 “xxx” 的引用必須以 ‘;’ 分隔符結尾;

我打開xml文件後,發現該“xxx”符號之前跟著一個”&“符號,後來瞭解到,這類符號在xml裡屬於一種特殊符號,而特殊符號若沒用轉義符表示,直接用到xml文件裡,就會在使用SAX等方式做解析時出現奇怪的異常。

其實,這都是因為這些特殊字符造成的。

XML當中特殊符號包括< > & ‘ “等,它們是不允許作為xml文件的PCDATA,若想使用話,需用轉義符代替:

&lt;    <
&gt;    >
&amp;   &
&quot;  “
&apos;  ‘

那麼,若要正常讀取xml文件數據,應該如何使用轉義符替換呢?

剛開始是想百度一番如何解決,卻發現好多帖子都是好幾年前的,且都沒有寫清楚怎麼個解決方法,大多都是提到是特殊符號引起的解析異常,但怎麼過濾掉,顯得含糊其辭,因此,隻能自己胡亂搗鼓一番,搗鼓出一個比較合適的將特殊字符過濾的方案。

實現思路其實很簡單,我們可以在讀取xml文件使用SAX解析前,先把xml文件通過Reader讀取,然後按行讀取出來拼接成一個String字符串,再使用字符串的替換方法replaceAll()將特殊符號進行替換,替換後,就可以將字符串形式的xml直接轉成Document對象做xml解析瞭:

  String xmlStr=s.replaceAll("&","&amp;");

轉換方法代碼如下:

StringBuffer buffer = new StringBuffer();
  BufferedReader bf= new BufferedReader(new FileReader("D:\\測試.xml"));
  String s = null;
     while((s = bf.readLine())!=null){
     buffer.append(s.trim());
  }

  String str = buffer.toString();
  //在這一步進行字符替換,替換成合法轉義字符
  String xml=str.replaceAll("&","&amp;");

  //這裡就可以將處理過的xml文件進行讀取解析瞭
  Document document =  DocumentHelper.parseText(xml);

至此,就可以解決Java解析xml文件遇到特殊符號&出現異常的問題瞭。

以上就是Java解析xml文件遇到特殊符號異常的情況(處理方案)的詳細內容,更多關於Java解析xml文件的資料請關註WalkonNet其它相關文章!

推薦閱讀: