java解析XML詳解
XML的主要用途
- –數據存儲和數據描述
- –是一個優良的配置文件
- –相當於一個小型數據庫
- –XML不依賴於任何一種編程語言,是獨立的W3C提供的規范,所以可以完成多種語言之間的數據交換(重點)
XML的語法嚴格,並且完全區分大小寫
- XML(
eXtensible Markup Language
)-描述事物本身 .xml
XSL (eXtensible Stylesheet Language
)-修飾XML XSL文件也有單獨的文件,文件後綴 .xsl
通過以下陳程序引入xsl文件
<?xml-stylesheet type="text/xsl" href="student.xsl"?>
DTD (Docment Type Definition
)-約定xml的標簽 在XML文件中隻能編寫那些標簽,標簽中隻能編寫那些屬性 DTD有單獨的文件,文件後綴 .dtd
DTD實例
Schema-約定xml標簽和類型,比DTD編寫更加方便,(約束XML文件) schema有單獨的文件,文件後綴 .xsd/.xml
實例是:
<?xml version="1.0" encoding="gb2312"?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs:element name="叢書"> <xs:complexType> <xs:sequence> <xs:element name="書"> <xs:element name="名" minoccurs="1"></xs:element> <xs:element name="人"></xs:element> <xs:element name="價"> <xs:attribute name="unit"> <xs:enumeration value="RMB"/> <xs:enumeration value="美元"/> <xs:enumeration value="日元"/> </xs:attribute> </xs:element> </xs:element> </xs:sequence> </xs:complexType> </xs:element> </xs:schema>
可以擴展的原因:DTD可以修改
對比HTML
HTML(Hyper Text Markup language
)
*超文本傳輸標記語句(程序員不能自己擴展)
*HTML主要用途:做頁面展示,不會做數據處理
*語法松散,不區分大小寫
CSS
DTD(Doucment Type Defined
)約束HTML能有那些標簽,標簽能有那些屬性
schema (DTD的升級版,語法更新一些,和DTD達到同等效果)
不可擴展原因:DTD不可擴展
關於XML文件的解析?
*無論是哪一種編程語言,對XML文件的解析都包括兩種方式:
*DOM解析
*SAX解析(org.xml.sax.helps DefaultHandler)
DOM解析
*原理
在開始解析XML文件的時候,將整個XMl文件全部加載到內存中
在內存中編程語言將XML文件映射成一顆DOM樹,這顆樹就是一個
對象,然後我們對這棵樹上的任意節點進行增刪改查操作,由於
這棵樹全部都在內存上,解析過去的節點可以再次解析,比較靈活。
*優點
靈活,解析過去的節點,可以再次解析
*缺點
如果XML文件比較大,可能會導致內存溢出,即使不導致內存溢出,
也會耗費大量內存,內存少瞭項目的運行效率自然就降低瞭。
*什麼情況下選擇dom解析方式
如果很靈活的操作每一個元素,選用dom解析,但是註意文件需要小一些
SAX解析
*原理
SAX解析是基於事件驅動型的解析方式,他的解析不需要將整個XML文件全部
轉載到內存中,解析的時候是有順序的,在XML文件中從上往下依次解析,遇
到開始標簽,表示發生瞭一個特定的事件,此時執行一段特定的程序,遇到結束
標簽表示又發生一個特定事件,此時執行一段特定的程序完成解析。
*優點
不需要轉載XML文件,所以不會占用大量內存, 適合大文件
*缺點
解析過去的節點不能重復解析,除非重頭開始
*什麼情況下選擇SAX解析方式
大文件適合使用SAX解析
作為程序員如何解析XML文件,解析XMl文件的開源項目都包括那些?
java解析XML相關的開源項目
*DOM4j(Dom for Java)
*JDOM
…..
JDK自帶一套,是實現W3C規范的
*org.w3c.com.*; 基於DOM解析
*org.xml.sax.*; 基於SAX解析
為瞭提高我們解析XMl文件的效率,還涉及到XPATH。(是一種標簽匹配方式,類似於正則表達式,可以讓我們程序快速定位XML文件中的標簽)
解析XML文件涉及到:
DOM4j/JDOM/W3C+……Xpath
JDK自帶的一套解析
首先在src目錄下創建一個xml文件
以下為解析過程
/** * 使用JDK自帶的"Dom解析"XML文件(讀) */ public class Text04 { public static void main(String[] args) throws Exception { //創建文檔解析器工廠對象 DocumentBuilderFactory factory= DocumentBuilderFactory.newInstance(); //創建文檔解析器對象 DocumentBuilder builder=factory.newDocumentBuilder(); //開始解析XML文件 String path=Thread.currentThread().getContextClassLoader().getResource("db-config.xml").toURI().getPath(); Document document =builder.parse(new File(path));//dom樹,在內存中生成瞭一顆dom樹 //獲取根元素 Node rootNode=document.getFirstChild(); //獲取根元素的名字 System.out.println(rootNode.getNodeName()); //通過根元素獲取其他元素 Node driverNode=document.getElementsByTagName("driver").item(0); String driver =driverNode.getTextContent(); System.out.println(driver); } }
輸出結果
使用dom4j開源項目(基於dom解析)解析xml文件(讀)
需要將dom4j開源項目的jar包作為目錄導入
/** * 使用dom4j開源項目解析XML文件(讀) * * 讀XML文件 * * DOM4j * * 基於dom方式 */ public class Text01 { public static void main(String[] args) throws Exception { //創建解析器對象 SAXReader reader=new SAXReader();//雖然使用瞭SAXReader,但是還是基於DOM的解析方式 //獲取文檔對象,還是dom樹 String path=Thread.currentThread().getContextClassLoader().getResource("db-config.xml").toURI().getPath(); Document document= reader.read(new File(path)); //獲取根元素 Element rootElement=document.getRootElement(); //System.out.println(element.getName()); //獲取driver元素 Element driverElement =rootElement.element("driver"); //在獲取文本 String driver=driverElement.getText(); //System.out.println(driver); //直接獲取元素的文本內容 driver=rootElement.elementText("driver"); System.out.println(driver); System.out.println(rootElement.elementText("url")); System.out.println(rootElement.elementText("user")); System.out.println(rootElement.elementText("password")); } }
輸出結果
使用dom4j開源項目(基於dom解析)解析xml文件(寫)
import org.dom4j.Document; import org.dom4j.DocumentHelper; import org.dom4j.Element; import org.dom4j.io.OutputFormat; import org.dom4j.io.XMLWriter; import java.io.File; import java.io.FileWriter; /** * 使用dom4j開源項目解析XML文件(寫) */ public class Text02 { public static void main(String[] args) throws Exception { //創建文檔對象 Document document= DocumentHelper.createDocument(); //添加根元素 Element studentInfoElt=document.addElement("學生信息"); //給學生信息節點添加子節點學生節點 Element studentElt=studentInfoElt.addElement("學生"); //給學生節點添加id屬性 studentElt.addAttribute("id","110"); //給學生節點添加名字字節點 Element nameElt=studentElt.addElement("名字"); //設置名字節點文本 nameElt.setText("張三"); //給學生節點添加性別字節點 Element sexElt=studentElt.addElement("性別"); //設置名字節點文本 sexElt.setText("男"); //開始寫 OutputFormat format= OutputFormat.createPrettyPrint(); format.setEncoding("utf-8"); String path="students.xml"; XMLWriter xmlWriter=new XMLWriter(new FileWriter(new File(path)),format); xmlWriter.write(document); xmlWriter.close(); } }
最終生成的xml文件
總結
本篇文章就到這裡瞭,希望能給你帶來幫助,也希望你能夠多多關註WalkonNet的更多內容!
推薦閱讀:
- Java中使用DOM4J生成xml文件並解析xml文件的操作
- Java dom4j生成與解析XML案例詳解
- Java網絡編程之UDP實現原理解析
- SpringBoot框架如何管理Xml和CSV
- Java全面解析string類型的xml字符串