java解析XML詳解

XML的主要用途

  • –數據存儲和數據描述
  • –是一個優良的配置文件
  • –相當於一個小型數據庫
  • –XML不依賴於任何一種編程語言,是獨立的W3C提供的規范,所以可以完成多種語言之間的數據交換(重點)

XML的語法嚴格,並且完全區分大小寫

  • XML(eXtensible Markup Language)-描述事物本身 .xml

XSL (eXtensible Stylesheet Language)-修飾XML XSL文件也有單獨的文件,文件後綴 .xsl

通過以下陳程序引入xsl文件

<?xml-stylesheet type="text/xsl" href="student.xsl"?>

DTD (Docment Type Definition)-約定xml的標簽 在XML文件中隻能編寫那些標簽,標簽中隻能編寫那些屬性 DTD有單獨的文件,文件後綴 .dtd

DTD實例

Schema-約定xml標簽和類型,比DTD編寫更加方便,(約束XML文件) schema有單獨的文件,文件後綴 .xsd/.xml

實例是:

<?xml version="1.0" encoding="gb2312"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
	<xs:element name="叢書">
		<xs:complexType>
			<xs:sequence>
				<xs:element name="書">
					<xs:element name="名"  minoccurs="1"></xs:element>
					<xs:element name="人"></xs:element>
					<xs:element name="價">
						<xs:attribute name="unit">
							<xs:enumeration value="RMB"/>
							<xs:enumeration value="美元"/>
							<xs:enumeration value="日元"/>
						</xs:attribute>
					</xs:element>
				</xs:element>
		</xs:sequence>
		</xs:complexType>
	</xs:element>
</xs:schema>

可以擴展的原因:DTD可以修改

對比HTML

HTML(Hyper Text Markup language

*超文本傳輸標記語句(程序員不能自己擴展)

*HTML主要用途:做頁面展示,不會做數據處理

*語法松散,不區分大小寫

CSS

DTD(Doucment Type Defined)約束HTML能有那些標簽,標簽能有那些屬性

schema (DTD的升級版,語法更新一些,和DTD達到同等效果)

不可擴展原因:DTD不可擴展

關於XML文件的解析?

*無論是哪一種編程語言,對XML文件的解析都包括兩種方式:

*DOM解析

*SAX解析(org.xml.sax.helps DefaultHandler)

DOM解析

*原理

在開始解析XML文件的時候,將整個XMl文件全部加載到內存中

在內存中編程語言將XML文件映射成一顆DOM樹,這顆樹就是一個

對象,然後我們對這棵樹上的任意節點進行增刪改查操作,由於

這棵樹全部都在內存上,解析過去的節點可以再次解析,比較靈活。

*優點

靈活,解析過去的節點,可以再次解析

*缺點

如果XML文件比較大,可能會導致內存溢出,即使不導致內存溢出,

也會耗費大量內存,內存少瞭項目的運行效率自然就降低瞭。

*什麼情況下選擇dom解析方式

如果很靈活的操作每一個元素,選用dom解析,但是註意文件需要小一些

SAX解析

*原理

SAX解析是基於事件驅動型的解析方式,他的解析不需要將整個XML文件全部

轉載到內存中,解析的時候是有順序的,在XML文件中從上往下依次解析,遇

到開始標簽,表示發生瞭一個特定的事件,此時執行一段特定的程序,遇到結束

標簽表示又發生一個特定事件,此時執行一段特定的程序完成解析。

*優點

不需要轉載XML文件,所以不會占用大量內存, 適合大文件

*缺點

解析過去的節點不能重復解析,除非重頭開始

*什麼情況下選擇SAX解析方式

大文件適合使用SAX解析

作為程序員如何解析XML文件,解析XMl文件的開源項目都包括那些?

java解析XML相關的開源項目

*DOM4j(Dom for Java)

*JDOM

…..

JDK自帶一套,是實現W3C規范的

*org.w3c.com.*; 基於DOM解析

*org.xml.sax.*; 基於SAX解析

為瞭提高我們解析XMl文件的效率,還涉及到XPATH。(是一種標簽匹配方式,類似於正則表達式,可以讓我們程序快速定位XML文件中的標簽)

解析XML文件涉及到:

DOM4j/JDOM/W3C+……Xpath

JDK自帶的一套解析

首先在src目錄下創建一個xml文件

以下為解析過程

/**
 * 使用JDK自帶的"Dom解析"XML文件(讀)
 */
public class Text04 {
    public static void main(String[] args) throws Exception {
        //創建文檔解析器工廠對象
        DocumentBuilderFactory factory= DocumentBuilderFactory.newInstance();
        //創建文檔解析器對象
        DocumentBuilder builder=factory.newDocumentBuilder();
        //開始解析XML文件
        String path=Thread.currentThread().getContextClassLoader().getResource("db-config.xml").toURI().getPath();
        Document document =builder.parse(new File(path));//dom樹,在內存中生成瞭一顆dom樹
        //獲取根元素
        Node rootNode=document.getFirstChild();
        //獲取根元素的名字
        System.out.println(rootNode.getNodeName());
        //通過根元素獲取其他元素
        Node driverNode=document.getElementsByTagName("driver").item(0);
        String driver =driverNode.getTextContent();
        System.out.println(driver);
    }
}

輸出結果

使用dom4j開源項目(基於dom解析)解析xml文件(讀)

需要將dom4j開源項目的jar包作為目錄導入

/**
 * 使用dom4j開源項目解析XML文件(讀)
 *
 * 讀XML文件
 *
 * DOM4j
 *
 * 基於dom方式
 */
public class Text01 {
    public static void main(String[] args) throws Exception {
        //創建解析器對象
        SAXReader reader=new SAXReader();//雖然使用瞭SAXReader,但是還是基於DOM的解析方式
        //獲取文檔對象,還是dom樹
        String path=Thread.currentThread().getContextClassLoader().getResource("db-config.xml").toURI().getPath();
        Document document= reader.read(new File(path));
        //獲取根元素
        Element rootElement=document.getRootElement();
        //System.out.println(element.getName());
        //獲取driver元素
        Element driverElement =rootElement.element("driver");
        //在獲取文本
        String driver=driverElement.getText();
        //System.out.println(driver);
        //直接獲取元素的文本內容
        driver=rootElement.elementText("driver");
        System.out.println(driver);
        System.out.println(rootElement.elementText("url"));
        System.out.println(rootElement.elementText("user"));
        System.out.println(rootElement.elementText("password"));

    }
}

輸出結果

使用dom4j開源項目(基於dom解析)解析xml文件(寫)

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;
import java.io.File;
import java.io.FileWriter;
/**
 * 使用dom4j開源項目解析XML文件(寫)
 */
public class Text02 {
    public static void main(String[] args) throws Exception {
        //創建文檔對象
        Document document= DocumentHelper.createDocument();
        //添加根元素
        Element studentInfoElt=document.addElement("學生信息");
        //給學生信息節點添加子節點學生節點
        Element studentElt=studentInfoElt.addElement("學生");
        //給學生節點添加id屬性
        studentElt.addAttribute("id","110");
        //給學生節點添加名字字節點
        Element nameElt=studentElt.addElement("名字");
        //設置名字節點文本
        nameElt.setText("張三");
        //給學生節點添加性別字節點
        Element sexElt=studentElt.addElement("性別");
        //設置名字節點文本
        sexElt.setText("男");
        //開始寫
        OutputFormat format= OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        String path="students.xml";
        XMLWriter xmlWriter=new XMLWriter(new FileWriter(new File(path)),format);
        xmlWriter.write(document);
        xmlWriter.close();

    }
}

最終生成的xml文件

總結

本篇文章就到這裡瞭,希望能給你帶來幫助,也希望你能夠多多關註WalkonNet的更多內容!

推薦閱讀: