Java使用SAX解析xml的示例

一、SAX解析xml簡介

SAX是Simple API for Xml的簡寫,主要功能是用於對xml文檔進行解析。由於該方式采用的是事件驅動(callback回調機制)解析方式,所以有速度快、占內存少的優點,當然這些優點也僅限於xml的讀取操作,SAX是無法對讀取的XML元素進行修改的。如果要修改節點元素則需要使用DOC方式進行將xml文件讀取,它會將xml讀取成document樹結構對象,這樣可用對節點元素進行編輯操作;DOC方式的缺點也比較明顯:占內存大、解析速度較慢。

所以僅用於讀取xml操作,使用SAX方式是比較好的方式。

二、SAX解析XML實例

創建一個解析的xml文件

<?xml version="1.0" encoding="utf-8"?>
<persons>
  <user>
    <userId>1001</userId>
    <userName>張三</userName>
  </user>
  <user>
    <userId>1002</userId>
    <userName>李四</userName>
  </user>
</persons>

創建一個XMLparseHandler用於自定義xml解析

public class Customhandler extends DefaultHandler2 {

  List<Map> list = new ArrayList<>();
  Map map = null;
  String tag = "";

  @Override
  public void startDocument() throws SAXException {
    System.out.println("開始解析xml");
  }

  @Override
  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    System.out.println("開始解析元素: <"+ qName + ">");
    if(qName == "user"){
      map = new HashMap();
    }
    tag = qName;
  }

  @Override
  public void characters(char[] ch, int start, int length) throws SAXException {
    String text = new String(ch, start, length).trim();
    if(text != null && !text.isEmpty() && tag!=null&& tag!=""){
      map.put(tag, text);
      if(!map.containsKey(tag)){
      }
      System.out.println("解析到元素值:"+ text);
    }
  }

  @Override
  public void endElement(String uri, String localName, String qName) throws SAXException {
    System.out.println("結束解析元素: <"+ qName + ">");
    if(qName.equals("user")){
      list.add(map);
    }
    tag = "";
  }

  @Override
  public void endDocument() throws SAXException {
    System.out.println("結束解析xml");
  }
}

創建SAX解析對象解析xml

public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
  //創建xml解析工廠
  SAXParserFactory factory = SAXParserFactory.newInstance();
  //創建xml解析對象
  SAXParser parser = factory.newSAXParser();
  File file = new File("test/custom/user.xml");
  InputStream inputStream = new FileInputStream(file);
  Customhandler customhandler = new Customhandler();
  //方式一
  //parser.parse(inputStream, customhandler);

	//方式二
  InputSource source = new InputSource(file.toURI().toURL().toString());
  XMLReader xmlParser = parser.getXMLReader();
  xmlParser.setContentHandler(customhandler);
  xmlParser.parse(source);
  List c = customhandler.list;
  inputStream.close();
}


//打印結果為:
開始解析xml
開始解析元素: <persons>
開始解析元素: <user>
開始解析元素: <userId>
解析到元素值:1001
結束解析元素: <userId>
開始解析元素: <userName>
解析到元素值:張三
結束解析元素: <userName>
結束解析元素: <user>
開始解析元素: <user>
開始解析元素: <userId>
解析到元素值:1002
結束解析元素: <userId>
開始解析元素: <userName>
解析到元素值:李四
結束解析元素: <userName>
結束解析元素: <user>
結束解析元素: <persons>
結束解析xml

三、SAX的實際應用

在tomcat源碼中,有一個Digester對象,這個Digester是tomcat啟動時,初始化各個容器(service、engine、Connetor)的執行者,而Digester執行容器初始化的依據是解析配置文件server.xml的內容,根據xml的具體配置進行來初始化容器。

下面是Digester的類的一些主要方法:

//org.apache.tomcat.util.digester.Digester#parse(org.xml.sax.InputSource)
public class Digester extends DefaultHandler2 {
  
  //讀取解析xml
  public Object parse(InputSource input) throws IOException, SAXException {
    configure();
    getXMLReader().parse(input);
    return root;
  }
  
  //對每個xml標簽進行解析,並執行於之對應的Rule規則列表
  public void startElement(String namespaceURI, String localName, String qName, Attributes list)
    throws SAXException {
    boolean debug = log.isDebugEnabled();
    // Parse system properties
    list = updateAttributes(list);
    // Save the body text accumulated for our surrounding element
    bodyTexts.push(bodyText);
    bodyText = new StringBuilder();
    // the actual element name is either in localName or qName, depending
    // on whether the parser is namespace aware
    String name = localName;
    if ((name == null) || (name.length() < 1)) {
      name = qName;
    }

    // Compute the current matching rule
    StringBuilder sb = new StringBuilder(match);
    if (match.length() > 0) {
      sb.append('/');
    }
    sb.append(name); //根據每次xml節點的名稱拼接成匹配url
    match = sb.toString();

    // Fire "begin" events for all relevant rules(根據namespaceURI匹配獲取的Rule規則列表,有順序規則)
    List<Rule> rules = getRules().match(namespaceURI, match);
    matches.push(rules);
    if ((rules != null) && (rules.size() > 0)) {
      for (Rule value : rules) {
        try {
          Rule rule = value;
          if (debug) {
            log.debug(" Fire begin() for " + rule);
          }
          //依次執行begin方法
          rule.begin(namespaceURI, name, list);
        } catch (Exception e) {
          log.error("Begin event threw exception", e);
          throw createSAXException(e);
        } catch (Error e) {
          log.error("Begin event threw error", e);
          throw e;
        }
      }
    } else {
      if (debug) {
        log.debug(" No rules found matching '" + match + "'.");
      }
    }

  }
}

與之對應的server.xml片段如下:

<Service name="Catalina">

  <Connector port="8081" protocol="HTTP/1.1"
        connectionTimeout="20000"
        redirectPort="8443" />

  <Engine name="Catalina" defaultHost="localhost">

     <Host name="localhost" appBase="webapps"
        unpackWARs="true" autoDeploy="true">
     </Host>
  </Engine>
</Service>

Digester讀取到上面這些xml標簽後,就會從外向裡進行嵌套解析,將這些標簽創建為與之對應的java類實例,也就是tomcat的主體容器結構。

以上就是Java使用SAX解析xml的示例的詳細內容,更多關於Java使用SAX解析xml的資料請關註WalkonNet其它相關文章!