Java 將HTML轉為XML的詳細步驟

本文介紹如何通過Java後端程序代碼來展示如何將html轉為XML。此功能通過采用Word API-Free Spire.Doc for Java提供的Document.saveToFile()方法來實現;該方法支持的目標文檔格式多達30餘種。另外,該API也提供瞭多種方法,如Document.saveToEpub()、Document.saveToFile()、Document.saveToImages()、Document.saveToSVG()、Document.saveToTxt()、Document.saveToTiff()等,可用於將源文件轉為Epub、圖片、文本文件等目標文檔格式。

下面,將以html轉為xml格式為例,介紹如何實現轉換。以下是詳細方法及步驟。

【關於如何導入jar包】

通過Maven倉庫下載導入,如下配置pom.xml:

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>5.2.0</version>
    </dependency>
</dependencies>

如需手動導入,需要下載jar包到本地,然後解壓,找到lib文件夾下的Spire.Doc.jar文件。在IDEA中打開“Project Structure”界面,執行如圖步驟將本地路徑下的jar文件手動引入Java程序:

【將 HTML 轉為 XML】

轉換時,可參考如下代碼步驟:

  • 創建Document類的對象。
  • 調用Document.loadFromFile(String fileName, FileFormat fileFormat)方法加載HTML文件。
  • 通過Document.saveToFile(String fileName, FileFormat fileFormat)方法保存為XML格式到指定路徑。

Java

import com.spire.doc.*;
public class HTMLtoXML {
    public static void main(String[] args) {
        //創建Document類的對象
        Document doc = new Document();
        //加載html文件
        doc.loadFromFile("sample.html",FileFormat.Html);
        //保存為XML格式
        doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml);
    }
}

轉換效果:

到此這篇關於Java 將HTML轉為XML的文章就介紹到這瞭,更多相關java html轉xml內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: