利用C#/VB.NET實現將PDF轉為Word

眾所周知,PDF 文檔支持特長文件,集成度和安全可靠性都較高,可有效防止他人對 PDF 內容進行更改,所以在工作中深受大傢喜愛。但是在工作中,我們不可避免的會對 PDF 文檔進行修改或再編輯,這時我們可以將 PDF 轉換為 Word 文檔格式進行修改。本文將分為兩部分介紹如何以編程的方式將 PDF 轉換為 Word。

  • 將 PDF 轉換為固定佈局的 Doc/Docx 文檔
  • 將 PDF 轉換為流動形態的 Doc/Docx 文檔

固定佈局模式轉換速度快,有利於最大程度保持 PDF 文件的原貌。但是,生成的文檔的可編輯性將受到限制,因為 PDF 中的每一行文本將在生成的 Word 文檔中顯示在單獨的框架中。

流動形態是一種完整的識別模式。轉換後的內容不會以框架形式呈現,並且生成的文檔的結構是可流動的。生成的 Word 文檔很容易重新編輯,但看起來可能與原始 PDF 文件不同。

將 PDF 轉換為固定佈局的 Doc/Docx 文檔

  • 創建一個 PdfDocument 對象。
  • 使用 PdfDocument.LoadFromFile() 方法加載示例 PDF 文件。
  • 使用 PdfDocument.SaveToFile() 方法將 PDF 轉換為 .doc/.docx 格式文件並保存。

完整代碼

C#

using Spire.Pdf;

namespace ConvertPdfToDoc
{
    class Program
    {
        static void Main(string[] args)
        {
            //創建一個 PdfDocument 對象
            PdfDocument doc = new PdfDocument();

            //加載示例 PDF 文件
            doc.LoadFromFile("示例.pdf");

            //將PDF轉換為Doc格式文件並保存
            doc.SaveToFile("ToDoc.doc", FileFormat.DOC);

            //將PDF轉換為Docx格式文件並保存
            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX);

        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace ConvertPdfToDoc
    Friend Class Program
        Private Shared Sub Main(ByVal args As String())
            '創建一個 PdfDocument 對象
            Dim doc As PdfDocument = New PdfDocument()

            '加載示例 PDF 文件
            doc.LoadFromFile("示例.pdf")

            '將PDF轉換為Doc格式文件並保存
            doc.SaveToFile("ToDoc.doc", FileFormat.DOC)

            '將PDF轉換為Docx格式文件並保存
            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX)

        End Sub
    End Class
End Namespace

將 PDF 轉換為流動形態的 Doc/Docx 文檔

創建一個 PdfDocument 對象。

使用 PdfDocument.LoadFromFile() 方法加載示例 PDF 文件。

使用 PdfConvertOptions.SetPdfToDocOptions(bool usePsMode,bool useFlowRecognitionMode) 方法將轉換引擎設置為 PS 模式並將識別模式設置為流。

使用 PdfDocument.SaveToFile() 方法將文檔轉換為.doc/.docx 格式的文件。

完整代碼

C#

using Spire.Pdf;

namespace ConvertPdfToDocxUsingPsMode
{
    class Program
    {
        static void Main(string[] args)
        {
            //創建一個 PdfDocument 對象
            PdfDocument doc = new PdfDocument();

            //加載示例 PDF 文件
            doc.LoadFromFile("示例.pdf");

            // PDF轉Word使用PS模式,識別模式設置為流
            doc.ConvertOptions.SetPdfToDocOptions(true, true);
      
      //將PDF轉換為Doc格式文件並保存
            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC);

            //將PDF轉換為Docx格式文件並保存
            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX);
        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace ConvertPdfToDocxUsingPsMode
    Friend Class Program
        Private Shared Sub Main(ByVal args As String())
            '創建一個 PdfDocument 對象
            Dim doc As PdfDocument = New PdfDocument()

            '加載示例 PDF 文件
            doc.LoadFromFile("示例.pdf")

            ' PDF轉Word使用PS模式,識別模式設置為流
            doc.ConvertOptions.SetPdfToDocOptions(True, True)

            '將PDF轉換為Doc格式文件並保存
            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC)

            '將PDF轉換為Docx格式文件並保存
            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX)
        End Sub
    End Class
End Namespace

效果圖

到此這篇關於利用C#/VB.NET實現將PDF轉為Word的文章就介紹到這瞭,更多相關C# PDF轉Word內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: