Python實戰之markdown轉pdf(包含公式轉換)
一、Pandoc轉換
1.1 問題
由於我們markdown編輯器比較特殊,一般情況下,我們不太好看,如果轉換成pdf的話,我們就不需要可以的去安裝各種編輯器才可以看瞭,所以我們有瞭md轉pdf或者是docx的需求。
1.2 下載
資源地址
安裝後,本地查看版本,是否安裝成功:
出現如上圖表示安裝成功。
1.3 md轉docx
cd進入我們需要轉換的文件目錄下,輸入:
pandoc xxx.md -s -o xxxx.docx
-s:生成恰當的文件頭部和底部。
-o:指定輸出的文件。
查看實際效果:
此時發現文件已經生成好.我們打開看下,
整體轉換效果還是不錯的。
1.4 md轉pdf
pandoc xxx.md -o xxxx.pdf --pdf-engine=xelatex
二、python庫實現
使用 Typora可以直接轉換
結合 wkhtmltopdf 使用 markdown 庫 和 pdfkit 庫
2.1 安裝 wkhtmltopdf
wkhtmltopdf 下載地址
2.2 安裝 mdutils
pip install markdown pip install pdfkit
參考案例:
import pdfkit from markdown import markdown input = r"F:\csdn博客\pytorch\【Pytorch】pytorch安裝.md" output = r"【Pytorch】pytorch安裝.pdf" with open(input, encoding='utf-8') as f: text = f.read() html = markdown(text, output_format='html') # MarkDown轉HTML htmltopdf = r'D:\htmltopdf\wkhtmltopdf\bin\wkhtmltopdf.exe' configuration = pdfkit.configuration(wkhtmltopdf=htmltopdf) pdfkit.from_string(html, output_path=output, configuration=configuration, options={'encoding': 'utf-8'}) # HTML轉PDF
但是我們此時存在一個問題,如果我們的md中有表格的話,如圖:
那麼轉換之後會發現是亂的:
我們此時需要設定參數,修改為如下:
html = markdown(text, output_format='html',extensions=['tables'])
我們再看下效果:
2.3 引入數學公式
pip install python-markdown-math
import pdfkit from markdown import markdown input_filename = 'xxxx.md' output_filename = 'xxxx.pdf' html = '<!DOCTYPE html><body><link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/katex/dist/katex.min.css" rel="external nofollow" crossorigin="anonymous"><script src="https://cdn.jsdelivr.net/npm/katex/dist/katex.min.js" crossorigin="anonymous"></script><script src="https://cdn.jsdelivr.net/npm/katex/dist/contrib/mathtex-script-type.min.js" defer></script>{}</body></html>' text = '$$E=mc^2$$' text = markdown(text, output_format='html', extensions=['mdx_math']) # MarkDown轉HTML html = html.format(text) pdfkit.from_string(html, output_filename, options={'encoding': 'utf-8'}) # HTML轉PDF
2.4 網頁轉pdf
import pdfkit pdfkit.from_file('xxx.html', 'xxxx.pdf', options={'encoding': 'utf-8'}) # HTML轉PDF
2.5 進度條轉換
pip install pymdown-extensions
progressbar.css
.progress-label { position: absolute; text-align: center; font-weight: 700; width: 100%; margin: 0; line-height: 1.2rem; white-space: nowrap; overflow: hidden; } .progress-bar { height: 1.2rem; float: left; background-color: #2979ff; } .progress { display: block; width: 100%; margin: 0.5rem 0; height: 1.2rem; background-color: #eeeeee; position: relative; } .progress.thin { margin-top: 0.9rem; height: 0.4rem; } .progress.thin .progress-label { margin-top: -0.4rem; } .progress.thin .progress-bar { height: 0.4rem; } .progress-100plus .progress-bar { background-color: #00e676; } .progress-80plus .progress-bar { background-color: #fbc02d; } .progress-60plus .progress-bar { background-color: #ff9100; } .progress-40plus .progress-bar { background-color: #ff5252; } .progress-20plus .progress-bar { background-color: #ff1744; } .progress-0plus .progress-bar { background-color: #f50057; }
progressbar.py
from markdown import markdown filename = 'progressbar.md' html = ''' <!DOCTYPE html> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1, minimal-ui"> <title>progressbar</title> <link rel="stylesheet" href="progressbar.css" rel="external nofollow" > </head> <body> {} </body> </html> ''' encoding = 'utf-8' with open(filename, encoding=encoding) as f: text = f.read() extensions = [ 'markdown.extensions.attr_list', 'pymdownx.progressbar' ] text = markdown(text, output_format='html', extensions=extensions) # MarkDown轉HTML html = html.format(text) print(html) with open(filename.replace('.md', '.html'), 'w', encoding=encoding) as f: f.write(html) # pdfkit.from_string(html, output, options={'encoding': 'utf-8'}) # HTML轉PDF print('完成')
progressbar.md
[=0% "0%"] [=5% "5%"] [=25% "25%"] [=45% "45%"] [=65% "65%"] [=85% "85%"] [=100% "100%"] [=85% "85%"]{: .candystripe} [=100% "100%"]{: .candystripe .candystripe-animate} [=0%]{: .thin} [=5%]{: .thin} [=25%]{: .thin} [=45%]{: .thin} [=65%]{: .thin} [=85%]{: .thin} [=100%]{: .thin}
我們看下最後的實際效果:
到此這篇關於Python實戰之markdown轉pdf(包含公式轉換)的文章就介紹到這瞭,更多相關Python markdown轉pdf內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python3實現網頁內容轉換成PDF文檔和圖片
- python實現csdn全部博文下載並轉PDF
- Python爬取csnd文章並轉為PDF文件
- Python自動化辦公之Word轉PDF的實現
- python pdfkit 中文亂碼問題的解決方案