Python格式化文本段落之textwrap庫
一、前言
前文是針對普通的字符串數據進行處理。今天,我們要講解的textwrap庫,是對多文本進行處理的庫。比如對於段落的縮進,填充,截取等,都可以通過textwrap庫進行操作。
特別是自己編寫打印程序的時候,可以使用該庫進行校正文檔非常便捷,大大的加快瞭文本格式的處理。話不多說,我們來一步步學習textwrap庫。
二、切割文檔
一般來說,一篇英文文檔在不考慮換行的情況下,默認是填充整個文檔行才切換至下一行的。現在,我們需要保證每行必須有且僅有50個字符怎麼辦?
我們可以使用textwrap.fill方法,具體代碼如下:
import textwrap content = "" with open('英文文檔.txt', 'r', encoding='utf-8') as f: content = f.read() print(content) print("----") print(textwrap.fill(content, width=50))
運行之後,分割線上下分別為原文檔與textwrap.fill處理後的文檔:
讀者可以自行測試,保證每行加上空格不多於50個字符,而且也沒有任何的縮進效果。
三、文本縮進
既然通過textwrap.fill達不到文檔縮進的效果。下面我們再來認識一個新的函數textwrap.indent()函數。
import textwrap content = "" with open('英文文檔.txt', 'r', encoding='utf-8') as f: content = f.read() print(textwrap.indent(content," "))
textwrap.indent()函數具有兩個參數,一個是需要縮進的字符串,另一個是匹配的縮進字符。比如這裡就是空瞭2格,那麼字符串每行前面都會縮進2格。
當然,我們還可以選擇特定的行進行縮進,textwrap.indent()函數還有第3個參數predicate,需要給它提供一個方法設置特定的規則。具體代碼如下:
import textwrap def choice_line(line): return len(line) % 2 == 0 content = "" with open('英文文檔.txt', 'r', encoding='utf-8') as f: content = f.read() indent_str = textwrap.indent(content, " ",predicate=choice_line) print(indent_str)
這裡,博主設置的規則是,當某行的字符串個數除2取餘數等於0時,就縮進。否則便不縮進。運行之後,效果如下:
四、文本去縮進
既然有縮進文本,那麼肯定就也有反向的操作去除縮進。下面,我們來通過函數textwrap.dedent()來去除縮進。
import textwrap content = "" with open('英文文檔.txt', 'r', encoding='utf-8') as f: content = f.read() indent_str = textwrap.indent(content, " ") print(textwrap.dedent(indent_str))
textwrap.dedent()函數隻有需要操作的文本一個參數,效果如下:
這樣,我們就實現瞭去除縮進。
五、截斷文本
除瞭縮進與截斷之外,我們還可以通過textwrap庫截斷文本進行操作。比如,我們常常看到某些資訊App簡介會這樣寫“某某什麼什麼等等[…]”描述,這就是截取某文開頭文字形成的結果字符串,textwrap.shorten正好可以完整實現,而且不會截斷英文。
import textwrap content = "" with open('英文文檔.txt', 'r', encoding='utf-8') as f: content = f.read() print(textwrap.shorten(content, 100))
運行之後,效果如下:
到此這篇關於Python格式化文本段落之textwrap庫的文章就介紹到這瞭,更多相關Python textwrap庫內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python二分查找+字符串模板+textwrap模塊,
- 如何使用python批量修改文本文件編碼格式
- 詳解Python中的文件操作
- 使用Python批量對文本文件編碼互轉的方法
- Python中json.load()和json.loads()有哪些區別