Python八個自動化辦公的技巧
導語
哈嘍吖鐵汁萌!今天這期就給大傢介紹幾個我用到的辦公室自動化技巧,可以瞬速提高辦公效率。有需要的可以往下滑瞭
1、Word文檔doc轉docx
去年想參賽一個數據比賽, 裡面的數據都是doc格式, 想用python-docx 讀取word文件中的數據, 但是python-docx隻支持docx格式, 所以研究瞭這兩種格式的轉換。
1.1 導入工具包
import os from win32com import client as wc
1.2 獲取文件夾下面所有doc文件明細
# 路徑 path="C:/Users/yyz/Desktop/python辦公技巧/data/doc轉docx/" # 根據自己電腦文件修改 # 定義空list,存放文件絕對路徑 files = [] for file in os.listdir(path): if file.endswith(".doc"): files.append(path+file) files
1.3 轉換文件
# 運行word程序 word = wc.Dispatch("Word.Application") # for循環 i = 0 for file in files: try: doc = word.Documents.Open(file) #打開word文件 doc.SaveAs("{}x".format(file), 12) #另存為後綴為".docx"的文件,其中參數12指docx文件 doc.Close() #關閉原來word文件 print(file +':轉換成功') i +=1 except: print(file +':轉換[不成功]') files.append(file) # 若讀取文件報錯, 則將文件名稱添加到files列表中重新讀取 pass print('轉換文件%i個'%i) # 退出word word.Quit()
2、文字地址批量轉經緯度
工作中地址轉經緯度會用在做地圖可視化或者計算距離方面。
2.1 導入工具包
# 導入工具包 import pandas as pd import json from urllib.request import urlopen, quote import requests
2.2 定義轉換函數
# 定義函數 def getlnglat(address): url = 'http://api.map.baidu.com/geocoding/v3/' output = 'json' ak = "自己申請的api" # 百度地圖API, 需要自己申請 address = quote(address) # 由於本文地址變量為中文,為防止亂碼,先用quote進行編碼 uri = url + '?' + 'address=' + address + '&output=' + output + '&ak=' + ak +'&callback=showLocation%20'+'//GET%E8%AF%B7%E6%B1%82' res=requests.get(uri).text temp = json.loads(res) # 將字符串轉化為json lat = temp['result']['location']['lat'] lng = temp['result']['location']['lng'] return lng, lat # 經度 longitude,緯度 latitude,
2.3 地址轉換
2.3.1 單個地址轉換
# 單個地址轉換 getlnglat('北京市朝陽區高碑店地區辦事處高井村委會') (116.52784003604923, 39.91806508560947)
2.3.2 批量地址轉換
# 讀取數據 data = pd.read_excel('C:/Users/yyz/Desktop/python辦公技巧/data/地址信息.xlsx') data
data['經度'] = '' data['緯度'] = '' for i in range(data.shape[0]): try: data.iloc[i,2] = getlnglat(data.iloc[i,1])[0] # 經度 將第i行,第2列的地址(列索引為1)轉換為經緯度,並將經度賦值給第i行,第3列(列索引為2) data.iloc[i,3] = getlnglat(data.iloc[i,1])[1] # 緯度 except: pass #print(i) data
3、經緯度計算距離
安裝工具包
pip install geopy
3.1 導入工具包
from geopy.distance import geodesic
3.2 讀取數據
# 讀取數據 data = pd.read_excel('C:/Users/yyz/Desktop/python辦公技巧/data/經緯度計算距離.xlsx') data
3.3 計算距離
# 將經緯度賦值給變量,簡化 wd1 = data['緯度1'].tolist() jd1 = data['經度1'].tolist() wd2 = data['緯度2'].tolist() jd2 = data['經度2'].tolist() lis1 = [] for i in range(len(data)): j= geodesic((wd1[i],jd1[i]), (wd2[i],jd2[i])).km # 緯度 經度 緯度 經度 lis1.append(j) #print(i) data['距離'] = lis1 data
4、百度經緯度轉高德經緯度
公司有2個系統,用的坐標系不一樣, 有時候需要轉換一下
4.1 工具包
# 導入工具包 import math import pandas as pd
4.2 定義函數
# 定義轉換函數 def bdToGaoDe(lon,lat): PI = 3.14159265358979324 * 3000.0 / 180.0 x = lon - 0.0065 y = lat - 0.006 z = math.sqrt(x * x + y * y) - 0.00002 * math.sin(y * PI) theta = math.atan2(y, x) - 0.000003 * math.cos(x * PI) lon = z * math.cos(theta) lat = z * math.sin(theta) return lon,lat
4.3 單個轉換
# 單個轉換 bdToGaoDe(116.512885, 39.847469) (116.50647396357492, 39.84120409781157)
4.4 批量轉換
# 讀取數據 data = pd.read_excel('C:/Users/yyz/Desktop/python辦公技巧/data/百度經緯度轉高德.xlsx') data.head()
wd = data['緯度'].tolist() jd = data['經度'].tolist() # 定義一個空列表 li1 = [] for i in range(len(data)): j = bdToGaoDe(jd[i],wd[i]) li1.append(j) li1 data['經度_re'] = [i[0] for i in li1] data['緯度_re'] = [i[1] for i in li1] data.head()
5、Excel文件批量合並
5.1 工具包
# 導入工具包 import pandas as pd import os
5.2 獲取文件列表
# 設置文件路徑 path = 'C:/Users/yyz/Desktop/python辦公技巧/data/數據合並/' # 空列表, 用於存放文件路徑 files = [] for file in os.listdir(path): if file.endswith(".xlsx"): files.append(path+file) # 查看列表 files
5.3 轉換存儲數據
# 定義一個空的dataframe data = pd.DataFrame() # 遍歷所有文件 for file in files: datai = pd.read_excel(file) datai_len = len(datai) data = data.append(datai) # 添加到總的數據中 print('讀取%i行數據,合並後文件%i列, 名稱:%s'%(datai_len,len(data.columns),file.split('/')[-1])) # 查看是否全部讀取,格式是否出錯 # 重置索引 data.reset_index(drop=True,inplace=True)
6、Word文件批量轉pdf
隻能轉docx文件,轉doc文件會報錯, 工具包安裝
pip install docx2pdf
6.1 導入工具包
# 安裝工具包: # 導入工具包 from docx2pdf import convert import os
6.2 單個轉換
# 單個轉換 convert("c:/users/yyz/desktop/魔方公式.docx", "c:/users/yyz/desktop/excel筆記.pdf")
6.3 批量轉換
# 文件位置 path = 'C:/Users/yyz/Desktop/python辦公技巧/data/word轉pdf/' # 定義空list,存放文件列表 files = [] for file in os.listdir(path): if file.endswith(".docx"): files.append(path+file) files for file in files: convert(file,file.split('.')[0]+'.pdf') print(file+'轉換成功')
7、批量讀取word中表格數據
7.1工具包安裝
pip install python-docx
# 讀取word文件 doc = docx.Document('C:/Users/yyz/Desktop/python辦公技巧/data/word信息.docx') # 獲取文檔中所有表格對象的列表 biaoges = doc.tables
7.2 不規范的表格
cells = biaoges[1]._cells cells_lis = [[cell.text for cell in cells]]
import pandas as pd import numpy as np datai = pd.DataFrame(cells_lis) datai = datai[[1,3,7,9,14,16,19,21]] datai.columns = ['姓名','年齡','籍貫','住址','工作單位','電話','是否黨員','出生日期'] datai
7.3 規范數據
# 獲取第1個表格行丨 rowi = len(biaoges[0].rows) rowi
# 定義空列表 lis1 = [] # for循環獲取第一個表的數據 for i in range(1,rowi): # 從第2行開始循環 lis1.append([biaoges[0].cell(i,0).text, biaoges[0].cell(i,1).text, biaoges[0].cell(i,2).text, biaoges[0].cell(i,3).text, biaoges[0].cell(i,4).text])
# 創建一個dataframe data1 = pd.DataFrame(lis1,columns=['日期','品類','數量','價格','金額']) data1
7.4 批量讀取
import pandas as pd import os os.chdir('C:/Users/yyz/Desktop/python辦公技巧/data/word信息/')
lis1=[] for file in os.listdir('.'): if file.endswith('.docx'): doc = docx.Document('./'+file) biaoges = doc.tables rowi = len(biaoges[0].rows) for i in range(1,rowi): lis1.append([biaoges[0].cell(i,0).text, biaoges[0].cell(i,1).text, biaoges[0].cell(i,2).text, biaoges[0].cell(i,3).text, biaoges[0].cell(i,4).text])
# 創建dataframe data1 = pd.DataFrame(lis1,columns=['日期','品類','數量','價格','金額']) data1
8 用outlook批量發郵件
8.1 導入工具包
import win32com.client as win32 import pandas as pd
8.2 讀取數據
# 讀取數據 data1 = pd.read_excel('C:/Users/yyz/Desktop/python批量發送郵件.xlsx',sheet_name='發送郵件') data1.fillna('',inplace=True)
8.3 發送郵件
# 運行outlook outlook = win32.Dispatch("outlook.Application") # for循環發送文件 for i in range(data1.shape[0]): mail = outlook.CreateItem(0) # 創建一個郵件對象 win32.constants.olMailItem mail.To = data1.iloc[i,0] #收件人 mail.CC = data1.iloc[i,1] #抄送人 mail.Subject = data1.iloc[i,2] #郵件主題 mail.HTMLBody = data1.iloc[i,3] # 郵件正文 html格式 # mail.Body = data1.iloc[i,3] # 郵件正文 mail.Attachments.Add(data1.iloc[i,4]) # 附件 mail.Send() #發送 i +=1 print('發送郵件%i份'%i)
python辦公自動化的技巧還有很多, python好掌握,能幫助我們提升工作效率,這也是很多非編程人員學習python的原因之一。
以上就是Python七個自動化辦公的技巧的詳細內容,更多關於Python自動化辦公的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- Python辦公自動化從Excel中計算整理數據並寫入Word
- 利用Python實現讀取Word表格計算匯總並寫入Excel
- Python實現光速定位並提取兩個文件的不同之處
- Python辦公自動化Word轉Excel文件批量處理
- Python快速優雅的批量修改Word文檔樣式