利用Python讀取微信朋友圈的多種方法總結

背景

由於課題需要爬取朋友圈的內容作為研究數據,稍微研究瞭一下。

目前爬取有四種方法,我們一一來分析一下。

法1,不適用

加某個微信號為好友,給這個微信號查看自己朋友圈的權限,然後那個微信號會把你自己朋友圈生成一個鏈接給你。一來這個和我需求不同,我是要爬取我好友的朋友圈,不是我自己的朋友圈,二來這個套路明顯是公眾號吸粉的套路,這個方法舍棄。。。

法2,已不能用

原理是在PC上操作,然後打開網頁版的微信,掃碼後進行操作。

但是試瞭一下,現在微信已經關閉網頁版瞭,因此該方法也不能用,一小段代碼放上來:

import itchat
import os
import math
from PIL import Image

# 獲取數據
def download_image():
    # 掃描二維碼登陸微信,即通過網頁版微信登陸
    itchat.auto_login()
    # 返回一個包含用戶信息字典的列表
    friends = itchat.get_friends(update=True)
    #  在當前位置創建一個用於存儲頭像的目錄wechatImages
    base_path = 'wechatImages'
    if not os.path.exists(base_path):
        os.mkdir(base_path)

    # 獲取所有好友頭像
    for friend in friends:
        # 獲取頭像數據
        img_data = itchat.get_head_img(userName = friend['UserName'])
        #判斷備註名是否為空
        if friend['RemarkName'] != '':
            img_name = friend['RemarkName']
        else :
            img_name = friend['NickName']
         #   在實際操作中如果文件名中含有*標志,會報錯。則直接可以將其替換掉
        if img_name is "*":
            img_name = ""
        #通過os.path.join()函數來拼接文件名
        img_file = os.path.join(base_path, img_name + '.jpg')
        print(img_file)
        with open(img_file, 'wb') as file:
            file.write(img_data)


# 拼接頭像
def join_image():
    base_path = 'headImages'
    files = os.listdir(base_path) #返回指定的文件或文件夾的名字列表
    print(len(files))
    each_size = int(math.sqrt(float(6400 * 6400) / len(files)))#計算每個粘貼圖片的邊長
    lines = int(6400 / each_size)#計算總共有多少行
    print(lines)
    image = Image.new('RGB', (6400, 6400))# new(mode, size, color=0) 定義一張大小為640*640大小的圖片,不給出第三個參數默認為黑色
    x = 0 #定義橫坐標
    y = 0 #定義縱坐標
    for file_name in files:
        img = Image.open(os.path.join(base_path, file_name)) #找到/打開圖片
        img = img.resize((each_size, each_size), Image.ANTIALIAS)#實現圖片同比例縮放,Image.ANTIALIAS添加濾鏡效果
        image.paste(img, (x * each_size, y * each_size))#將縮放後的照片放到對應的坐標下
        x += 1
        if x == lines:#如果每行的粘貼內容夠瞭,則換行
            x = 0
            y += 1
    image.save('jointPic.jpg')#最後將全部的照片保存下來

if __name__ == '__main__':
    download_image()
    join_image()

如果你微信還能玩網頁版可以試試,上面代碼隻是把你朋友聯系人讀取出來,拼成一個大的圖片。操作朋友圈代碼我沒試,自己百度可以找到。

法3:Appnium

沒試,但是理論上可以的,是在PC上裝手機的模擬器,然後裝微信,然後用工具Appnium模擬操作,讀取朋友圈數據。但是Appnium不是一個庫,是一套軟件,安裝需要java環境等,還有配置,非常麻煩,因此沒有上手試,可以百度,有例子。

法4:模擬操作

這個簡單,但是不是完整例子,後續還要自己寫,先記錄一下吧。

思路很簡單,就是利用PC上的微信,然後讀取窗口信息,模擬手工操作,打開朋友圈窗口,然後讀取顯示朋友圈內容的控件,就可以看到內容。

先在電腦上打開並登錄微信,沒有運行就沒法找到微信進程號。

import psutil# 用於獲取微信電腦版的進程信息;
import pywinauto# 用於自動化控制微信電腦版
from pywinauto.application import Application

沒裝用pip install安裝一下,很快。

然後在main函數裡面寫代碼

	PID = 0#用來保存微信的進程號

    for proc in psutil.process_iter():#循環電腦上的進程,獲取進程號和名稱
        try:
            pinfo = proc.as_dict(attrs=['pid', 'name'])
        except psutil.NoSuchProcess:#沒有運行微信程序
            pass
        else:
            if 'WeChat.exe' == pinfo['name']:#當進程名為WeChat.exe的時候,把進程號記下來
                PID = pinfo['pid']
#進程ID用來提供給 PyWinAuto.application 以連接微信電腦版,connect是要已經運行微信才行
    app = Application(backend='uia').connect(process=PID)
    #獲得微信窗口實例
    Win_wechat = app['微信']

接下來是關鍵一步,由於微信新版窗口的佈局有更改,因此下一步是關鍵,如果不會變通,就會失敗,先調用下面語句,以樹形方式打印窗口上所有控件

Win_wechat.print_control_identifiers()#以樹形方式打印窗口上所有控件

然後觀察,【title=“朋友圈”, control_type=“Button”】這句話在哪個控件下面,目前這個版本是在【Pane6】下面,因此用下面代碼獲取朋友圈按鈕

#獲取微信窗口上朋友圈按鈕實例
    Button_pyq = Win_wechat['Pane6'].child_window(title="朋友圈", control_type="Button")

然後打開朋友圈窗口

	#獲取按鈕坐標
    cords = Button_pyq.rectangle()
    # 接著控制微信電腦版,模擬鼠標點擊,把朋友圈窗口打開
    pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top + 10))

運行到這裡,朋友圈窗口就打開瞭,接下來獲取朋友圈窗口實例,然後把當前窗口內容以樹形顯示出來

	Win_pyq = app['朋友圈']#獲取朋友圈窗口實例

    Win_pyq.draw_outline(colour = 'red',thickness = 2)# 在當前定位到的窗口圍畫出一條邊界線,方便我們看出定位到瞭哪個控件
    Win_pyq.dump_tree()

整體代碼

import psutil# 用於獲取微信電腦版的進程信息;
import pywinauto# 用於自動化控制微信電腦版
from pywinauto.application import Application

if __name__ == '__main__':
    PID = 0#用來保存微信的進程號

    for proc in psutil.process_iter():#循環電腦上的進程,獲取進程號和名稱
        try:
            pinfo = proc.as_dict(attrs=['pid', 'name'])
        except psutil.NoSuchProcess:#沒有運行微信程序
            pass
        else:
            if 'WeChat.exe' == pinfo['name']:#當進程名為WeChat.exe的時候,把進程號記下來
                PID = pinfo['pid']

    #進程ID用來提供給 PyWinAuto.application 以連接微信電腦版,connect是要已經運行微信才行
    app = Application(backend='uia').connect(process=PID)
    #獲得微信窗口實例
    Win_wechat = app['微信']
    #win.print_control_identifiers()#以樹形方式打印窗口上所有控件

    #獲取微信窗口上朋友圈按鈕實例
    Button_pyq = Win_wechat['Pane6'].child_window(title="朋友圈", control_type="Button")
    #獲取按鈕坐標
    cords = Button_pyq.rectangle()
    # 接著控制微信電腦版,把朋友圈窗口打開
    pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top + 10))

    Win_pyq = app['朋友圈']#獲取朋友圈窗口實例

    Win_pyq.draw_outline(colour = 'red',thickness = 2)# 在當前定位到的窗口圍畫出一條邊界線,方便我們看出定位到瞭哪個控件
    Win_pyq.dump_tree()#樹形打印


後續工作及擴展

1.可以看到,目前隻打印當前窗口的內容,後續要將窗口滑動,然後再次讀取,另外還需要對數據進行處理,因為數據比較亂:

2.可以借鑒模擬鼠標點擊的操作,自動操作微信進行消息的發送和回復,自動聊天機器人可以瞭解一下。

總結

到此這篇關於利用Python讀取微信朋友圈的文章就介紹到這瞭,更多相關Python讀取微信朋友圈內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: