詳解python的二進制轉化模塊

在pyton中,通過struct模塊來對二進制進行轉換,主要包括兩大類函數,即用於打包的pack和用於解包的unpack。

其中,struct.pack的輸入格式為struct.pack(format, v1, v2, ...),其中format為格式字符串,v1,v2..為將要轉成bytes的字符。

例如

>>> import struct
>>> struct.pack('i', 15)
b'\x0f\x00\x00\x00'
>>> struct.pack('iii', 15, 16, 17)
b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00'
>>> struct.pack('b', 255)   #b格式的取值范圍是-128到127
struct.error: byte format requires -128 <= number <= 127
>>> struct.pack('B', 200)
b'\xc8'
>>> struct.pack('B', 71)    #128以內可用ASCII表示
b'G'

i代表int,15對應的二進制代碼為F000,故其輸出為b\x0f\x00\x00\x00。當格式字符串為iii時,說明要將三個數字以整數類型轉化為二進制。

其中,格式化字符串中的每個字符都代表一種數據類型,其中整型相關的字符如下,左側為帶符號整型,右側為無符號整型

  C語言類型   C語言類型 標準大小
b signed char B unsigned char 1
h short H unsigned short 2
i int I unsigned int 4
l long L unsigned long 4
q long long Q unsigned long long 8
n ssize_t N size_t  

其他類型

格式 C 類型 Python 類型 標準大小
x 填充字節  
c char 長度為1的字節串  
? _Bool bool 1
e   float 2
f float float 4
d double float 8
s char[] 字節串  
p char[] 字節串  
P void* 整數  

struct中提供瞭獲取標準大小的函數,calcsize:

>>> struct.calcsize('B')
1
>>> struct.calcsize('i')
4

除瞭聲明被格式化時的數據類型,struct還可以指定對齊方式,例如

>>> struct.pack("i",15)
b'\x0f\x00\x00\x00'
>>> struct.pack(">i",15)    #小端序
b'\x00\x00\x00\x0f'
>>> struct.pack("<i",15)    #大端序
b'\x0f\x00\x00\x00'

其對應字符的含義分別為

@ = < > !
本機 本機 小端 大端 網絡(大端)

其中默認為@,即本機字節順序。

在熟悉瞭pack之後,與之對偶的unpack也就沒啥難度瞭

>>> test = struct.pack("III",125,1255,12555)
>>> struct.unpack("III",test)
(125, 1255, 12555)

除瞭packunpackstruct模塊還提供瞭C語言風格的一對函數pack_intounpack_from,二者的聲明分別為

struct.pack_into(format, buffer, offset, v1, v2, ...)
struct.unpack_from(format, /, buffer, offset=0)

其中buffer表示緩沖流,在pack_into中,將v1,v2...offset的偏置打包入buffer中;在unpack_from中,將buffer中的數據從offset處依次取出。

struct中封裝瞭用於二進制處理的類Struct,按照以往經驗,其pack函數的實現方法很有可能是下面這種

def pack(format,*args):
    return Struct(format).pack(args)

其中Struct的初始化方法就是輸入一個格式化字符串,例如

>>> s = struct.Struct("III")
>>> s.pack(1,2,3)
b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'

總結

本篇文章就到這裡瞭,希望能夠給你帶來幫助,也希望您能夠多多關註WalkonNet的更多內容!

推薦閱讀: