詳解python的二進制轉化模塊
在pyton中,通過struct
模塊來對二進制進行轉換,主要包括兩大類函數,即用於打包的pack和用於解包的unpack。
其中,struct.pack
的輸入格式為struct.pack(format, v1, v2, ...)
,其中format
為格式字符串,v1,v2..
為將要轉成bytes
的字符。
例如
>>> import struct >>> struct.pack('i', 15) b'\x0f\x00\x00\x00' >>> struct.pack('iii', 15, 16, 17) b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00' >>> struct.pack('b', 255) #b格式的取值范圍是-128到127 struct.error: byte format requires -128 <= number <= 127 >>> struct.pack('B', 200) b'\xc8' >>> struct.pack('B', 71) #128以內可用ASCII表示 b'G'
i
代表int
,15對應的二進制代碼為F000
,故其輸出為b\x0f\x00\x00\x00
。當格式字符串為iii
時,說明要將三個數字以整數類型轉化為二進制。
其中,格式化字符串中的每個字符都代表一種數據類型,其中整型相關的字符如下,左側為帶符號整型,右側為無符號整型
C語言類型 | C語言類型 | 標準大小 | ||
---|---|---|---|---|
b |
signed char | B |
unsigned char | 1 |
h |
short | H |
unsigned short | 2 |
i |
int | I |
unsigned int | 4 |
l |
long | L |
unsigned long | 4 |
q |
long long | Q |
unsigned long long | 8 |
n |
ssize_t | N |
size_t |
其他類型
格式 | C 類型 | Python 類型 | 標準大小 |
---|---|---|---|
x |
填充字節 | 無 | |
c |
char | 長度為1的字節串 | |
? |
_Bool | bool | 1 |
e |
float | 2 | |
f |
float | float | 4 |
d |
double | float | 8 |
s |
char[] | 字節串 | |
p |
char[] | 字節串 | |
P |
void* | 整數 |
struct
中提供瞭獲取標準大小的函數,calcsize
:
>>> struct.calcsize('B') 1 >>> struct.calcsize('i') 4
除瞭聲明被格式化時的數據類型,struct
還可以指定對齊方式,例如
>>> struct.pack("i",15) b'\x0f\x00\x00\x00' >>> struct.pack(">i",15) #小端序 b'\x00\x00\x00\x0f' >>> struct.pack("<i",15) #大端序 b'\x0f\x00\x00\x00'
其對應字符的含義分別為
@ |
= |
< |
> |
! |
---|---|---|---|---|
本機 | 本機 | 小端 | 大端 | 網絡(大端) |
其中默認為@
,即本機字節順序。
在熟悉瞭pack
之後,與之對偶的unpack
也就沒啥難度瞭
>>> test = struct.pack("III",125,1255,12555) >>> struct.unpack("III",test) (125, 1255, 12555)
除瞭pack
和unpack
,struct
模塊還提供瞭C語言風格的一對函數pack_into
和unpack_from
,二者的聲明分別為
struct.pack_into(format, buffer, offset, v1, v2, ...) struct.unpack_from(format, /, buffer, offset=0)
其中buffer
表示緩沖流,在pack_into
中,將v1,v2...
以offset
的偏置打包入buffer
中;在unpack_from
中,將buffer
中的數據從offset
處依次取出。
struct
中封裝瞭用於二進制處理的類Struct
,按照以往經驗,其pack
函數的實現方法很有可能是下面這種
def pack(format,*args): return Struct(format).pack(args)
其中Struct
的初始化方法就是輸入一個格式化字符串,例如
>>> s = struct.Struct("III") >>> s.pack(1,2,3) b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'
總結
本篇文章就到這裡瞭,希望能夠給你帶來幫助,也希望您能夠多多關註WalkonNet的更多內容!
推薦閱讀:
- python二進制轉換模塊的具體用法
- Python基礎筆記之struct和格式化字符
- Python二進制數據結構Struct的具體使用
- Python使用sigthief簽發證書的實現步驟
- python 中sys.getsizeof的用法說明