C語言中0數組\柔性數組的使用詳解

前言:

上次看到一篇面試分享,裡面有個朋友說,面試官問瞭char[0] 相關問題,但是自己沒有遇到過,就繞過瞭這個問題。

我自己在這篇文章下面做瞭一些回復。

現在我想結合我自己的理解,解釋一下這個 char[0] C語言柔性數組的問題。

0數組和柔性數組的介紹

0數組顧名思義,就是數組長度定義為0,我們一般知道數組長度定義至少為1才會給它分配實際的空間,而定義瞭0的數組是沒有任何空間,但是如果像上面的結構體一樣在最後一個成員定義為零數組,雖然零數組沒有分配的空間,但是它可以當作一個偏移量,因為數組名這個符號本身代表瞭一個不可修改的地址常量。柔性數組也叫可伸縮性數組,而0數組是一種柔性數組。

因為在早期沒引入0長度數組的時候, 大傢是通過定長數組和指針的方式來解決的, 但是定長數組定義瞭一個足夠大的緩沖區, 這樣使用方便, 但是每次都造成空間的浪費指針的方式, 要求程序員在釋放空間是必須進行多次的free操作, 而我們在使用的過程中往往在函數中返回瞭指向緩沖區的指針, 我們並不能保證每個人都理解並遵從我們的釋放方式所以 GNU 就對其進行瞭0長度數組的擴展. 當使用data[0]的時候, 也就是0長度數組的時候,0長度數組作為數組名, 並不占用存儲空間。這樣就可以更加高效的利用內存。

在C99之後,也加瞭類似的擴展,隻不過用的是 char payload[]這種形式(所以如果你在編譯的時候確實需要用到-pedantic參數,那麼你可以將char payload[0]類型改成char payload[], 這樣就可以編譯通過瞭,當然你的編譯器必須支持C99標準的,如果太古老的編譯器,那可能不支持瞭。

0數組的常規使用

首先我們定義一個結構體,再在一個結構體的最後,定義一個長度為0的數組,就可以使得這個結構體是可變長的。

如下所示:

//  0長度數組
struct zero_buffer
{
    int     len;
    char    data[0];
};

這個時候 data[0] 隻是個數組名, 是不占用存儲空間的.

這個結構體的大小用sizeof取長度,實際就是它的成員int的長度,data[0]不占用空間。(數組名僅僅是一個符號, 它不會占用任何空間, 它在結構體中, 隻是代表瞭一個偏移量, 代表一個不可修改的地址常量!)

sizeof(struct zero_buffer) = sizeof(int)

printf("zero struct length is:%d int length is:%d\n",sizeof(struct zero_buffer),sizeof(int));

zero struct length is:4 int length is:4

對於0長數組的這個特點,很容易構造出我們需要的數據結構,如緩沖區,數據包等等。

結構體定義如上所示

假設我們需要設置一條tcp待發送的數據,長度是15,數據內容是”Hello My Friend”,這樣我們就可以按照如下去定義瞭。其中  zbuffer->data 為定義數據的地址,len表示數據的長度。

開辟空間之後使用

我們使用的時候, 隻需要開辟一次空間即可。

#define CURR_LENGTH 15struct zero_buffer  *zbuffer = NULL;//  開辟if ((zbuffer = (struct zero_buffer *)malloc(sizeof(struct zero_buffer) + sizeof(char) * CURR_LENGTH)) != NULL){    zbuffer->len = CURR_LENGTH;    memcpy(zbuffer->data, "Hello My Friend", CURR_LENGTH);    printf("%d, %s\n", zbuffer->len, zbuffer->data);}

使用完釋放空間

釋放空間一次釋放即可

//  銷毀
free(zbuffer);
zero_buffer = NULL;

其他方法實現一些不定長數據的傳輸

除瞭0數組之外,還有使用定長數組和指針數組實現柔性數組的功能。

定長數組

定長數組顧名思義,就是在結構體裡面有個定長的數組,這個數組大小是按照我們定義數據最大來進行設置的,為瞭就是防止數據儲存的時候溢出。

定義

//  定長緩沖區
#define MAX_LENGTH      512
struct max_buffer
{
    int     len;
    char    data[MAX_LENGTH];
};

不過使用過程中,比如我要發送 512 字節的數據, 如果用定長包, 假設定長包的最大長度 MAX_LENGTH 為 1024, 那麼就會浪費 512 個字節的空間, 也會造成不必要的流量浪費。如果數組結構對齊放置(這塊知識詳細可以看我之前的數據對齊的文章) sizeof(struct max_buffer) = sizeof(int)+ sizieof(char) * MAX_LENGTH

數據包的構造

一般來說, 我們會返回一個指向緩沖區數據結構 max_buffer 的指針.

#define CURR_LENGTH 512struct max_buffer   *mbuffer = NULL;if ((mbuffer = (struct max_buffer *)malloc(sizeof(struct max_buffer))) != NULL){    mbuffer->len = CURR_LENGTH;    memcpy(mbuffer->data, "Hello World", CURR_LENGTH);    printf("%d, %s\n", mbuffer->len, mbuffer->data);}

作者:良知猶存
鏈接:https://juejin.cn/post/6960470520831672333
來源:掘金
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。

前部分 4 個字節 p->len, 作為包頭(就是多出來的那部分),這個包頭是用來描述緊接著包頭後面的數據部分的長度,這裡是 1024, 所以前四個字節賦值為 1024 (既然我們要構造不定長數據包,那麼這個包到底有多長呢,因此,我們就必須通過一個變量來表明這個數據包的長度,這就是len的作用),

而緊接其後的內存是真正的數據部分, 通過 p->data, 最後, 進行一個 memcpy() 內存拷貝, 把要發送的數據填入到這段內存當中

釋放空間

當使用完畢釋放數據的空間的時候, 直接釋放就可以瞭

free(mbuffer);
mbuffer = NULL;

使用定長數組, 作為數據緩沖區, 為瞭避免造成緩沖區溢出, 數組的大小一般設為足夠的空間 MAX_LENGTH, 而實際使用過程中, 達到 MAX_LENGTH 長度的數據很少, 那麼多數情況下, 緩沖區的大部分空間都是浪費掉的.

但是使用過程很簡單, 數據空間的開辟和釋放簡單, 無需程序員考慮額外的操作

指針數組

它和0數組的區別在於,零數組最後一個結構體元素定義一個data[0],而指針數組就是結構體中需要定義一個指針數組,這裡面的指針數組不需要特定在結構體的最後一個元素。

struct point_buffer
{
    char    *data;
    int     len;
};

考慮數組結構對齊(這塊知識詳細可以看我之前的[數據對齊](https://www.jb51.net/article/211811.htm)的文章), 那麼數據結構的大小 sizeof(point_buffer)= sizeof(int) + (補齊int與char * 類型的長度值)+ sizeof(char * ),在我的64位編譯環境中int類型是4byte,char * 類型為8byte,所以補齊的長度為8-4,最終sizeof(point_buffer) 為16byte。

如果結構體加上  _attribute((packed))  數據對齊修飾,則 sizeof(point_buffer)= sizeof(int)  sizeof(char * ),最終計算為12byte。

空間分配使用

#define CURR_LENGTH 1024 struct point_buffer *pbuffer = NULL;if ((pbuffer = (struct point_buffer *)malloc(sizeof(struct point_buffer))) != NULL){   pbuffer->len = CURR_LENGTH;   if ((pbuffer->data = (char *)malloc(sizeof(char) * CURR_LENGTH)) != NULL)   {       memcpy(pbuffer->data, "Hello World", CURR_LENGTH);       printf("%d, %s\n", pbuffer->len, pbuffer->data);   }}

分配內存時,需采用兩步

首先, 需為結構體分配一塊內存空間;

其次,再為結構體中的成員變量分配內存空間.

這樣兩次分配的內存是不連續的, 需要分別對其進行管理. 當使用長度為的數組時, 則是采用一次分配的原則, 一次性將所需的內存全部分配給它.

釋放

相反, 釋放時也是一樣的.

free(pbuffer->data);
free(pbuffer);
pbuffer = NULL;

使用指針結果作為緩沖區, 隻多使用瞭一個指針大小的空間, 無需使用固定長度的數組, 不會造成空間的大量浪費.

但那是開辟空間時, 需要額外開辟數據域的空間, 施放時候也需要顯示釋放數據域的空間, 但是實際使用過程中, 往往在函數中開辟空間, 然後返回給使用者指向 struct point_buffer 的指針, 這時候我們並不能假定使用者瞭解我們開辟的細節, 並按照約定的操作釋放空間, 因此使用起來多有不便, 甚至造成內存泄漏

小結:

定長數組使用方便, 但是卻浪費空間, 指針形式隻多使用瞭一個指針的空間, 不會造成大量空間分浪費, 但是使用起來需要多次分配, 多次釋放。所以最優解

0數組的優劣以及註意事項

優點 :比起在結構體中聲明一個指針變量、再進行動態分配的辦法,這種方法效率要高。因為在訪問數組內容時,不需要間接訪問,避免瞭兩次訪存。此外,0數組也不會像定長數組會造成一定的內存的浪費。

缺點 :在結構體中,數組為0的數組必須在最後聲明,使用上有一定限制。

總結

到此這篇關於C語言中0數組\柔性數組使用的文章就介紹到這瞭,更多相關C語言0數組\柔性數組內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: