C語言數據的存儲詳解

數據類型的介紹

數據類型存在的意義

  • 為變量開辟的空間大小(大小決定瞭使用范圍)
  • 取數據的時候按照什麼格式取出(先看大小端,在看數據類型(用來解析二進制數據的方式))

整形

char

  • unsigned char
  • signed char

short

  • unsigned short [int]
  • signed short [int]

int

  • unsigned int
  • signed int

long

  • unsigned long [int]
  • signed long [int]

註意:默認的char,short,int 在VS都是signed

……

浮點型

float

double

構造類型

數組

結構體

枚舉

聯合體

指針類型

int* pi;

char* pc;

void* pv;

void空類型

void 表示空類型,沒有給定類型

通常應用於指針類型

整數在內存中的存儲

我們都知道 int類型的數據在內存中被分配瞭四個字節的空間,那麼他們在內存中如何存儲呢?

int a = 20;

int b = -10;

原反補的介紹

計算機中的整數有三種表示方法,即原碼、反碼、補碼

原碼:直接將十進制按照正負數的形式翻譯成二進制就可以

反碼:將原碼的符號位不變,其他位取反即可得到

補碼:反碼 + 1

註意:整數的 原反補 相同

對於整形數據來說,在內存中存的其實是補碼,為什麼?

使用補碼,可以將符號位和數值域統一處理,同時,加法和減法可以統一處理(CPU隻有加法器),不需要額外的硬件電路,減少瞭開銷

看看變量在內存中的存儲:

我們會看到a,b存儲的是補碼,但是字節的順序有點有對,這就是整形數據存儲的大小端問題,也叫字節序問題

大小端的介紹

大端存儲:數據的低位保存在內存的高地址中,而數據的高位,保存在內存的低地址中

小端存儲:指數據的低位保存在內存的低地址中,而數據的高位,,保存在內存的高地址中

存在的原因:

我們都知道在計算機系統中,都是以字節為單位的,每個地址單元管理一個字節的空間大小,但是在C語言中如 int 有4字節等,所以對於32位或者64位的處理器來說,就必然存在著4個字節的排放順序,因此就出現瞭大小端存儲的問題,也成為字節序問題,上述代碼就是小端存儲(VS底下的代碼)

面試例題

百度2015年系統工程師筆試題:

請簡述大端字節序和小端字節序的概念,設計一個小程序來判斷當前機器的字節序。

// 代碼1 - 利用char類型的指針一次訪問一個字節的特性
#include <stdio.h>
int check_sys()
{
	 int i = 1;
	 return (*(char *)&i);
}
int main()
{
	 int ret = check_sys();
	 if(ret == 1)
	 {
	 	printf("小端\n");
	 }
	 else
	 {
	 	printf("大端\n");
	 }
 	return 0; 
 }
 
//代碼2 - 聯合體
int check_sys()
{
	 union
	 {
		 int i;
		 char c;
	 }un;
	 
	 un.i = 1;
	 
 	return un.c; 
 }

練習

1.
#include <stdio.h>
int main()
{
    char a = -128;
    printf("%u\n",a);
    return 0; 
}

2.
	int i= -20;
	unsigned  int  j = 10;
	printf("%d\n", i+j);

// 這裡就是i+j是個表達式,先算表達式的值,在%d打印
// 表達式計算的時候是基於補碼進行的,跟類型是無關的
// 11111111 11111111 11111111 11101100
// 00000000 00000000 00000000 00001010
// -------------------------------------+
// 11111111 11111111 11111111 11110110  - 計算後的補碼
// 10000000 00000000 00000000 00001010  - 最後結果-10
3.
int main()
{
    char a[1000];
    int i;
    for(i=0; i<1000; i++)
    {
        a[i] = -1-i;
    }
    printf("%d",strlen(a));
    return 0; }

補充

  • 存:字面數據必須先轉成補碼,在放入空間當中。所以,所謂符號位,完全看數據本身是否攜帶±號。和變量是否有符號 無關!
  • 取:取數據一定要先看變量本身類型,然後才決定要不要看最高符號位。如果不需要,直接二進制轉成十進制。如果需 要,則需要轉成原碼,然後才能識別。(當然,最高符號位在哪裡,又要明確大小端)

浮點數在內存中的存儲

3.14159,1E10(1^10)都是我們常見的浮點數,而C語言中定義的浮點數有float和double常見的兩種類型,兩種類型范圍被定義在頭文件float.h中

存儲規則講解

看上面代碼,我們很容易發現num和*pfloat在內存明明訪問的是同一塊空間,為什麼浮點數和整數的解讀差別這麼大呢,下面我們講講浮點數的存儲規則。

國際IEEE(電氣和電子工程協會)754規定,任何一個二進制浮點數V都可以表示成下面的形式:

  • (-1)^S * M * 2^E
  • (-1)^S表示符號位,S=0時,表示正數;S=1時,表示負數
  • M表示有效數字,1 <= M <2
  • E表示指數位

舉例

十進制5.0,寫成二進制101.0,科學計數法:1.01 * 2^2

S = 0,M = 1.01,E = 2

十進制的-5.0,寫成二進制是 -101.0 ,相當於 -1.01×2^2 。那麼,s=1,M=1.01,E=2

IEEE754的特別規定

有效位M

前面說過, 1 <= M < 2 ,也就是說,M可以寫成 1.xxxxxx 的形式,其中xxxxxx表示小數部分。

IEEE754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被舍去,隻保存後面的xxxxxx部分。比如保存1.01的時候,隻保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給M隻有23位,

將第一位的1舍去以後,等於可以保存24位有效數字。

指數E

至於指數E,情況就比較復雜。

首先,E為一個無符號整數(unsigned int)

這意味著,如果E為8位,它的取值范圍為0255;如果E為11位,它的取值范圍為02047。但是,我們 知道,科學計數法中的E是可以出

現負數的,所以IEEE 754規定,存入內存時E的真實值必須再加上一個中間數,對於8位的E,這個中間數 是127;對於11位的E,這個中間

數是1023。比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即 10001001。

E取出分為三種情況
  • E不全為0或不全為1

這時,浮點數就采用下面的規則表示,即指數E的計算值減去127(或1023),得到真實值,再將 有效數字M前加上第一位的1。 比如:

0.5(1/2)的二進制形式為0.1,由於規定正數部分必須為1,即將小數點右移1位,則為

1.0*2^(-1),其階碼為-1+127=126,表示為 01111110,而尾數1.0去掉整數部分為0,補齊0到23位00000000000000000000000,

則其二進制表示形式為: 0 01111110 00000000000000000000000

  • E全為0

這時,浮點數的指數E等於1-127(或者1-1023)即為真實值,

有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數。

這樣做是為瞭表示±0,以及接近於 0的很小的數字。

  • E全為1

這時,如果有效數字M全為0,表示±無窮大(正負取決於符號位s);

案例

int main()
{
	int n = 9;
	float *pFloat = (float *)&n;
	printf("n的值為:%d\n", n);
	printf("*pFloat的值為:%f\n", *pFloat);


	*pFloat = 9.0;
	printf("num的值為:%d\n", n);
	printf("*pFloat的值為:%f\n", *pFloat);

	return 0;
}

float用%d打印的特例講解

這裡我們會發現%d打印浮點數的時候結果為0

而%lld打印的結果和double存儲變量的結果一樣的

原因:

在可變長參數函數(例如printf函數)或者不帶原型聲明函數中,在調用該函數時C自動進行類型提升(在調用函數時如果聲明這個函數那麼則不會提升),提升如下:

  • float類型的實際參數將提升到double
  • char、short和相應的signed、unsigned類型的實際參數提升到int
  • 如果int不能存儲原值,則提升到unsigned int 然後,調用者將提升後的參數傳遞給被調用者。

C標準對默認實際參數提升規則有明確規定。也就是說, 帶有可變長參數列表的函數,

絕對不會接受到char類型的實際參數。

以上所述是小編給大傢介紹的C語言數據的存儲詳解,希望對大傢有所幫助。在此也非常感謝大傢對WalkonNet網站的支持!

推薦閱讀: