C語言數據的存儲詳解
數據類型的介紹
數據類型存在的意義
- 為變量開辟的空間大小(大小決定瞭使用范圍)
- 取數據的時候按照什麼格式取出(先看大小端,在看數據類型(用來解析二進制數據的方式))
整形
char
- unsigned char
- signed char
short
- unsigned short [int]
- signed short [int]
int
- unsigned int
- signed int
long
- unsigned long [int]
- signed long [int]
註意:默認的char,short,int 在VS都是signed
……
浮點型
float
double
構造類型
數組
結構體
枚舉
聯合體
指針類型
int* pi;
char* pc;
void* pv;
void空類型
void 表示空類型,沒有給定類型
通常應用於指針類型
整數在內存中的存儲
我們都知道 int類型的數據在內存中被分配瞭四個字節的空間,那麼他們在內存中如何存儲呢?
int a = 20;
int b = -10;
原反補的介紹
計算機中的整數有三種表示方法,即原碼、反碼、補碼
原碼:直接將十進制按照正負數的形式翻譯成二進制就可以
反碼:將原碼的符號位不變,其他位取反即可得到
補碼:反碼 + 1
註意:整數的 原反補 相同
對於整形數據來說,在內存中存的其實是補碼,為什麼?
使用補碼,可以將符號位和數值域統一處理,同時,加法和減法可以統一處理(CPU隻有加法器),不需要額外的硬件電路,減少瞭開銷
看看變量在內存中的存儲:
我們會看到a,b存儲的是補碼,但是字節的順序有點有對,這就是整形數據存儲的大小端問題,也叫字節序問題
大小端的介紹
大端存儲:數據的低位保存在內存的高地址中,而數據的高位,保存在內存的低地址中
小端存儲:指數據的低位保存在內存的低地址中,而數據的高位,,保存在內存的高地址中
存在的原因:
我們都知道在計算機系統中,都是以字節為單位的,每個地址單元管理一個字節的空間大小,但是在C語言中如 int 有4字節等,所以對於32位或者64位的處理器來說,就必然存在著4個字節的排放順序,因此就出現瞭大小端存儲的問題,也成為字節序問題,上述代碼就是小端存儲(VS底下的代碼)
面試例題
百度2015年系統工程師筆試題:
請簡述大端字節序和小端字節序的概念,設計一個小程序來判斷當前機器的字節序。
// 代碼1 - 利用char類型的指針一次訪問一個字節的特性 #include <stdio.h> int check_sys() { int i = 1; return (*(char *)&i); } int main() { int ret = check_sys(); if(ret == 1) { printf("小端\n"); } else { printf("大端\n"); } return 0; } //代碼2 - 聯合體 int check_sys() { union { int i; char c; }un; un.i = 1; return un.c; }
練習
1. #include <stdio.h> int main() { char a = -128; printf("%u\n",a); return 0; }
2. int i= -20; unsigned int j = 10; printf("%d\n", i+j); // 這裡就是i+j是個表達式,先算表達式的值,在%d打印 // 表達式計算的時候是基於補碼進行的,跟類型是無關的 // 11111111 11111111 11111111 11101100 // 00000000 00000000 00000000 00001010 // -------------------------------------+ // 11111111 11111111 11111111 11110110 - 計算後的補碼 // 10000000 00000000 00000000 00001010 - 最後結果-10
3. int main() { char a[1000]; int i; for(i=0; i<1000; i++) { a[i] = -1-i; } printf("%d",strlen(a)); return 0; }
補充
- 存:字面數據必須先轉成補碼,在放入空間當中。所以,所謂符號位,完全看數據本身是否攜帶±號。和變量是否有符號 無關!
- 取:取數據一定要先看變量本身類型,然後才決定要不要看最高符號位。如果不需要,直接二進制轉成十進制。如果需 要,則需要轉成原碼,然後才能識別。(當然,最高符號位在哪裡,又要明確大小端)
浮點數在內存中的存儲
3.14159,1E10(1^10)都是我們常見的浮點數,而C語言中定義的浮點數有float和double常見的兩種類型,兩種類型范圍被定義在頭文件float.h中
存儲規則講解
看上面代碼,我們很容易發現num和*pfloat在內存明明訪問的是同一塊空間,為什麼浮點數和整數的解讀差別這麼大呢,下面我們講講浮點數的存儲規則。
國際IEEE(電氣和電子工程協會)754規定,任何一個二進制浮點數V都可以表示成下面的形式:
- (-1)^S * M * 2^E
- (-1)^S表示符號位,S=0時,表示正數;S=1時,表示負數
- M表示有效數字,1 <= M <2
- E表示指數位
舉例
十進制5.0,寫成二進制101.0,科學計數法:1.01 * 2^2
S = 0,M = 1.01,E = 2
十進制的-5.0,寫成二進制是 -101.0 ,相當於 -1.01×2^2 。那麼,s=1,M=1.01,E=2
IEEE754的特別規定
有效位M
前面說過, 1 <= M < 2 ,也就是說,M可以寫成 1.xxxxxx 的形式,其中xxxxxx表示小數部分。
IEEE754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被舍去,隻保存後面的xxxxxx部分。比如保存1.01的時候,隻保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給M隻有23位,
將第一位的1舍去以後,等於可以保存24位有效數字。
指數E
至於指數E,情況就比較復雜。
首先,E為一個無符號整數(unsigned int)
這意味著,如果E為8位,它的取值范圍為0255;如果E為11位,它的取值范圍為02047。但是,我們 知道,科學計數法中的E是可以出
現負數的,所以IEEE 754規定,存入內存時E的真實值必須再加上一個中間數,對於8位的E,這個中間數 是127;對於11位的E,這個中間
數是1023。比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即 10001001。
E取出分為三種情況
- E不全為0或不全為1
這時,浮點數就采用下面的規則表示,即指數E的計算值減去127(或1023),得到真實值,再將 有效數字M前加上第一位的1。 比如:
0.5(1/2)的二進制形式為0.1,由於規定正數部分必須為1,即將小數點右移1位,則為
1.0*2^(-1),其階碼為-1+127=126,表示為 01111110,而尾數1.0去掉整數部分為0,補齊0到23位00000000000000000000000,
則其二進制表示形式為: 0 01111110 00000000000000000000000
- E全為0
這時,浮點數的指數E等於1-127(或者1-1023)即為真實值,
有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數。
這樣做是為瞭表示±0,以及接近於 0的很小的數字。
- E全為1
這時,如果有效數字M全為0,表示±無窮大(正負取決於符號位s);
案例
int main() { int n = 9; float *pFloat = (float *)&n; printf("n的值為:%d\n", n); printf("*pFloat的值為:%f\n", *pFloat); *pFloat = 9.0; printf("num的值為:%d\n", n); printf("*pFloat的值為:%f\n", *pFloat); return 0; }
float用%d打印的特例講解
這裡我們會發現%d打印浮點數的時候結果為0
而%lld打印的結果和double存儲變量的結果一樣的
原因:
在可變長參數函數(例如printf函數)或者不帶原型聲明函數中,在調用該函數時C自動進行類型提升(在調用函數時如果聲明這個函數那麼則不會提升),提升如下:
- float類型的實際參數將提升到double
- char、short和相應的signed、unsigned類型的實際參數提升到int
- 如果int不能存儲原值,則提升到unsigned int 然後,調用者將提升後的參數傳遞給被調用者。
C標準對默認實際參數提升規則有明確規定。也就是說, 帶有可變長參數列表的函數,
絕對不會接受到char類型的實際參數。
以上所述是小編給大傢介紹的C語言數據的存儲詳解,希望對大傢有所幫助。在此也非常感謝大傢對WalkonNet網站的支持!