C語言修煉之路數據類型悟正法 解析存儲定風魔下篇

(壹)大端小端藏端倪

1.1  什麼是大端小端

大端(存儲)模式,是指數據的低位保存在內存的高地址中,而數據的高位,保存在內存的低地址中;

小端(存儲)模式,是指數據的低位保存在內存的低地址中,而數據的高位,,保存在內存的高地址中。

1.2  大端小端模式

1)大端模式:

低地址 —————–> 高地址

0x0A  |  0x0B  |  0x0C  |  0x0D

2)小端模式:

低地址 ——————> 高地址

0x0D  |  0x0C  |  0x0B  |  0x0A

1.3  為什麼有大端和小端

為什麼會有大小端模式之分呢?

這是因為在計算機系統中,我們是以字節為單位的,每個地址單元都對應著一個字節,一個字節為8bit。

但是在C語言中除瞭8bit的char之外,還有16bit的short型,32bit的long型(要看具體的編譯器),另外,對於位數大於8位的處理器,例如16位或者32位的處理器,由於寄存器寬度大於一個字節,那麼必然存在著一個如果將多個字節安排的問題。因此就導致瞭大端存儲模式和小端存儲模式。

例如:

一個 16bit 的 short 型 x ,在內存中的地址為 0x0010,x 的值為0x1122,那麼0x11為高字節,0x22為低字節。對於大端模式,就將0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小

端模式,剛好相反。我們常用的X86結構是小端模式,而KEIL C51則為大端模式。很多的ARM,DSP都為小端模式。有些ARM處理器還可以由硬件來選擇是大端模式還是小端模式。

1.4  如何判斷機器的字節序

一般都是通過 union 來測試的,下面這段代碼可以用來測試一下你的編譯器是大端模式還是小端模式:

 union 型數據所占的空間等於其最大的成員所占的空間。

對 union 型的成員的存取都是相對於該聯合體基地址的偏移量為 0 處開始,也就是聯合體的訪問不論對哪個變量的存取都是從 union 的首地址位置開始。

聯合是一個在同一個存儲空間裡存儲不同類型數據的數據類型。這些存儲區的地址都是一樣的,聯合裡不同存儲區的內存是重疊的,修改瞭任何一個其他的會受影響。那麼通過強制類型轉換,判斷其實存儲位置,也可以測試大小端瞭:

(二) 浮點型在內存中的存儲

常見的浮點數:

3.14159 1E10

浮點數傢族包括:float、double、long double類型。

浮點數表示的范圍:float.h中定義

浮點數存儲的例子:

 輸出的結果是什麼呢?

num和*pFloat在內存中明明是同一個數,為什麼浮點數和整數的解讀結果會差別這麼大?

要理解這個結果,一定要搞懂浮點數在計算機內部的表示方法。

2.1  浮點數在內存中的儲存

根據國際標準IEEE(電氣和電子工程協會) 754,任意一個二進制浮點數V可以表示成下面的形式:

舉例來說:

十進制的 5.0 ,寫成二進制是101.0,相當於 1.01×2^2 。 那麼,按照上面V的格式,可以得出 s=0,M=1.01,E=2。 

十進制的 – 5.0,寫成二進制是 -101.0,相當於 -1.01×2^2。那麼,s=1,M=1.01,E=2。 

IEEE 754規定:

對於32位的浮點數,最高的1位是符號位s,接著的8位是指數E,剩下的23位為有效數字M。 

對於64位的浮點數,最高的1位是符號位S,接著的11位是指數E,剩下的52位為有效數字M。 

IEEE 754對有效數字M和指數E,還有一些特別規定。

前面說過,1≤M<2,也就是說,M可以寫成1.xxxxxx的形式,其中xxxxxx表示小數部分。

IEEE 754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被舍去,隻保存後面的xxxxxx部分。

比如保存1.01的時候,隻保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給M隻有23位,將第一位的1舍去以後,等於可以保存24位有效數字。 

至於指數E,情況就比較復雜。

首先,E 為一個無符號整數(unsigned int) 這意味著,如果E為8位,它的取值范圍為0~255;如果E為11位,它的取值范圍為0~2047。

但是,我們知道,科學計數法中的 E是可以出現負數 的,所以IEEE 754規定,存入內存時E的真實值必須再加上一個中間數,對於8位的E,這個中間數是127;對於11位的E,這個中間數是1023。比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即10001001。

然後,指數E從內存中取出還可以再分成三種情況:

①E不全為0或不全為1

 ②E全為0

 ③E全為1

2.2  題目解釋

下面,讓我們回到一開始的問題:為什麼0x00000009還原成浮點數,就成瞭0.000000?

首先,將0x00000009拆分,得到第一位符號位s=0,後面8位的指數E=00000000,最後23位的有效數字M=000 0000 0000 0000 00001001。

由於指數E全為0,所以符合上一節的第二種情況。因此,浮點數V就寫成:

V=(-1)^0 ×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

顯然,V是一個很小的接近於0的正數,所以用十進制小數表示就是0.000000。 

再看例題的第二部分。 請問浮點數9.0,如何用二進制表示?還原成十進制又是多少? 首先,浮點數9.0等於二進制的1001.0,即1.001×2^3。

那麼,第一位的符號位s=0,有效數字M等於001後面再加20個0,湊滿23位,指數E等於3+127=130,即10000010。 所以,寫成二進制形式,應該是s+E+M,即

這個32位的二進制數,還原成十進制,正是1091567616。 

到此這篇關於C語言修煉之路數據類型悟正法 解析存儲定風魔下篇的文章就介紹到這瞭,更多相關C語言 數據類型內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: