匯編語言基礎理解計算機底層技術原理

前言

備註:該技術博客的內容是我根據技術視頻整理與總結的(並非復制粘貼)。原視頻源於【遇見狂神說】

如果我們想要做高級程序員,匯編語言是我們必經之路,匯編讓我們跳出傳統的編程思想,往底層學習,對我的技術提升非常非常重要。總而言之,想要成為高級程序員,我們必須要學會匯編語言,匯編語言是非常重要的計算機底層技術,一般用於底層的編寫。不懂匯編的程序員算不上一個好的程序員,充其量是一個熟練使用某種語言的工程師,而編程高手一定要研究底層。

1.機器語言

何為語言,就是人和人之間交流的工具。而匯編語言就是計算機的語言。

機器語言(二進制):

主流的電子計算機使用二進制,計算機隻認識 0和1,因為在電路中隻有兩種狀態,要麼通電要麼斷電,我們用數字表示這兩種狀態就是0和1,我們可以用0和1與計算機交流。

機器語言就是由0和1構成的語言,我們很難理解,幾乎看不懂。而我們需要將這些復雜的機器語言(一堆0和1的數字)簡化,就需要助計符(INC DEC MUL DIV等),也就是匯編語言。

我們掌握瞭匯編語言就可以操作計算機的底層,深入一點就是可以直接操作計算機裡面的 位。
匯編語言助記機器語言,所以說我們學會瞭匯編語言就學會瞭機器語言。

學習匯編就是為瞭理解計算機怎麼操作,每一行代碼怎麼被計算機執行,這些原理非常重要!

在這裡插入圖片描述

在這裡插入圖片描述

2.進制思想本質

學習進制的障礙:
很多人搞不懂進制的主要原因是因為我們從小接受瞭十進制的概念,逢十進一的原則深入人心。
人本能的選擇就是 十進制。

常見進制:
1進制:逢一進一,1 1
2進制:逢二進一,計算機進制
8進制:逢八進一,8個符號組成:0 1 2 3 4 5 6 7
10進制:逢十進一,10個符號組成:0 1 2 3 4 5 6 7 8 9
16進制: 逢十六進一,16個符號組成:0 1 2 3 4 5 6 7 8 9 a b c d e f

進制其實非常簡單,隻需要會 查數。

測試:

在這裡插入圖片描述

進制可以自定義:
小朱同學的十進制:0 2 4 7 8 a b r d f,可以隨便定義。
由此我可以使用進制加密,防止被爆破(暴力破解)。

3.二進制

目前的計算機(電子計算機)使用二進制 0 1

現在的計算機(電子計算機):
都是通過集成電路來實現電路的有電和無電,高電平和低電平,表現出來兩個值0 1。

在這裡插入圖片描述

由於二進制寫起來非常麻煩,我們就需要簡寫二進制,所以我們就去寫16進制。

在這裡插入圖片描述

拓展:
未來的量子計算機:(傳道)
可以實現量子計算的機器。

量子計算機的 單位:昆比特。也就是所謂的(量子比特),量子的兩態(光子,磁場)來表示。
量子的計算速度遠遠超越瞭現在的電子計算速度。
光子:正交偏振方向。
磁場:電子的自旋方向。

如今我們已經到瞭21世紀,計算力已經快到盡頭瞭,沒辦法突破(落伍)的本質問題!
我們想要突破這個本質問題,就要使用量子計算機。核心要素就是提高計算機的計算力!

2019年,Google研究人員展示其最新54比特量子計算機,該計算機隻用200秒便可計算完畢當前世界最大的超級計算機需1萬年進行的運算。
2020年.6.18,霍尼韋爾公司推出瞭量子體積64的量子計算機!
霍尼韋爾還表示,將在一年之內得到至少10個有效量子比特,相當於1024個量子體積。
如果可以量產,大規模普及到民用之後,我們這些程序員是第一批使用他們的人。因為我們要
針對量子計算機寫程序。

我們為什麼學習理解二進制?

如果我們瞭解寄存器,內存,位的概念,計算機底層的每一個位都是有含義的(匯編入門理解的基礎)。每一個0和1都代表一種狀態,計算機會按照這種狀態去執行特定的功能。程序運行時候會快速發生變化,每一個變化就會產生不同的狀態,就比如:移動鼠標為什麼會動,這底層如何實現非常的復雜。

4.數據寬度

計算機的內存是有限制的,內存不可能是無窮大的。所以我們就需要給數據增加數據寬度。

在計算計領域,我們要記住:所有的內存,所有的操作,都要給數據加上寬度,尤其是C,C++,Java這種強類型語言,都需要定義數據類型!為什麼要需要定義類型?因為計算機底層需要我們這些數據定義寬度。

有瞭寬度,就有瞭一些基本的量。常用量包含字節,字,雙字等…

位 (bit):0 1
字節 (byte):(8位) 0-0xFF
字 (word):0-0xFFFF
雙字 (dword):0-0xFFFFFFF

在計算機中,每一個數據都需要給它定義類型。定義類型的原因就是給它定義寬度。在內存中的寬度。

5.有符號數和無符號數

計算機它並不知道我們寫的數字是正還是負。我們可以通過正負號來判斷,而計算機如何去表示正負呢?我們接下來瞭解一下!

數據都是有寬度的。 那麼每個數據代表什麼意思呢?

規則
就好比我們解析一個音頻:比如說為什麼網易雲可以放出MP3?那是因為有個MP3的編碼格式,我們根據這個格式解碼才能放出聲音對應的格式。如果是一個視頻就要遵守視頻的解碼規則…

現在我們需要給二進制解碼增加一個規則。
1.無符號數規則:
你這個數字是什麼,那就是什麼,無關正負。

1 0 0 1 1 0 1 0  轉換十六進制為: 0x9A   十進制為:154

2.有符號數規則:
最高位是符號位。 如果最高位是1,就代表一個負數。如果最高位是0,就代表是一個正數。

1 0 0 1 1 0 1 0  如何轉換十六進制?

這裡就涉及一套計算機規則:就是原碼反碼補碼。

6.原碼反碼補碼

為什麼學原碼反碼補碼?
因為我們之後要用它來計算。

編碼規則:(無符號數編碼規則沒什麼可說的,寫的數字是什麼就是什麼)

有符號數編碼規則有三種狀態:**原碼,反碼,補碼。**我們來依此學習一下這三種狀態。

1.原碼: 最高位是符號位,對齊它的位進行本身的絕對值即可。
2.反碼: 分為正數和負數

正數:反碼和原碼相同。負數:符號位一定是1,其餘位對原碼取反。

3.補碼:

正數:補碼和原碼相同負數:符號一定是1,對反碼進行+1

舉個例子:

現在我說的這些都是 8 位 

如果是正數,都是一樣的。
對1取值:
原碼:0 0 0 0  0 0 0 1
反碼:0 0 0 0  0 0 0 1
補碼:0 0 0 0  0 0 0 1

如果是負數
對-1取值:
原碼:1 0 0 0  0 0 0 1
反碼:1 1 1 1  1 1 1 0
補碼:1 1 1 1  1 1 1 1

對-7取值:
原碼:1 0 0 0  0 1 1 1
反碼:1 1 1 1  1 0 0 0
補碼:1 1 1 1  1 0 0 1

對3+5取值:
3的二進制是 11
5的二進制是 101
加起來是 1000

我們現在要理解一句話,如果看到一個二進制的數字。需要瞭解它是有符號數還是無符號數。

拓展:
接下來先給大傢擴展一個寄存器:裡面可以存值。通用的寄存器有8個,可以存儲任意的值。我可以通過mov指令向某個寄存器存值,如下圖:

在這裡插入圖片描述

現在我要寫一個-1,我們來看看會有怎樣的區別:

在這裡插入圖片描述

這裡的FFFF FFFF是我們存的-1在寄存器中的值。一個F就是 1111,首先最高位的值是1,所以代表他是一個負數。我們正常存1的時候首位明顯是0,而存-1就變成FFFF FFFF。因為-1在計算機中是補碼的方式存儲的,所以負數在我們計算機中使用補碼方式存儲的。所以學習通過直接操作查看是最有效的。

FFFF FFFF代表三十二個1,如果是無符號的話,代表它是正數。如果是有符號的話,代表它是一個負數,是有很大的本質區別的。

我們搞懂原碼反碼補碼之後,以後知道瞭計算機底層是怎麼存儲數字的:正數就正常的存,因為無論原碼反碼補碼,正數都是相同的。而負數主要存的是補碼!如果瞭解瞭這些,就是為瞭接下來的位運算打交道。

7.位運算

我們之前說過,計算機現在可以存儲所有的數字(正數,浮點數,字符),不論正數還是負數都可以存儲。如果可以把這些數字加以運算,我們就可以做到世界上的一切。無論多復雜的運算,底層都是加減乘除。我們隻要把位運算的位如何操作運算記住、突破就可以瞭。

接下來我們學習位運算。

首先有一個面試高頻題:2*8最高效的計算方式?
這道題不論怎樣都非常慢,隻有通過位運算才是最快的,比如左移、右移。而且要記住一句話:很多底層的調試器(例如C語言調試器),當我們手寫調試器的時候就需要通過位來判斷CPU的狀態。

位運算就是我們常說的與或非 異或運算等…我們一個一個來看:

與運算:

在JAVA語言中用 & 符號去表示,但是在匯編中用 and 代表與。下面圖片方便我們的理解:

在這裡插入圖片描述

1011 0001
1101 1000
-------------------- 與運算的結果
1001 0000

或運算:
在JAVA語言中用(|)表示,在匯編語言中用or表示,同樣根據或運算也有一張電路圖可以幫助理解:

在這裡插入圖片描述

1011 0001
1101 1000
--------------- 或運算
1111 1001

異或運算:
在我們JAVA語言中用(^)表示,在匯編語言中xor表示。說白瞭記住一句話:不一樣就是1。再來一張電路圖理解:

在這裡插入圖片描述

1011 0001
1101 1000
--------------------異或運算
0110 1001

非運算(單目運算符):
我們所謂的取反(非),在JAVA語言中是(!),在C語言中是(~),在匯編語言中是not。
說白瞭一句話:0就是1,1就是0。

1101 1000
----------------- 非運算 
0010 0111

通過這些可以完成我們的加減乘除。怎麼通過位運算實現加減乘除呢?

位運算:
它是一個移動位,分為左移,右移。(左移*2,右移/2)。

左移(shl <<):

0000 0001  所有的二進制位全部左移若幹位,高位就丟棄,低位補0
0000 0010

右移(shr >>):

0000 0001  所有二進制全部右移若幹位,低位就丟棄,高位補0或1(根據符號位決定,負數補1,正數補0)
0000 0000

如果想要取值(C++)
int a = 10;
printf("%d\n",a>>2);

總結: 匯編的本質就是操作二進制。

通過二進制、位運算實現 加減乘除。

8.位運算的加減乘除

接下來我們講,如何通過位運算實現加減乘除。我們的計算機隻認識0和1,但是基本的數學是建立在加減乘除上。(加法搞定,一切都搞定瞭)

舉個例子:求4+5?

計算機是如何操作的呢?
0000 0100
0000 0101
-------------------------(加法,計算機是不會直接加)
0000 1001

那麼計算機的實現原理是什麼呢?
怎麼將兩個數加起來?核心是:異或。

第一步,異或(不一樣為1):如果不考慮進位,異或就可以直接出結果
0000 0100
0000 0101
-------------------------
0000 0001
第二步,計算機在這個異或的結果上在做與運算操作:
與運算(判斷進位),如果與運算結果為0,那麼就沒有進位。
0000 0100
0000 0101
-------------------------
0000 0100
第三步,將與運算的結果左移一位。
0000 0100 ——> 0000 1000 (進位的結果)
第四步,還是一個異或運算。(第一步異或出來的結果和第三步與運算的進位結果再一次異或)
0000 0001
0000 1000
------------------------
0000 1001
第五步,再去做一個與運算,判斷它是否有進位。(與第二步一樣)
0000 0001
0000 1000
------------------------
0000 0000
最後一步與運算結果為
0000 0000
電路都斷瞭,燈泡全滅,通過不瞭,所以最終結果就是:
與運算為0的結果的上一個異或運算結果:
0000 1001 (二進制的9)
如果與運算不為0,繼續循環。

舉個例子:求4-5?

我們說瞭,計算機沒有所謂的減法,那麼計算機是如何操作的呢?
4-5 說白瞭就是 4+(-5)
0000 0100
1111 1011 (代表二進制的-5)
------------------------(減法,計算機是不會直接減)
1111 1111(8個1就是ff,所以ff在十進制中代表-1)

0000 0100
1111 1011
------------------------ 異或(如果不考慮進位,異或就可以直接出結果)
1111 1111

0000 0100
1111 1011
------------------------ 與運算(判斷進位),如果與運算結果為0,那麼就沒有進位。
0000 0000

最終結果
1111 1111 (十六進制的ff,十進制的-1)

舉個例子:
乘法: x * y,本質就是y個x相加,還是加法。
除法: x / y,本質就是減法,就是x能減去多少個y。

結論:
計算機隻會做加法!

9.匯編語言環境說明

目前為止,我們可以從零設計一套自己的進制規則。自己設計電路來實現加減乘除。但是最終乘除的結果是一個二進制,例如:我們有32個燈泡,就可以顯示32個數值,最終亮起燈泡的數就是最終的結果。手動轉換這個結果和值!(十進制和二進制的轉換)

機器語言並不會做很多事情,它很“笨”。機器語言說白瞭就是位運算,(加減乘除)
都是電路來實現的。這就是計算機最底層的本質。

但是,我們發現,學完瞭這些東西依舊是不懂,隻是對現在的程序做瞭一些提高的理解。但是想通過理解寫程序寫不出來,難道我們真的寫不出來嗎?

通過機器語言來實現加法計算器,這就是設計電路。

我們通過指令來代替我們的一些二進制編碼!比如說:剛才的加法運算是通過各種操作能否通過一個符號計算呢?比如說我就想叫它(ADD指令),假設我給計算機發一個ADD指令,它通過識別我的指令轉換成機器語言(也就是編譯)ADD指令轉換為二進制操作。

在這裡插入圖片描述

匯編語言說白瞭,底層還是二進制,但是二進制寫起來太麻煩瞭。這個時候我們通過匯編指令給計算機發一些操作,然後讓計算機執行。這個地方就要涉及到編譯器!因為我們說的編譯命令不是機器直接能識別的,需要把命令轉碼,轉成計算機認識的信息,不然沒法識別。這個時候就涉及到編譯器的發展。

如果學底層,一定不要用特別智能的編譯器(IDEA,VSCODE等),就是用越遠古的越好(記事本,vim等)。很多人學習C語言使用,用的是vim編輯器去寫C語言,用gcc來執行。這是學習C的正確方式。底層的大佬幾乎都是最原始的idea。

在學習匯編之前,先要掌握環境的配置:

Vc6(程序到匯編的理解,通過C語言實現)

OD

抓包工具

加密解密工具

盡量不要使用java去學匯編,學完瞭匯編去學jvm就會覺得很簡單。但是如果我學java再學匯編就有點痛苦,建議使用C++學匯編。因為C++可以直接看到內存的地址,可以打印通過指針直接找到內存的地址,通過地址判斷信息。

學匯編不是為瞭寫代碼,就是為瞭理解程序的本質。
如果懂匯編,就能夠理解所有復雜的概念。

在這裡插入圖片描述

如果我們是一個做應用的程序員,別人調試不瞭的程序,如果學過匯編,都可以調試。因為知道底層堆棧到底做瞭什麼。如果是做安全的(反外掛,反病毒),就要理解匯編到二進制的全部知識。

現在的計算機至少是32位,還有的是64位。我們要知道,它是由32位演化過來的。底層架構沒有發生變化,隻是多瞭寄存器,主要是尋址能力增加。

匯編入門: 瞭解匯編和程序的對應關系,程序的本質即可。

在這裡插入圖片描述

學會瞭這些,不理解的java原碼就理解瞭。匯編非常重要!這對我們向上學習有很大的幫助。有些編程技術學進不去,很大原因就是因為底層不夠。底層精通瞭在學習編程語言就發現太輕松瞭!

10.寄存器的理解

學習匯編,要學習三個重要的概念:

寄存器

內存

匯編指令

通用寄存器:可以存儲任何值

存儲數據:CPU>內存>硬盤
CPU分為32位和64位。

32位:8 16 3264位:8 16 32 64

32位的通用寄存器隻有8個:

在這裡插入圖片描述

寄存器中的存值范圍:0 ~ FFFFFFFF

計算機如何向寄存器中存值呢?
對於二進制來說,就是直接修改值。但是修改值需要找到對應的位置,所以才有內存地址。

mov指令

mov  存的地址,存的數
mov  存的地址1,存的地址1

在這裡插入圖片描述

可以將數字寫入到寄存器,可以將寄存器中的值,寫到寄存器。

計算機的本質:計算力! 就是為瞭計算!(鼠標光標在移動都是在計算)

不同的寄存器:

32位代表八個F(FFFF FFFF),一個F代表4位(1111)
		FFFF	FF    
32位    16位    8位
EAX     AX		AL
ECX		CX		CL
EDX		DX		DL
EBX		BX		BL
ESP		SP		AH
EBP		BP		CH
ESI		SI		DH
EDI		DI		BH

對於8位:L代表低8位,H代表高8位
16位是FFFF 高八位占前兩個FF,低八位占後兩個FF

在這裡插入圖片描述

除瞭這些通用寄存器之外,那麼其他的寄存器每一位都有自己特定的功能(比如:開機關機)。
我們一般寫值都會寫到通用寄存器中。

11.內存

寄存器很小,而且不夠用。所以我們會把數據放到內存中。

有句話:每個應用程序進程都有4GB的內存空間。 程序用的內存就是空頭支票,雖然每個應用程序的進程都有4GB內存空間,但是真正到機器上使用時候並沒有那麼大。

在這裡插入圖片描述

程序真正運行的時候,才會用到物理內存。

1B = 8bit
1KB = 1024B
1MB = 1024KB
1GB = 1024MB

假設是4GB內存電腦,就等於4096m => 最終計算為位,就是可以存儲的最大容量。
計算機中的內存地址很多,空間很大。

內存地址:
存一個數:占用大小,數據寬度。存到哪裡呢?

計算機中的內存地址很多,空間很大。我們要給空間取名字,每個空間分配一個地址,名字。

在這裡插入圖片描述

這些給內存起的編號就是我們的內存地址。32位(8個十六進制的值)

32位:決定尋址能力!
FFFFFFFF + 1 = 100000000,最大的值。
位是怎麼限制內存大小呢?
100000000 內存地址 * 8位 :800000000。
轉換為十進制 / 8:4,294,967,296字節。
按照規則/1024最終發現就是 4GB(不能超過)。
64位,綽綽有餘。

所以每個內存地址都有一個編號:可以通過編號向裡面存值

在這裡插入圖片描述

很多人學C語言搞不懂指針,原因就是 不懂內存。

內存如何存值?(mov指令)
存值需要知道數據寬度(byte word dword),地址位置(自定義:0xFFFFFFFF)
不是任意的地址都可以寫東西,隻有程序申請過的內存地址我們才可以使用。

匯編如何向內存中寫值:
mov  數據寬度  內存地址,1

mov  byte ptr ds:[0x19ff70],1

傳遞的值的大小一定要和數據寬度要相等,如果大放不進去。

在這裡插入圖片描述

內存地址有多種寫法:

ds:[0x19FF70+4](內存地址偏移):加 偏移(4),地址就變成瞭:0x19FF74ds:[eax](寄存器):把寄存器中的值放到內存中。ds:[eax + 4](寄存器偏移)

以數組為例:
ds:[reg + reg * {1,2,4,8}]
ds:[reg + reg * {1,2,4,8} + 4] 偏移

12.總結

學到這裡,在學其他的匯編內容已經很輕松瞭,包括學計算機操作原理也很輕松。
如果能夠全部理解,再看自己寫的程序就會豁然開朗很多。

以上就是匯編語言基礎理解計算機底層原理的詳細內容,更多關於計算機底層匯編語言的資料請關註WalkonNet其它相關文章!

推薦閱讀: