深入理解C++內鏈接與外鏈接的意義

上一篇博客給大傢解釋瞭“程序運行鏈接”的概念與意義,並區分瞭動態鏈接庫與靜態鏈接庫。接下來想和大傢談一下C++的內鏈接與外鏈接的區別與意義。看完之後,希望你能理解以下幾個問題~

1.      為什麼不要在頭文件中定義具有外部鏈接的實體?

2.      在頭文件中定義具有內部鏈接的實體有什麼劣勢?

3.      內部鏈接與外部鏈接存在的意義是什麼?

首先理解什麼是編譯單元?

我們知道,其實編譯器在編譯代碼時,隻會去編譯.cpp格式的源文件,並且預編譯器會遞歸的把.cpp所有#include的頭文件都“拷貝”到.cpp文件中去,之後對這個文件再進行編譯,生成二進制的.obj文件。那麼其實每一個.cpp文件都是一個編譯單元。

聲明與定義

一個聲明將一個名稱引入一個作用域,C++中在同一個作用域中可以重復聲明,除瞭類中的成員函數與成員變量的聲明。以下都是聲明:

Extern int number; //外部引用聲明

Typedef int  int32; // typedef聲明

Class A;          //類的前置聲明

Using std::cin;   //名字空間引用聲明

Friend f;         //友元聲明

Int testFun();    //函數前置聲明

定義決定瞭一個實體在一個作用域的唯一描述,同一作用域不可以重復定義一個實體。以下都是定義:

Int a;

Class Myclass{…};

Myclass ma;

Static int b;

Enum{first, second,third};

Const int m = 2;

Void hello(){…}

什麼是內部鏈接?

如果一個名稱對於他的編譯單元是局部的,並且在鏈接時不會與其他的編譯單元中同樣的名字沖突,那麼這個名稱就擁有內部鏈接。這個實體有內部鏈接,他就不會與其他.cpp文件同名的實體沖突。換個說法,那些編譯單元(.cpp)中不能向其他編譯單元(.cpp)展示提供其定義的函數、變量就擁有內部鏈接

那麼哪些實體擁有內部鏈接?

1.      靜態(static)全局變量,自由函數,友元函數定義

2.      類的定義

3.      內聯函數定義

4.      Union共用體定義

5.      名字空間的const常量定義

6.      枚舉類型定義

7.      所有的聲明(有人將聲明歸結為無鏈接)

什麼是外部鏈接?

一個多文件的程序中,一個實體可以在鏈接時與其他編譯單元交互,那麼這個實體就擁有外部鏈接。

換個說法,那些編譯單元(.cpp)中能想其他編譯單元(.cpp)提供其定義,讓其他編譯單元(.cpp)使用的函數、變量就擁有外部鏈接

那麼哪些實體擁有外部鏈接?

1.      類的非內聯函數(包括成員函數和靜態類成員函數)的定義

2.      類的靜態成員變量的定義

3.      名字空間或全局的非靜態的自由函數,非靜態變量,非友元函數的定義

那麼這裡總結一下,定義這樣的內鏈接與外鏈接有什麼意義?

所謂鏈接,就是因為項目工程的不斷擴大,寫在一個.cpp文件即難以維護,又不好去合作開發。所以去將代碼按照比較有條理的,分成多個文件,讓其可以獨立編譯,在最後運行在整合到一起,也就是通過鏈接再去找到需要的代碼。這時候就需要外鏈接定位到合適的代碼。

比如我們定義的全局函數和變量,可以跨模塊的鏈接使用。

有一些名字定義所表示的實體擁有外部鏈接,這樣就意味著他可以跨越編譯單元去進行代碼的鏈接。所以,擁有外部鏈接的實體如果被聲明在頭文件並且被多個.cpp文件包含,可能就會出現鏈接沖突錯誤,因為每個包含這個擁有外部鏈接實體的.cpp都會分配空間,當多個編譯單元鏈接的時候,連接器就會面對多個相同的名字,無法正常鏈接到正確的對象。

下面舉個例子:(VS2012環境下)

//lesson.h

namespace lesson

{
         int  test;

}

//lesson.cpp

#include "stdafx.h"

#include "lesson.h"

int _tmain(intargc,_TCHAR*argv[])

{
         system("pause");

         return0;

}

//test.cpp

#include "lesson.h"

我們就會看到

error LNK2005: “intlesson::test” (?test@lesson@@3HA) 已經在 lesson.obj 中定義C:\Users\user\Documents\Visual Studio 2012\Projects\lesson\lesson\stdafx.obj

這樣的錯誤提示。

而對於擁有內部鏈接的實體則不會出現這樣的情況,因為他不會與其他.cpp的同名實體產生沖突。比如我們將上面的lesson.h改為

//lesson.h

class lesson

{
         int  test;

}

這樣就不會有任何錯誤,因為類的定義是有內部鏈接的。

如果在lesson.h裡面再定義靜態變量,枚舉類,進行各種聲明等,這些實體由於有內部鏈接所以仍然是合法的,編譯器會認為你想在各個編譯單元中都有一個私有的副本。

那麼進一步的概括這些內容就是一句話  

相同作用域內的聲明可以有多個,但是隻能定義一次。

先不考慮內鏈接還是外鏈接,我們都知道一個{}裡面不可能定義兩個一模一樣的名字。對於一個單獨的.cpp文件,我們是知道的,但是對於多個文件,好像就稍微有點暈。其實,這是一個道理,我們的外部鏈接就是讓各個.cpp文件能鏈接到一起,這樣在.cpp文件遇到第一個{}之前,他們的作用域就可以理解為相同的,所以擁有外部鏈接的實體(全局函數,變量等)出現在第一個{}之前,而且名字相同,那就是出現瞭定義重復的錯誤。

我們再看,所有的聲明都是有內部鏈接的,然而他其實可以鏈接到其他文件,因為他的定義是在其他的編譯單元的,所以多個編譯單元擁有相同的聲明也是合理的。但是,我們知道,這個聲明對應的定義肯定隻有一個。

最後再給出一個C++編程建議,慎重考慮在頭文件中定義有鏈接的實體

一,如果頭文件是像int a=1;這樣的定義,被包含在多個.cpp文件後肯定會報出鏈接錯誤。

二,如果是想static int a = 2;這樣的定義就會在所有包含他的.cpp文件中生成一個副本,如果被大量源文件include的話,就會占據大量的空間,造成內存浪費。

總結

到此這篇關於C++內鏈接與外鏈接意義的文章就介紹到這瞭,更多相關C++內鏈接與外鏈接內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: