詳解C++編譯器優化技術
前言
註1:vc6、vs沒有提供編譯選項來關閉該優化,無論是debug還是release都會進行RVO和復制省略優化
註2:vc6、vs2005以下及vs2005+ Debug上不支持NRVO優化,vs2005+ Release支持NRVO優化
註3:g++支持這三種優化,並且可通過編譯選項:-fno-elide-constructors來關閉優化
RVO
#include <stdio.h> class A { public: A() { printf("%p construct\n", this); } A(const A& cp) { printf("%p copy construct\n", this); } ~A() { printf("%p destruct\n", this); } }; A GetA() { return A(); } int main() { { A a = GetA(); } return 0; }
在g++和vc6、vs中,上述代碼僅僅隻會調用一次構造函數和析構函數 ,輸出結果如下:
0x7ffe9d1edd0f construct
0x7ffe9d1edd0f destruct
在g++中,加上-fno-elide-constructors選項關閉優化後,輸出結果如下:
0x7ffc46947d4f construct // 在函數GetA中,調用無參構造函數A()構造出一個臨時變量temp
0x7ffc46947d7f copy construct // 函數GetA return語句處,把臨時變量temp做為參數傳入並調用拷貝構造函數A(const A& cp)將返回值ret構造出來
0x7ffc46947d4f destruct // 函數GetA執行完return語句後,臨時變量temp生命周期結束,調用其析構函數~A()
0x7ffc46947d7e copy construct // 函數GetA調用結束,返回上層main函數後,把返回值變量ret做為參數傳入並調用拷貝構造函數A(const A& cp)將變量A a構造出來
0x7ffc46947d7f destruct // A a = GetA()語句結束後,返回值ret生命周期結束,調用其析構函數~A()
0x7ffc46947d7e destruct // A a要離開作用域,生命周期結束,調用其析構函數~A()
註:臨時變量temp、返回值ret均為匿名變量
下面用c++代碼模擬一下其優化行為:
#include <new> A& GetA(void* p) { //由於p的內存是從外部傳入的,函數返回後仍然有效,因此返回值可為A& //vs中,以下代碼還可以寫成: // A& o = *((A*)p); // o.A::A(); // return o; return *new (p) A(); // placement new } int main() { { char buf[sizeof(A)]; A& a = GetA(buf); a.~A(); } return 0; }
NRVO
g++編譯器、vs2005+ Release(開啟/O2及以上優化開關)
修改上述代碼,將GetA的實現修改成:
A GetA() { A o; return o; }
在g++、vs2005+ Release中,上述代碼也僅僅隻會調用一次構造函數和析構函數 ,輸出結果如下:
0x7ffe9d1edd0f construct
0x7ffe9d1edd0f destruct
g++加上-fno-elide-constructors選項關閉優化後,和上述結果一樣
0x7ffc46947d4f construct
0x7ffc46947d7f copy construct
0x7ffc46947d4f destruct
0x7ffc46947d7e copy construct
0x7ffc46947d7f destruct
0x7ffc46947d7e destruct
但在vc6、vs2005以下、vs2005+ Debug中,沒有進行NRVO優化,輸出結果為:
18fec4 construct // 在函數GetA中,調用無參構造函數A()構造出一個臨時變量o
18ff44 copy construct // 函數GetA return語句處,把臨時變量o做為參數傳入並調用拷貝構造函數A(const A& cp)將返回值ret構造出來
18fec4 destruct // 函數GetA執行完return語句後,臨時變量o生命周期結束,調用其析構函數~A()
18ff44 destruct // A a要離開作用域,生命周期結束,調用其析構函數~A()
下面用c++代碼模擬一下vc6、vs2005以下、vs2005+ Debug上的行為:
#include <new> A& GetA(void* p) { A o; //由於p的內存是從外部傳入的,函數返回後仍然有效,因此返回值可為A& //vs中,以下代碼還可以寫成: // A& t = *((A*)p); // t.A::A(o); // return t; return *new (p) A(o); // placement new } int main() { { char buf[sizeof(A)]; A& a = GetA(buf); a.~A(); } return 0; }
註:與g++、vs2005+ Release相比,vc6、vs2005以下、vs2005+ Debug隻優化掉瞭返回值到變量a的拷貝,命名局部變量o沒有被優化掉,所以最後一共有2次構造和析構的調用
復制省略
典型情況是:調用構造函數進行值類型傳參
void Func(A a) { } int main() { { Func(A()); } return 0; }
在g++和vc6、vs中,上述代碼僅僅隻會調用一次構造函數和析構函數 ,輸出結果如下:
0x7ffeb5148d0f construct
0x7ffeb5148d0f destruct
在g++中,加上-fno-elide-constructors選項關閉優化後,輸出結果如下:
0x7ffc53c141ef construct // 在main函數中,調用無參構造函數構造實參變量o
0x7ffc53c141ee copy construct // 調用Func函數後,將實參變量o做為參數傳入並調用拷貝構造函數A(const A& cp)將形參變量a構造出來
0x7ffc53c141ee destruct // 函數Func執行完後,形參變量a生命周期結束,調用其析構函數~A()
0x7ffc53c141ef destruct // 返回main函數後,實參變量o要離開作用域,生命周期結束,調用其析構函數~A()
下面用c++代碼模擬一下其優化行為:
void Func(const A& a) { } int main() { { Func(A()); } return 0; }
優化失效的情況
開啟g++優化,得到以下各種失效情況的輸出結果:
(1)根據不同的條件分支,返回不同變量
A GetA(bool bflag) { A a1, a2; if (bflag) return a1; return a2; } int main() { A a = GetA(true); return 0; }
0x7ffc3cca324f construct
0x7ffc3cca324e construct
0x7ffc3cca327f copy construct
0x7ffc3cca324e destruct
0x7ffc3cca324f destruct
0x7ffc3cca327f destruct
註1:2次缺省構造函數調用:用於構造a1、a2
註2:1次拷貝構造函數調用:用於拷貝構造返回值
註3:這兒仍然用右值引用優化掉瞭一次拷貝函數調用:返回值賦值給a
(2)返回參數變量
(3)返回全局變量
(4)返回復合數據類型中的成員變量
(5)返回值賦值給已構造好的變量(此時會調用operator==賦值運算符)
以上就是詳解C++編譯器優化技術的詳細內容,更多關於C++編譯器優化技術的資料請關註WalkonNet其它相關文章!