C++右值引用與移動構造函數基礎與應用詳解

1.右值引用

右值引用是 C++11 引入的與 Lambda 表達式齊名的重要特性之一。它的引入解決瞭 C++ 中大量的歷史遺留問題, 消除瞭諸如 std::vector、std::string 之類的額外開銷, 也才使得函數對象容器 std::function 成為瞭可能。

1.1左值右值的純右值將亡值右值

要弄明白右值引用到底是怎麼一回事,必須要對左值和右值做一個明確的理解。

左值 (lvalue, left value),顧名思義就是賦值符號左邊的值。準確來說, 左值是表達式(不一定是賦值表達式)後依然存在的持久對象。

右值 (rvalue, right value),右邊的值,是指表達式結束後就不再存在的臨時對象。

而 C++11 中為瞭引入強大的右值引用,將右值的概念進行瞭進一步的劃分,分為:純右值、將亡值。

純右值 (prvalue, pure rvalue),純粹的右值,要麼是純粹的字面量,例如 10, true; 要麼是求值結果相當於字面量或匿名臨時對象,例如 1+2。非引用返回的臨時變量、運算表達式產生的臨時變量、 原始字面量、Lambda 表達式都屬於純右值。

需要註意的是,字面量除瞭字符串字面量以外,均為純右值。而字符串字面量是一個左值,類型為 const char 數組。例如:

#include <type_traits>
int main() {
    // 正確,"01234" 類型為 const char [6],因此是左值
    const char (&left)[6] = "01234";
    // 斷言正確,確實是 const char [6] 類型,註意 decltype(expr) 在 expr 是左值
    // 且非無括號包裹的 id 表達式與類成員表達式時,會返回左值引用
    static_assert(std::is_same<decltype("01234"), const char(&)[6]>::value, "");
    // 錯誤,"01234" 是左值,不可被右值引用
    // const char (&&right)[6] = "01234";
}

但是註意,數組可以被隱式轉換成相對應的指針類型,而轉換表達式的結果(如果不是左值引用)則一定是個右值(右值引用為將亡值,否則為純右值)。例如:

const char*   p   = "01234";  // 正確,"01234" 被隱式轉換為 const char*
const char*&& pr  = "01234";  // 正確,"01234" 被隱式轉換為 const char*,該轉換的結果是純右值
// const char*& pl = "01234"; // 錯誤,此處不存在 const char* 類型的左值
將亡值 (xvalue, expiring value),是 C++11 為瞭引入右值引用而提出的概念(因此在傳統 C++ 中, 純右值和右值是同一個概念),也就是即將被銷毀、卻能夠被移動的值。
將亡值可能稍有些難以理解,我們來看這樣的代碼:
std::vector<int> foo() {
    std::vector<int> temp = {1, 2, 3, 4};
    return temp;
}
std::vector<int> v = foo();

在這樣的代碼中,就傳統的理解而言,函數 foo 的返回值 temp 在內部創建然後被賦值給 v, 然而 v 獲得這個對象時,會將整個 temp 拷貝一份,然後把 temp 銷毀,如果這個 temp 非常大, 這將造成大量額外的開銷(這也就是傳統 C++ 一直被詬病的問題)。在最後一行中,v 是左值、 foo() 返回的值就是右值(也是純右值)。但是,v 可以被別的變量捕獲到, 而 foo() 產生的那個返回值作為一個臨時值,一旦被 v 復制後,將立即被銷毀,無法獲取、也不能修改。 而將亡值就定義瞭這樣一種行為:臨時的值能夠被識別、同時又能夠被移動。

在 C++11 之後,編譯器為我們做瞭一些工作,此處的左值 temp 會被進行此隱式右值轉換, 等價於 static_cast<std::vector<int> &&>(temp),進而此處的 v 會將 foo 局部返回的值進行移動。 也就是後面我們將會提到的移動語義。

1.2右值引用和左值引用

要拿到一個將亡值,就需要用到右值引用:T &&,其中 T 是類型。 右值引用的聲明讓這個臨時值的生命周期得以延長、隻要變量還活著,那麼將亡值將繼續存活。

C++11 提供瞭 std::move 這個方法將左值參數無條件的轉換為右值, 有瞭它我們就能夠方便的獲得一個右值臨時對象,例如:

#include <iostream>
#include <string>
void reference(std::string& str) {
    std::cout << "左值" << std::endl;
}
void reference(std::string&& str) {
    std::cout << "右值" << std::endl;
}
int main()
{
    std::string lv1 = "string,"; // lv1 是一個左值
    // std::string&& r1 = lv1; // 非法, 右值引用不能引用左值
    std::string&& rv1 = std::move(lv1); // 合法, std::move可以將左值轉移為右值
    std::cout << rv1 << std::endl; // string,
    const std::string& lv2 = lv1 + lv1; // 合法, 常量左值引用能夠延長臨時變量的生命周期
    // lv2 += "Test"; // 非法, 常量引用無法被修改
    std::cout << lv2 << std::endl; // string,string,
    std::string&& rv2 = lv1 + lv2; // 合法, 右值引用延長臨時對象生命周期
    rv2 += "Test"; // 合法, 非常量引用能夠修改臨時變量
    std::cout << rv2 << std::endl; // string,string,string,Test
    reference(rv2); // 輸出左值
    return 0;
}

rv2 雖然引用瞭一個右值,但由於它是一個引用,所以 rv2 依然是一個左值。

註意,這裡有一個很有趣的歷史遺留問題,我們先看下面的代碼:

#include <iostream>
int main() {
    // int &a = std::move(1);    // 不合法,非常量左引用無法引用右值
    const int &b = std::move(1); // 合法, 常量左引用允許引用右值
    std::cout << a << b << std::endl;
}
第一個問題,為什麼不允許非常量引用綁定到非左值?這是因為這種做法存在邏輯錯誤:
void increase(int & v) {
    v++;
}
void foo() {
    double s = 1;
    increase(s);
}

由於 int& 不能引用 double 類型的參數,因此必須產生一個臨時值來保存 s 的值, 從而當 increase() 修改這個臨時值時,調用完成後 s 本身並沒有被修改。

第二個問題,為什麼常量引用允許綁定到非左值?原因很簡單,因為 Fortran 需要。

2.移動構造函數

傳統 C++ 通過拷貝構造函數和賦值操作符為類對象設計瞭拷貝/復制的概念,但為瞭實現對資源的移動操作, 調用者必須使用先復制、再析構的方式,否則就需要自己實現移動對象的接口。 試想,搬傢的時候是把傢裡的東西直接搬到新傢去,而不是將所有東西復制一份(重買)再放到新傢、 再把原來的東西全部扔掉(銷毀)

傳統的 C++ 沒有區分『移動』和『拷貝』的概念,造成瞭大量的數據拷貝,浪費時間和空間。 右值引用的出現恰好就解決瞭這兩個概念的混淆問題,例如:

#include <iostream>
class A {
public:
    int *pointer;
    A():pointer(new int(1)) {
        std::cout << "構造" << pointer << std::endl;
    }
    A(A& a):pointer(new int(*a.pointer)) {
        std::cout << "拷貝" << pointer << std::endl;
    } // 無意義的對象拷貝
    A(A&& a):pointer(a.pointer) {
        a.pointer = nullptr;
        std::cout << "移動" << pointer << std::endl;
    }
    ~A(){
        std::cout << "析構" << pointer << std::endl;
        delete pointer;
    }
};
// 防止編譯器優化
A return_rvalue(bool test) {
    A a,b;
    if(test) return a; // 等價於 static_cast<A&&>(a);
    else return b;     // 等價於 static_cast<A&&>(b);
}
int main() {
    A obj = return_rvalue(false);
    std::cout << "obj:" << std::endl;
    std::cout << obj.pointer << std::endl;
    std::cout << *obj.pointer << std::endl;
    return 0;
}

在上面的代碼中:

首先會在 return_rvalue 內部構造兩個 A 對象,於是獲得兩個構造函數的輸出;

函數返回後,產生一個將亡值,被 A 的移動構造(A(A&&))引用,從而延長生命周期,並將這個右值中的指針拿到,保存到瞭 obj 中,而將亡值的指針被設置為 nullptr,防止瞭這塊內存區域被銷毀。

從而避免瞭無意義的拷貝構造,加強瞭性能。再來看看涉及標準庫的例子:

#include <iostream> // std::cout
#include <utility> // std::move
#include <vector> // std::vector
#include <string> // std::string
int main() {
    std::string str = "Hello world.";
    std::vector<std::string> v;
    // 將使用 push_back(const T&), 即產生拷貝行為
    v.push_back(str);
    // 將輸出 "str: Hello world."
    std::cout << "str: " << str << std::endl;
    // 將使用 push_back(const T&&), 不會出現拷貝行為
    // 而整個字符串會被移動到 vector 中,所以有時候 std::move 會用來減少拷貝出現的開銷
    // 這步操作後, str 中的值會變為空
    v.push_back(std::move(str));
    // 將輸出 "str: "
    std::cout << "str: " << str << std::endl;
    return 0;
}

2.1完美的移動轉發

前面我們提到瞭,一個聲明的右值引用其實是一個左值。這就為我們進行參數轉發(傳遞)造成瞭問題:

void reference(int& v) {
    std::cout << "左值" << std::endl;
}
void reference(int&& v) {
    std::cout << "右值" << std::endl;
}
template <typename T>
void pass(T&& v) {
    std::cout << "普通傳參:";
    reference(v); // 始終調用 reference(int&)
}
int main() {
    std::cout << "傳遞右值:" << std::endl;
    pass(1); // 1是右值, 但輸出是左值
    std::cout << "傳遞左值:" << std::endl;
    int l = 1;
    pass(l); // l 是左值, 輸出左值
    return 0;
}

對於 pass(1) 來說,雖然傳遞的是右值,但由於 v 是一個引用,所以同時也是左值。 因此 reference(v) 會調用 reference(int&),輸出『左值』。 而對於pass(l)而言,l是一個左值,為什麼會成功傳遞給 pass(T&&) 呢?

這是基於引用坍縮規則的:在傳統 C++ 中,我們不能夠對一個引用類型繼續進行引用, 但 C++ 由於右值引用的出現而放寬瞭這一做法,從而產生瞭引用坍縮規則,允許我們對引用進行引用, 既能左引用,又能右引用。但是卻遵循如下規則:

函數形參類型 實參參數類型 推導後函數形參類型
T& 左引用 T&
T& 右引用 T&
T&&amp; 左引用 T&
T&& 右引用 T&&

因此,模板函數中使用 T&& 不一定能進行右值引用,當傳入左值時,此函數的引用將被推導為左值。 更準確的講,無論模板參數是什麼類型的引用,當且僅當實參類型為右引用時,模板參數才能被推導為右引用類型。 這才使得 v 作為左值的成功傳遞。

完美轉發就是基於上述規律產生的。所謂完美轉發,就是為瞭讓我們在傳遞參數的時候, 保持原來的參數類型(左引用保持左引用,右引用保持右引用)。 為瞭解決這個問題,我們應該使用 std::forward 來進行參數的轉發(傳遞):

#include <iostream>
#include <utility>
void reference(int& v) {
    std::cout << "左值引用" << std::endl;
}
void reference(int&& v) {
    std::cout << "右值引用" << std::endl;
}
template <typename T>
void pass(T&& v) {
    std::cout << "              普通傳參: ";
    reference(v);
    std::cout << "       std::move 傳參: ";
    reference(std::move(v));
    std::cout << "    std::forward 傳參: ";
    reference(std::forward<T>(v));
    std::cout << "static_cast<T&&> 傳參: ";
    reference(static_cast<T&&>(v));
}
int main() {
    std::cout << "傳遞右值:" << std::endl;
    pass(1);
    std::cout << "傳遞左值:" << std::endl;
    int v = 1;
    pass(v);
    return 0;
}

輸出結果為:

傳遞右值:

              普通傳參: 左值引用
       std::move 傳參: 右值引用
    std::forward 傳參: 右值引用
static_cast<T&&> 傳參: 右值引用
傳遞左值:
              普通傳參: 左值引用
       std::move 傳參: 右值引用
    std::forward 傳參: 左值引用
static_cast<T&&> 傳參: 左值引用

無論傳遞參數為左值還是右值,普通傳參都會將參數作為左值進行轉發, 所以 std::move 總會接受到一個左值,從而轉發調用瞭reference(int&&) 輸出右值引用。

唯獨 std::forward 即沒有造成任何多餘的拷貝,同時完美轉發(傳遞)瞭函數的實參給瞭內部調用的其他函數。

std::forward 和 std::move 一樣,沒有做任何事情,std::move 單純的將左值轉化為右值, std::forward 也隻是單純的將參數做瞭一個類型的轉換,從現象上來看, std::forward<T>(v) 和 static_cast<T&&>(v) 是完全一樣的。

讀者可能會好奇,為何一條語句能夠針對兩種類型的返回對應的值, 我們再簡單看一看 std::forward 的具體實現機制,std::forward 包含兩個重載:

template<typename _Tp>
constexpr _Tp&& forward(typename std::remove_reference<_Tp>::type& __t) noexcept
{ return static_cast<_Tp&&>(__t); }
template<typename _Tp>
constexpr _Tp&& forward(typename std::remove_reference<_Tp>::type&& __t) noexcept
{
    static_assert(!std::is_lvalue_reference<_Tp>::value, "template argument"
        " substituting _Tp is an lvalue reference type");
    return static_cast<_Tp&&>(__t);
}

在這份實現中,std::remove_reference 的功能是消除類型中的引用, std::is_lvalue_reference 則用於檢查類型推導是否正確,在 std::forward 的第二個實現中 檢查瞭接收到的值確實是一個左值,進而體現瞭坍縮規則。

當 std::forward 接受左值時,_Tp 被推導為左值,所以返回值為左值;而當其接受右值時, _Tp 被推導為 右值引用,則基於坍縮規則,返回值便成為瞭 && + && 的右值。 可見 std::forward 的原理在於巧妙的利用瞭模板類型推導中產生的差異。

這時我們能回答這樣一個問題:為什麼在使用循環語句的過程中,auto&& 是最安全的方式? 因為當 auto 被推導為不同的左右引用時,與 && 的坍縮組合是完美轉發。

到此這篇關於C++右值引用與移動構造函數基礎與應用詳解的文章就介紹到這瞭,更多相關C++右值引用內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: