C#元組類型ValueTuple用法詳解

System.Tuple 類型是在.NET 4.0中引入的,但是有兩個明顯的缺點:
(1) Tuple 類型是引用類型。
(2) 沒有構造函數支持。

為瞭解決這些問題,C# 7 引入瞭新的語言功能以及新的類型。

現在,如果您需要從函數中返回兩個值的合並結果,或者把兩個值合並到一個哈希表中,可以使用System.ValueTuple類型並使用一個精短的語法來構造它們:

    // 構建元組實例
    var tpl = (1, 2);
                
    // 在字典中使用元組
    var d = new Dictionary<(int x, int y), (byte a, short b)>();
     
    // 不同名稱的元組是兼容的
    d.Add(tpl, (a: 3, b: 4));
     
    // 元組值的語義
    if (d.TryGetValue((1, 2), out var r))
    {
        // 解構元組忽略第一個元素
        var (_, b) = r;
                    
        // 使用命名語法和定義名稱
        Console.WriteLine($"a: {r.a}, b: {r.Item2}");
    }

System.ValueTuple 類型在.NET Framework 4.7中引入。但是您仍然可以在較低的框架版本中使用這個功能,這時候,您必須引用一個特殊的nuget包:System.ValueTuple。

  • 元組聲明的語法與函數參數聲明相似:(Type1 name1, Type2 name2)
  • 元組的構造語法類似於參數構造:(value1, optionalName: value2)
  • 兩個元組具有相同的元素類型,但不同的名稱是兼容(**):(int a, int b) = (1, 2)
  • 元組值的語義: (1,2).Equals((a: 1, b: 2))(1,2).GetHashCode() == (1,2).GetHashCode() 返回的值均是true
  • 元組不支持==!=。在github上有一個懸而未決的討論:“支持==和!=元組類型”。
  • 元組可以被“解構”,但隻能轉換成“變量聲明”,而不能“out var”或case語句中轉換:var (x, y) = (1,2) – OK, (var x, int y) = (1,2) – OK, dictionary.TryGetValue(key, out var (x, y)) – not OK, case var (x, y): break; – not OK。
  • 元組是可變的:(int a, int b) x = (1,2); x.a++;.
  • 元組元素可以通過名稱(如果提供的話)或通過通用名稱Item1Item2等來訪問。

我們馬上就會明白上面幾點。

元組名稱

缺少用戶定義的名稱導致System.Tuple類型不常用。我們可以將System.Tuple用作一個精減方法的實現細節,但如果我們需要傳遞它,我更喜歡使用具有描述性屬性名稱的命名類型。新元組功能很好地解決瞭這個問題:可以為元組元素指定名稱,而不像匿名類型,即使在不同的程序集中也可以使用這些名稱。

C#編譯器為方法簽名中使用的每個元組類型指定瞭一個特殊的標記TupleElementNamesAttribute

TupleElementNamesAttribute標記非常特殊,不能在用戶代碼中直接使用。如果您嘗試使用它,編譯器會報出錯誤。

    public (int a, int b) Foo1((int c, int d) a) => a;
 
    [return: TupleElementNames(new[] { "a", "b" })]
    public ValueTuple<int, int> Foo(
        [TupleElementNames(new[] { "c", "d" })] ValueTuple<int, int> a)
    {
        return a;
    }

這有助於IDE和編譯器“檢查”元素名稱,並警告錯誤地使用它們:

    // 正確: 元組聲明可以跳過元素名稱
    (int x, int y) tpl = (1, 2);
     
    // 警告: 由於目標類型“(int x, int y)”指定瞭其他名稱或未指定名稱,因此元組元素名稱“a”被忽略。
    tpl = (a:1, b:2);
     
    // 正確 :元組解構忽略元素名稱
    var (a, b) = tpl;
     
    // x: 2, y: 1. 元組名被忽略
    var (y, x) = tpl;

編譯器對繼承的成員有較強的要求:

    public abstract class Base
    {
        public abstract (int a, int b) Foo();
        public abstract (int, int) Bar();
    }
     
    public class Derived : Base
    {
        // 錯誤:替代繼承成員“Base.Foo()”時無法更改元組元素名稱
        public override (int c, int d) Foo() => (1, 2);
        // 錯誤:替代繼承成員“Base.Bar()”時無法更改元組元素名稱
        public override (int a, int b) Bar() => (1, 2);
    }

常規方法參數可以在重寫成員中自由更改,重寫成員中的元組元素名稱應該與基本類型中的元素名稱完全匹配。

元素名稱推斷

C# 7.1 引入瞭一個額外的增強功能:元素名稱推斷類似於C#為匿名類型所做的推斷。

    public void NameInference(int x, int y)
    {
        // (int x, int y)
        var tpl = (x, y);
     
        var a = new {X = x, Y = y};
     
        // (int X, int Y)
        var tpl2 = (a.X, a.Y);
    }

值語義和可變性

元組是公共字段可變的值類型。這聽起來令人擔憂,因為我們知道可變值類型被認為是有害的。這是一個邪惡的小例子:

    var x = new { Items = new List<int> { 1, 2, 3 }.GetEnumerator() };
    while (x.Items.MoveNext())
    {
        Console.WriteLine(x.Items.Current);
    }

如果運行這個代碼,您會得到一個無限循環。List<T>.Enumerator是一個可變值類型,但是Items是屬性。這意味著x.Items在每個循環迭代中返回原始迭代器的副本,從而導致無限循環。

但是隻有當數據與行為混合在一起時,可變值類型才是危險的:枚舉器擁有一個狀態(當前元素)並具有行為(通過調用MoveNext方法來推進迭代器的能力)。這種組合可能會導致問題,因為在副本上調用方法而不是在原始實例上調用方法,從而導致無效操作。下面是一組由於值類型的隱藏副本而導致不明顯行為的示例:gist。

但可變性問題依然存在:

    var tpl = (x: 1, y: 2);
    var hs = new HashSet<(int x, int y)>();
    hs.Add(tpl);
     
    tpl.x++;
    Console.WriteLine(hs.Contains(tpl)); // false

元組在字典中作為鍵是非常有用的,並且由於適當的值語義可以存儲在哈希表中。但是您不應該在集合的不同操作之間改變一個元組變量的狀態。

解構

雖然元組的構造函數對於元組來說非常特殊的,但是解構非常通用,並且可以與任何類型一起使用。

    public static class VersionDeconstrucion
    {
        public static void Deconstruct(this Version v, out int major, out int minor, out int build, out int revision)
        {
            major = v.Major;
            minor = v.Minor;
            build = v.Build;
            revision = v.Revision;
        }
    }
     
    
    var version = Version.Parse("1.2.3.4");
    var (major, minor, build, _) = version;
     
    // Prints: 1.2.3
    Console.WriteLine($"{major}.{minor}.{build}");

解構使用“鴨子類型(duck-typing)”的方法:如果編譯器可以找到一個方法調用Deconstruct給定的類型 – 實例方法或擴展方法 – 類型即是可解構的。

元組別名

一旦您開始使用元組,很快就會意識到想在源代碼的多個地方“重用”一個元組類型,但這並沒有什麼問題。首先,雖然C#不支持給定類型的全局別名,不過您可以使用“using”別名指令,它會在一個文件中創建一個別名;其次,您不能將元組指定別名:

//您不能這樣做:編譯錯誤
using Point = (int x, int y);
 
// 但是您可以這樣做
using SetOfPoints = System.Collections.Generic.HashSet<(int x, int y)>;

github上有一個關於“使用指令中的元組類型”的討論。所以,如果您發現自己在多個地方使用一個元組類型,你有兩個選擇:保持復制粘貼或創建一個命名的類型。

命名規則

下面是一個有趣的問題:我們應該遵循什麼命名規則來處理元組元素?Pascal規則喜歡ElementName還是駱峰規則elementName?一方面,元組元素應該遵循公共成員的命名規則(即PascalCase),但另一方面,元組隻是包含變量的變量,變量應該遵循駱峰規則。

如果元組被用作參數或方法的返回類型使用PascalCase規則,並且如果在函數中本地創建元組使用camelCase規則,可以考慮使用基於用法和使用的不同命名方案。但我更喜歡總是使用camelCase

總結

我發現元組在日常工作中非常有用。我需要不止一個函數返回值,或者我需要把一對值放入一個哈希表,或者字典的Key非常復雜,我需要用另一個“字段”來擴展它。

我甚至使用它們來避免與方法類似的ConcurrentDictionary.TryGetOrAdd的閉包分配,需要額外的參數。在許多情況下,狀態也是一個元組。

該功能是非常有用的,但我還想看到一些增強功能:

  • 全局別名:能夠“命名”一個元組並在整個程序集中使用它們。
  • 在模式匹配中解構一個元組:out varcase var語法。
  • 使用運算符==進行相等比較。

到此這篇關於C#元組類型ValueTuple用法詳解的文章就介紹到這瞭。希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。

推薦閱讀: