C# IQueryable<T>揭開表達式樹的神秘面紗
什麼是樹?
什麼是樹?這個問題好像有點白癡。樹不就是樹嘛。
我們從最下面的主幹開始往上看,主枝-分支-分支….可以說是無限分支下去。我們倒過來看就是這樣:
平時我們用得最多的樹結構數據就是XML瞭,節點下面可以無限添加子節點。我們想想平時還用過什麼樹結構數據,比如:菜單無限分級、評論區的樓層。
這和我們今天講的有毛關系啊。… 我們今天主要就是來分析表達式樹的。、
lambda表達式和表達式樹的區別:
Lambda表達式:
Func<Student, bool> func = t => t.Name == "農碼一生";
表達式樹:
Expression<Func<Student, bool>> expression = t => t.Name == "農碼一生";
咋一看,沒啥區別啊。表達式隻是用Expression包瞭一下而已。那你錯瞭,這隻是Microsoft給我們展示的障眼法,我們看編譯後的C#代碼:
第一個lambda表達式編譯成瞭匿名函數,第二個表達式樹編譯成一瞭一堆我們不認識的東西,遠比我們原來寫的lambda復雜得多。
結論:
我們平時使用的表達式樹,是編寫的lambda表達式然後編譯成的表達式樹,也就是說平時一般情況使用的表達式樹都是編譯器幫我們完成的。(當然,我們可以可以手動的主動的去創表達式樹。隻是太麻煩,不是必要情況沒有誰願意去幹這個苦活呢)
我們來看看表達式樹到底有什麼神奇的地方:
有沒有看出點感覺來?Body裡面有Right、Left,Right裡面又有Right、Left,它們的類型都是繼承自Expression。這種節點下面有節點,可以無限附加下去的數據結構我們稱為樹結構數據。也就是我們的表達式樹。
補:上面的Student實體類:
public class Student { public string Name { get; set; } public int Age { get; set; } public string Address { get; set; } public string Sex { get; set; } }
解析表達式樹
上面我們看到瞭所謂的表達式樹,其他也沒有想象的那麼復雜嘛。不就是一個樹結構數據嘛。如果我們要實現自己的orm,免不瞭要解析表達式樹。一般說到解析樹結構數據都會用到遞歸算法。下面我們開始解析表達式樹。
先定義解析方法:
//表達式解析 public static class AnalysisExpression { public static void VisitExpression(Expression expression) { switch (expression.NodeType) { case ExpressionType.Call://執行方法 MethodCallExpression method = expression as MethodCallExpression; Console.WriteLine("方法名:" + method.Method.Name); for (int i = 0; i < method.Arguments.Count; i++) VisitExpression(method.Arguments[i]); break; case ExpressionType.Lambda://lambda表達式 LambdaExpression lambda = expression as LambdaExpression; VisitExpression(lambda.Body); break; case ExpressionType.Equal://相等比較 case ExpressionType.AndAlso://and條件運算 BinaryExpression binary = expression as BinaryExpression; Console.WriteLine("運算符:" + expression.NodeType.ToString()); VisitExpression(binary.Left); VisitExpression(binary.Right); break; case ExpressionType.Constant://常量值 ConstantExpression constant = expression as ConstantExpression; Console.WriteLine("常量值:" + constant.Value.ToString()); break; case ExpressionType.MemberAccess: MemberExpression Member = expression as MemberExpression; Console.WriteLine("字段名稱:{0},類型:{1}", Member.Member.Name, Member.Type.ToString()); break; default: Console.Write("UnKnow"); break; } } }
調用解析方法:
Expression<Func<Student, bool>> expression = t => t.Name == "農碼一生" && t.Sex == "男"; AnalysisExpression.VisitExpression(expression);
一層一層的往子節點遞歸,直到遍歷完所有的節點。最後打印效果如下:
基本上我們想要的元素和值都取到瞭,接著怎麼組裝就看你自己的心情瞭。是拼成sql,還是生成url,請隨意!
實現自己的IQueryable<T>、IQueryProvider
僅僅解析瞭表達式樹就可以搗鼓自己的orm瞭?不行,起碼也要基於IQueryable<T>接口來編碼吧。
接著我們自定義個類MyQueryable<T>繼承接口IQueryable<T>:
public class MyQueryable<T> : IQueryable<T> { public IEnumerator<T> GetEnumerator() { throw new NotImplementedException(); } IEnumerator IEnumerable.GetEnumerator() { throw new NotImplementedException(); } public Type ElementType { get { throw new NotImplementedException(); } } public Expression Expression { get { throw new NotImplementedException(); } } public IQueryProvider Provider { get { throw new NotImplementedException(); } } }
我們看到其中有個接口屬性IQueryProvider,這個接口的作用大著呢,主要作用是在執行查詢操作符的時候重新創建IQueryable<T>並且最後遍歷的時候執行sql遠程取值。我們還看見瞭Expression 屬性。
現在我們明白瞭IQueryable<T>和Expression(表達式樹)的關系瞭吧:
IQueryable<T>最主要的作用就是用來存儲Expression(表達式樹)
下面我們也自定義現實瞭IQueryProvider接口的類MyQueryProvider:
public class MyQueryProvider : IQueryProvider { public IQueryable<TElement> CreateQuery<TElement>(Expression expression) { throw new NotImplementedException(); } public IQueryable CreateQuery(Expression expression) { throw new NotImplementedException(); } public TResult Execute<TResult>(Expression expression) { throw new NotImplementedException(); } public object Execute(Expression expression) { throw new NotImplementedException(); } }
上面全是自動生成的偽代碼,下面我們來填充具體的實現:
public class MyQueryProvider : IQueryProvider { public IQueryable<TElement> CreateQuery<TElement>(Expression expression) { return new MyQueryable<TElement>(expression); } public IQueryable CreateQuery(Expression expression) { throw new NotImplementedException(); } public TResult Execute<TResult>(Expression expression) { return default(TResult); } public object Execute(Expression expression) { return new List<object>(); } } public class MyQueryable<T> : IQueryable<T> { public MyQueryable() { _provider = new MyQueryProvider(); _expression = Expression.Constant(this); } public MyQueryable(Expression expression) { _provider = new MyQueryProvider(); _expression = expression; } public Type ElementType { get { return typeof(T); } } private Expression _expression; public Expression Expression { get { return _expression; } } private IQueryProvider _provider; public IQueryProvider Provider { get { return _provider; } } public IEnumerator GetEnumerator() { return (Provider.Execute(Expression) as IEnumerable).GetEnumerator(); } IEnumerator<T> IEnumerable<T>.GetEnumerator() { var result = _provider.Execute<List<T>>(_expression); if (result == null) yield break; foreach (var item in result) { yield return item; } } }
執行代碼:
var aa = new MyQueryable<Student>(); var bb = aa.Where(t => t.Name == "農碼一生"); var cc = bb.Where(t => t.Sex == "男"); var dd = cc.AsEnumerable(); var ee = cc.ToList();
結論:
- 每次在執行Where查詢操作符的時候IQueryProvider會為我們創建一個新的IQueryable<T>
- 調用AsEnumerable()方法的時候並不會去實際取值(隻是得到一個IEnumerable)[註意:在EF裡面查詢不要先取IEnumerable後濾篩,因為AsEnumerable()會生成查詢全表的sql]
- 執行ToList()方法時才去真正調用迭代器GetEnumerator()取值
- 真正取值的時候,會去執行IQueryProvider中的Execute方法。(就是在調用這個方法的時候解析表達式數,然後執行取得結果)
我們看到真正應該辦實事的Execute 我們卻讓他返回默認值瞭。
現在估計有人不爽瞭,你到是具體實現下Execute。好吧!(其實通過上面說的解析表達式樹,你可以自己在這裡做想做的任何事瞭。)
首先為瞭簡單起見,我們用一個集合做為數據源:
//構造Student數組 public static List<Student> StudentArrary = new List<Student>() { new Student(){Name="農碼一生", Age=26, Sex="男", Address="長沙"}, new Student(){Name="小明", Age=23, Sex="男", Address="嶽陽"}, new Student(){Name="嗨-妹子", Age=25, Sex="女", Address="四川"} };
然後,重新寫一個VisitExpression2方法:(和之前的區別: 現在目的是取表達式樹中的表達式,而不是重新組裝成sql或別的)
public static void VisitExpression2(Expression expression, ref List<LambdaExpression> lambdaOut) { if (lambdaOut == null) lambdaOut = new List<LambdaExpression>(); switch (expression.NodeType) { case ExpressionType.Call://執行方法 MethodCallExpression method = expression as MethodCallExpression; Console.WriteLine("方法名:" + method.Method.Name); for (int i = 0; i < method.Arguments.Count; i++) VisitExpression2(method.Arguments[i], ref lambdaOut); break; case ExpressionType.Lambda://lambda表達式 LambdaExpression lambda = expression as LambdaExpression; lambdaOut.Add(lambda); VisitExpression2(lambda.Body, ref lambdaOut); break; case ExpressionType.Equal://相等比較 case ExpressionType.AndAlso://and條件運算 BinaryExpression binary = expression as BinaryExpression; Console.WriteLine("運算符:" + expression.NodeType.ToString()); VisitExpression2(binary.Left, ref lambdaOut); VisitExpression2(binary.Right, ref lambdaOut); break; case ExpressionType.Constant://常量值 ConstantExpression constant = expression as ConstantExpression; Console.WriteLine("常量值:" + constant.Value.ToString()); break; case ExpressionType.MemberAccess: MemberExpression Member = expression as MemberExpression; Console.WriteLine("字段名稱:{0},類型:{1}", Member.Member.Name, Member.Type.ToString()); break; case ExpressionType.Quote: UnaryExpression Unary = expression as UnaryExpression; VisitExpression2(Unary.Operand, ref lambdaOut); break; default: Console.Write("UnKnow"); break; } }
然後重新實現方法Execute:
public TResult Execute<TResult>(Expression expression) { List<LambdaExpression> lambda = null; AnalysisExpression.VisitExpression2(expression, ref lambda);//解析取得表達式數中的表達式 IEnumerable<Student> enumerable = null; for (int i = 0; i < lambda.Count; i++) { //把LambdaExpression轉成Expression<Func<Student, bool>>類型 //通過方法Compile()轉成委托方法 Func<Student, bool> func = (lambda[i] as Expression<Func<Student, bool>>).Compile(); if (enumerable == null) enumerable = Program.StudentArrary.Where(func);//取得IEnumerable else enumerable = enumerable.Where(func); } dynamic obj = enumerable.ToList();//(註意:這個方法的整個處理過程,你可以換成解析sql執行數據庫查詢,或者生成url然後請求獲取數據。) return (TResult)obj; }
執行過程:
個人對IQueryable延遲加載的理解:
- 前段部分的查詢操作符隻是把邏輯分解存入表達式樹,並沒有遠程執行sql。
- foreache執行的是IEnumerable<T>,然而IEnumerable<T>同樣具有延遲加載的特性。每次迭代的時候才真正的取數據。且在使用導航屬性的時候會再次查詢數據庫。(下次說延遲加載不要忘記瞭IEnumerable的功勞哦!)
小知識:
表達式樹轉成Lambda表達式:
Expression<Func<Student, bool>> expression = t => t.Name == "農碼一生"; Func<Student, bool> func = expression.Compile();
總結
表達式樹的分析就告一段落瞭,其中還有很多細節或重要的沒有分析到。下次有新的心得再來總結。
感覺表達式樹就是先把表達式打散存在樹結構裡(一般打散的過程是編譯器完成),然後可以根據不同的數據源或接口重新組裝成自己想要的任何形式,這也讓我們實現自己的orm成為瞭可能。
今天主要是對表達式樹的解析、和實現自己的IQueryable<T>、IQueryProvider做瞭一個記錄和總結,其中不定有錯誤的結論或說法,輕點拍!
以上就是C# IQueryable<T>揭開表達式樹的神秘面紗的詳細內容,更多關於C# IQueryable<T>的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- C#表達式樹Expression基礎講解
- C#值類型、引用類型、泛型、集合、調用函數的表達式樹實踐
- C# Lambda表達式及Lambda表達式樹的創建過程
- C#使用表達式樹(LambdaExpression)動態更新類的屬性值(示例代碼)
- 關於C#10 新特性 Lambda 優化