Entity Framework系統架構與原理介紹

一、Entity Framework概要

Entity Framework是微軟的Object Relational Mapper(對象關系映射),也就是我們平常說的ORM,它可以讓應用程序開發者將關系型數據作為業務模型來使用,也消除瞭開發者為數據訪問編寫的絕大多數管道代碼的需要(比如使用ADO.NET)。Entity Framework提供瞭一個綜合的、基於模型的系統,通過擺脫為所有的領域模型編寫相似的數據訪問代碼,使得開發者創建數據訪問層是如此之簡單。Entity Framework的首發版本是EF3.5,是伴隨著.NET Framework 3.5 SP1和VS 2008 SP1一同發佈的。從那之後,EF已經進化瞭很多很多,當前版本是6.1.3。
Entity Framework通過開啟數據訪問和將數據表示為概念化模型(即一系列的實體類和關系),減輕瞭創建數據訪問層的任務。應用程序可以執行基本的CRUD(CRUD是指在做計算處理時的增加(Create)、查詢(Retrieve)(重新得到數據)、更新(Update)和刪除(Delete)幾個單詞的首字母簡寫。主要被用在描述軟件系統中數據庫或者持久層的基本操作功能。)操作,以及輕松地管理實體間的一對一、一對多和多對多關系。

EF是微軟主推的數據存取技術,其他一些重要的微軟技術領域,比如ASP.NET MVC、WCF等,都使用EF構建數據存取層。在實際開發中,現在通常使用EF來構建應用程序的數據存取層。

二、使用Entity Framework的一些好處

因為開發者不需要為數據訪問編寫所有需要的ADO.NET管道代碼(所謂管道代碼即創建數據庫連接、打開數據庫、執行查詢、返回數據、關閉數據庫),因此可以節省很多開發時間。
我們可以使用更高級的語言(例如C#)來編寫所有的數據訪問邏輯而不是編寫SQL查詢和存儲過程。
因為數據庫表沒有高級的關系(如繼承),然而實體是可以有的,所以業務模型(也就是概念模型)可以使用實體間的關系來適配應用領域。
底層的數據存儲可以相對輕松地被取代,因為所有的數據訪問邏輯都呈現在應用層而不是數據層。

  • 開源,且有足夠的資源投入,持續完善。
  • 可以訪問多種數據庫(如Oracle、DB2、MySQL等),但與SQL Server配合得最好。
  • 更好地將應用程序與數據庫結構隔離開瞭。
  • 足夠靈活:支持三種開發模式。

三、缺點

沒有原生編寫的SQL語句執行速度快。

四、EF的系統架構與基本原理

從上圖中可以看出,EF在底層使用ADO.NET data provider,因此,它可以看成是對現有ADO.NET技術的一個“增強版”。
ADO.NET對數據庫存取引擎的封裝較少,因此,開發效率不如EF,但性能有保證。
EF提供瞭更高層的抽象,開發簡單,使用靈活,但性能比直接使用ADO.NET會有損失(因為它多瞭一個將LINQ查詢轉換為SQL命令的步驟)。

五、什麼是ORM

幾乎所有的商業軟件都要存儲數據,多年來,Relational Database Management System(RDBMS)一直是開發者尋求的數據存儲。ORM是允許開發者使用面向對象的編程語言訪問RDBMS數據的一系列技術。可用的RDBMS包括SQL Server, Oracle, DB2, MySQL等等。這些數據庫系統有一些共性。每個數據庫系統都支持一個或多個數據庫。數據庫都包含數據表,每個表都以表格的形式存儲數據,並且被分成瞭列和行。多個表中的數據行可能相互關聯。比如,一個訂單Order表中的Id可能存儲在一個流水表Transaction中。
過去,在像EF這樣的工具出現之前,開發者都是在軟件代碼內部嵌套的sql語句,這是因為編程語言不能原生理解Sql。比如,要從數據庫中檢索數據,然後將結果作為對象操作,必須使用ADO.NET要寫相當數量的代碼才行。具體來說,先定義一個存儲person的類,然後打開數據庫連接,創建具有查詢文本的命令,再執行該命令的reader,然後對該reader的結果進行迭代,最後再使用來自reader的數據填充Person類的實例。你會看到,這裡包含瞭很多步驟,而且更重要的是,這樣寫的代碼維護成本很高。比如,數據庫中改瞭一個列名,這樣還要去代碼中進行相應更改,否則運行時就會拋出異常。此外,我們數據庫中存儲的是標量值數據(int,string等),但我們的目標是一個對象或者對象圖。這樣看來,這種訪問數據的方式有很多問題。

首先,RDBMS的列類型和.Net類型之間有類型失配;其次,存儲和目標之間也不匹配,前者是標量值的集合,後者是具有屬性的對象。更糟糕的是,鍵入我們的person對象有一個更復雜的屬性List Phones,該屬性代表其他表的集合。這些問題在OOP和關系數據庫中被稱為“阻抗失配”(impedance mismatch)。
ORM這些工具出現的原因就是為瞭解決這種失配問題。ORM工具將存儲在數據表中的數據表示為對象,這比起傳統的代碼有很多優勢:
它們使用原生.net類型暴露數據,使用簡單的屬性暴露相關的數據,提供編譯時檢查。
最後,在後面會看到,你會寫更少的代碼。更少的代碼意味著更少的bugs,不是嗎?:)

六、Entity Framework簡史

多年來,有許多ORM工具進入市場,有開源的,也有商業的。微軟也開發瞭自己的ORM工具。第一個是內置於.Net 3.5的LINQ to SQL。該ORM僅支持SQL Server和SQL Server Compact。2008年第一次發佈的Entity Framework是第二次嘗試,相較於LINQ to SQL有很多優點。首先,有自己的provider架構,因此對於所有的關系數據庫引擎都是開放的,而不僅僅是SQL Server。現在所有的主要RDBMS都有Entity Framework provider。
Entity Framework經歷瞭很多版本。
第一版隻支持Database First。這意味著你要將設計器指向一個已存在的數據庫,然後就會生成一個包含數據庫和表抽象的代碼。除瞭代碼之外,還會創建一個EDMX文件,該XML文件包含瞭實體數據模型(因此你也就知道瞭EDMX的意思瞭Entity Data Model Xml)。它包括三個模型:邏輯,存儲和映射。邏輯模型(有時也叫概念模型)就是使用C#進行編碼的那個,存儲模型描述瞭數據是如何存儲到數據庫中的,映射模型提供瞭邏輯模型和存儲模型之間的映射。如果你在數據庫中更改瞭東西,那麼你也要更新生成的模型,C#代碼也要再次生成。映射模型有一個基於ObjectContext的類,該類有數據庫中每張表的集合屬性,每個集合都是一個泛型集合,集合中的元素類型是從EF中的一個基類中繼承的。每個類都有屬性和相應的數據表中的列對應。
第二版,也就是EF4,也開始支持Model-First瞭。這樣 ,我們就可以使用設計面板創建實體類,然後設計器會產成SQL腳本來生成數據庫。對於這種方法,仍會生成EDMX文件,最終的結果是和Database First是相同的。
最後,EF的Code First在版本4.1中引入。Code First不需要EDMX文件瞭,每個實體也不需要從EF的基類中繼承瞭。這樣,代碼變得更加容易測試。這種方法也不需要依賴設計器瞭,你隻需要編寫類就行,而且它們會自動地映射到數據庫中的表。當前的EF 6.1.3中的Code First已經相當強大瞭。

七、Entity Framework具有的潛力

EF對於微軟開發者可以做很多事情。
首先,它可以將數據庫暴露成對象的集合,這是通過利用很多關鍵的類完成的。前提是你要瞭解DbContext,這個類是EF Code First的核心,在高層次上是數據庫抽象。數據庫包含瞭表,每個表又包含瞭行和列。DbContext有泛型集合屬性,每個屬性的類型是DbSet<TRowType>對應於每個表。集合中的每個對象指的是一個實體,代表相應表中的一行。數據表中的列是定義在TRowType類中的屬性。一旦這個結構佈局好瞭,那麼你就能夠通過LINQ查詢來查詢底層的數據庫瞭。如果你將一個全新的TRowType類的實例添加到父集合中,然後使用DbContext API保存更改,那麼這個新的對象就會變成相應表中的一行,該對象的每個屬性的值就會變成該行相應的列值。此外,EF有能力表示其他的數據庫工件,比如存儲過程和函數。數據庫結構的進化是很重要的一個問題,在大多數情況,隨著應用程序的變化,你需要添加列和表,EF是通過Migration(遷移)功能來解決這個問題的。這個能力允許你通過C#代碼更改數據庫結構,除瞭添加和刪除表和列之外,還可以添加索引。Migration可以沒有數據損失地進化數據庫模式。你將會看到,EF會暴露你需要使用C#訪問的一切數據而不需要編寫SQL,並且像對待你整個應用程序代碼的一部分來對待數據庫。你可以將migration代碼遷入到源代碼控制系統(Git/SVN)中,因為它也是C#代碼!

八、Entity Framework的架構

EF構建在provider架構之上。當開發者使用C#創建一個LINQ查詢時,EF框架引擎會連接一個provider,將它轉換成實際的SQL語句,最後發往數據庫。任何給定的provider都是連接Entity Framework和一個特定的RDBMS的橋梁。一旦該provider執行瞭最終的SQL命令,結果就被EF物質化到.NET對象中。Data reader就是為瞭這個目的。理解EF構建於ADO.NET之上非常重要,因此,EF也使用瞭諸如connection,command,和data reader的概念。談到數據持久化,也就是插入,更新和刪除功能,插入時,開發者將一個實體類的實例添加到數據庫上下文中。相似地,之前添加到上下文中的實例被標記為changed或deleted,就會產生對數據庫即將執行更新和刪除的語句。EF會檢查上下文中的每個對象,再次使用provider來創建RDBMS特定的insert,update,或delete命令。

九、Entity Framework建模和持久化

EF依賴概念模型完成工作,首先來理解一下什麼是Entity Data Model(EDM)以及EF如何使用它管理數據庫操作。

理解EDM

概念數據模型是EF的核心。要使用EF,我們必須創建概念數據模型,即EDM。EDM定義瞭我們的概念模型類,這些類之間的關系,以及這些模型到數據庫模式之間的映射。
一旦創建瞭EDM,我們就可以對概念模型執行所有的CRUD操作,EF會將所有的這些對象查詢翻譯成數據庫查詢(SQL)。一旦這些查詢執行瞭,EF就會將返回的結果轉成概念模型對象實例。EF會使用存儲在EDM中的映射信息來執行對象查詢到SQL查詢,以及相關的數據到概念模型的翻譯。
一旦EDM準備就緒,我們就可以使用模型對象來執行CRUD操作。要能夠執行CRUD操作,我們必須使用ObjectContext類。接下來讓我們理解一下這個類。

理解ObjectContext類

一旦我創建瞭EDM,我就有瞭應用程序中可以使用的所有的實體。然而,我還需要一個東西來讓我在這些實體上執行各種操作。它就是EF中的ObjectContext類。
ObjectContext類是EF中的主要對象。它負責:

  • 管理數據庫連接。
  • 提供執行CRUD操作的支持。
  • 追蹤模型的更改,目的在於在數據庫中更新模型。

ObjectContext類可以理解成管理EDM中所有實體的東西,讓我們為這些實體執行所有的數據庫操作。當我們想要保存一個新的或者更改的對象到數據庫時,我們必須調用ObjectContext類中的SaveChanges方法。
還有另一個類DbContext,它和ObjectContext類很相似。實際上,Dbcontext類就是ObjectContext類的封裝類。它是一個更新的API,而且它提供瞭更好的API來管理數據庫連接和執行CRUD操作。因為DbContext是更好的API,所以我們會使用DbContext來執行所有的數據庫操作。

十、Entity Framework的三種開發風格

  • Database First:這是一種用於已存在數據庫模式的方法。使用這種方法,EDM是從數據庫模式中生成的,這種方法最適合於使用瞭已經存在的數據庫的應用。
  • Code First:這種方法中,所有的領域模型都是以類的形式編寫的。這些類會建立我們的EDM,數據庫模式會從這些類中創建。這種方法最適合於那些高度以領域為中心並且領域模型類創建優先的應用程序。這裡需要的數據庫隻是為瞭這些領域模型的持久化機制。
  • Model First:這種方法和Code First方法很相似,但是這種情況下我們使用瞭EDM視覺設計器來設計我們的模型。數據庫模式和類將會通過這個概念模型生成。該模型將會給我們創建數據庫的SQL語句,然後我們可以使用它來創建數據庫並連接應用程序。

三種開發風格的比較:

Database First

主要的好處就是:如果數據庫已經存在瞭,那麼隻需要花一點時間就可以編寫數據訪問層。EDM可以從數據庫中生成,然後根據需求更改EDM。
一些場景:
對遺留的數據庫進行開發。
當其他團隊的DBA完成瞭數據庫設計時,一旦數據庫完成,應用開發就要開始。
當要開發數據為中心的應用時,應用領域模型就是數據庫本身,數據庫會頻繁修改來滿足新的需求。

Model First

和Database First相似,Model First最終以EDM結束。使用該EDM,我們可以創建概念模型和數據庫。使用這種方法的唯一原因就是我們真的想要使用視覺實體設計器。

Code First

Code First對於所有的業務邏輯以類實現,並且數據庫隻用作這些模型的持久化機制時很有用。
選擇Code First的一些原因:
數據庫隻是作為模型的持久化機制,即數據庫中沒有邏輯。
完全控制代碼,即沒有自動生成的模型和上下文代碼。
數據庫不會手動更改。模型類總是更改,然後數據庫基於模型類的更改而更改。

十一、如何選擇持久化方法

方法一:工作流決定樹

方法二:檢查清單

場景 方式
有遺留的數據庫或者數據庫已經存在 Database First
在開始開發前,我們會獲得DBA創建的數據庫 Database First
數據庫頻繁改變,應用程序應該隨之改變 Database First
我們想要使用視覺實體設計器來生成數據庫和模型類 Model First
我們已有模型類並且隻需要數據庫保存數據 Code First
我們想要編寫所有的模型類,實現這些類,然後考慮數據庫存儲 Code First
我們不想處理自動生成的類,目更喜歡動手親自編寫 Code First

到此這篇關於Entity Framework系統架構與原理的文章就介紹到這瞭。希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。

推薦閱讀: