C#去除DataTable重復數據的三種方法
業務需求
最近做一個把源數據庫的數據批次導出到目標數據庫。源數據庫是采集程序采集而來的原始數據庫,所以需要對其進行一些處理(過濾一些為空,長度太短或太長,非法字符,重復數據)然後在進行入庫。
其中要避免目標庫插入重復數據。這重復數據可能是源數據庫本身就有重復數據,還有就是已經插入避免重復插入。
過濾自身重復數據解決方案
第一種:采用DataView.ToTable()方法
- DataView.ToTable 方法
- .NET Framework 2.0
其根據現有 DataView 中的行,創建並返回一個新的DataTable。
重載列表
名稱 | 說明 |
---|---|
DataView.ToTable () | 根據現有 DataView 中的行,創建並返回一個新的 DataTable。
由 .NET Compact Framework 支持。 |
DataView.ToTable (String) | 根據現有 DataView 中的行,創建並返回一個新的 DataTable。
由 .NET Compact Framework 支持。 |
DataView.ToTable (Boolean, String[]) | 根據現有 DataView 中的行,創建並返回一個新的 DataTable。
由 .NET Compact Framework 支持。 |
DataView.ToTable (String, Boolean, String[]) | 根據現有 DataView 中的行,創建並返回一個新的 DataTable。
由 .NET Compact Framework 支持。 |
實例代碼
public static DataTable Distinct(DataTable dt, string[] filedNames) { DataView dv = dt.DefaultView; DataTable DistTable = dv.ToTable("Dist", true, filedNames); return DistTable; }
第二種方法:循環遍歷+DataTable.Select()
利用for循環遍歷DataTable的數據行,利用DataTable.Select 方法判斷是否重復,如果重復,則利用DataTable.Rows.RemoveAt(Index)刪除重復的那一行。
具體看代碼。
代碼示例
public DataTable GetDistinctSelf(DataTable SourceDt, string filedName) { for (int i = SourceDt.Rows.Count - 2; i > 0; i--) { DataRow[] rows = SourceDt.Select(string.Format("{0}='{1}'", filedName, SourceDt.Rows[i][filedName])); if (rows.Length > 1) { SourceDt.Rows.RemoveAt(i); } } return SourceDt; }
第三種方法
利用雙循環遍歷(不推薦)
public DataTable GetDistinctSelf(DataTable SourceDt, string filedName) { for (int i = SourceDt.Rows.Count - 2; i > 0; i--) { string title = SourceDt.Rows[0][filedName].ToString(); for (int j = i + 1; j > 0; i--) { if (SourceDt.Rows[j][filedName].ToString() == title) { SourceDt.Rows.RemoveAt(i); } } } return SourceDt; }
到此這篇關於C#去除DataTable重復數據的三種方法的文章就介紹到這瞭,更多相關C#去除DataTable重復數據內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- C# 遍歷datatable字段名和value的案例
- C# Datatable的幾種用法小結
- C# DataTable數據遍歷優化詳解
- C#獲取DataTable對象狀態DataRowState
- C#中DataTable的創建與遍歷實現