C#去除DataTable重復數據的三種方法

業務需求

最近做一個把源數據庫的數據批次導出到目標數據庫。源數據庫是采集程序采集而來的原始數據庫,所以需要對其進行一些處理(過濾一些為空,長度太短或太長,非法字符,重復數據)然後在進行入庫。

其中要避免目標庫插入重復數據。這重復數據可能是源數據庫本身就有重復數據,還有就是已經插入避免重復插入。

過濾自身重復數據解決方案

第一種:采用DataView.ToTable()方法

  • DataView.ToTable 方法
  • .NET Framework 2.0

其根據現有 DataView 中的行,創建並返回一個新的DataTable。

重載列表

名稱 說明
DataView.ToTable () 根據現有 DataView 中的行,創建並返回一個新的 DataTable。

由 .NET Compact Framework 支持。

DataView.ToTable (String) 根據現有 DataView 中的行,創建並返回一個新的 DataTable。

由 .NET Compact Framework 支持。

DataView.ToTable (Boolean, String[]) 根據現有 DataView 中的行,創建並返回一個新的 DataTable。

由 .NET Compact Framework 支持。

DataView.ToTable (String, Boolean, String[]) 根據現有 DataView 中的行,創建並返回一個新的 DataTable。

由 .NET Compact Framework 支持。

實例代碼

 public static DataTable Distinct(DataTable dt, string[] filedNames)
  {
   DataView dv = dt.DefaultView;
   DataTable DistTable = dv.ToTable("Dist", true, filedNames);
   return DistTable;
  }

第二種方法:循環遍歷+DataTable.Select()

利用for循環遍歷DataTable的數據行,利用DataTable.Select 方法判斷是否重復,如果重復,則利用DataTable.Rows.RemoveAt(Index)刪除重復的那一行。

具體看代碼。

代碼示例

 public DataTable GetDistinctSelf(DataTable SourceDt, string filedName)
  {
 for (int i = SourceDt.Rows.Count - 2; i > 0; i--)
   {
    DataRow[] rows = SourceDt.Select(string.Format("{0}='{1}'", filedName, SourceDt.Rows[i][filedName]));
    if (rows.Length > 1)
    {
     SourceDt.Rows.RemoveAt(i);
    }
   }
   return SourceDt;  
  }

第三種方法

利用雙循環遍歷(不推薦)

 public DataTable GetDistinctSelf(DataTable SourceDt, string filedName)
  {
   for (int i = SourceDt.Rows.Count - 2; i > 0; i--)
   {
    string title = SourceDt.Rows[0][filedName].ToString();
    for (int j = i + 1; j > 0; i--)
    {
     if (SourceDt.Rows[j][filedName].ToString() == title)
     {
      SourceDt.Rows.RemoveAt(i);

     }
    }

   }
   return SourceDt;
   }

到此這篇關於C#去除DataTable重復數據的三種方法的文章就介紹到這瞭,更多相關C#去除DataTable重復數據內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: