一次現場mysql重復記錄數據的排查處理實戰記錄

前言

我當時正好出差在客戶現場部署調試軟件,有一天客戶突然找到我這裡,說他們現場生產的數據出現瞭異常的情況,最直接的表現就是 同一個標簽,出現在瞭多個物料上,需要我配合,看怎麼排查問題

分析

客戶當時直接一摞重復標簽的盒子碼在我面前,我慌得一匹,這怕不是捅婁子瞭

稍加思索,現在需要做的就是,在數據庫中查詢出重復的標簽,即對一個標簽進行統計,判斷出計數> 1 的即可

emmm,語法錯誤,我記得還有個Having 來著,換上試試

好傢夥,重復的標簽有 1500 多條,再統計一下總共問題的記錄數量,以及再分組看看標簽重復次數的占比數據

對瞭,先把這些重復標簽數據扔個客戶去追溯產品(幸好 navicat 支持復制數據)

數據總計

以上一條查詢記錄的結果為臨時表,在此基礎上,用 sum() 求和

重復的記錄有點多,這問題有一點點大瞭

重復次數占比

對之前的查詢表換一個查詢方式,即對 count 數據再次分組

從結果來看,絕大部分問題數據重復瞭2次

where 和 having 的區別

Where是一個 約束聲明,在查詢數據庫的結果返回之前對數據庫中的查詢條件進行約束,即在結果返回之前起作用,且where後面 不能使用聚合函數

Having是一個 過濾聲明,所謂過濾是 在查詢數據庫的結果返回之後進行過濾,即在結果返回之後起作用,並且having後面可以使用聚合函數。

所謂 聚合函數,是對一組值進行計算並且返回單一值的函數:sum—求和,count—計數,max—最大值,avg—平均值等。

總結

在 mysql 的查詢操作中,我們日常用到的,一般都是多表聯查,將查詢的結果當成中間表進行多次查詢,對查詢的結果做分組,做統計匯總等操作

如果查詢操作中使用瞭函數計算或者是分組,典型的特征就是將原始表的多條記錄合並成一條,就需要 having 對這些操作的結果進行過濾,除此之外,使用 where 對表記錄進行條件過濾即可

到此這篇關於現場mysql重復記錄數據的排查處理記錄的文章就介紹到這瞭,更多相關mysql重復記錄數據排查處理內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: