一次現場mysql重復記錄數據的排查處理實戰記錄
前言
我當時正好出差在客戶現場部署調試軟件,有一天客戶突然找到我這裡,說他們現場生產的數據出現瞭異常的情況,最直接的表現就是 同一個標簽,出現在瞭多個物料上,需要我配合,看怎麼排查問題
分析
客戶當時直接一摞重復標簽的盒子碼在我面前,我慌得一匹,這怕不是捅婁子瞭
稍加思索,現在需要做的就是,在數據庫中查詢出重復的標簽,即對一個標簽進行統計,判斷出計數> 1 的即可
emmm,語法錯誤,我記得還有個Having 來著,換上試試
好傢夥,重復的標簽有 1500 多條,再統計一下總共問題的記錄數量,以及再分組看看標簽重復次數的占比數據
對瞭,先把這些重復標簽數據扔個客戶去追溯產品(幸好 navicat 支持復制數據)
數據總計
以上一條查詢記錄的結果為臨時表,在此基礎上,用 sum() 求和
重復的記錄有點多,這問題有一點點大瞭
重復次數占比
對之前的查詢表換一個查詢方式,即對 count 數據再次分組
從結果來看,絕大部分問題數據重復瞭2次
where 和 having 的區別
Where是一個 約束聲明,在查詢數據庫的結果返回之前對數據庫中的查詢條件進行約束,即在結果返回之前起作用,且where後面 不能使用聚合函數
Having是一個 過濾聲明,所謂過濾是 在查詢數據庫的結果返回之後進行過濾,即在結果返回之後起作用,並且having後面可以使用聚合函數。
所謂 聚合函數,是對一組值進行計算並且返回單一值的函數:sum—求和,count—計數,max—最大值,avg—平均值等。
總結
在 mysql 的查詢操作中,我們日常用到的,一般都是多表聯查,將查詢的結果當成中間表進行多次查詢,對查詢的結果做分組,做統計匯總等操作
如果查詢操作中使用瞭函數計算或者是分組,典型的特征就是將原始表的多條記錄合並成一條,就需要 having 對這些操作的結果進行過濾,除此之外,使用 where 對表記錄進行條件過濾即可
到此這篇關於現場mysql重復記錄數據的排查處理記錄的文章就介紹到這瞭,更多相關mysql重復記錄數據排查處理內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 聊聊Navicat統計的行數竟然和表實際行數不一致的問題
- Mysql中count(*)、count(1)、count(主鍵id)與count(字段)的區別
- 一文搞清楚MySQL count(*)、count(1)、count(col)區別
- 關於Navicat連接MySql數據庫慢的問題
- MySQL COUNT函數的使用與優化