一次現場mysql重復記錄數據的排查處理實戰記錄
我當時正好出差在客戶現場部署調試軟件,有一天客戶突然找到我這里,說他們現場生產的數據出現了異常的情況,最直接的表現就是 同一個標簽,出現在了多個物料上,需要我配合,看怎么排查問題
分析
客戶當時直接一摞重復標簽的盒子碼在我面前,我慌得一匹,這怕不是捅婁子了
稍加思索,現在需要做的就是,在數據庫中查詢出重復的標簽,即對一個標簽進行統計,判斷出計數> 1 的即可
emmm,語法錯誤,我記得還有個Having 來著,換上試試
好家伙,重復的標簽有 1500 多條,再統計一下總共問題的記錄數量,以及再分組看看標簽重復次數的占比數據
對了,先把這些重復標簽數據扔個客戶去追溯產品(幸好 navicat 支持復制數據)
數據總計
以上一條查詢記錄的結果為臨時表,在此基礎上,用 sum() 求和
重復的記錄有點多,這問題有一點點大了
重復次數占比
對之前的查詢表換一個查詢方式,即對 count 數據再次分組
從結果來看,絕大部分問題數據重復了2次
where 和 having 的區別
Where是一個 約束聲明,在查詢數據庫的結果返回之前對數據庫中的查詢條件進行約束,即在結果返回之前起作用,且where后面 不能使用聚合函數
Having是一個 過濾聲明,所謂過濾是 在查詢數據庫的結果返回之后進行過濾,即在結果返回之后起作用,并且having后面可以使用聚合函數。
所謂 聚合函數,是對一組值進行計算并且返回單一值的函數:sum---求和,count---計數,max---最大值,avg---平均值等。
總結
在 mysql 的查詢操作中,我們日常用到的,一般都是多表聯查,將查詢的結果當成中間表進行多次查詢,對查詢的結果做分組,做統計匯總等操作
如果查詢操作中使用了函數計算或者是分組,典型的特征就是將原始表的多條記錄合并成一條,就需要 having 對這些操作的結果進行過濾,除此之外,使用 where 對表記錄進行條件過濾即可
到此這篇關于現場mysql重復記錄數據的排查處理記錄的文章就介紹到這了,更多相關mysql重復記錄數據排查處理內容請搜索本站以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持本站!
版權聲明:本站文章來源標注為YINGSOO的內容版權均為本站所有,歡迎引用、轉載,請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網站,禁止在非www.333abb.com所屬的服務器上建立鏡像,否則將依法追究法律責任。本站部分內容來源于網友推薦、互聯網收集整理而來,僅供學習參考,不代表本站立場,如有內容涉嫌侵權,請聯系alex-e#qq.com處理。