count()聚合計算
count()是聚合函數,對于返回的結果集,一行行地判斷,累計值加1,最后返回累計值,count(*)、count(主鍵ID)和count(1)表示返回滿足條件的結果集的總行數。
count()聚合函數統計非NULL與NULL值的區別:
1、count(字段)不統計NULL記錄,即表示滿足條件的數據行里參數字段不為NULL的行
2、count(1)和count(*)會記錄NULL值
count(主鍵ID)、count(字段)、count(1)、count(*)的區別和性能差異(分析性能差別的原則)
1、server層要什么就給什么
2、InnoDB只給必要的值
3、現在的優化器對count(*)的取行數做了優化,其他沒有做優化
count(主鍵ID)比count(1)慢的原因
對于 count(主鍵 ID) 來說,InnoDB 引擎會遍歷主鍵索引樹,把每一行的ID值取出來,返回給server層,server層拿到ID后,判斷是不可能為空的,按行累加加1,最后返回累計值。
對于count(1),InnoDB引擎會掃描主鍵索引樹,但不取值,server層對于返回的每一行,按行累計加1,判斷不可能為NULL,返回累計值。
從InnoDB引擎層返回ID會涉及到解析數據行、拷貝字段值的操作,因此count(主鍵 ID)執行要比count(1)執行慢。
count(字段)
1、如果這個字段定義為not null的話,一行行地從記錄里面讀出這個字段,判斷不能為null,按行累計加1
2、如果這個字段定義允許為null,一行行地從記錄里面讀出這個字段,執行的時候還要判斷是否為null,不為null的按行累計加1,返回累加值
count(主鍵id)走主鍵索引的時候效率較count(*)差的原因?
平時我們檢索一列的時候,基本上等值或范圍查詢,那么索引基數大的索引必然效率很高(符合走主鍵索引查找速度最快的原則)。
但是在做count(*)的時候并沒有檢索具體的一行或者一個范圍,那么選擇基數小的索引對count操作效率會更高。在做count操作的時候,mysql會遍歷每個葉子節點,所以基數越小,效率越高。mysql非聚簇索引葉子節點保存指向主鍵ID的指針,所以需要檢索兩遍索引。但是這里相對于遍歷主鍵索引,即使檢索兩遍索引效率也比單純的檢索主鍵索引快。
Innodb是索引組織表,主鍵索引樹的葉子節點是數據,而普通索引樹的葉子節點是主鍵值,索引普通索引樹小很多,索引長度越小樹的大小就越小。
MyISAM與InnoDB,正如在不同的存儲引擎中,count(*)函數的執行是不同的
在MyISAM存儲引擎中,count()函數是直接讀取數據表保存的行記錄數并返回,效率很高,但是如果添加了where條件的話,MyISAM表也不能返回得很快。
在InnoDB存儲引擎中,count(*)函數是先從內存中讀取表中的數據到內存緩沖區,然后掃描全表獲得行記錄數。在使用count函數中加上where條件時,在兩個存儲引擎中的效果是一樣的,都會掃描全表計算某字段有值項的次數。
count(*)中關于select count(*) from tab_name幾種不走索引和走那種索引情景分析
CREATE TABLE`t1` (
`c1`varchar(30) NOT NULL,
`c2`varchar(20) NOT NULL,
`c3`varchar(40) NOT NULL,
`c4`varchar(10) DEFAULT NULL)
ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='ceshi_count'