本篇深入了解查詢優(yōu)化和服務(wù)器的內(nèi)部機制,了解MySql如何執(zhí)行特定查詢,從中也可以知道如何更改查詢執(zhí)行計劃,當我們深入理解MySql如何真正地執(zhí)行查詢,明白高效和低效的真正含義,在實際應(yīng)用中就能揚長避短。
聲明:本人使用的數(shù)據(jù)庫版本為MySql 5.1
一、基本原則:優(yōu)化數(shù)據(jù)訪問
查詢性能低下的最基本原因就是訪問了太多數(shù)據(jù),一些查詢要不可避免地篩選大量的數(shù)據(jù),大部分性能欠佳的查詢都可以用減少數(shù)據(jù)訪問的方式進行優(yōu)化。
1、首先分析應(yīng)用程序是否正在獲取超過需要的數(shù)據(jù),這通常表現(xiàn)在獲取了過多的行或列。一些查詢先向服務(wù)器請求不需要的數(shù)據(jù),再丟掉他們,這個讓服務(wù)器造成了額外的負擔,增加了網(wǎng)絡(luò)開銷,消耗了內(nèi)存和CPU資源。
> 如果前臺只需要顯示15條數(shù)據(jù),而你的查詢結(jié)果集返回了100條,則要想想是否真有必要這樣干了,最好使用LIMIT來限制查詢的條數(shù)。
> 盡量避免使用SELECT * , 也許你并不需要所有的列,但獲取所有的列將會造成覆蓋索引這樣的優(yōu)化手段失效,也會增加磁盤I/O、內(nèi)存和CPU的開銷等,所以基于這種情況,盡量使用SELECT t.id, t.name ... 這種查詢具體字段的SQL。
但是,SELECT * 這種稍顯浪費的方式可以簡化開發(fā),增加代碼的復(fù)用性(比如以后擴展了字段,就不用再改sql代碼了)。
如果系統(tǒng)使用了持久化框架,而我們只查詢了某一些字段出來,然后再直接去更新這個持久化對象時,那些未查詢出來的字段就會被設(shè)置為NULL,導(dǎo)致數(shù)據(jù)丟失。所以,如果只查詢一部分字段,要避免去更新持久化對象(親身經(jīng)歷)。
在程序中,還是倡導(dǎo)使用SELECT t.id, t.name ... 這種形式,能更好地利用索引;如果只是顯示數(shù)據(jù),那就按需查詢部分字段即可,這樣能更充分利用覆蓋索引;如果需要更新數(shù)據(jù),則必須查詢出所有字段。
2、其次看是否檢查了過多的數(shù)據(jù),一般從查詢的執(zhí)行時間、檢查的行數(shù)、返回的行數(shù)來看,但這些不可作為絕對的標準。
> 看下面的這個執(zhí)行計劃:
第一幅圖中:key表明使用了id_card索引;rows=1,表明只檢查了一行數(shù)據(jù),所以其速度是很快的。
第二幅圖中:刪除了索引后的執(zhí)行計劃,沒有使用索引,檢查的行數(shù)是81697,而我們只需要一行數(shù)據(jù);而如果數(shù)據(jù)量不斷增加,再與其它表關(guān)聯(lián)查詢的話,其性能可想而知是有多低效。
所以,查看是否檢查了過多的行,使用一些優(yōu)化手段如利用好索引或者重構(gòu)查詢盡量去減少檢查的行數(shù)。
> 再看下面這個執(zhí)行計劃:
這個查詢聯(lián)接了多張表,僅第一張表就檢查了10W行(而我們只需要15行),然后再與其它表進行聯(lián)接,再排序,效率自然低下了。而其它檢查出只有一行的表,可看出其使用了索引列進行聯(lián)接,可見使用好索引的高效。
看第二幅圖:使用了一個子查詢以減少檢查的行數(shù),加上id列本身是排好序的,所以Extra列可以看到?jīng)]有使用臨時表進行文件排序了,在第一幅圖中,使用臨時表排序(using temporyary,using filesort)是很耗時的。