MySQL 定位用戶記錄的過程可以描述為:打開索引 -> 根據(jù)索引鍵值逐層查找 B+ 樹 branch 結(jié)點(diǎn) -> 定位到葉子結(jié)點(diǎn),將 cursor 定位到滿足條件的 rec 上;如果樹高為 N, 則需要讀取索引樹上的 N 個(gè)結(jié)點(diǎn)并進(jìn)行比較,如果 buffer_pool 較小,則大量的操作都會(huì)在 pread 上,用戶響應(yīng)時(shí)間變長(zhǎng);另外,MySQL中 Server 層與 Engine 之間的是以 row 為單位進(jìn)行交互的,engine 將記錄返回給 server 層,server 層對(duì) engine 的行數(shù)據(jù)進(jìn)行相應(yīng)的計(jì)算,然后緩存或發(fā)送至客戶端,為了減少交互過程所需要的時(shí)間,MySQL 做了兩個(gè)優(yōu)化:
如果同一個(gè)查詢語(yǔ)句連續(xù)取出了 MYSQL_FETCH_CACHE_THRESHOLD(4) 條記錄,則會(huì)調(diào)用函數(shù) row_sel_enqueue_cache_row_for_mysql 將 MYSQL_FETCH_CACHE_SIZE(8) 記錄緩存至 prebuilt->fetch_cache 中,在隨后的 prebuilt->n_fetch_cached 次交互中,都會(huì)從prebuilt->fetch_cache 中直接取數(shù)據(jù)返回到 server 層,那么問題來了,即使是用戶只需要 4 條數(shù)據(jù),Engine 層也會(huì)將 MYSQL_FETCH_CACHE_SIZE 條數(shù)據(jù)放入 fetch_cache 中,造成了不必要的緩存使用。另外, 5.7 可以根據(jù)用戶的設(shè)置來調(diào)整緩存用戶記錄的條數(shù);
Engine 取出數(shù)據(jù)后,會(huì)將 cursor 的位置保存起來,當(dāng)取下一條數(shù)據(jù)時(shí),會(huì)嘗試恢復(fù) cursor 的位置,成功則并繼續(xù)取下一條數(shù)據(jù),否則會(huì)重新定位 cursor 的位置,從而通過保存 cursor 位置的方法可以減少 server 層 & engine 層交互的時(shí)間;
???Server 層 & engine 層交互的過程如下,由于 server & engine 的 row format 不一樣,那么 engine row format -> server row format 在讀場(chǎng)景下的開銷也是比較大的。
while (rc == NESTED_LOOP_OK && join->return_tab >= join_tab) { int error; if (in_first_read) { in_first_read= false; error= (*join_tab->read_first_record)(join_tab); } else error= info->read_record(info); /* load data from engine */ rc= evaluate_join_record(join, join_tab); /* computed by server */ }
AHI 功能作用
????由以上的分析可以看到 MySQL 一次定位 cursor 的過程即是從根結(jié)點(diǎn)到葉子結(jié)點(diǎn)的路徑,時(shí)間復(fù)雜度為:height(index) + [CPU cost time],上述的兩個(gè)優(yōu)化過程無法省略定位 cursor 的中間結(jié)點(diǎn),因此需要引入一種可以從 search info 定位到葉子結(jié)點(diǎn)的方法,從而省略根結(jié)點(diǎn)到葉子結(jié)點(diǎn)的路徑上所消耗的時(shí)間,而這種方法即是 自適應(yīng)索引(Adaptive hash index, AHI)。查詢語(yǔ)句使用 AHI 的時(shí)候有以下優(yōu)點(diǎn):