上一篇文章里面,講到了遇到mysql主從同步延遲的坑,對(duì)于這次的坑多說(shuō)兩句,以前也看過(guò)這樣的例子,也知道不能夠?qū)懲曛篑R上更新,但是真正開(kāi)發(fā)的時(shí)候還是沒(méi)有注意到這一點(diǎn),道理大家都懂,但是還是會(huì)犯錯(cuò),只有等到自己親生體驗(yàn)到該錯(cuò)誤之后,才真正的掌握到該道理。
經(jīng)歷過(guò)一次mysql主從延遲之后,就開(kāi)始思考,主從復(fù)制是什么東西?它是怎么實(shí)現(xiàn)的呢?它的原理是什么?于是乎就開(kāi)始查閱資料、文章,現(xiàn)將自己理解到的內(nèi)容總結(jié)在此,加深印象。
為什么要做主從復(fù)制?
1、在業(yè)務(wù)復(fù)雜的系統(tǒng)中,有這么一個(gè)情景,有一句sql語(yǔ)句需要鎖表,導(dǎo)致暫時(shí)不能使用讀的服務(wù),那么就很影響運(yùn)行中的業(yè)務(wù),使用主從復(fù)制,讓主庫(kù)負(fù)責(zé)寫(xiě),從庫(kù)負(fù)責(zé)讀,這樣,即使主庫(kù)出現(xiàn)了鎖表的情景,通過(guò)讀從庫(kù)也可以保證業(yè)務(wù)的正常運(yùn)作。
2、做數(shù)據(jù)的熱備
3、架構(gòu)的擴(kuò)展。業(yè)務(wù)量越來(lái)越大,I/O訪問(wèn)頻率過(guò)高,單機(jī)無(wú)法滿足,此時(shí)做多庫(kù)的存儲(chǔ),降低磁盤(pán)I/O訪問(wèn)的頻率,提高單個(gè)機(jī)器的I/O性能。
mysql主從復(fù)制的原理是什么?
binlog: binary log,主庫(kù)中保存更新事件日志的二進(jìn)制文件。
主從復(fù)制的基礎(chǔ)是主庫(kù)記錄數(shù)據(jù)庫(kù)的所有變更記錄到binlog。binlog是數(shù)據(jù)庫(kù)中保存配置中過(guò)期時(shí)間內(nèi)所有修改數(shù)據(jù)庫(kù)結(jié)構(gòu)或內(nèi)容的一個(gè)文件。如果過(guò)期時(shí)間是10d的話,那么就是最近10d的數(shù)據(jù)庫(kù)修改記錄。
mysql主從復(fù)制是一個(gè)異步的復(fù)制過(guò)程,主庫(kù)發(fā)送更新事件到從庫(kù),從庫(kù)讀取更新記錄,并執(zhí)行更新記錄,使得從庫(kù)的內(nèi)容與主庫(kù)保持一致。
在主庫(kù)里,只要有更新事件出現(xiàn),就會(huì)被依次地寫(xiě)入到binlog里面,是之后從庫(kù)連接到主庫(kù)時(shí),從主庫(kù)拉取過(guò)來(lái)進(jìn)行復(fù)制操作的數(shù)據(jù)源。
binlog輸出線程。每當(dāng)有從庫(kù)連接到主庫(kù)的時(shí)候,主庫(kù)都會(huì)創(chuàng)建一個(gè)線程然后發(fā)送binlog內(nèi)容到從庫(kù)。
對(duì)于每一個(gè)即將發(fā)送給從庫(kù)的sql事件,binlog輸出線程會(huì)將其鎖住。一旦該事件被線程讀取完之后,該鎖會(huì)被釋放,即使在該事件完全發(fā)送到從庫(kù)的時(shí)候,該鎖也會(huì)被釋放。
在從庫(kù)里,當(dāng)復(fù)制開(kāi)始的時(shí)候,從庫(kù)就會(huì)創(chuàng)建兩個(gè)線程進(jìn)行處理:
從庫(kù)I/O線程。當(dāng)START SLAVE語(yǔ)句在從庫(kù)開(kāi)始執(zhí)行之后,從庫(kù)創(chuàng)建一個(gè)I/O線程,該線程連接到主庫(kù)并請(qǐng)求主庫(kù)發(fā)送binlog里面的更新記錄到從庫(kù)上。
從庫(kù)I/O線程讀取主庫(kù)的binlog輸出線程發(fā)送的更新并拷貝這些更新到本地文件,其中包括relay log文件。
從庫(kù)的SQL線程。從庫(kù)創(chuàng)建一個(gè)SQL線程,這個(gè)線程讀取從庫(kù)I/O線程寫(xiě)到relay log的更新事件并執(zhí)行。
可以知道,對(duì)于每一個(gè)主從復(fù)制的連接,都有三個(gè)線程。擁有多個(gè)從庫(kù)的主庫(kù)為每一個(gè)連接到主庫(kù)的從庫(kù)創(chuàng)建一個(gè)binlog輸出線程,每一個(gè)從庫(kù)都有它自己的I/O線程和SQL線程。
從庫(kù)通過(guò)創(chuàng)建兩個(gè)獨(dú)立的線程,使得在進(jìn)行復(fù)制時(shí),從庫(kù)的讀和寫(xiě)進(jìn)行了分離。因此,即使負(fù)責(zé)執(zhí)行的線程運(yùn)行較慢,負(fù)責(zé)讀取更新語(yǔ)句的線程并不會(huì)因此變得緩慢。比如說(shuō),如果從庫(kù)有一段時(shí)間沒(méi)運(yùn)行了,當(dāng)它在此啟動(dòng)的時(shí)候,盡管它的SQL線程執(zhí)行比較慢,它的I/O線程可以快速地從主庫(kù)里讀取所有的binlog內(nèi)容。這樣一來(lái),即使從庫(kù)在SQL線程執(zhí)行完所有讀取到的語(yǔ)句前停止運(yùn)行了,I/O線程也至少完全讀取了所有的內(nèi)容,并將其安全地備份在從庫(kù)本地的relay log,隨時(shí)準(zhǔn)備在從庫(kù)下一次啟動(dòng)的時(shí)候執(zhí)行語(yǔ)句。