日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

作者 | Amazing10

責(zé)編 | 屠敏

本文為業(yè)余碼農(nóng)投稿,已獲授權(quán)

還記得剛上研究生的時(shí)候,導(dǎo)師常掛在嘴邊的一句話,“科研的基礎(chǔ)不過就是數(shù)據(jù)而已。”如今看來,無論是人文社科,還是自然科學(xué),或許都可在一定程度上看作是數(shù)據(jù)的科學(xué)。

倘若剝開研究領(lǐng)域的外衣,將人的操作抽象出來,那么科研的過程大概就是根據(jù)數(shù)據(jù)流動(dòng)探索其中的未知信息吧。當(dāng)然科學(xué)研究的范疇涵蓋甚廣,也不是一兩句話能夠拎得清的。不過從這個(gè)角度上的闡述,也只是為了引出數(shù)據(jù)的重要性。

在當(dāng)今社會(huì),充斥著大量的數(shù)據(jù)。從眾多App上的賬戶資料到銀行信用體系等個(gè)人檔案,都離不開對(duì)大量數(shù)據(jù)的組織、存儲(chǔ)和管理。而這,便是數(shù)據(jù)庫存在的目的和價(jià)值。

目前數(shù)據(jù)庫的類型主要分為兩種,一種是關(guān)系型數(shù)據(jù)庫,另一種是非關(guān)系型數(shù)據(jù)庫(NoSQL)。而我們今天的主角MySQL就是關(guān)系型數(shù)據(jù)庫中的一種。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

本文結(jié)構(gòu)

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

 

關(guān)系型數(shù)據(jù)庫與NoSQL

關(guān)系型數(shù)據(jù)庫,顧名思義,是指存儲(chǔ)的數(shù)據(jù)之間具有關(guān)系。這種所謂的關(guān)系通常用二維表格中的行列來表示,即一個(gè)二維表的邏輯結(jié)構(gòu)能夠反映表中數(shù)據(jù)的存儲(chǔ)關(guān)系。

概念總是拗口難懂的。那么簡單來說,關(guān)系型數(shù)據(jù)庫的存儲(chǔ)就是按照表格進(jìn)行的。數(shù)據(jù)的存儲(chǔ)實(shí)際上就是對(duì)一個(gè)或者多個(gè)表格的存儲(chǔ)。通過對(duì)這些表格進(jìn)行分類、合并、連接或者選取等運(yùn)算來實(shí)現(xiàn)對(duì)數(shù)據(jù)庫的管理。常見的關(guān)系型數(shù)據(jù)庫有MySQL、Oracle、DB2和SqlServer等。

非關(guān)系型數(shù)據(jù)庫(NoSQL)是相對(duì)于關(guān)系型數(shù)據(jù)庫的一種泛指,它的特點(diǎn)是去掉了關(guān)系型數(shù)據(jù)庫中的關(guān)系特性,從而可獲得更好的擴(kuò)展性。NoSQL并沒有嚴(yán)格的存儲(chǔ)方式,但采用不同的存儲(chǔ)結(jié)構(gòu)都是為了獲得更高的性能和更高的并發(fā)。

NoSQL根據(jù)存儲(chǔ)方式可分為四大類,鍵值存儲(chǔ)數(shù)據(jù)庫、列存儲(chǔ)數(shù)據(jù)庫、文檔型數(shù)據(jù)庫和圖形數(shù)據(jù)庫。這四種數(shù)據(jù)的存儲(chǔ)原理不盡相同,因而在應(yīng)用場景上也有些許的差異。一般常用的有作為數(shù)據(jù)緩存的redis和分布式系統(tǒng)的HBase。目前常見的數(shù)據(jù)庫排名可見網(wǎng)站:

https://db-engines.com/en/ranking

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

關(guān)系型數(shù)據(jù)庫與非關(guān)系型數(shù)據(jù)庫本質(zhì)上的區(qū)別就在于存儲(chǔ)的數(shù)據(jù)是否具有一定的邏輯關(guān)系,由此產(chǎn)生的兩類數(shù)據(jù)庫看的性能和優(yōu)劣勢上也有一定的區(qū)別。二者對(duì)比可見下圖。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

關(guān)系型數(shù)據(jù)庫與NoSQL的優(yōu)缺點(diǎn)對(duì)比

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

 

MySQL簡介

介紹

在關(guān)系型數(shù)據(jù)庫中,MySQL可以說是其中的王者。它是目前最流行的數(shù)據(jù)庫之一,由瑞典 MySQL AB 公司開發(fā),目前屬于 Oracle 公司。MySQL數(shù)據(jù)庫具有以下幾個(gè)方面的優(yōu)勢:

  • 體積小、速度快;

  • 代碼開源,采用了 GPL 協(xié)議,可以修改源碼來開發(fā)自己的 MySQL 系統(tǒng);

  • 支持大型的數(shù)據(jù)庫,可以處理擁有上千萬條記錄的大型數(shù)據(jù)庫;

  • 使用標(biāo)準(zhǔn)的 SQL 數(shù)據(jù)語言形式,并采用優(yōu)化的 SQL 查詢算法,有效地提高查詢速度;

  • 使用 C 和 C++ 編寫,并使用多種編譯器進(jìn)行測試,保證源代碼的可移植性;

  • 可運(yùn)行在多個(gè)系統(tǒng)上,并且支持多種語言;

  • 核心程序采用完全的多線程編程,可以靈活地為用戶提供服務(wù),充分利用CPU資源。

 

邏輯架構(gòu)

MySQL的邏輯架構(gòu)可分為四層,包括連接層、服務(wù)層、引擎層和存儲(chǔ)層,各層的接口交互及作用如下圖所示。需要注意的是,由于本文將主要講解事務(wù)的實(shí)現(xiàn)原理,因此下文針對(duì)的都是InnoDB引擎下的情況。

連接層: 負(fù)責(zé)處理客戶端的連接以及權(quán)限的認(rèn)證。

服務(wù)層: 定義有許多不同的模塊,包括權(quán)限判斷,SQL接口,SQL解析,SQL分析優(yōu)化, 緩存查詢的處理以及部分內(nèi)置函數(shù)執(zhí)行等。MySQL的查詢語句在服務(wù)層內(nèi)進(jìn)行解析、優(yōu)化、緩存以及內(nèi)置函數(shù)的實(shí)現(xiàn)和存儲(chǔ)。

引擎層: 負(fù)責(zé)MySQL中數(shù)據(jù)的存儲(chǔ)和提取。MySQL中的服務(wù)器層不管理事務(wù),事務(wù)是由存儲(chǔ)引擎實(shí)現(xiàn)的。其中使用最為廣泛的存儲(chǔ)引擎為InnoDB,其它的引擎都不支持事務(wù)。

存儲(chǔ)層: 負(fù)責(zé)將數(shù)據(jù)存儲(chǔ)于設(shè)備的文件系統(tǒng)中。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

MySQL的邏輯架構(gòu)

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

 

MySQL事務(wù)

事務(wù)是MySQL區(qū)別于NoSQL的重要特征,是保證關(guān)系型數(shù)據(jù)庫數(shù)據(jù)一致性的關(guān)鍵技術(shù)。事務(wù)可看作是對(duì)數(shù)據(jù)庫操作的基本執(zhí)行單元,可能包含一個(gè)或者多個(gè)SQL語句。這些語句在執(zhí)行時(shí),要么都執(zhí)行,要么都不執(zhí)行。

事務(wù)的執(zhí)行主要包括兩個(gè)操作,提交和回滾。

提交:commit,將事務(wù)執(zhí)行結(jié)果寫入數(shù)據(jù)庫。

回滾:rollback,回滾所有已經(jīng)執(zhí)行的語句,返回修改之前的數(shù)據(jù)。

MySQL事務(wù)包含四個(gè)特性,號(hào)稱ACID四大天王。

原子性(Atomicity) :語句要么全執(zhí)行,要么全不執(zhí)行,是事務(wù)最核心的特性,事務(wù)本身就是以原子性來定義的;實(shí)現(xiàn)主要基于undo log日志實(shí)現(xiàn)的。

持久性(Durability :保證事務(wù)提交后不會(huì)因?yàn)殄礄C(jī)等原因?qū)е聰?shù)據(jù)丟失;實(shí)現(xiàn)主要基于redo log日志。

隔離性(Isolation) :保證事務(wù)執(zhí)行盡可能不受其他事務(wù)影響;InnoDB默認(rèn)的隔離級(jí)別是RR,RR的實(shí)現(xiàn)主要基于鎖機(jī)制、數(shù)據(jù)的隱藏列、undo log和類next-key lock機(jī)制。

一致性(Consistency) :事務(wù)追求的最終目標(biāo),一致性的實(shí)現(xiàn)既需要數(shù)據(jù)庫層面的保障,也需要應(yīng)用層面的保障。

 

原子性

事務(wù)的原子性就如原子操作一般,表示事務(wù)不可再分,其中的操作要么都做,要么都不做;如果事務(wù)中一個(gè)SQL語句執(zhí)行失敗,則已執(zhí)行的語句也必須回滾,數(shù)據(jù)庫退回到事務(wù)前的狀態(tài)。只有0和1,沒有其它值。

事務(wù)的原子性表明事務(wù)就是一個(gè)整體,當(dāng)事務(wù)無法成功執(zhí)行的時(shí)候,需要將事務(wù)中已經(jīng)執(zhí)行過的語句全部回滾,使得數(shù)據(jù)庫回歸到最初未開始事務(wù)的狀態(tài)。

事務(wù)的原子性就是通過undo log日志進(jìn)行實(shí)現(xiàn)的。當(dāng)事務(wù)需要進(jìn)行回滾時(shí),InnoDB引擎就會(huì)調(diào)用undo log日志進(jìn)行SQL語句的撤銷,實(shí)現(xiàn)數(shù)據(jù)的回滾。

 

持久性

事務(wù)的持久性是指當(dāng)事務(wù)提交之后,數(shù)據(jù)庫的改變就應(yīng)該是永久性的,而不是暫時(shí)的。這也就是說,當(dāng)事務(wù)提交之后,任何其它操作甚至是系統(tǒng)的宕機(jī)故障都不會(huì)對(duì)原來事務(wù)的執(zhí)行結(jié)果產(chǎn)生影響。

事務(wù)的持久性是通過InnoDB存儲(chǔ)引擎中的redo log日志來實(shí)現(xiàn)的,具體實(shí)現(xiàn)思路見下文。

 

隔離性

原子性和持久性是單個(gè)事務(wù)本身層面的性質(zhì),而隔離性是指事務(wù)之間應(yīng)該保持的關(guān)系。隔離性要求不同事務(wù)之間的影響是互不干擾的,一個(gè)事務(wù)的操作與其它事務(wù)是相互隔離的。

由于事務(wù)可能并不只包含一條SQL語句,所以在事務(wù)的執(zhí)行期間很有可能會(huì)有其它事務(wù)開始執(zhí)行。因此多事務(wù)的并發(fā)性就要求事務(wù)之間的操作是相互隔離的。這一點(diǎn)跟多線程之間數(shù)據(jù)同步的概念有些類似。

鎖機(jī)制

事務(wù)之間的隔離,是通過鎖機(jī)制實(shí)現(xiàn)的。當(dāng)一個(gè)事務(wù)需要對(duì)數(shù)據(jù)庫中的某行數(shù)據(jù)進(jìn)行修改時(shí),需要先給數(shù)據(jù)加鎖;加了鎖的數(shù)據(jù),其它事務(wù)是不運(yùn)行操作的,只能等待當(dāng)前事務(wù)提交或回滾將鎖釋放。

鎖機(jī)制并不是一個(gè)陌生的概念,在許多場景中都會(huì)利用到不同實(shí)現(xiàn)的鎖對(duì)數(shù)據(jù)進(jìn)行保護(hù)和同步。而在MySQL中,根據(jù)不同的劃分標(biāo)準(zhǔn),還可將鎖分為不同的種類。

按照粒度劃分:行鎖、表鎖、頁鎖

按照使用方式劃分:共享鎖、排它鎖

按照思想劃分:悲觀鎖、樂觀鎖

鎖機(jī)制的知識(shí)點(diǎn)很多,由于篇幅不好全部展開講。這里對(duì)按照粒度劃分的鎖進(jìn)行簡單介紹。

粒度:指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。細(xì)化程度越高,粒度級(jí)就越??;相反,細(xì)化程度越低,粒度級(jí)就越大。

MySQL按照鎖的粒度劃分可以分為行鎖、表鎖和頁鎖。

行鎖:粒度最小的鎖,表示只針對(duì)當(dāng)前操作的行進(jìn)行加鎖;

表鎖:粒度最大的鎖,表示當(dāng)前的操作對(duì)整張表加鎖;

頁鎖:粒度介于行級(jí)鎖和表級(jí)鎖中間的一種鎖,表示對(duì)頁進(jìn)行加鎖。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

這三種鎖是在不同層次上對(duì)數(shù)據(jù)進(jìn)行鎖定,由于粒度的不同,其帶來的好處和劣勢也不一而同。

表鎖在操作數(shù)據(jù)時(shí)會(huì)鎖定整張表,因而并發(fā)性能較差;

行鎖則只鎖定需要操作的數(shù)據(jù),并發(fā)性能好。但是由于加鎖本身需要消耗資源(獲得鎖、檢查鎖、釋放鎖等都需要消耗資源),因此在鎖定數(shù)據(jù)較多情況下使用表鎖可以節(jié)省大量資源。

MySQL中不同的存儲(chǔ)引擎能夠支持的鎖也是不一樣的。MyIsam只支持表鎖,而InnoDB同時(shí)支持表鎖和行鎖,且出于性能考慮,絕大多數(shù)情況下使用的都是行鎖。

并發(fā)讀寫問題

在并發(fā)情況下,MySQL的同時(shí)讀寫可能會(huì)導(dǎo)致三類問題,臟讀、不可重復(fù)度和幻讀。

(1)臟讀:當(dāng)前事務(wù)中讀到其他事務(wù)未提交的數(shù)據(jù),也就是臟數(shù)據(jù)。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

以上圖為例,事務(wù)A在讀取文章的閱讀量時(shí),讀取到了事務(wù)B為提交的數(shù)據(jù)。如果事務(wù)B最后沒有順利提交,導(dǎo)致事務(wù)回滾,那么實(shí)際上閱讀量并沒有修改成功,而事務(wù)A卻是讀到的修改后的值,顯然不合情理。

(2)不可重復(fù)讀:在事務(wù)A中先后兩次讀取同一個(gè)數(shù)據(jù),但是兩次讀取的結(jié)果不一樣。臟讀與不可重復(fù)讀的區(qū)別在于:前者讀到的是其他事務(wù)未提交的數(shù)據(jù),后者讀到的是其他事務(wù)已提交的數(shù)據(jù)。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

以上圖為例,事務(wù)A在先后讀取文章閱讀量的數(shù)據(jù)時(shí),結(jié)果卻不一樣。說明事務(wù)A在執(zhí)行的過程中,閱讀量的值被其它事務(wù)給修改了。這樣使得數(shù)據(jù)的查詢結(jié)果不再可靠,同樣也不合實(shí)際。

(3)幻讀:在事務(wù)A中按照某個(gè)條件先后兩次查詢數(shù)據(jù)庫,兩次查詢結(jié)果的行數(shù)不同,這種現(xiàn)象稱為幻讀。不可重復(fù)讀與幻讀的區(qū)別可以通俗的理解為:前者是數(shù)據(jù)變了,后者是數(shù)據(jù)的行數(shù)變了。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

以上圖為例,當(dāng)對(duì)0<閱讀量<100的文章進(jìn)行查詢時(shí),先查到了一個(gè)結(jié)果,后來查詢到了兩個(gè)結(jié)果。這表明同一個(gè)事務(wù)的查詢結(jié)果數(shù)不一,行數(shù)不一致。這樣的問題使得在根據(jù)某些條件對(duì)數(shù)據(jù)篩選的時(shí)候,前后篩選結(jié)果不具有可靠性。

隔離級(jí)別

根據(jù)上面這三種問題,產(chǎn)生了四種隔離級(jí)別,表明數(shù)據(jù)庫不同程度的隔離性質(zhì)。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

在實(shí)際的數(shù)據(jù)庫設(shè)計(jì)中,隔離級(jí)別越高,導(dǎo)致數(shù)據(jù)庫的并發(fā)效率會(huì)越低;而隔離級(jí)別太低,又會(huì)導(dǎo)致數(shù)據(jù)庫在讀寫過程中會(huì)遇到各種亂七八糟的問題。

因此在大多數(shù)數(shù)據(jù)庫系統(tǒng)中,默認(rèn)的隔離級(jí)別時(shí)讀已提交(如Oracle)或者可重復(fù)讀RR(MySQL的InnoDB引擎)。

MVCC

又是一個(gè)難嚼的大塊頭。MVCC就是用來實(shí)現(xiàn)上面的第三個(gè)隔離級(jí)別,可重復(fù)讀RR。

MVCC:Multi-Version Concurrency Control,即多版本的并發(fā)控制協(xié)議。

MVCC的特點(diǎn)就是在同一時(shí)刻,不同事務(wù)可以讀取到不同版本的數(shù)據(jù),從而可以解決臟讀和不可重復(fù)讀的問題。

MVCC實(shí)際上就是通過數(shù)據(jù)的隱藏列和回滾日志(undo log),實(shí)現(xiàn)多個(gè)版本數(shù)據(jù)的共存。這樣的好處是,使用MVCC進(jìn)行讀數(shù)據(jù)的時(shí)候,不用加鎖,從而避免了同時(shí)讀寫的沖突。

在實(shí)現(xiàn)MVCC時(shí),每一行的數(shù)據(jù)中會(huì)額外保存幾個(gè)隱藏的列,比如當(dāng)前行創(chuàng)建時(shí)的版本號(hào)和刪除時(shí)間和指向undo log的回滾指針。這里的版本號(hào)并不是實(shí)際的時(shí)間值,而是系統(tǒng)版本號(hào)。每開始新的事務(wù),系統(tǒng)版本號(hào)都會(huì)自動(dòng)遞增。事務(wù)開始時(shí)的系統(tǒng)版本號(hào)會(huì)作為事務(wù)的版本號(hào),用來和查詢每行記錄的版本號(hào)進(jìn)行比較。

每個(gè)事務(wù)又有自己的版本號(hào),這樣事務(wù)內(nèi)執(zhí)行數(shù)據(jù)操作時(shí),就通過版本號(hào)的比較來達(dá)到數(shù)據(jù)版本控制的目的。

另外,InnoDB實(shí)現(xiàn)的隔離級(jí)別RR時(shí)可以避免幻讀現(xiàn)象的,這是通過next-key lock機(jī)制實(shí)現(xiàn)的。

next-key lock實(shí)際上就是行鎖的一種,只不過它不只是會(huì)鎖住當(dāng)前行記錄的本身,還會(huì)鎖定一個(gè)范圍。比如上面幻讀的例子,開始查詢0<閱讀量<100的文章時(shí),只查到了一個(gè)結(jié)果。next-key lock會(huì)將查詢出的這一行進(jìn)行鎖定,同時(shí)還會(huì)對(duì)0<閱讀量<100這個(gè)范圍進(jìn)行加鎖,這實(shí)際上是一種間隙鎖。間隙鎖能夠防止其他事務(wù)在這個(gè)間隙修改或者插入記錄。這樣一來,就保證了在0<閱讀量<100這個(gè)間隙中,只存在原來的一行數(shù)據(jù),從而避免了幻讀。

間隙鎖:封鎖索引記錄中的間隔

雖然InnoDB使用next-key lock能夠避免幻讀問題,但卻并不是真正的可串行化隔離。再來看一個(gè)例子吧。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

首先提一個(gè)問題:

在T6時(shí)間,事務(wù)A提交事務(wù)之后,猜一猜文章A和文章B的閱讀量為多少?

答案是,文章AB的閱讀量都被修改成了10000。這代表著事務(wù)B的提交實(shí)際上對(duì)事務(wù)A的執(zhí)行產(chǎn)生了影響,表明兩個(gè)事務(wù)之間并不是完全隔離的。雖然能夠避免幻讀現(xiàn)象,但是卻沒有達(dá)到可串行化的級(jí)別。

這還說明,避免臟讀、不可重復(fù)讀和幻讀,是達(dá)到可串行化的隔離級(jí)別的必要不充分條件??纱谢嵌寄軌虮苊馀K讀、不可重復(fù)讀和幻讀,但是避免臟讀、不可重復(fù)讀和幻讀卻不一定達(dá)到了可串行化。

 

一致性

一致性是指事務(wù)執(zhí)行結(jié)束后,數(shù)據(jù)庫的完整性約束沒有被破壞,事務(wù)執(zhí)行的前后都是合法的數(shù)據(jù)狀態(tài)。

一致性是事務(wù)追求的最終目標(biāo),原子性、持久性和隔離性,實(shí)際上都是為了保證數(shù)據(jù)庫狀態(tài)的一致性而存在的。

這就不多說了吧。你細(xì)品。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

 

MySQL日志系統(tǒng)

了解完MySQL的基本架構(gòu),大體上能夠?qū)ySQL的執(zhí)行流程有了比較清晰的認(rèn)知。接下來我將為大家介紹一下日志系統(tǒng)。

MySQL日志系統(tǒng)是數(shù)據(jù)庫的重要組件,用于記錄數(shù)據(jù)庫的更新和修改。若數(shù)據(jù)庫發(fā)生故障,可通過不同日志記錄恢復(fù)數(shù)據(jù)庫的原來數(shù)據(jù)。因此實(shí)際上日志系統(tǒng)直接決定著MySQL運(yùn)行的魯棒性和穩(wěn)健性。

MySQL的日志有很多種,如二進(jìn)制日志(binlog)、錯(cuò)誤日志、查詢?nèi)罩?、慢查詢?nèi)罩镜?,此外InnoDB存儲(chǔ)引擎還提供了兩種日志:redo log(重做日志)和undo log(回滾日志)。這里將重點(diǎn)針對(duì)InnoDB引擎,對(duì)重做日志、回滾日志和二進(jìn)制日志這三種進(jìn)行分析。

 

重做日志(redo log)

重做日志(redo log)是InnoDB引擎層的日志,用來記錄事務(wù)操作引起數(shù)據(jù)的變化,記錄的是數(shù)據(jù)頁的物理修改。

重做日記的作用其實(shí)很好理解,我打個(gè)比方。數(shù)據(jù)庫中數(shù)據(jù)的修改就好比你寫的論文,萬一哪天論文丟了怎么呢?以防這種不幸的發(fā)生,我們可以在寫論文的時(shí)候,每一次修改都拿個(gè)小本本記錄一下,記錄什么時(shí)間對(duì)某一頁進(jìn)行了怎么樣的修改。這就是重做日志。

InnoDB引擎對(duì)數(shù)據(jù)的更新,是先將更新記錄寫入redo log日志,然后會(huì)在系統(tǒng)空閑的時(shí)候或者是按照設(shè)定的更新策略再將日志中的內(nèi)容更新到磁盤之中。這就是所謂的預(yù)寫式技術(shù)(Write Ahead logging)。這種技術(shù)可以大大減少IO操作的頻率,提升數(shù)據(jù)刷新的效率。

臟數(shù)據(jù)刷盤

值得注意的是,redo log日志的大小是固定的,為了能夠持續(xù)不斷的對(duì)更新記錄進(jìn)行寫入,在redo log日志中設(shè)置了兩個(gè)標(biāo)志位置,checkpoint和write_pos,分別表示記錄擦除的位置和記錄寫入的位置。redo log日志的數(shù)據(jù)寫入示意圖可見下圖。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

當(dāng)write_pos標(biāo)志到了日志結(jié)尾時(shí),會(huì)從結(jié)尾跳至日志頭部進(jìn)行重新循環(huán)寫入。所以redo log的邏輯結(jié)構(gòu)并不是線性的,而是可看作一個(gè)圓周運(yùn)動(dòng)。write_pos與checkpoint中間的空間可用于寫入新數(shù)據(jù),寫入和擦除都是往后推移,循環(huán)往復(fù)的。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

當(dāng)write_pos追上checkpoint時(shí),表示redo log日志已經(jīng)寫滿。這時(shí)不能繼續(xù)執(zhí)行新的數(shù)據(jù)庫更新語句,需要停下來先刪除一些記錄,執(zhí)行checkpoint規(guī)則騰出可寫空間。

checkpoint規(guī)則:checkpoint觸發(fā)后,將buffer中臟數(shù)據(jù)頁和臟日志頁都刷到磁盤。

臟數(shù)據(jù):指內(nèi)存中未刷到磁盤的數(shù)據(jù)。

redo log中最重要的概念就是緩沖池buffer pool,這是在內(nèi)存中分配的一個(gè)區(qū)域,包含了磁盤中部分?jǐn)?shù)據(jù)頁的映射,作為訪問數(shù)據(jù)庫的緩沖。

當(dāng)請(qǐng)求讀取數(shù)據(jù)時(shí),會(huì)先判斷是否在緩沖池命中,如果未命中才會(huì)在磁盤上進(jìn)行檢索后放入緩沖池;

當(dāng)請(qǐng)求寫入數(shù)據(jù)時(shí),會(huì)先寫入緩沖池,緩沖池中修改的數(shù)據(jù)會(huì)定期刷新到磁盤中。這一過程也被稱之為刷臟 。

因此,當(dāng)數(shù)據(jù)修改時(shí),除了修改buffer pool中的數(shù)據(jù),還會(huì)在redo log中記錄這次操作;當(dāng)事務(wù)提交時(shí),會(huì)根據(jù)redo log的記錄對(duì)數(shù)據(jù)進(jìn)行刷盤。如果MySQL宕機(jī),重啟時(shí)可以讀取redo log中的數(shù)據(jù),對(duì)數(shù)據(jù)庫進(jìn)行恢復(fù),從而保證了事務(wù)的持久性,使得數(shù)據(jù)庫獲得crash-safe能力。

臟日志刷盤

除了上面提到的對(duì)于臟數(shù)據(jù)的刷盤,實(shí)際上redo log日志在記錄時(shí),為了保證日志文件的持久化,也需要經(jīng)歷將日志記錄從內(nèi)存寫入到磁盤的過程。redo log日志可分為兩個(gè)部分,一是存在易失性內(nèi)存中的緩存日志redo log buff,二是保存在磁盤上的redo log日志文件redo log file。

為了確保每次記錄都能夠?qū)懭氲酱疟P中的日志中,每次將redo log buffer中的日志寫入redo log file的過程中都會(huì)調(diào)用一次操作系統(tǒng)的fsync操作。

fsync函數(shù):包含在UNIX系統(tǒng)頭文件#include <unistd.h>中,用于同步內(nèi)存中所有已修改的文件數(shù)據(jù)到儲(chǔ)存設(shè)備。

在寫入的過程中,還需要經(jīng)過操作系統(tǒng)內(nèi)核空間的os buffer。redo log日志的寫入過程可見下圖。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

redo log日志刷盤流程

 

二進(jìn)制日志(binlog)

二進(jìn)制日志binlog是服務(wù)層的日志,還被稱為歸檔日志。binlog主要記錄數(shù)據(jù)庫的變化情況,內(nèi)容包括數(shù)據(jù)庫所有的更新操作。所有涉及數(shù)據(jù)變動(dòng)的操作,都要記錄進(jìn)二進(jìn)制日志中。因此有了binlog可以很方便的對(duì)數(shù)據(jù)進(jìn)行復(fù)制和備份,因而也常用作主從庫的同步。

這里binlog所存儲(chǔ)的內(nèi)容看起來似乎與redo log很相似,但是其實(shí)不然。redo log是一種物理日志,記錄的是實(shí)際上對(duì)某個(gè)數(shù)據(jù)進(jìn)行了怎么樣的修改;而binlog是邏輯日志,記錄的是SQL語句的原始邏輯,比如”給ID=2這一行的a字段加1 "。binlog日志中的內(nèi)容是二進(jìn)制的,根據(jù)日記格式參數(shù)的不同,可能基于SQL語句、基于數(shù)據(jù)本身或者二者的混合。一般常用記錄的都是SQL語句。

這里的物理和邏輯的概念,我的個(gè)人理解是:

物理的日志可看作是實(shí)際數(shù)據(jù)庫中數(shù)據(jù)頁上的變化信息,只看重結(jié)果,而不在乎是通過“何種途徑”導(dǎo)致了這種結(jié)果;

邏輯的日志可看作是通過了某一種方法或者操作手段導(dǎo)致數(shù)據(jù)發(fā)生了變化,存儲(chǔ)的是邏輯性的操作。

同時(shí),redo log是基于crash recovery,保證MySQL宕機(jī)后的數(shù)據(jù)恢復(fù);而binlog是基于point-in-time recovery,保證服務(wù)器可以基于時(shí)間點(diǎn)對(duì)數(shù)據(jù)進(jìn)行恢復(fù),或者對(duì)數(shù)據(jù)進(jìn)行備份。

事實(shí)上最開始MySQL是沒有redo log日志的。因?yàn)槠鹣萂ySQL是沒有InnoDB引擎的,自帶的引擎是MyISAM。binlog是服務(wù)層的日志,因此所有引擎都能夠使用。但是光靠binlog日志只能提供歸檔的作用,無法提供crash-safe能力,所以InnoDB引擎就采用了學(xué)自于Oracle的技術(shù),也就是redo log,這才擁有了crash-safe能力。這里對(duì)redo log日志和binlog日志的特點(diǎn)分別進(jìn)行了對(duì)比:

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

在MySQL執(zhí)行更新語句時(shí),都會(huì)涉及到redo log日志和binlog日志的讀寫。一條更新語句的執(zhí)行過程如下:

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

MySQL更新語句的執(zhí)行過程

從上圖可以看出,MySQL在執(zhí)行更新語句的時(shí)候,在服務(wù)層進(jìn)行語句的解析和執(zhí)行,在引擎層進(jìn)行數(shù)據(jù)的提取和存儲(chǔ);同時(shí)在服務(wù)層對(duì)binlog進(jìn)行寫入,在InnoDB內(nèi)進(jìn)行redo log的寫入。

不僅如此,在對(duì)redo log寫入時(shí)有兩個(gè)階段的提交,一是binlog寫入之前prepare狀態(tài)的寫入,二是binlog寫入之后commit狀態(tài)的寫入。

之所以要安排這么一個(gè)兩階段提交,自然是有它的道理的?,F(xiàn)在我們可以假設(shè)不采用兩階段提交的方式,而是采用“單階段”進(jìn)行提交,即要么先寫入redo log,后寫入binlog;要么先寫入binlog,后寫入redo log。這兩種方式的提交都會(huì)導(dǎo)致原先數(shù)據(jù)庫的狀態(tài)和被恢復(fù)后的數(shù)據(jù)庫的狀態(tài)不一致。

先寫入redo log,后寫入binlog:

在寫完redo log之后,數(shù)據(jù)此時(shí)具有crash-safe能力,因此系統(tǒng)崩潰,數(shù)據(jù)會(huì)恢復(fù)成事務(wù)開始之前的狀態(tài)。但是,若在redo log寫完時(shí)候,binlog寫入之前,系統(tǒng)發(fā)生了宕機(jī)。此時(shí)binlog沒有對(duì)上面的更新語句進(jìn)行保存,導(dǎo)致當(dāng)使用binlog進(jìn)行數(shù)據(jù)庫的備份或者恢復(fù)時(shí),就少了上述的更新語句。從而使得id=2這一行的數(shù)據(jù)沒有被更新。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

先寫入binlog,后寫入redo log:

寫完binlog之后,所有的語句都被保存,所以通過binlog復(fù)制或恢復(fù)出來的數(shù)據(jù)庫中id=2這一行的數(shù)據(jù)會(huì)被更新為a=1。但是如果在redo log寫入之前,系統(tǒng)崩潰,那么redo log中記錄的這個(gè)事務(wù)會(huì)無效,導(dǎo)致實(shí)際數(shù)據(jù)庫中id=2這一行的數(shù)據(jù)并沒有更新。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

由此可見,兩階段的提交就是為了避免上述的問題,使得binlog和redo log中保存的信息是一致的。

 

回滾日志(undo log)

回滾日志同樣也是InnoDB引擎提供的日志,顧名思義,回滾日志的作用就是對(duì)數(shù)據(jù)進(jìn)行回滾。當(dāng)事務(wù)對(duì)數(shù)據(jù)庫進(jìn)行修改,InnoDB引擎不僅會(huì)記錄redo log,還會(huì)生成對(duì)應(yīng)的undo log日志;如果事務(wù)執(zhí)行失敗或調(diào)用了rollback,導(dǎo)致事務(wù)需要回滾,就可以利用undo log中的信息將數(shù)據(jù)回滾到修改之前的樣子。

但是undo log不redo log不一樣,它屬于邏輯日志。它對(duì)SQL語句執(zhí)行相關(guān)的信息進(jìn)行記錄。當(dāng)發(fā)生回滾時(shí),InnoDB引擎會(huì)根據(jù)undo log日志中的記錄做與之前相反的工作。比如對(duì)于每個(gè)數(shù)據(jù)插入操作(insert),回滾時(shí)會(huì)執(zhí)行數(shù)據(jù)刪除操作(delete);對(duì)于每個(gè)數(shù)據(jù)刪除操作(delete),回滾時(shí)會(huì)執(zhí)行數(shù)據(jù)插入操作(insert);對(duì)于每個(gè)數(shù)據(jù)更新操作(update),回滾時(shí)會(huì)執(zhí)行一個(gè)相反的數(shù)據(jù)更新操作(update),把數(shù)據(jù)改回去。undo log由兩個(gè)作用,一是提供回滾,二是實(shí)現(xiàn)MVCC。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

 

主從復(fù)制

主從復(fù)制的概念很簡單,就是從原來的數(shù)據(jù)庫復(fù)制一個(gè)完全一樣的數(shù)據(jù)庫,原來的數(shù)據(jù)庫稱作主數(shù)據(jù)庫,復(fù)制的數(shù)據(jù)庫稱為從數(shù)據(jù)庫。從數(shù)據(jù)庫會(huì)與主數(shù)據(jù)庫進(jìn)行數(shù)據(jù)同步,保持二者的數(shù)據(jù)一致性。

主從復(fù)制的原理實(shí)際上就是通過bin log日志實(shí)現(xiàn)的。bin log日志中保存了數(shù)據(jù)庫中所有SQL語句,通過對(duì)bin log日志中SQL的復(fù)制,然后再進(jìn)行語句的執(zhí)行即可實(shí)現(xiàn)從數(shù)據(jù)庫與主數(shù)據(jù)庫的同步。

主從復(fù)制的過程可見下圖。主從復(fù)制的過程主要是靠三個(gè)線程進(jìn)行的,一個(gè)運(yùn)行在主服務(wù)器中的發(fā)送線程,用于發(fā)送binlog日志到從服務(wù)器。兩外兩個(gè)運(yùn)行在從服務(wù)器上的I/O線程和SQL線程。I/O線程用于讀取主服務(wù)器發(fā)送過來的binlog日志內(nèi)容,并拷貝到本地的中繼日志中。SQL線程用于讀取中繼日志中關(guān)于數(shù)據(jù)更新的SQL語句并執(zhí)行,從而實(shí)現(xiàn)主從庫的數(shù)據(jù)一致。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

主從復(fù)制原理

之所以需要實(shí)現(xiàn)主從復(fù)制,實(shí)際上是由實(shí)際應(yīng)用場景所決定的。主從復(fù)制能夠帶來的好處有:

1. 通過復(fù)制實(shí)現(xiàn)數(shù)據(jù)的異地備份,當(dāng)主數(shù)據(jù)庫故障時(shí),可切換從數(shù)據(jù)庫,避免數(shù)據(jù)丟失。

2. 可實(shí)現(xiàn)架構(gòu)的擴(kuò)展,當(dāng)業(yè)務(wù)量越來越大,I/O訪問頻率過高時(shí),采用多庫的存儲(chǔ),可以降低磁盤I/O訪問的頻率,提高單個(gè)機(jī)器的I/O性能。

3. 可實(shí)現(xiàn)讀寫分離,使數(shù)據(jù)庫能支持更大的并發(fā)。

4. 實(shí)現(xiàn)服務(wù)器的負(fù)載均衡,通過在主服務(wù)器和從服務(wù)器之間切分處理客戶查詢的負(fù)荷。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

 

總結(jié)

MySQL數(shù)據(jù)庫應(yīng)該算是程序員必須掌握的技術(shù)之一了。無論是項(xiàng)目過程中還是面試中,MySQL都是非常重要的基礎(chǔ)知識(shí)。不過,對(duì)于MySQL來說,真的東西太多了。我在寫這篇文章的時(shí)候,查閱了大量的資料,發(fā)現(xiàn)越看不懂的越多。還真是應(yīng)了那句話:

你知道的越多,不知道的也就越多。

這篇文章著重是從理論的角度去解析MySQL基本的事務(wù)和日志系統(tǒng)的基本原理,我在表述的時(shí)候盡可能的避免采用實(shí)際的代碼去描述。即便是這篇將近一萬字+近二十副純手工繪制的圖解,也難以將MySQL的博大精深分析透徹。

但是我相信,對(duì)于初學(xué)者而言,這些理論能夠讓你對(duì)MySQL有一個(gè)整體的感知,讓你對(duì)“何謂關(guān)系型數(shù)據(jù)庫”這么一個(gè)問題有了比較清晰的認(rèn)知;而對(duì)于熟練掌握MySQL的大佬來說,或許本文也能夠喚醒你塵封已久的底層理論基礎(chǔ),對(duì)你之后的面試也會(huì)有一定幫助。

技術(shù)這種東西沒有絕對(duì)的對(duì)錯(cuò),倘若文中有誤還請(qǐng)諒解,并歡迎與我討論。自主思考永遠(yuǎn)比被動(dòng)接受更有效。

超干貨!為了讓你徹底弄懂 MySQL 事務(wù)日志,我通宵搞出了這份圖解

 

Reference

  • https://www.cnblogs.com/kismetv/p/10331633.html

  • https://www.cnblogs.com/ivy-zheng/p/11094528.html

  • https://blog.csdn.net/qq_39016934/article/details/90116706

  • https://www.jianshu.com/p/5af73b203f2a

  • https://www.cnblogs.com/f-ck-need-u/archive/2018/05/08/9010872.html#auto_id_2


 

 

 

?TIOBE 6 月編程語言排行榜:C 與 JAVA 進(jìn)一步拉開差距、Rust 躍進(jìn) TOP 20

?20 位行業(yè)專家共話選型經(jīng)驗(yàn),CSDN「選型智囊團(tuán)高端研討會(huì)」圓滿落幕!

?馬云曾賣鮮花,柳傳志賣冰箱!擺攤吧,程序員!

?韓版馬化騰:在大財(cái)閥圍堵下仍白手起家的鳳凰男,搶灘加密交易平臺(tái)、公鏈賽道

?一個(gè)神秘URL釀大禍,差點(diǎn)讓我背鍋!

?Uber 前無人駕駛工程師告訴你,國內(nèi)無人駕駛之路還要走多久?

分享到:
標(biāo)簽:事務(wù) 日志 MySQL
用戶無頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績?cè)u(píng)定