<menuitem id="dtdv5"><dl id="dtdv5"><address id="dtdv5"></address></dl></menuitem>
<cite id="dtdv5"><span id="dtdv5"></span></cite>
<del id="dtdv5"><noframes id="dtdv5"><del id="dtdv5"></del>
<ins id="dtdv5"></ins><ins id="dtdv5"></ins>
<ins id="dtdv5"></ins>
<var id="dtdv5"><span id="dtdv5"></span></var>
<del id="dtdv5"><noframes id="dtdv5"><ins id="dtdv5"></ins><del id="dtdv5"></del>
<del id="dtdv5"><noframes id="dtdv5"><ins id="dtdv5"></ins>

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

作者:小林coding

圖解計算機基礎網站https://xiaolincoding.com/

大家好,我是小林。

之前寫過一篇 MySQL 的 MVCC 的工作原理,最近有讀者在網站上學習的時候,評論區指出了一些問題。

而這個知識點很重要,面試太常問了,所以,我就重寫了這篇文章!開車!

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

正文

這是我的錢包,共有 100 萬元。

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

今天我心情好,我決定給你的轉賬 100 萬,最后的結果肯定是我的余額變為 0 元,你的余額多了 100 萬元,是不是想到就很開心?

轉賬這一動作在程序里會涉及到一系列的操作,假設我向你轉賬 100 萬的過程是有下面這幾個步驟組成的:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

可以看到這個轉賬的過程涉及到了兩次修改數據庫的操作。

假設在執行第三步驟之后,服務器忽然掉電了,就會發生一個蛋疼的事情,我的賬戶扣了 100 萬,但是錢并沒有到你的賬戶上,也就是說這 100 萬消失了!

要解決這個問題,就要保證轉賬業務里的所有數據庫的操作是不可分割的,要么全部執行成功 ,要么全部失敗,不允許出現中間狀態的數據。

數據庫中的「事務(Transaction」就能達到這樣的效果。

我們在轉賬操作前先開啟事務,等所有數據庫操作執行完成后,才提交事務,對于已經提交的事務來說,該事務對數據庫所做的修改將永久生效,如果中途發生發生中斷或錯誤,那么該事務期間對數據庫所做的修改將會被回滾到沒執行該事務之前的狀態。


事務有哪些特性?

事務是由 MySQL 的引擎來實現的,我們常見的 InnoDB 引擎它是支持事務的。

不過并不是所有的引擎都能支持事務,比如 MySQL 原生的 MyISAM 引擎就不支持事務,也正是這樣,所以大多數 MySQL 的引擎都是用 InnoDB。

事務看起來感覺簡單,但是要實現事務必須要遵守 4 個特性,分別如下:

  • 原子性(Atomicity):一個事務中的所有操作,要么全部完成,要么全部不完成,不會結束在中間某個環節,而且事務在執行過程中發生錯誤,會被回滾到事務開始前的狀態,就像這個事務從來沒有執行過一樣;
  • 一致性(Consistency):數據庫的完整性不會因為事務的執行而受到破壞,比如表中有一個字段為姓名,它有唯一約束,也就是表中姓名不能重復,如果一個事務對姓名字段進行了修改,但是在事務提交后,表中的姓名變得非唯一性了,這就破壞了事務的一致性要求,這時數據庫就要撤銷該事務,返回初始化的狀態。
  • 隔離性(Isolation):數據庫允許多個并發事務同時對其數據進行讀寫和修改的能力,隔離性可以防止多個事務并發執行時由于交叉執行而導致數據的不一致。
  • 持久性(Durability):事務處理結束后,對數據的修改就是永久的,即便系統故障也不會丟失。

InnoDB 引擎通過什么技術來保證事務的這四個特性的呢?

  • 持久性是通過 redo log (重做日志)來保證的;
  • 原子性是通過 undo log(回滾日志) 來保證的;
  • 隔離性是通過 MVCC(多版本并發控制) 或鎖機制來保證的;
  • 一致性則是通過持久性+原子性+隔離性來保證;

這次將重點介紹事務的隔離性,這也是面試時最常問的知識的點。

為什么事務要有隔離性,我們就要知道并發事務時會引發什么問題。

并行事務會引發什么問題?

MySQL 服務端是允許多個客戶端連接的,這意味著 MySQL 會出現同時處理多個事務的情況。

那么在同時處理多個事務的時候,就可能出現臟讀(dirty read)、不可重復讀(non-repeatable read)、幻讀(phantom read)的問題。

接下來,通過舉例子給大家說明,這些問題是如何發生的。

臟讀

如果一個事務「讀到」了另一個「未提交事務修改過的數據」,就意味著發生了「臟讀」現象。

舉個栗子。

假設有 A 和 B 這兩個事務同時在處理,事務 A 先開始從數據庫中讀取小林的余額數據,然后再執行更新操作,如果此時事務 A 還沒有提交事務,而此時正好事務 B 也從數據庫中讀取小林的余額數據,那么事務 B 讀取到的余額數據是剛才事務 A 更新后的數據,即使沒有提交事務。

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

因為事務 A 是還沒提交事務的,也就是它隨時可能發生回滾操作,如果在上面這種情況事務 A 發生了回滾,那么事務 B 剛才得到的數據就是過期的數據,這種現象就被稱為臟讀。

不可重復讀

在一個事務內多次讀取同一個數據,如果出現前后兩次讀到的數據不一樣的情況,就意味著發生了「不可重復讀」現象。

舉個栗子。

假設有 A 和 B 這兩個事務同時在處理,事務 A 先開始從數據庫中讀取小林的余額數據,然后繼續執行代碼邏輯處理,在這過程中如果事務 B 更新了這條數據,并提交了事務,那么當事務 A 再次讀取該數據時,就會發現前后兩次讀到的數據是不一致的,這種現象就被稱為不可重復讀。

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

幻讀

在一個事務內多次查詢某個符合查詢條件的「記錄數量」,如果出現前后兩次查詢到的記錄數量不一樣的情況,就意味著發生了「幻讀」現象。

舉個栗子。

假設有 A 和 B 這兩個事務同時在處理,事務 A 先開始從數據庫查詢賬戶余額大于 100 萬的記錄,發現共有 5 條,然后事務 B 也按相同的搜索條件也是查詢出了 5 條記錄。

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

接下來,事務 A 插入了一條余額超過 100 萬的賬號,并提交了事務,此時數據庫超過 100 萬余額的賬號個數就變為 6。

然后事務 B 再次查詢賬戶余額大于 100 萬的記錄,此時查詢到的記錄數量有 6 條,發現和前一次讀到的記錄數量不一樣了,就感覺發生了幻覺一樣,這種現象就被稱為幻讀。

事務的隔離級別有哪些?

前面我們提到,當多個事務并發執行時可能會遇到「臟讀、不可重復讀、幻讀」的現象,這些現象會對事務的一致性產生不同程序的影響。

  • 臟讀:讀到其他事務未提交的數據;
  • 不可重復讀:前后讀取的數據不一致;
  • 幻讀:前后讀取的記錄數量不一致。

這三個現象的嚴重性排序如下:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

SQL 標準提出了四種隔離級別來規避這些現象,隔離級別越高,性能效率就越低,這四個隔離級別如下:

  • 讀未提交(read uncommitted,指一個事務還沒提交時,它做的變更就能被其他事務看到;
  • 讀提交(read committed,指一個事務提交之后,它做的變更才能被其他事務看到;
  • 可重復讀(repeatable read,指一個事務執行過程中看到的數據,一直跟這個事務啟動時看到的數據是一致的,MySQL InnoDB 引擎的默認隔離級別;
  • 串行化(serializable;會對記錄加上讀寫鎖,在多個事務對這條記錄進行讀寫操作時,如果發生了讀寫沖突的時候,后訪問的事務必須等前一個事務執行完成,才能繼續執行;

按隔離水平高低排序如下:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

針對不同的隔離級別,并發事務時可能發生的現象也會不同。

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

也就是說:

  • 在「讀未提交」隔離級別下,可能發生臟讀、不可重復讀和幻讀現象;
  • 在「讀提交」隔離級別下,可能發生不可重復讀和幻讀現象,但是不可能發生臟讀現象;
  • 在「可重復讀」隔離級別下,可能發生幻讀現象,但是不可能臟讀和不可重復讀現象;
  • 在「串行化」隔離級別下,臟讀、不可重復讀和幻讀現象都不可能會發生。

所以,要解決臟讀現象,就要升級到「讀提交」以上的隔離級別;要解決不可重復讀現象,就要升級到「可重復讀」的隔離級別。

不過,要解決幻讀現象不建議將隔離級別升級到「串行化」,因為這樣會導致數據庫在并發事務時性能很差。

InnoDB 引擎的默認隔離級別雖然是「可重復讀」,但是它通過next-key lock 鎖(行鎖和間隙鎖的組合)來鎖住記錄之間的“間隙”和記錄本身,防止其他事務在這個記錄之間插入新的記錄,這樣就避免了幻讀現象。

接下里,舉個具體的例子來說明這四種隔離級別,有一張賬戶余額表,里面有一條記錄:

然后有兩個并發的事務,事務 A 只負責查詢余額,事務 B 則會將我的余額改成 200 萬,下面是按照時間順序執行兩個事務的行為:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

在不同隔離級別下,事務 A 執行過程中查詢到的余額可能會不同:

  • 在「讀未提交」隔離級別下,事務 B 修改余額后,雖然沒有提交事務,但是此時的余額已經可以被事務 A 看見了,于是事務 A 中余額 V1 查詢的值是 200 萬,余額 V2、V3 自然也是 200 萬了;
  • 在「讀提交」隔離級別下,事務 B 修改余額后,因為沒有提交事務,所以事務 A 中余額 V1 的值還是 100 萬,等事務 B 提交完后,最新的余額數據才能被事務 A 看見,因此額 V2、V3 都是 200 萬;
  • 在「可重復讀」隔離級別下,事務 A 只能看見啟動事務時的數據,所以余額 V1、余額 V2 的值都是 100 萬,當事務 A 提交事務后,就能看見最新的余額數據了,所以余額 V3 的值是 200 萬;
  • 在「串行化」隔離級別下,事務 B 在執行將余額 100 萬修改為 200 萬時,由于此前事務 A 執行了讀操作,這樣就發生了讀寫沖突,于是就會被鎖住,直到事務 A 提交后,事務 B 才可以繼續執行,所以從 A 的角度看,余額 V1、V2 的值是 100 萬,余額 V3 的值是 200萬。

這四種隔離級別具體是如何實現的呢?

  • 對于「讀未提交」隔離級別的事務來說,因為可以讀到未提交事務修改的數據,所以直接讀取最新的數據就好了;
  • 對于「串行化」隔離級別的事務來說,通過加讀寫鎖的方式來避免并行訪問;
  • 對于「讀提交」和「可重復讀」隔離級別的事務來說,它們是通過 Read View 來實現的,它們的區別在于創建 Read View 的時機不同,大家可以把 Read View 理解成一個數據快照,就像相機拍照那樣,定格某一時刻的風景。「讀提交」隔離級別是在「每個語句執行前」都會重新生成一個 Read View,而「可重復讀」隔離級別是「啟動事務時」生成一個 Read View,然后整個事務期間都在用這個 Read View。

注意,執行「開始事務」命令,并不意味著啟動了事務。在 MySQL 有兩種開啟事務的命令,分別是:

  • 第一種:begin/start transaction 命令;
  • 第二種:start transaction with consistent snapshot 命令;

這兩種開啟事務的命令,事務的啟動時機是不同的:

  • 執行了 begin/start transaction 命令后,并不代表事務啟動了。只有在執行這個命令后,執行了增刪查改操作的 SQL 語句,才是事務真正啟動的時機;
  • 執行了 start transaction with consistent snapshot 命令,就會馬上啟動事務。

接下來詳細說下,Read View 在 MVCC 里如何工作的?

Read View 在 MVCC 里如何工作的?

我們需要了解兩個知識:

  • Read View 中四個字段作用;
  • 聚簇索引記錄中兩個跟事務有關的隱藏列;

那 Read View 到底是個什么東西?

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

Read View 有四個重要的字段:

  • m_ids :指的是在創建 Read View 時,當前數據庫中「活躍事務」的事務 id 列表,注意是一個列表,“活躍事務”指的就是,啟動了但還沒提交的事務。
  • min_trx_id :指的是在創建 Read View 時,當前數據庫中「活躍事務」中事務 id 最小的事務,也就是 m_ids 的最小值。
  • max_trx_id :這個并不是 m_ids 的最大值,而是創建 Read View 時當前數據庫中應該給下一個事務的 id 值,也就是全局最大的事務 id + 1。
  • creator_trx_id :指的是創建該 Read View 的事務的事務 id。

知道了 Read View 的字段,我們還需要了解聚簇索引記錄中的兩個隱藏列。

假設在賬戶余額表插入一條小林余額為 100 萬的記錄,然后我把這兩個隱藏列也畫出來,該記錄的整個示意圖如下:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

對于使用 InnoDB 存儲引擎的數據庫表,它的聚簇索引記錄中都包含下面兩個隱藏列:

  • trx_id,當一個事務對某條聚簇索引記錄進行改動時,就會把該事務的事務 id 記錄在 trx_id 隱藏列里;
  • roll_pointer,每次對某條聚簇索引記錄進行改動時,都會把舊版本的記錄寫入到 undo 日志中,然后這個隱藏列是個指針,指向每一個舊版本記錄,于是就可以通過它找到修改前的記錄。

在創建 Read View 后,我們可以將記錄中的 trx_id 劃分這三種情況:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

一個事務去訪問記錄的時候,除了自己的更新記錄總是可見之外,還有這幾種情況:

  • 如果記錄的 trx_id 值小于 Read View 中的 min_trx_id 值,表示這個版本的記錄是在創建 Read View 已經提交的事務生成的,所以該版本的記錄對當前事務可見。
  • 如果記錄的 trx_id 值大于等于 Read View 中的 max_trx_id 值,表示這個版本的記錄是在創建 Read View 才啟動的事務生成的,所以該版本的記錄對當前事務不可見。
  • 如果記錄的 trx_id 值在 Read View 的 min_trx_idmax_trx_id 之間,需要判斷 trx_id 是否在 m_ids 列表中:
    • 如果記錄的 trx_id m_ids 列表中,表示生成該版本記錄的活躍事務依然活躍著(還沒提交事務),所以該版本的記錄對當前事務不可見。
    • 如果記錄的 trx_id 不在 m_ids 列表中,表示生成該版本記錄的活躍事務已經被提交,所以該版本的記錄對當前事務可見。

這種通過「版本鏈」來控制并發事務訪問同一個記錄時的行為就叫 MVCC(多版本并發控制)。

可重復讀是如何工作的?

可重復讀隔離級別是啟動事務時生成一個 Read View,然后整個事務期間都在用這個 Read View。

假設事務 A (事務 id 為51)啟動后,緊接著事務 B (事務 id 為52)也啟動了,那這兩個事務創建的 Read View 如下:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

事務 A 和 事務 B 的 Read View 具體內容如下:

  • 在事務 A 的 Read View 中,它的事務 id 是 51,由于它是第一個啟動的事務,所以此時活躍事務的事務 id 列表就只有 51,活躍事務的事務 id 列表中最小的事務 id 是事務 A 本身,下一個事務 id 則是 52。
  • 在事務 B 的 Read View 中,它的事務 id 是 52,由于事務 A 是活躍的,所以此時活躍事務的事務 id 列表是 51 和 52,活躍的事務 id 中最小的事務 id 是事務 A,下一個事務 id 應該是 53。

接著,在可重復讀隔離級別下,事務 A 和事務 B 按順序執行了以下操作:

  • 事務 B 讀取小林的賬戶余額記錄,讀到余額是 100 萬;
  • 事務 A 將小林的賬戶余額記錄修改成 200 萬,并沒有提交事務;
  • 事務 B 讀取小林的賬戶余額記錄,讀到余額還是 100 萬;
  • 事務 A 提交事務;
  • 事務 B 讀取小林的賬戶余額記錄,讀到余額依然還是 100 萬;

接下來,跟大家具體分析下。

事務 B 第一次讀小林的賬戶余額記錄,在找到記錄后,它會先看這條記錄的 trx_id,此時發現 trx_id 為 50,比事務 B 的 Read View 中的 min_trx_id 值(51)還小,這意味著修改這條記錄的事務早就在事務 B 啟動前提交過了,所以該版本的記錄對事務 B 可見的,也就是事務 B 可以獲取到這條記錄。

接著,事務 A 通過 update 語句將這條記錄修改了(還未提交事務),將小林的余額改成 200 萬,這時 MySQL 會記錄相應的 undo log,并以鏈表的方式串聯起來,形成版本鏈,如下圖:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

你可以在上圖的「記錄的字段」看到,由于事務 A 修改了該記錄,以前的記錄就變成舊版本記錄了,于是最新記錄和舊版本記錄通過鏈表的方式串起來,而且最新記錄的 trx_id 是事務 A 的事務 id(trx_id = 51)。

然后事務 B 第二次去讀取該記錄,發現這條記錄的 trx_id 值為 51,在事務 B 的 Read View 的 min_trx_id 和 max_trx_id 之間,則需要判斷 trx_id 值是否在 m_ids 范圍內,判斷的結果是在的,那么說明這條記錄是被還未提交的事務修改的,這時事務 B 并不會讀取這個版本的記錄。而是沿著 undo log 鏈條往下找舊版本的記錄,直到找到 trx_id 「小于」事務 B 的 Read View 中的 min_trx_id 值的第一條記錄,所以事務 B 能讀取到的是 trx_id 為 50 的記錄,也就是小林余額是 100 萬的這條記錄。

最后,當事物 A 提交事務后,由于隔離級別時「可重復讀」,所以事務 B 再次讀區記錄時,還是基于啟動事務時創建的 Read View 來判斷當前版本的記錄是否可見。所以,即使事物 A 將小林余額修改為 200 萬并提交了事務, 事務 B 第三次讀取記錄時,讀到的記錄都是小林余額是 100 萬的這條記錄。

就是通過這樣的方式實現了,「可重復讀」隔離級別下在事務期間讀到的記錄都是事務啟動前的記錄。

讀提交是如何工作的?

讀提交隔離級別是在每次讀取數據時,都會生成一個新的 Read View。

也意味著,事務期間的多次讀取同一條數據,前后兩次讀的數據可能會出現不一致,因為可能這期間另外一個事務修改了該記錄,并提交了事務。

那讀提交隔離級別是怎么工作呢?我們還是以前面的例子來聊聊。

假設事務 A (事務 id 為51)啟動后,緊接著事務 B (事務 id 為52)也啟動了,接著按順序執行了以下操作:

  • 事務 B 讀取數據(創建 Read View),小林的賬戶余額為 100 萬;
  • 事務 A 修改數據(還沒提交事務),將小林的賬戶余額從 100 萬修改成了 200 萬;
  • 事務 B 讀取數據(創建 Read View),小林的賬戶余額為 100 萬;
  • 事務 A 提交事務;
  • 事務 B 讀取數據(創建 Read View),小林的賬戶余額為 200 萬;

那具體怎么做到的呢?我們重點看事務 B 每次讀取數據時創建的 Read View。前兩次 事務 B 讀取數據時創建的 Read View 如下圖:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP

我們來分析下為什么事務 B 第二次讀數據時,讀不到事務 A (還未提交事務)修改的數據?

事務 B 在找到小林這條記錄時,會看這條記錄的 trx_id 是 51,在事務 B 的 Read View 的 min_trx_id 和 max_trx_id 之間,接下來需要判斷 trx_id 值是否在 m_ids 范圍內,判斷的結果是在的,那么說明這條記錄是被還未提交的事務修改的,這時事務 B 并不會讀取這個版本的記錄。而是,沿著 undo log 鏈條往下找舊版本的記錄,直到找到 trx_id 「小于」事務 B 的 Read View 中的 min_trx_id 值的第一條記錄,所以事務 B 能讀取到的是 trx_id 為 50 的記錄,也就是小林余額是 100 萬的這條記錄。

我們來分析下為什么事務 A 提交后,事務 B 就可以讀到事務 A 修改的數據?

在事務 A 提交后,由于隔離級別是「讀提交」,所以事務 B 在每次讀數據的時候,會重新創建 Read View,此時事務 B 第三次讀取數據時創建的 Read View 如下:

面試官:什么是MySQL 事務與 MVCC 原理?-LMLPHP在這里插入圖片描述

事務 B 在找到小林這條記錄時,會發現這條記錄的 trx_id 是 51,比事務 B 的 Read View 中的 min_trx_id 值(52)還小,這意味著修改這條記錄的事務早就在創建 Read View 前提交過了,所以該版本的記錄對事務 B 是可見的。

正是因為在讀提交隔離級別下,事務每次讀數據時都重新創建 Read View,那么在事務期間的多次讀取同一條數據,前后兩次讀的數據可能會出現不一致,因為可能這期間另外一個事務修改了該記錄,并提交了事務。

總結

事務是在 MySQL 引擎層實現的,我們常見的 InnoDB 引擎是支持事務的,事務的四大特性是原子性、一致性、隔離性、持久性,我們這次主要講的是隔離性。

當多個事務并發執行的時候,會引發臟讀、不可重復讀、幻讀這些問題,那為了避免這些問題,SQL 提出了四種隔離級別,分別是讀未提交、讀已提交、可重復讀、串行化,從左往右隔離級別順序遞增,隔離級別越高,意味著性能越差,InnoDB 引擎的默認隔離級別是可重復讀。

要解決臟讀現象,就要將隔離級別升級到讀已提交以上的隔離級別,要解決不可重復讀現象,就要將隔離級別升級到可重復讀以上的隔離級別。

而對于幻讀現象,不建議將隔離級別升級為串行化,因為這會導致數據庫并發時性能很差。InnoDB 引擎的默認隔離級別雖然是「可重復讀」,但是它通過 next-key lock 鎖(行鎖+間隙鎖的組合)來鎖住記錄之間的“間隙”和記錄本身,防止其他事務在這個記錄之間插入新的記錄,這樣就避免了幻讀現象。

對于「讀提交」和「可重復讀」隔離級別的事務來說,它們是通過 **Read View **來實現的,它們的區別在于創建 Read View 的時機不同:

  • 「讀提交」隔離級別是在每個 select 都會生成一個新的 Read View,也意味著,事務期間的多次讀取同一條數據,前后兩次讀的數據可能會出現不一致,因為可能這期間另外一個事務修改了該記錄,并提交了事務。
  • 「可重復讀」隔離級別是啟動事務時生成一個 Read View,然后整個事務期間都在用這個 Read View,這樣就保證了在事務期間讀到的數據都是事務啟動前的記錄。

這兩個隔離級別實現是通過「事務的 Read View 里的字段」和「記錄中的兩個隱藏列」的比對,來控制并發事務訪問同一個記錄時的行為,這就叫 MVCC(多版本并發控制)。

在可重復讀隔離級別中,普通的 select 語句就是基于 MVCC 實現的快照讀,也就是不會加鎖的。而 select .. for update 語句就不是快照讀了,而是當前讀了,也就是每次讀都是拿到最新版本的數據,但是它會對讀到的記錄加上 next-key lock 鎖。

微信搜索公眾號:「小林coding」 ,回復「圖解」即可免費獲得「圖解網絡、圖解系統、圖解MySQL、圖解Redis」PDF 電子書
04-01 10:27
护士巨好爽好大乳 - 成男女人看片免费视频播放人 - 久青青在线观看视频国产 - 97中文字幕在线