一、二階段提交演算法描述
在分布式系統中,事務往往包含有多個參與者的活動,單個參與者上的活動是能夠保證原子性的,而多個參與者之間原子性的保證則需要通過兩階段提交來實現,兩階段提交是分布式事務實現的關鍵。
很明顯,兩階段提交保證了分布式事務的原子性,這些子事務要麼都做,要麼都不做。而資料庫的一致性是由資料庫的完整性約束實現的,永續性則是通過commit日誌來實現的,不是由兩階段提交來保證的。至於兩階段提交如何保證隔離性,可以參考large-scale incremental processing using distributed transactions and notifications中兩階段提交的具體實現。
兩階段提交的過程涉及到協調者和參與者。協調者可以看做成事務的發起者,同時也是事務的乙個參與者。對於乙個分布式事務來說,乙個事務是涉及到多個參與者的。具體的兩階段提交的過程如下:
第一階段:
首先,協調者在自身節點的日誌中寫入一條的日誌記錄,然後所有參與者傳送訊息prepare t,詢問這些參與者(包括自身),是否能夠提交這個事務;
參與者在接受到這個prepare t 訊息以後,會根據自身的情況,進行事務的預處理,如果參與者能夠提交該事務,則會將日誌寫入磁碟,並返回給協調者乙個ready t資訊,同時自身進入可提交狀態;如果不能提交該事務,則記錄日誌,並返回乙個not commit t資訊給協調者,同時撤銷在自身上所做的資料庫改;
第二階段:
協調者會收集所有參與者的意見。(1)如果收到參與者發來的not commit t資訊,則標識著該事務不能提交,協調者會將abort t 記錄到日誌中,並向所有參與者傳送乙個abort t 資訊,讓所有參與者撤銷在自身上所有的預操作;(2)如果協調者收到所有參與者發來prepare t資訊,那麼協調者會將commit t日誌寫入磁碟,並向所有參與者傳送乙個commit t資訊,提交該事務。(3)若協調者遲遲未收到某個參與者發來的資訊,則認為該參與者傳送了乙個vote_abort資訊,從而取消該事務的執行。
參與者接收到協調者發來的abort t資訊以後,參與者會終止提交,並將abort t 記錄到日誌中;如果參與者收到的是commit t資訊,則會將事務進行提交,並寫入記錄。
二、可能出現的問題
一般情況下,兩階段提交機制都能較好的執行,但可能出現下面三種問題:
(1)協調者不宕機,參與者宕機;
(2)協調者宕機,參與者不宕機;
(3)協調者宕機,參與者也宕機;
對於(1),當在事務進行過程中,有參與者宕機時,他重啟以後,可以通過詢問其他參與者或者協調者,從而知道這個事務到底提交了沒有。當然,這一切的前提都是各個參與者在進行每一步操作時,都會事先寫入日誌。
對於(2),協調者宕機後,可以起新的協調者,然後查詢所有參與者的狀態是否有commit的,如果有,則繼續commit,如果都沒有,則abort。
對於(3),是唯一乙個兩階段提交不能解決的困境是:當協調者在發出commit t訊息後宕機了,而唯一收到這條命令的乙個參與者也宕機了,這個時候這個事務就處於乙個未知的狀態,沒有人知道這個事務到底是提交了還是未提交,從而需要資料庫管理員的介入,防止資料庫進入乙個不一致的狀態。當然,如果有乙個前提是:所有節點或者網路的異常最終都會恢復,那麼這個問題就不存在了,協調者和參與者最終會重啟,其他節點也最終也會收到commit t的資訊。
對於上面的困境,業界提出了三階段提交的方法來此問題,即將二階段提交的第二階段再分為待定階段(或預提交階段)和確定階段,從而變為三階段;在待定階段協調者log prepare_commit訊息後向所有參與者傳送prepare_commit訊息, 待收到所有參與者回包(這裡的回包結果只會成功)或超時時就進入第三段階,log commit訊息並向所有參與者傳送commit訊息。如果在待定階段和確定階段出現協調者和部分參與者同時宕機(即上面的困境),只要存活的協調者或參與者裡有prepare_commit或commit訊息,新的協調者可以繼續進行commit訊息,如果沒有,就不commit訊息,從而保證資料的一致性。
3 日誌
資料庫日誌保證了事務執行的原子性和永續性,日誌型別可以分為redo log,undo log,undo/redo log
分布式事務 二階段提交與三階段提交
一 二階段提交演算法描述 在分布式系統中,事務往往包含有多個參與者的活動,單個參與者上的活動是能夠保證原子性的,而多個參與者之間原子性的保證則需要通過兩階段提交來實現,兩階段提交是分布式事務實現的關鍵。很明顯,兩階段提交保證了分布式事務的原子性,這些子事務要麼都做,要麼都不做。而資料庫的一致性是由資...
分布式事務 二階段提交與三階段提交
一 二階段提交演算法描述 在分布式系統中,事務往往包含有多個參與者的活動,單個參與者上的活動是能夠保證原子性的,而多個參與者之間原子性的保證則需要通過兩階段提交來實現,兩階段提交是分布式事務實現的關鍵。很明顯,兩階段提交保證了分布式事務的原子性,這些子事務要麼都做,要麼都不做。而資料庫的一致性是由資...
分布式事務 二階段提交與三階段提交
一 二階段提交演算法描述 在分布式系統中,事務往往包含有多個參與者的活動,單個參與者上的活動是能夠保證原子性的,而多個參與者之間原子性的保證則需要通過兩階段提交來實現,兩階段提交是分布式事務實現的關鍵。很明顯,兩階段提交保證了分布式事務的原子性,這些子事務要麼都做,要麼都不做。而資料庫的一致性是由資...