多階段提交協(xié)議是專用的共識(shí)協(xié)議,其中常見(jiàn)的是兩階段提交協(xié)議(2PC)和三階段提交協(xié)議(3PC)。這些協(xié)議的目的是協(xié)調(diào)參與分布式原子事務(wù)的進(jìn)程,決定是提交還是終止(回退)事務(wù)。由于這些算法能夠處理整個(gè)系統(tǒng)網(wǎng)絡(luò)或進(jìn)程方面的故障,所以它們常被當(dāng)作分布式數(shù)據(jù)存儲(chǔ)或處理的解決方案。
2PC的基礎(chǔ)算法由兩個(gè)階段構(gòu)成。第一個(gè)階段是表決階段,即主存儲(chǔ)設(shè)備或協(xié)調(diào)程序向所有參與者或其他存儲(chǔ)設(shè)備發(fā)起“提交請(qǐng)求”。在提交前,所有參與者都處理事務(wù),提交后參與者會(huì)告知主存儲(chǔ)或協(xié)調(diào)程序它們能夠提交了,或者投贊成票了。這就可以開(kāi)始第二階段了,即完成階段,主存儲(chǔ)設(shè)備給所有參與者發(fā)送提交信號(hào),參與者們開(kāi)始提交數(shù)據(jù)。只要有參與者提交失敗,回退信號(hào)就會(huì)發(fā)送給所有參與者,事務(wù)將被終止。
到目前為止,該協(xié)議聽(tīng)起來(lái)相當(dāng)不錯(cuò),因?yàn)樵诜植际綌?shù)據(jù)庫(kù)環(huán)境中提供了事務(wù)的原子性。暫且不要這么早下結(jié)論。它在步驟A中發(fā)起了事務(wù)。那么在主數(shù)據(jù)庫(kù)告知應(yīng)用服務(wù)器事務(wù)完成(步驟C)前,所有的2PC步驟都要完成(步驟B)。在整個(gè)過(guò)程中,應(yīng)用服務(wù)器上的線程都要等待SQL查詢結(jié)束,且數(shù)據(jù)庫(kù)響應(yīng)了這一事務(wù)。這一示例非常常見(jiàn),網(wǎng)絡(luò)上幾乎所有的用戶購(gòu)買、注冊(cè)或競(jìng)價(jià)的事務(wù),都可能用2PC實(shí)現(xiàn)。但是,把應(yīng)用服務(wù)器鎖住那么久,會(huì)造成可怕的后果。即使你可能認(rèn)為自己的應(yīng)用服務(wù)器還有充足的容量,或者由于應(yīng)用服務(wù)器是商用硬件,可以用較低的成本擴(kuò)展它們,但還要考慮鎖定同樣會(huì)發(fā)生在數(shù)據(jù)庫(kù)端。在執(zhí)行提交操作時(shí),假設(shè)你采用的是行鎖,那么在所有數(shù)據(jù)提交完之前,所有的數(shù)據(jù)行都會(huì)被鎖住。如果采用的是塊鎖,結(jié)果會(huì)更糟我們已經(jīng)大范圍地實(shí)現(xiàn)了2PC協(xié)議,結(jié)果是災(zāi)難性的,這要完全歸昝于該方法的鎖定和等待特性。在實(shí)現(xiàn)2PC協(xié)議前,數(shù)據(jù)庫(kù)最初每秒可以處理幾千個(gè)讀操作和寫(xiě)操作。在一小部分(少于20%)調(diào)用中引人了2PC后,整個(gè)站點(diǎn)能處理的事務(wù)量只有以前的1/4。即使我們能增加更多的應(yīng)用服務(wù)器,但由于數(shù)據(jù)被鎖定了,網(wǎng)站建設(shè)數(shù)據(jù)庫(kù)也不能處理更多的查詢。雖然2PC協(xié)議看起來(lái)是個(gè)比Y軸劃分或乙軸劃分更好的分割數(shù)據(jù)庫(kù)的方法,但仔細(xì)考慮后就會(huì)發(fā)現(xiàn)很多問(wèn)題。要用更好的辦法拆分?jǐn)?shù)據(jù)庫(kù)表,而不是用多階段提交協(xié)議延長(zhǎng)單一數(shù)據(jù)庫(kù)的生命。
本文地址:http://m.knowyourextract.com//article/3498.html