天天精品国产av九九久久久,少少妇bbwbbw高潮喷水

在數(shù)據(jù)庫(kù)系統(tǒng)發(fā)展的歷史長(zhǎng)河中，故障恢復(fù)問(wèn)題始終伴隨左右，也深刻影響著數(shù)據(jù)庫(kù)結(jié)構(gòu)的發(fā)展變化。通過(guò)故障恢復(fù)機(jī)制，可以實(shí)現(xiàn)數(shù)據(jù)庫(kù)的兩個(gè)至關(guān)重要的特性：Durability of Updates以及Failure Atomic，也就是我們常說(shuō)的的ACID中的A和D。磁盤(pán)數(shù)據(jù)庫(kù)由于其卓越的性?xún)r(jià)比一直以來(lái)都占據(jù)數(shù)據(jù)庫(kù)應(yīng)用的主流位置。然而，由于需要協(xié)調(diào)內(nèi)存和磁盤(pán)兩種截然不同的存儲(chǔ)介質(zhì)，在處理故障恢復(fù)問(wèn)題時(shí)也增加了很多的復(fù)雜度。隨著學(xué)術(shù)界及工程界的共同努力及硬件本身的變化，磁盤(pán)數(shù)據(jù)庫(kù)的故障恢復(fù)機(jī)制也不斷的迭代更新，尤其近些年來(lái)，隨著NVM的浮現(xiàn)，圍繞新硬件的研究也如雨后春筍出現(xiàn)。

本文希望通過(guò)分析不同時(shí)間點(diǎn)的關(guān)鍵研究成果，來(lái)梳理數(shù)據(jù)庫(kù)故障恢復(fù)問(wèn)題的本質(zhì)，其發(fā)展及優(yōu)化方向，以及隨著硬件變化而發(fā)生的變化。文章將首先描述故障恢復(fù)問(wèn)題本身；然后按照基本的時(shí)間順序介紹傳統(tǒng)數(shù)據(jù)庫(kù)中故障恢復(fù)機(jī)制的演進(jìn)及優(yōu)化；之后思考新硬件帶來(lái)的機(jī)遇與挑戰(zhàn)；并引出圍繞新硬件的兩個(gè)不同方向的研究成果；最后進(jìn)行總結(jié)。

問(wèn)題

數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)行過(guò)程中可能遇到的故障類(lèi)型主要包括，Transaction Failure，Process Failure，System Failure以及Media Failure。其中Transaction Failure可能是應(yīng)用程序的主動(dòng)回滾，也可能是并發(fā)控制機(jī)制發(fā)現(xiàn)沖突后的強(qiáng)制Abort；Process Failure指的是由于各種原因?qū)е碌倪M(jìn)程退出，進(jìn)程內(nèi)存內(nèi)容會(huì)丟失；System Failure來(lái)源于操作系統(tǒng)或硬件故障，同樣會(huì)導(dǎo)致內(nèi)存丟失；Media Failure則是存儲(chǔ)介質(zhì)的不可恢復(fù)損壞。數(shù)據(jù)庫(kù)系統(tǒng)需要正確合理的處理這些故障，從而保證系統(tǒng)的正確性。為此需要提供兩個(gè)特性：

Durability of Updates：已經(jīng)Commit的事務(wù)的修改，故障恢復(fù)后仍然存在；

Failure Atomic：失敗事務(wù)的所有修改都不可見(jiàn)。

因此，故障恢復(fù)的問(wèn)題描述為：即使在出現(xiàn)故障的情況下，數(shù)據(jù)庫(kù)依然能夠通過(guò)提供Durability及Atomic特性，保證恢復(fù)后的數(shù)據(jù)庫(kù)狀態(tài)正確。然而，要解決這個(gè)問(wèn)題并不是一個(gè)簡(jiǎn)單的事情，由于內(nèi)存及磁盤(pán)不同的數(shù)據(jù)組織方式及性能差異，為了不顯著犧牲數(shù)據(jù)庫(kù)性能，長(zhǎng)久以來(lái)人們對(duì)故障恢復(fù)機(jī)制進(jìn)行了一系列的探索。

Shadow Paging

1981年，JIM GRAY等人在《The Recovery Manager of the System R Database Manager》采用了一種非常直觀的解決方式Shadow Paging[1]。System R的磁盤(pán)數(shù)據(jù)采用Page為最小的組織單位，一個(gè)File由多個(gè)Page組成，并通過(guò)稱(chēng)為Direcotry的元數(shù)據(jù)進(jìn)行索引，每個(gè)Directory項(xiàng)紀(jì)錄了當(dāng)前文件的Page Table，指向其包含的所有Page。采用Shadow Paging的文件稱(chēng)為Shadow File，如下圖中的File B所示，這種文件會(huì)包含兩個(gè)Directory項(xiàng)，Current及Shawing。

事務(wù)對(duì)文件進(jìn)行修改時(shí)，會(huì)獲得新的Page，并加入Current的Page Table，所有的修改都只發(fā)生在Current Directory；事務(wù)Commit時(shí)，Current指向的Page刷盤(pán)，并通過(guò)原子的操作將Current的Page Table合并到Shadow Directory中，之后再返回應(yīng)用Commit成功；事務(wù)Abort時(shí)只需要簡(jiǎn)單的丟棄Current指向的Page；如果過(guò)程中發(fā)生故障，恢復(fù)時(shí)只需要恢復(fù)Shadow Directory，相當(dāng)于對(duì)所有未提交事務(wù)的回滾操作。Shadow Paging很方便的實(shí)現(xiàn)了：

Durability of Updates：事務(wù)完成Commit后，所有修改的Page已經(jīng)落盤(pán)，合并到Shadow后，其所有的修改可以在故障后恢復(fù)出來(lái)。

Failure Atomic：回滾的事務(wù)由于沒(méi)有Commit，從未影響Shadow Directory，因此其所有修改不可見(jiàn)。

雖然Shadow Paging設(shè)計(jì)簡(jiǎn)單直觀，但它的一些缺點(diǎn)導(dǎo)致其并沒(méi)有成為主流，首先不支持Page內(nèi)并發(fā)，一個(gè)Commit操作會(huì)導(dǎo)致其Page上所有事務(wù)的修改被提交，因此一個(gè)Page內(nèi)只能包含一個(gè)事務(wù)的修改；其次不斷修改Page的物理位置，導(dǎo)致很難將相關(guān)的頁(yè)維護(hù)在一起，破壞局部性；另外，對(duì)大事務(wù)而言，Commit過(guò)程在關(guān)鍵路勁上修改Shadow Directory的開(kāi)銷(xiāo)可能很大，同時(shí)這個(gè)操作還必須保證原子；最后，增加了垃圾回收的負(fù)擔(dān)，包括對(duì)失敗事務(wù)的Current Pages和提交事務(wù)的Old Pages的回收。

WAL

由于傳統(tǒng)磁盤(pán)順序訪問(wèn)性能遠(yuǎn)好于隨機(jī)訪問(wèn)的特征，采用Logging的故障恢復(fù)機(jī)制意圖利用順序?qū)懙腖og來(lái)記錄對(duì)數(shù)據(jù)庫(kù)的操作，并在故障恢復(fù)后通過(guò)Log內(nèi)容將數(shù)據(jù)庫(kù)恢復(fù)到正確的狀態(tài)。簡(jiǎn)單的說(shuō)，采用Log機(jī)制的數(shù)據(jù)庫(kù)需要在每次修改數(shù)據(jù)內(nèi)容前先寫(xiě)順序?qū)憣?duì)應(yīng)的Log，同時(shí)為了保證恢復(fù)時(shí)可以從Log中看到最新的數(shù)據(jù)庫(kù)狀態(tài)，要求Log先于對(duì)應(yīng)的數(shù)據(jù)內(nèi)容落盤(pán)，也就是常說(shuō)的Write Ahead Log，WAL。除此之外，事務(wù)完成Commit前還需要在Log中記錄對(duì)應(yīng)的Commit標(biāo)記，以供恢復(fù)時(shí)通過(guò)Log了解當(dāng)前的事務(wù)狀態(tài)，因此還需要關(guān)注Commit標(biāo)記和事務(wù)中數(shù)據(jù)內(nèi)容的落盤(pán)順序。根據(jù)Log中記錄的內(nèi)容可以分為三類(lèi)：Undo-Only，Redo-Only，Redo-Undo。

Undo-Only Logging

Undo-Only Logging的Log記錄可以表示未，事務(wù)T修改了X的值，X的舊值是v。事務(wù)提交時(shí)，需要通過(guò)強(qiáng)制Flush保證Commit標(biāo)記落盤(pán)前，對(duì)應(yīng)事務(wù)的所有數(shù)據(jù)落盤(pán)，即落盤(pán)順序?yàn)長(zhǎng)og記錄->Data->Commit標(biāo)記?；謴?fù)時(shí)可以根據(jù)Commit標(biāo)記判斷事務(wù)的狀態(tài)，并通過(guò)Undo Log中記錄的舊值將未提交事務(wù)的修改回滾。我們來(lái)審視一下Undo-Only對(duì)Durability及Atomic的保證：

Durability of Updates：Data強(qiáng)制刷盤(pán)保證，已經(jīng)Commit的事務(wù)由于其所有Data都已經(jīng)在Commit標(biāo)記之前落盤(pán)，因此會(huì)一直存在；

Failure Atomic：Undo Log內(nèi)容保證，失敗事務(wù)的已刷盤(pán)的修改會(huì)在恢復(fù)階段通過(guò)Undo日志回滾，不再可見(jiàn)。

然而Undo-Only依然有Page內(nèi)并發(fā)的問(wèn)題，如果兩個(gè)事務(wù)的修改落到一個(gè)Page中，一個(gè)事務(wù)提交前需要的強(qiáng)制Flush操作會(huì)導(dǎo)致同Page所有事務(wù)的Data落盤(pán)，可能會(huì)早于對(duì)應(yīng)的Log項(xiàng)從而損害WAL。同時(shí)，Commit前的強(qiáng)制數(shù)據(jù)刷盤(pán)會(huì)導(dǎo)致關(guān)鍵路徑上過(guò)于頻繁的磁盤(pán)隨機(jī)訪問(wèn)。

Redo-Only Logging

不同于Undo-Only，采用Redo-Only的Log中記錄的是修改后的新值。對(duì)應(yīng)地，Commit時(shí)需要保證Log中的Commit標(biāo)記需要在事務(wù)的任何事務(wù)羅盤(pán)前落盤(pán)，即落盤(pán)順序?yàn)長(zhǎng)og記錄->Commit標(biāo)記->Data?；謴?fù)時(shí)同樣根據(jù)Commit標(biāo)記判斷事務(wù)狀態(tài)，并通過(guò)Redo Log中記錄的新值將已經(jīng)Commit，但數(shù)據(jù)沒(méi)有落盤(pán)的事務(wù)修改重放。

Durability of Updates：Redo Log內(nèi)容保證，已提交事務(wù)的未刷盤(pán)的修改，利用Redo Log中的內(nèi)容重放，之后可見(jiàn)；

Failure Atomic：阻止Commit前Data落盤(pán)保證，失敗事務(wù)的修改不會(huì)出現(xiàn)在磁盤(pán)上，自然不可見(jiàn)。

Redo-Only同樣有Page內(nèi)并發(fā)的問(wèn)題，同Page中的多個(gè)不同事務(wù)，只要有一個(gè)未提交就不能刷盤(pán)，這些數(shù)據(jù)全部都需要維護(hù)在內(nèi)存中，會(huì)造成較大的內(nèi)存壓力。

Redo-Undo Logging

可以看出的只有Undo或Redo的Logging方式的問(wèn)題主要來(lái)自與對(duì)Commit標(biāo)記及Data落盤(pán)順序的限制，而這種限制歸根結(jié)底來(lái)源于Log信息中對(duì)新值或舊值的缺失。因此Redo-Undo采用同時(shí)記錄新值和舊值的方式來(lái)取消對(duì)刷盤(pán)順序的限制。

Durability of Updates：Redo 內(nèi)容保證，已提交事務(wù)的未刷盤(pán)的修改，利用Redo Log中的內(nèi)容重放，之后可見(jiàn)；

Failure Atomic：Undo內(nèi)容保證，失敗事務(wù)的已刷盤(pán)的修改會(huì)在恢復(fù)階段通過(guò)Undo日志回滾，不再可見(jiàn)。

如此一來(lái)，同Page的不同事務(wù)提交就變得很簡(jiǎn)單。同時(shí)可以將連續(xù)的數(shù)據(jù)攢著進(jìn)行批量的刷盤(pán)已利用磁盤(pán)較高的順序?qū)懶阅堋?/p>

Force and Steal

從上面看出，Redo和Undo內(nèi)容分別可以保證Durability和Atomic兩個(gè)特性，其中一種信息的缺失需要用嚴(yán)格的刷盤(pán)順序來(lái)彌補(bǔ)。這里關(guān)注的刷盤(pán)順序包含兩個(gè)維度：

Force or No-Force：Commit時(shí)是否需要強(qiáng)制刷盤(pán)，采用Force的方式由于所有的已提交事務(wù)的數(shù)據(jù)一定已經(jīng)存在與磁盤(pán)，自然而然地保證了Durability。

No-Steal or Steal，Commit前數(shù)據(jù)是否可以提前刷盤(pán)，采用No-Steal的方式由于保證事務(wù)提交前修改不會(huì)出現(xiàn)在磁盤(pán)上，自然而然地保證了Atomic

總結(jié)一下，實(shí)現(xiàn)Durability可以記錄Redo信息或要求Force刷盤(pán)順序，實(shí)現(xiàn)Atomic需要記錄Undo信息或要求No-Steal刷盤(pán)順序，組合得到如下四種模式，如下圖所示：

ARIES，一統(tǒng)江湖

1992年，IBM的研究員們發(fā)表了《ARIES: a transaction recovery method supporting fine-granularity locking and partial rollbacks using write-ahead logging》[2]，其中提出的ARIES逐步成為磁盤(pán)數(shù)據(jù)庫(kù)實(shí)現(xiàn)故障恢復(fù)的標(biāo)配，ARIES本質(zhì)是一種Redo-Undo的WAL實(shí)現(xiàn)。Normal過(guò)程：修改數(shù)據(jù)之前先追加Log記錄，Log內(nèi)容同時(shí)包括Redo和Undo信息，每個(gè)日志記錄產(chǎn)生一個(gè)標(biāo)記其在日志中位置的遞增LSN（Log Sequence Number）；數(shù)據(jù)Page中記錄最后修改的日志項(xiàng)LSN，以此來(lái)判斷Page中的內(nèi)容的新舊程度，實(shí)現(xiàn)冪等。故障恢復(fù)階段需要通過(guò)Log中的內(nèi)容恢復(fù)數(shù)據(jù)庫(kù)狀態(tài)，為了減少恢復(fù)時(shí)需要處理的日志量，ARIES會(huì)在正常運(yùn)行期間周期性的生成Checkpoint，Checkpoint中除了當(dāng)前的日志LSN之外，還需要記錄當(dāng)前活躍事務(wù)的最新LSN，以及所有臟頁(yè)，供恢復(fù)時(shí)決定重放Redo的開(kāi)始位置。需要注意的是，由于生成Checkpoint時(shí)數(shù)據(jù)庫(kù)還在正常提供服務(wù)（Fuzzy Checkpoint），其中記錄的活躍事務(wù)及Dirty Page信息并不一定準(zhǔn)確，因此需要Recovery階段通過(guò)Log內(nèi)容進(jìn)行修正。

Recover過(guò)程：故障恢復(fù)包含三個(gè)階段：Analysis，Redo和Undo。Analysis階段的任務(wù)主要是利用Checkpoint及Log中的信息確認(rèn)后續(xù)Redo和Undo階段的操作范圍，通過(guò)Log修正Checkpoint中記錄的Dirty Page集合信息，并用其中涉及最小的LSN位置作為下一步Redo的開(kāi)始位置RedoLSN。同時(shí)修正Checkpoint中記錄的活躍事務(wù)集合（未提交事務(wù)），作為Undo過(guò)程的回滾對(duì)象；Redo階段從Analysis獲得的RedoLSN出發(fā)，重放所有的Log中的Redo內(nèi)容，注意這里也包含了未Commit事務(wù)；最后Undo階段對(duì)所有未提交事務(wù)利用Undo信息進(jìn)行回滾，通過(guò)Log的PrevLSN可以順序找到事務(wù)所有需要回滾的修改。

除此之外，ARIES還包含了許多優(yōu)化設(shè)計(jì)，例如通過(guò)特殊的日志記錄類(lèi)型CLRs避免嵌套R(shí)ecovery帶來(lái)的日志膨脹，支持細(xì)粒度鎖，并發(fā)Recovery等。[3]認(rèn)為，ARIES有兩個(gè)主要的設(shè)計(jì)目標(biāo)：

Feature：提供豐富靈活的實(shí)現(xiàn)事務(wù)的接口：包括提供靈活的存儲(chǔ)方式、提供細(xì)粒度的鎖、支持基于Savepoint的事務(wù)部分回滾、通過(guò)Logical Undo以獲得更高的并發(fā)、通過(guò)Page-Oriented Redo實(shí)現(xiàn)簡(jiǎn)單的可并發(fā)的Recovery過(guò)程。

Performance：充分利用內(nèi)存和磁盤(pán)介質(zhì)特性，獲得極致的性能：采用No-Force避免大量同步的磁盤(pán)隨機(jī)寫(xiě)、采用Steal及時(shí)重用寶貴的內(nèi)存資源、基于Page來(lái)簡(jiǎn)化恢復(fù)和緩存管理。

NVM帶來(lái)的機(jī)遇與挑戰(zhàn)

從Shadow Paging到WAL，再到ARIES，一直圍繞著兩個(gè)主題：減少同步寫(xiě)以及盡量用順序?qū)懘骐S機(jī)寫(xiě)。而這些正是由于磁盤(pán)性能遠(yuǎn)小于內(nèi)存，且磁盤(pán)順序訪問(wèn)遠(yuǎn)好于隨機(jī)訪問(wèn)。然而隨著NVM磁盤(pán)的出現(xiàn)以及對(duì)其成為主流的預(yù)期，使得我們必須要重新審視我們所做的一切。相對(duì)于傳統(tǒng)的HDD及SSD，NVM最大的優(yōu)勢(shì)在于：

接近內(nèi)存的高性能

順序訪問(wèn)和隨機(jī)訪問(wèn)差距不大

按字節(jié)尋址而不是Block

在這種情況下，再來(lái)看ARIES的實(shí)現(xiàn)：

No-force and Steal：同時(shí)維護(hù)Redo， Undo和數(shù)據(jù)造成的三倍寫(xiě)放大，來(lái)?yè)Q取磁盤(pán)順序?qū)懙男阅?，但在NVM上這種取舍變得很不劃算；

Pages：為了遷就磁盤(pán)基于Block的訪問(wèn)接口，采用Page的存儲(chǔ)管理方式，而內(nèi)存本身是按字節(jié)尋址的，因此，這種適配也帶來(lái)很大的復(fù)雜度。在同樣按字節(jié)尋址的NVM上可以消除。

近年來(lái)，眾多的研究嘗試為NVM量身定制更合理的故障恢復(fù)機(jī)制，我們這幾介紹其中兩種比較有代表性的研究成果，MARS希望充分利用NVM并發(fā)及內(nèi)部帶寬的優(yōu)勢(shì)，將更多的任務(wù)交給硬件實(shí)現(xiàn)；而WBL則嘗試重構(gòu)當(dāng)前的Log方式。

MARS

發(fā)表在2013年的SOSP上的《"From ARIES to MARS: Transaction support for next-generation, solid-state drives." 》提出了一種盡量保留ARIES特性，但更適合NVM的故障恢復(fù)算法MARS[3]。MARS取消了Undo Log，保留的Redo Log也不同于傳統(tǒng)的Append-Only，而是可以隨機(jī)訪問(wèn)的。如下圖所示，每個(gè)事務(wù)會(huì)占有一個(gè)唯一的TID，對(duì)應(yīng)的Metadata中記錄了Log和Data的位置。

正常訪問(wèn)時(shí)，所有的數(shù)據(jù)修改都在對(duì)應(yīng)的Redo Log中進(jìn)行，不影響真實(shí)數(shù)據(jù)，由于沒(méi)有Undo Log，需要采用No-Steal的方式，阻止Commit前的數(shù)據(jù)寫(xiě)回；Commit時(shí)會(huì)先設(shè)置事務(wù)狀態(tài)為COMMITTED，之后利用NVM的內(nèi)部帶寬將Redo中的所有內(nèi)容并發(fā)拷貝回Metadata中記錄的數(shù)據(jù)位置。如果在COMMITED標(biāo)記設(shè)置后發(fā)生故障，恢復(fù)時(shí)可以根據(jù)Redo Log中的內(nèi)容重放。其本質(zhì)是一種Redo加No-Steal的實(shí)現(xiàn)方式：

Durability of Updates： Redo實(shí)現(xiàn)，故障后重放Redo；

Failure Atomic：未Commit事務(wù)的修改只存在于Redo Log，重啟后會(huì)被直接丟棄。

可以看出，MARS的Redo雖然稱(chēng)之為L(zhǎng)og，但其實(shí)已經(jīng)不同于傳統(tǒng)意義上的順序?qū)懳募试S隨機(jī)訪問(wèn)，更像是一種臨時(shí)的存儲(chǔ)空間，類(lèi)似于Shadow的東西。之所以在Commit時(shí)進(jìn)行數(shù)據(jù)拷貝而不是像Shadow Paging一樣的元信息修改，筆者認(rèn)為是為了保持?jǐn)?shù)據(jù)的局部性，并且得益于硬件優(yōu)異的內(nèi)部帶寬。

WBL

不同于MARS保留Redo信息的思路，2016年VLDB上的《 "Write Behind Logging" 》只保留了Undo信息。筆者認(rèn)為這篇論文中關(guān)于WBL的介紹里，用大量筆墨介紹了算法上的優(yōu)化部分，為了抓住其本質(zhì)，這里先介紹最基本的WBL算法，WBL去掉了傳統(tǒng)的Append Only的Redo和Undo日志，但仍然需要保留Undo信息用來(lái)回滾未提交事務(wù)。事務(wù)Commit前需要將其所有的修改強(qiáng)制刷盤(pán)，之后在Log中記錄Commit標(biāo)記，也就是這里說(shuō)的Write Behind Log?；謴?fù)過(guò)程中通過(guò)分析Commit標(biāo)記將為提交的事務(wù)通過(guò)Undo信息回滾?？梢钥闯鯳BL算法本身非常簡(jiǎn)單，在這個(gè)基礎(chǔ)上，WBL做了如下優(yōu)化：

Group Commit：周期性的檢查內(nèi)存中的修改，同樣先將所有修改刷盤(pán)后寫(xiě)Log，Log項(xiàng)中記錄最新Commit并落盤(pán)的最大事務(wù)TimeStamp cp，保證早于cp的所有事務(wù)修改都已經(jīng)落盤(pán)；同時(shí)記錄當(dāng)前分配出去的最大TimeStamp cd；也就是說(shuō)此時(shí)所有有修改但未提交的事務(wù)Timestamp都落在cp和cd之間。Reovery的時(shí)候只需對(duì)這部分?jǐn)?shù)據(jù)進(jìn)行回滾；

針對(duì)多版本數(shù)據(jù)庫(kù)，多版本信息已經(jīng)起到了undo的作用，因此不需要再額外記錄undo信息；

延遲回滾：Recovery后不急于對(duì)未提交事務(wù)進(jìn)行回滾，而是直接提供服務(wù)，一組(cp, cd)稱(chēng)為一個(gè)gap，每一次故障恢復(fù)都可能引入新的gap，通過(guò)對(duì)比事務(wù)Timestamp和gap集合，來(lái)判斷數(shù)據(jù)的可見(jiàn)性，需要依靠后臺(tái)垃圾回收線程真正的進(jìn)行回滾和對(duì)gap的清理，如下圖所示

可以看出，WBL本質(zhì)并沒(méi)有什么新穎，是一個(gè)Force加Undo的實(shí)現(xiàn)方式，其正確性保證如下：

Durability of Updates：Commit事務(wù)的數(shù)據(jù)刷盤(pán)后才進(jìn)行Commit，因此Commit事務(wù)的數(shù)據(jù)一定在Recovery后存在

Failure Atomic：通過(guò)記錄的Undo信息或多版本時(shí)的歷史版本信息，在Recovery后依靠后臺(tái)垃圾回收線程進(jìn)行回滾。

總結(jié)

數(shù)據(jù)庫(kù)故障恢復(fù)問(wèn)題本質(zhì)是要在容忍故障發(fā)生的情況下保證數(shù)據(jù)庫(kù)的正確性，而這種正確性需要通過(guò)提供Durability of Updates和Failure Atomic來(lái)保證。其中Duribility of Update要保證Commit事務(wù)數(shù)據(jù)在恢復(fù)后存在，可以通過(guò)Force機(jī)制或者通過(guò)Redo信息回放來(lái)保證；對(duì)應(yīng)的，F(xiàn)ailure Atomic需要保證未Commit事務(wù)的修改再恢復(fù)后消失，可以通過(guò)No-Steal機(jī)制或者通過(guò)Undo信息回滾來(lái)保證?？梢员ＷCDurability和Atomic的方式，對(duì)本文提到的算法進(jìn)行分類(lèi)，如下：

Shadow Paging可以看做是采用了Force加No-Steal的方式，沒(méi)有Log信息，在Commit時(shí)，通過(guò)原子的修改Directory元信息完成數(shù)據(jù)的持久化更新，但由于其對(duì)Page內(nèi)并發(fā)的限制，以及對(duì)數(shù)據(jù)局部性的破壞等原因，沒(méi)有成為主流；

Logging的實(shí)現(xiàn)方式增加了Redo或Undo日志，記錄恢復(fù)需要的信息，從而放松Force或No-Steal機(jī)制對(duì)刷盤(pán)順序的限制，從而盡量用磁盤(pán)順序?qū)懘骐S機(jī)寫(xiě)獲得較好的性能。ARIES算法是在這一方向上的集大成者，其對(duì)上層應(yīng)用提供了豐富靈活的接口，采用了No-Force加Steal機(jī)制，將傳統(tǒng)磁盤(pán)上的性能發(fā)揮到極致，從而成為傳統(tǒng)磁盤(pán)數(shù)據(jù)故障恢復(fù)問(wèn)題的標(biāo)準(zhǔn)解決方案；

隨著NVM設(shè)備的逐步出現(xiàn)，其接近內(nèi)存的性能、同樣優(yōu)異的順序訪問(wèn)和隨機(jī)訪問(wèn)性能，以及基于字節(jié)的尋址方式，促使人們開(kāi)始重新審視數(shù)據(jù)庫(kù)故障恢復(fù)的實(shí)現(xiàn)。其核心思路在于充分利用NVM硬件特性，減少Log機(jī)制導(dǎo)致的寫(xiě)放大以及設(shè)計(jì)較復(fù)雜的問(wèn)題；

MARS作為其中的佼佼者之一，在NVM上維護(hù)可以隨機(jī)訪問(wèn)的Redo日志，同時(shí)采用Force加Steal的緩存策略，充分利用NVM優(yōu)異的隨機(jī)寫(xiě)性能和內(nèi)部帶寬。

WBL從另一個(gè)方向進(jìn)行改造，保留Undo信息，采用No-Force加No-Steal的緩存策略，并通過(guò)Group Commit及延遲回滾等優(yōu)化，減少日志信息，縮短恢復(fù)時(shí)間。

本文介紹了磁盤(pán)數(shù)據(jù)庫(kù)一路走來(lái)的核心發(fā)展思路，但距離真正的實(shí)現(xiàn)還有巨大的距離和眾多的設(shè)計(jì)細(xì)節(jié)，如對(duì)Logical Log或Physical Log的選擇、并發(fā)Recovery、Fuzzy Checkpoing、Nested Top Actions等，之后會(huì)用單獨(dú)的文章以InnoDB為例來(lái)深入探究其設(shè)計(jì)和實(shí)現(xiàn)細(xì)節(jié)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

硬件

硬件

+關(guān)注

關(guān)注
11

文章
3406

瀏覽量
66499
數(shù)據(jù)庫(kù)

數(shù)據(jù)庫(kù)

+關(guān)注

關(guān)注
7

文章
3853

瀏覽量
64749

原文標(biāo)題：數(shù)據(jù)庫(kù)故障恢復(fù)機(jī)制的前世今生

文章出處：【微信號(hào)：inf_storage，微信公眾號(hào)：數(shù)據(jù)庫(kù)和存儲(chǔ)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

虛擬化數(shù)據(jù)恢復(fù)—誤還原快照的數(shù)據(jù)恢復(fù)案例

虛擬化數(shù)據(jù)恢復(fù)環(huán)境&故障： vmfs文件系統(tǒng)，存儲(chǔ)的數(shù)據(jù)是SqlServer數(shù)據(jù)庫(kù)及其他辦公文

發(fā)表于 02-07 11:09 ?66次閱讀

SqlServer數(shù)據(jù)恢復(fù)—SqlServer數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

一塊硬盤(pán)上存放的SqlServer數(shù)據(jù)庫(kù)，windows server操作系統(tǒng)+NTFS文件系統(tǒng)。由于誤操作導(dǎo)致分區(qū)損壞，需要恢復(fù)硬盤(pán)里的SqlServer數(shù)據(jù)庫(kù)數(shù)據(jù)。

發(fā)表于 01-09 11:15 ?105次閱讀

SqlServer<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—SqlServer<b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫(kù)表記錄丟失的數(shù)據(jù)恢復(fù)流程

Mysql數(shù)據(jù)庫(kù)故障： Mysql數(shù)據(jù)庫(kù)表記錄丟失。 Mysql數(shù)據(jù)庫(kù)故障表現(xiàn)： 1、Mysql

發(fā)表于 12-16 11:05 ?232次閱讀

<b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—Mysql<b class='flag-5'>數(shù)據(jù)庫(kù)</b>表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>流程

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫(kù)ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

mysql數(shù)據(jù)庫(kù)故障： mysql數(shù)據(jù)庫(kù)文件ibdata1、MYI、MYD損壞。故障表現(xiàn)：1、數(shù)據(jù)庫(kù)無(wú)法進(jìn)行查詢(xún)等操作；2、使用my

發(fā)表于 12-09 11:05 ?231次閱讀

Sybase數(shù)據(jù)恢復(fù)—Sybase數(shù)據(jù)庫(kù)無(wú)法啟動(dòng)怎么恢復(fù)數(shù)據(jù)？

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)工程師經(jīng)過(guò)檢測(cè)，發(fā)現(xiàn)Sybase數(shù)據(jù)庫(kù)出現(xiàn)故障的原因是：異常斷電造成Sybase數(shù)據(jù)庫(kù)

發(fā)表于 11-30 16:45 ?184次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—通過(guò)拼接數(shù)據(jù)庫(kù)碎片恢復(fù)SQLserver數(shù)據(jù)庫(kù)

試圖恢復(fù)數(shù)據(jù)庫(kù)，發(fā)現(xiàn)有數(shù)個(gè)ndf文件大小變?yōu)?KB。雖然NDF文件大小變?yōu)?KB，但是NDF文件在磁盤(pán)上還可能存在?？梢試L試通過(guò)掃描&拼接數(shù)據(jù)庫(kù)碎片來(lái)恢復(fù)NDF文件，然后修復(fù)數(shù)據(jù)庫(kù)

發(fā)表于 10-31 13:21 ?343次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Oracle ASM實(shí)例無(wú)法掛載的數(shù)據(jù)恢復(fù)案例

Oracle數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境&故障： Oracle ASM磁盤(pán)組由4塊磁盤(pán)組成。Oracle ASM磁盤(pán)組掉線，ASM實(shí)例不能mount。 Oracle

發(fā)表于 10-28 11:26 ?211次閱讀

Oracle數(shù)據(jù)恢復(fù)—異常斷電后Oracle數(shù)據(jù)庫(kù)啟庫(kù)報(bào)錯(cuò)的數(shù)據(jù)恢復(fù)案例

Oracle數(shù)據(jù)庫(kù)故障：機(jī)房異常斷電后，Oracle數(shù)據(jù)庫(kù)啟庫(kù)報(bào)錯(cuò)：“system01.dbf需要更多的恢復(fù)來(lái)保持一致性，

發(fā)表于 09-30 13:31 ?406次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Oracle數(shù)據(jù)庫(kù)文件system01.dbf損壞的數(shù)據(jù)恢復(fù)案例

打開(kāi)oracle數(shù)據(jù)庫(kù)報(bào)錯(cuò)“system01.dbf需要更多的恢復(fù)來(lái)保持一致性，數(shù)據(jù)庫(kù)無(wú)法打開(kāi)”。

發(fā)表于 09-21 14:25 ?536次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)出現(xiàn)823錯(cuò)誤的數(shù)據(jù)恢復(fù)案例

SQL Server數(shù)據(jù)庫(kù)故障： SQL Server附加數(shù)據(jù)庫(kù)出現(xiàn)錯(cuò)誤823，附加數(shù)據(jù)庫(kù)失敗。數(shù)據(jù)庫(kù)沒(méi)有備份，無(wú)法通過(guò)備份

發(fā)表于 09-20 11:46 ?417次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)所在分區(qū)空間不足報(bào)錯(cuò)的數(shù)據(jù)恢復(fù)案例

Server數(shù)據(jù)庫(kù)故障：存放SQL Server數(shù)據(jù)庫(kù)的D盤(pán)分區(qū)容量不足，管理員在E盤(pán)中生成了一個(gè).ndf的文件并且將數(shù)據(jù)庫(kù)路徑指向E盤(pán)繼續(xù)使用。

發(fā)表于 07-10 13:54 ?595次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—數(shù)據(jù)庫(kù)所在分區(qū)空間不足導(dǎo)致sqlserver故障的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境：某品牌r520服務(wù)器，服務(wù)器中有7塊SAS硬盤(pán)，這7塊硬盤(pán)組建了一組2盤(pán)raid1陣列和一組5盤(pán)raid5陣列，raid1陣列存儲(chǔ)空間安裝操作系統(tǒng)，raid5陣列存儲(chǔ)空間存放

發(fā)表于 05-22 13:16 ?547次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—raid5陣列上層Sql Server數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境： 5塊硬盤(pán)組建一組RAID5陣列，劃分LUN供windows系統(tǒng)服務(wù)器使用。windows系統(tǒng)服務(wù)器內(nèi)運(yùn)行了Sql Server數(shù)據(jù)庫(kù)，存儲(chǔ)空間在操作系統(tǒng)層面劃分

發(fā)表于 05-08 11:43 ?586次閱讀

MongoDB數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫(kù)文件損壞的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境：一臺(tái)Windows Server操作系統(tǒng)服務(wù)器，服務(wù)器上部署MongoDB數(shù)據(jù)庫(kù)。 MongoDB數(shù)據(jù)庫(kù)故障&

發(fā)表于 04-23 14:48 ?465次閱讀

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Sql Server數(shù)據(jù)庫(kù)文件丟失的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境：一臺(tái)安裝windows server操作系統(tǒng)的服務(wù)器。一組由8塊硬盤(pán)組建的RAID5，劃分LUN供這臺(tái)服務(wù)器使用。在windows服務(wù)器內(nèi)裝有SqlServer數(shù)據(jù)庫(kù)

發(fā)表于 04-11 15:38 ?977次閱讀

欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

搜索歷史

梳理數(shù)據(jù)庫(kù)故障恢復(fù)問(wèn)題的本質(zhì)及其發(fā)展優(yōu)化方向

評(píng)論

虛擬化數(shù)據(jù)恢復(fù)—誤還原快照的數(shù)據(jù)恢復(fù)案例

SqlServer數(shù)據(jù)恢復(fù)—SqlServer數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫(kù)表記錄丟失的數(shù)據(jù)恢復(fù)流程

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫(kù)ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

Sybase數(shù)據(jù)恢復(fù)—Sybase數(shù)據(jù)庫(kù)無(wú)法啟動(dòng)怎么恢復(fù)數(shù)據(jù)？

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—通過(guò)拼接數(shù)據(jù)庫(kù)碎片恢復(fù)SQLserver數(shù)據(jù)庫(kù)

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Oracle ASM實(shí)例無(wú)法掛載的數(shù)據(jù)恢復(fù)案例

Oracle數(shù)據(jù)恢復(fù)—異常斷電后Oracle數(shù)據(jù)庫(kù)啟庫(kù)報(bào)錯(cuò)的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Oracle數(shù)據(jù)庫(kù)文件system01.dbf損壞的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)出現(xiàn)823錯(cuò)誤的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)所在分區(qū)空間不足報(bào)錯(cuò)的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—數(shù)據(jù)庫(kù)所在分區(qū)空間不足導(dǎo)致sqlserver故障的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—raid5陣列上層Sql Server數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

MongoDB數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫(kù)文件損壞的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Sql Server數(shù)據(jù)庫(kù)文件丟失的數(shù)據(jù)恢復(fù)案例