什么是NewSQL
數(shù)據(jù)庫(kù)發(fā)展至今已經(jīng)有3代了:
SQL,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),例如 MySQL
noSQL,例如 MongoDB,Redis
newSQL
傳統(tǒng)SQL的問(wèn)題
互聯(lián)網(wǎng)在本世紀(jì)初開始迅速發(fā)展,互聯(lián)網(wǎng)應(yīng)用的用戶規(guī)模、數(shù)據(jù)量都越來(lái)越大,并且要求7X24小時(shí)在線。
傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)在這種環(huán)境下成為了瓶頸,通常有2種解決方法:
升級(jí)服務(wù)器硬件
雖然提升了性能,但總有天花板。
數(shù)據(jù)分片
使用分布式集群結(jié)構(gòu)
對(duì)單點(diǎn)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)分片,存放到由廉價(jià)機(jī)器組成的分布式的集群里,可擴(kuò)展性更好了,但也帶來(lái)了新的麻煩。
以前在一個(gè)庫(kù)里的數(shù)據(jù),現(xiàn)在跨了多個(gè)庫(kù),應(yīng)用系統(tǒng)不能自己去多個(gè)庫(kù)中操作,需要使用數(shù)據(jù)庫(kù)分片中間件。
分片中間件做簡(jiǎn)單的數(shù)據(jù)操作時(shí)還好,但涉及到跨庫(kù)join、跨庫(kù)事務(wù)時(shí)就很頭疼了,很多人干脆自己在業(yè)務(wù)層處理,復(fù)雜度較高。
NoSQL 的問(wèn)題
后來(lái) noSQL 出現(xiàn)了,放棄了傳統(tǒng)SQL的強(qiáng)事務(wù)保證和關(guān)系模型,重點(diǎn)放在數(shù)據(jù)庫(kù)的高可用性和可擴(kuò)展性。
優(yōu)點(diǎn)
高可用性和可擴(kuò)展性,自動(dòng)分區(qū),輕松擴(kuò)展
不保證強(qiáng)一致性,性能大幅提升
沒(méi)有關(guān)系模型的限制,極其靈活
缺點(diǎn)
不保證強(qiáng)一致性,對(duì)于普通應(yīng)用沒(méi)問(wèn)題,但還是有不少像金融一樣的企業(yè)級(jí)應(yīng)用有強(qiáng)一致性的需求。
不支持 SQL 語(yǔ)句,兼容性是個(gè)大問(wèn)題,不同的 NoSQL 數(shù)據(jù)庫(kù)都有自己的 api 操作數(shù)據(jù),比較復(fù)雜。
NewSQL 特性
NewSQL 提供了與 noSQL 相同的可擴(kuò)展性,而且仍基于關(guān)系模型,還保留了極其成熟的 SQL 作為查詢語(yǔ)言,保證了ACID事務(wù)特性。
簡(jiǎn)單來(lái)講,NewSQL 就是在傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)上集成了 NoSQL 強(qiáng)大的可擴(kuò)展性。
傳統(tǒng)的SQL架構(gòu)設(shè)計(jì)基因中是沒(méi)有分布式的,而 NewSQL 生于云時(shí)代,天生就是分布式架構(gòu)。
NewSQL 的主要特性
SQL 支持,支持復(fù)雜查詢和大數(shù)據(jù)分析。
支持 ACID 事務(wù),支持隔離級(jí)別。
彈性伸縮,擴(kuò)容縮容對(duì)于業(yè)務(wù)層完全透明。
高可用,自動(dòng)容災(zāi)。
三種SQL的對(duì)比
什么是 TiDB
TiDB 是一個(gè)分布式 NewSQL 數(shù)據(jù)庫(kù)。它支持水平彈性擴(kuò)展、ACID 事務(wù)、標(biāo)準(zhǔn) SQL、MySQL 語(yǔ)法和 MySQL 協(xié)議,具有數(shù)據(jù)強(qiáng)一致的高可用特性,是一個(gè)不僅適合 OLTP 場(chǎng)景還適合 OLAP 場(chǎng)景的混合數(shù)據(jù)庫(kù)。
TiDB是 PingCAP公司自主設(shè)計(jì)、研發(fā)的開源分布式關(guān)系型數(shù)據(jù)庫(kù),是一款同時(shí)支持在線事務(wù)處理與在線分析處理 (Hybrid Transactional and Analytical Processing, HTAP)的融合型分布式數(shù)據(jù)庫(kù)產(chǎn)品,具備水平擴(kuò)容或者縮容、金融級(jí)高可用、實(shí)時(shí) HTAP、云原生的分布式數(shù)據(jù)庫(kù)、兼容 MySQL 5.7 協(xié)議和 MySQL 生態(tài)等重要特性。
目標(biāo)是為用戶提供一站式 OLTP (Online Transactional Processing)、OLAP (Online Analytical Processing)、HTAP 解決方案。TiDB 適合高可用、強(qiáng)一致要求較高、數(shù)據(jù)規(guī)模較大等各種應(yīng)用場(chǎng)景。
TiDB分為社區(qū)版以及企業(yè)版,企業(yè)版收費(fèi)提供服務(wù)以及安全性的支持。
TIDB核心特性
水平彈性擴(kuò)展
通過(guò)簡(jiǎn)單地增加新節(jié)點(diǎn)即可實(shí)現(xiàn) TiDB 的水平擴(kuò)展,按需擴(kuò)展吞吐或存儲(chǔ),輕松應(yīng)對(duì)高并發(fā)、海量數(shù)據(jù)場(chǎng)景。
得益于 TiDB 存儲(chǔ)計(jì)算分離的架構(gòu)的設(shè)計(jì),可按需對(duì)計(jì)算、存儲(chǔ)分別進(jìn)行在線擴(kuò)容或者縮容,擴(kuò)容或者縮容過(guò)程中對(duì)應(yīng)用運(yùn)維人員透明。
分布式事務(wù)支持
TiDB 100% 支持標(biāo)準(zhǔn)的 ACID 事務(wù)
金融級(jí)高可用
相比于傳統(tǒng)主從 (M-S) 復(fù)制方案,基于 Raft 的多數(shù)派選舉協(xié)議可以提供金融級(jí)的 100% 數(shù)據(jù)強(qiáng)一致性保證,且在不丟失大多數(shù)副本的前提下,可以實(shí)現(xiàn)故障的自動(dòng)恢復(fù) (auto-failover),無(wú)需人工介入
數(shù)據(jù)采用多副本存儲(chǔ),數(shù)據(jù)副本通過(guò) Multi-Raft 協(xié)議同步事務(wù)日志,多數(shù)派寫入成功事務(wù)才能提交,確保數(shù)據(jù)強(qiáng)一致性且少數(shù)副本發(fā)生故障時(shí)不影響數(shù)據(jù)的可用性??砂葱枧渲酶北镜乩砦恢?、副本數(shù)量等策略滿足不同容災(zāi)級(jí)別的要求。
實(shí)時(shí) HTAP
TiDB 作為典型的 OLTP 行存數(shù)據(jù)庫(kù),同時(shí)兼具強(qiáng)大的 OLAP 性能,配合 TiSpark,可提供一站式 HTAP 解決方案,一份存儲(chǔ)同時(shí)處理 OLTP & OLAP 無(wú)需傳統(tǒng)繁瑣的 ETL 過(guò)程。
提供行存儲(chǔ)引擎 TiKV、列存儲(chǔ)引擎 TiFlash 兩款存儲(chǔ)引擎,TiFlash 通過(guò) Multi-Raft Learner 協(xié)議實(shí)時(shí)從 TiKV 復(fù)制數(shù)據(jù),確保行存儲(chǔ)引擎 TiKV 和列存儲(chǔ)引擎 TiFlash 之間的數(shù)據(jù)強(qiáng)一致。TiKV、TiFlash 可按需部署在不同的機(jī)器,解決 HTAP 資源隔離的問(wèn)題。
云原生的分布式數(shù)據(jù)庫(kù)
TiDB 是為云而設(shè)計(jì)的數(shù)據(jù)庫(kù),同 Kubernetes 深度耦合,支持公有云、私有云和混合云,使部署、配置和維護(hù)變得十分簡(jiǎn)單。TiDB 的設(shè)計(jì)目標(biāo)是 100% 的 OLTP 場(chǎng)景和 80% 的 OLAP 場(chǎng)景,更復(fù)雜的 OLAP 分析可以通過(guò) TiSpark 項(xiàng)目來(lái)完成。TiDB 對(duì)業(yè)務(wù)沒(méi)有任何侵入性,能優(yōu)雅的替換傳統(tǒng)的數(shù)據(jù)庫(kù)中間件、數(shù)據(jù)庫(kù)分庫(kù)分表等 Sharding 方案。同時(shí)它也讓開發(fā)運(yùn)維人員不用關(guān)注數(shù)據(jù)庫(kù) Scale 的細(xì)節(jié)問(wèn)題,專注于業(yè)務(wù)開發(fā),極大的提升研發(fā)的生產(chǎn)力。
高度兼容 MySQL
兼容 MySQL 5.7 協(xié)議、MySQL 常用的功能、MySQL 生態(tài),應(yīng)用無(wú)需或者修改少量代碼即可從 MySQL 遷移到 TiDB。
提供豐富的數(shù)據(jù)遷移工具幫助應(yīng)用便捷完成數(shù)據(jù)遷移,大多數(shù)情況下,無(wú)需修改代碼即可從 MySQL 輕松遷移至 TiDB,分庫(kù)分表后的 MySQL 集群亦可通過(guò) TiDB 工具進(jìn)行實(shí)時(shí)遷移。
OLTP&OLAP
OLTP(聯(lián)機(jī)事務(wù)處理)
OLTP(Online Transactional Processing) 即聯(lián)機(jī)事務(wù)處理,OLTP 是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)的主要應(yīng)用,主要是基本的、日常的事務(wù)處理,記錄即時(shí)的增、刪、改、查,比如在銀行存取一筆款,就是一個(gè)事務(wù)交易。
聯(lián)機(jī)事務(wù)處理是事務(wù)性非常高的系統(tǒng),一般都是高可用的在線系統(tǒng),以小的事務(wù)以及小的查詢?yōu)橹鳎u(píng)估其系統(tǒng)的時(shí)候,一般看其每秒執(zhí)行的Transaction以及Execute SQL的數(shù)量。在這樣的系統(tǒng)中,單個(gè)數(shù)據(jù)庫(kù)每秒處理的Transaction往往超過(guò)幾百個(gè),或者是幾千個(gè),Select 語(yǔ)句的執(zhí)行量每秒幾千甚至幾萬(wàn)個(gè)。典型的OLTP系統(tǒng)有電子商務(wù)系統(tǒng)、銀行、證券等,如美國(guó)eBay的業(yè)務(wù)數(shù)據(jù)庫(kù),就是很典型的OLTP數(shù)據(jù)庫(kù)。
OLAP(聯(lián)機(jī)分析處理)
OLAP(Online Analytical Processing) 即聯(lián)機(jī)分析處理,是數(shù)據(jù)倉(cāng)庫(kù)的核心部心,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。典型的應(yīng)用就是復(fù)雜的動(dòng)態(tài)報(bào)表系統(tǒng)。
在這樣的系統(tǒng)中,語(yǔ)句的執(zhí)行量不是考核標(biāo)準(zhǔn),因?yàn)橐粭l語(yǔ)句的執(zhí)行時(shí)間可能會(huì)非常長(zhǎng),讀取的數(shù)據(jù)也非常多。所以,在這樣的系統(tǒng)中,考核的標(biāo)準(zhǔn)往往是磁盤子系統(tǒng)的吞吐量(帶寬),如能達(dá)到多少M(fèi)B/s的流量。
特性對(duì)比
OLTP和OLAP的特性對(duì)比
設(shè)計(jì)角度區(qū)別
TiDB 整體架構(gòu)
TiDB的優(yōu)勢(shì)
與傳統(tǒng)的單機(jī)數(shù)據(jù)庫(kù)相比,TiDB 具有以下優(yōu)勢(shì):
純分布式架構(gòu),擁有良好的擴(kuò)展性,支持彈性的擴(kuò)縮容。
支持 SQL,對(duì)外暴露 MySQL 的網(wǎng)絡(luò)協(xié)議,并兼容大多數(shù) MySQL 的語(yǔ)法,在大多數(shù)場(chǎng)景下可以直接替換 MySQL。
默認(rèn)支持高可用,在少數(shù)副本失效的情況下,數(shù)據(jù)庫(kù)本身能夠自動(dòng)進(jìn)行數(shù)據(jù)修復(fù)和故障轉(zhuǎn)移,對(duì)業(yè)務(wù)透明。
支持 ACID 事務(wù),對(duì)于一些有強(qiáng)一致需求的場(chǎng)景友好,例如:銀行轉(zhuǎn)賬。
具有豐富的工具鏈生態(tài),覆蓋數(shù)據(jù)遷移、同步、備份等多種場(chǎng)景。
TiDB的組件
要深入了解 TiDB 的水平擴(kuò)展和高可用特點(diǎn),首先需要了解 TiDB 的整體架構(gòu)。TiDB 集群主要包括三個(gè)核心組件:TiDB Server,PD Server 和 TiKV Server,此外,還有用于解決用戶復(fù)雜 OLAP 需求的 TiSpark 組件。
在內(nèi)核設(shè)計(jì)上,TiDB 分布式數(shù)據(jù)庫(kù)將整體架構(gòu)拆分成了多個(gè)模塊,各模塊之間互相通信,組成完整的 TiDB 系統(tǒng)。對(duì)應(yīng)的架構(gòu)圖如下:
TiDB Server
TiDB Server 負(fù)責(zé)接收 SQL 請(qǐng)求,處理 SQL 相關(guān)的邏輯,并通過(guò) PD 找到存儲(chǔ)計(jì)算所需數(shù)據(jù)的 TiKV 地址,與 TiKV 交互獲取數(shù)據(jù),最終返回結(jié)果。TiDB Server 是無(wú)狀態(tài)的,其本身并不存儲(chǔ)數(shù)據(jù),只負(fù)責(zé)計(jì)算,可以無(wú)限水平擴(kuò)展,可以通過(guò)負(fù)載均衡組件(如 LVS、HAProxy 或 F5)對(duì)外提供統(tǒng)一的接入地址。
PD (Placement Driver) Server
Placement Driver (簡(jiǎn)稱 PD) 是整個(gè)集群的管理模塊,其主要工作有三個(gè):
一是存儲(chǔ)集群的元信息(某個(gè) Key 存儲(chǔ)在哪個(gè) TiKV 節(jié)點(diǎn));
二是對(duì) TiKV 集群進(jìn)行調(diào)度和負(fù)載均衡(如數(shù)據(jù)的遷移、Raft group leader 的遷移等);
三是分配全局唯一且遞增的事務(wù) ID。
PD 通過(guò) Raft 協(xié)議保證數(shù)據(jù)的安全性。Raft 的 leader server 負(fù)責(zé)處理所有操作,其余的 PD server 僅用于保證高可用。建議部署奇數(shù)個(gè) PD 節(jié)點(diǎn)
TiKV Server
TiKV Server 負(fù)責(zé)存儲(chǔ)數(shù)據(jù),從外部看 TiKV 是一個(gè)分布式的提供事務(wù)的 Key-Value 存儲(chǔ)引擎。存儲(chǔ)數(shù)據(jù)的基本單位是 Region,每個(gè) Region 負(fù)責(zé)存儲(chǔ)一個(gè) Key Range(從 StartKey 到 EndKey 的左閉右開區(qū)間)的數(shù)據(jù),每個(gè) TiKV 節(jié)點(diǎn)會(huì)負(fù)責(zé)多個(gè) Region。TiKV 使用 Raft 協(xié)議做復(fù)制,保持?jǐn)?shù)據(jù)的一致性和容災(zāi)。副本以 Region 為單位進(jìn)行管理,不同節(jié)點(diǎn)上的多個(gè) Region 構(gòu)成一個(gè) Raft Group,互為副本。數(shù)據(jù)在多個(gè) TiKV 之間的負(fù)載均衡由 PD 調(diào)度,這里也是以 Region 為單位進(jìn)行調(diào)度。
TiSpark
TiSpark 作為 TiDB 中解決用戶復(fù)雜 OLAP 需求的主要組件,將 Spark SQL 直接運(yùn)行在 TiDB 存儲(chǔ)層上,同時(shí)融合 TiKV 分布式集群的優(yōu)勢(shì),并融入大數(shù)據(jù)社區(qū)生態(tài)。至此,TiDB 可以通過(guò)一套系統(tǒng),同時(shí)支持 OLTP 與 OLAP,免除用戶數(shù)據(jù)同步的煩惱。
TiFlash
TiFlash 是一類特殊的存儲(chǔ)節(jié)點(diǎn)。和普通 TiKV 節(jié)點(diǎn)不一樣的是,在 TiFlash 內(nèi)部,數(shù)據(jù)是以列式的形式進(jìn)行存儲(chǔ),主要的功能是為分析型的場(chǎng)景加速。
TiKV整體架構(gòu)
與傳統(tǒng)的整節(jié)點(diǎn)備份方式不同的,TiKV是將數(shù)據(jù)按照 key 的范圍劃分成大致相等的切片(下文統(tǒng)稱為 Region),每一個(gè)切片會(huì)有多個(gè)副本(通常是 3 個(gè)),其中一個(gè)副本是 Leader,提供讀寫服務(wù)。TiKV 通過(guò) PD 對(duì)這些 Region 以及副本進(jìn)行調(diào)度,以保證數(shù)據(jù)和讀寫負(fù)載都均勻地分散在各個(gè) TiKV 上,這樣的設(shè)計(jì)保證了整個(gè)集群資源的充分利用并且可以隨著機(jī)器數(shù)量的增加水平擴(kuò)展。
Region分裂與合并
當(dāng)某個(gè) Region 的大小超過(guò)一定限制(默認(rèn)是 144MB)后,TiKV 會(huì)將它分裂為兩個(gè)或者更多個(gè) Region,以保證各個(gè) Region 的大小是大致接近的,這樣更有利于 PD 進(jìn)行調(diào)度決策。同樣,當(dāng)某個(gè) Region 因?yàn)榇罅康膭h除請(qǐng)求導(dǎo)致 Region 的大小變得更小時(shí),TiKV 會(huì)將比較小的兩個(gè)相鄰 Region 合并為一個(gè)。
Region調(diào)度
Region 與副本之間通過(guò) Raft 協(xié)議來(lái)維持?jǐn)?shù)據(jù)一致性,任何寫請(qǐng)求都只能在 Leader 上寫入,并且需要寫入多數(shù)副本后(默認(rèn)配置為 3 副本,即所有請(qǐng)求必須至少寫入兩個(gè)副本成功)才會(huì)返回客戶端寫入成功。
當(dāng) PD 需要把某個(gè) Region 的一個(gè)副本從一個(gè) TiKV 節(jié)點(diǎn)調(diào)度到另一個(gè)上面時(shí),PD 會(huì)先為這個(gè) Raft Group 在目標(biāo)節(jié)點(diǎn)上增加一個(gè) Learner 副本(復(fù)制 Leader 的數(shù)據(jù))。當(dāng)這個(gè) Learner 副本的進(jìn)度大致追上 Leader 副本時(shí),Leader 會(huì)將它變更為 Follower,之后再移除操作節(jié)點(diǎn)的 Follower 副本,這樣就完成了 Region 副本的一次調(diào)度。
Leader 副本的調(diào)度原理也類似,不過(guò)需要在目標(biāo)節(jié)點(diǎn)的 Learner 副本變?yōu)?Follower 副本后,再執(zhí)行一次 Leader Transfer,讓該 Follower 主動(dòng)發(fā)起一次選舉成為新 Leader,之后新 Leader 負(fù)責(zé)刪除舊 Leader 這個(gè)副本。
分布式事務(wù)
TiKV 支持分布式事務(wù),用戶(或者 TiDB)可以一次性寫入多個(gè) key-value 而不必關(guān)心這些 key-value 是否處于同一個(gè)數(shù)據(jù)切片 (Region) 上,TiKV 通過(guò)兩階段提交保證了這些讀寫請(qǐng)求的 ACID 約束。
高可用架構(gòu)
高可用是 TiDB 的另一大特點(diǎn),TiDB/TiKV/PD 這三個(gè)組件都能容忍部分實(shí)例失效,不影響整個(gè)集群的可用性。下面分別說(shuō)明這三個(gè)組件的可用性、單個(gè)實(shí)例失效后的后果以及如何恢復(fù)。
TiDB高可用
TiDB 是無(wú)狀態(tài)的,推薦至少部署兩個(gè)實(shí)例,前端通過(guò)負(fù)載均衡組件對(duì)外提供服務(wù)。當(dāng)單個(gè)實(shí)例失效時(shí),會(huì)影響正在這個(gè)實(shí)例上進(jìn)行的 Session,從應(yīng)用的角度看,會(huì)出現(xiàn)單次請(qǐng)求失敗的情況,重新連接后即可繼續(xù)獲得服務(wù)。單個(gè)實(shí)例失效后,可以重啟這個(gè)實(shí)例或者部署一個(gè)新的實(shí)例。
PD高可用
PD 是一個(gè)集群,通過(guò) Raft 協(xié)議保持?jǐn)?shù)據(jù)的一致性,單個(gè)實(shí)例失效時(shí),如果這個(gè)實(shí)例不是 Raft 的 leader,那么服務(wù)完全不受影響;如果這個(gè)實(shí)例是 Raft 的 leader,會(huì)重新選出新的 Raft leader,自動(dòng)恢復(fù)服務(wù)。PD 在選舉的過(guò)程中無(wú)法對(duì)外提供服務(wù),這個(gè)時(shí)間大約是3秒鐘。推薦至少部署三個(gè) PD 實(shí)例,單個(gè)實(shí)例失效后,重啟這個(gè)實(shí)例或者添加新的實(shí)例。
TiKV高可用
TiKV 是一個(gè)集群,通過(guò) Raft 協(xié)議保持?jǐn)?shù)據(jù)的一致性(副本數(shù)量可配置,默認(rèn)保存三副本),并通過(guò) PD 做負(fù)載均衡調(diào)度。單個(gè)節(jié)點(diǎn)失效時(shí),會(huì)影響這個(gè)節(jié)點(diǎn)上存儲(chǔ)的所有 Region。對(duì)于 Region 中的 Leader 結(jié)點(diǎn),會(huì)中斷服務(wù),等待重新選舉;對(duì)于 Region 中的 Follower 節(jié)點(diǎn),不會(huì)影響服務(wù)。當(dāng)某個(gè) TiKV 節(jié)點(diǎn)失效,并且在一段時(shí)間內(nèi)(默認(rèn) 10 分鐘)無(wú)法恢復(fù),PD 會(huì)將其上的數(shù)據(jù)遷移到其他的 TiKV 節(jié)點(diǎn)上。
應(yīng)用場(chǎng)景
MySQL分片與合并
TiDB 應(yīng)用的第一類場(chǎng)景是 MySQL 的分片與合并。對(duì)于已經(jīng)在用 MySQL 的業(yè)務(wù),分庫(kù)、分表、分片、中間件是常用手段,隨著分片的增多,跨分片查詢是一大難題。TiDB 在業(yè)務(wù)層兼容 MySQL 的訪問(wèn)協(xié)議,PingCAP 做了一個(gè)數(shù)據(jù)同步的工具——Syncer,它可以把 TiDB 作為一個(gè) MySQL Slave,將 TiDB 作為現(xiàn)有數(shù)據(jù)庫(kù)的從庫(kù)接在主 MySQL 庫(kù)的后方,在這一層將數(shù)據(jù)打通,可以直接進(jìn)行復(fù)雜的跨庫(kù)、跨表、跨業(yè)務(wù)的實(shí)時(shí) SQL 查詢。黃東旭提到,“過(guò)去的數(shù)據(jù)庫(kù)都是一主多從,有了 TiDB 以后,可以反過(guò)來(lái)做到多主一從?!?/p>
直接替換MySQL
第二類場(chǎng)景是用 TiDB 直接去替換 MySQL。如果你的IT架構(gòu)在搭建之初并未考慮分庫(kù)分表的問(wèn)題,全部用了 MySQL,隨著業(yè)務(wù)的快速增長(zhǎng),海量高并發(fā)的 OLTP 場(chǎng)景越來(lái)越多,如何解決架構(gòu)上的弊端呢?
在一個(gè) TiDB 的數(shù)據(jù)庫(kù)上,所有業(yè)務(wù)場(chǎng)景不需要做分庫(kù)分表,所有的分布式工作都由數(shù)據(jù)庫(kù)層完成。TiDB 兼容 MySQL 協(xié)議,所以可以直接替換 MySQL,而且基本做到了開箱即用,完全不用擔(dān)心傳統(tǒng)分庫(kù)分表方案帶來(lái)繁重的工作負(fù)擔(dān)和復(fù)雜的維護(hù)成本,友好的用戶界面讓常規(guī)的技術(shù)人員可以高效地進(jìn)行維護(hù)和管理。另外,TiDB 具有 NoSQL 類似的擴(kuò)容能力,在數(shù)據(jù)量和訪問(wèn)流量持續(xù)增長(zhǎng)的情況下能夠通過(guò)水平擴(kuò)容提高系統(tǒng)的業(yè)務(wù)支撐能力,并且響應(yīng)延遲穩(wěn)定。
數(shù)據(jù)倉(cāng)庫(kù)
TiDB 本身是一個(gè)分布式系統(tǒng),第三種使用場(chǎng)景是將 TiDB 當(dāng)作數(shù)據(jù)倉(cāng)庫(kù)使用。TPC-H 是數(shù)據(jù)分析領(lǐng)域的一個(gè)測(cè)試集,TiDB 2.0 在 OLAP 場(chǎng)景下的性能有了大幅提升,原來(lái)只能在數(shù)據(jù)倉(cāng)庫(kù)里面跑的一些復(fù)雜的 Query,在 TiDB 2.0 里面跑,時(shí)間基本都能控制在 10 秒以內(nèi)。當(dāng)然,因?yàn)?OLAP 的范疇非常大,TiDB 的 SQL 也有搞不定的情況,為此 PingCAP 開源了 TiSpark,TiSpark 是一個(gè) Spark 插件,用戶可以直接用 Spark SQL 實(shí)時(shí)地在 TiKV 上做大數(shù)據(jù)分析。
作為其他系統(tǒng)的模塊
TiDB 是一個(gè)傳統(tǒng)的存儲(chǔ)跟計(jì)算分離的項(xiàng)目,其底層的 Key-Value 層,可以單獨(dú)作為一個(gè) HBase 的 Replacement 來(lái)用,它同時(shí)支持跨行事務(wù)。TiDB 對(duì)外提供兩個(gè) API 接口,一個(gè)是 ACID Transaction 的 API,用于支持跨行事務(wù);另一個(gè)是 Raw API,它可以做單行的事務(wù),換來(lái)的是整個(gè)性能的提升,但不提供跨行事務(wù)的 ACID 支持。用戶可以根據(jù)自身的需求在兩個(gè) API 之間自行選擇。例如有一些用戶直接在 TiKV 之上實(shí)現(xiàn)了 Redis 協(xié)議,將 TiKV 替換一些大容量,對(duì)延遲要求不高的 Redis 場(chǎng)景。
TiDB與MySQL兼容性對(duì)比
TiDB支持MySQL?傳輸協(xié)議及其絕大多數(shù)的語(yǔ)法。這意味著您現(xiàn)有的MySQL連接器和客戶端都可以繼續(xù)使用。大多數(shù)情況下您現(xiàn)有的應(yīng)用都可以遷移至 TiDB,無(wú)需任何代碼修改。
當(dāng)前TiDB服務(wù)器官方支持的版本為MySQL 5.7?。大部分MySQL運(yùn)維工具(如PHPMyAdmin, Navicat, MySQL Workbench等),以及備份恢復(fù)工具(如 mysqldump, Mydumper/myloader)等都可以直接使用。
不過(guò)一些特性由于在分布式環(huán)境下沒(méi)法很好的實(shí)現(xiàn),目前暫時(shí)不支持或者是表現(xiàn)與MySQL有差異
一些MySQL語(yǔ)法在TiDB中可以解析通過(guò),但是不會(huì)做任何后續(xù)的處理?,例如Create Table語(yǔ)句中Engine,是解析并忽略。
TiDB不支持的MySql特性
存儲(chǔ)過(guò)程與函數(shù)
觸發(fā)器
事件
自定義函數(shù)
外鍵約束
臨時(shí)表
全文/空間函數(shù)與索引
非?ascii/latin1/binary/utf8/utf8mb4?的字符集
SYS schema
MySQL 追蹤優(yōu)化器
XML 函數(shù)
X-Protocol
Savepoints
列級(jí)權(quán)限
XA?語(yǔ)法(TiDB 內(nèi)部使用兩階段提交,但并沒(méi)有通過(guò) SQL 接口公開)
CREATE TABLE tblName AS SELECT stmt?語(yǔ)法
CHECK TABLE?語(yǔ)法
CHECKSUM TABLE?語(yǔ)法
GET_LOCK?和?RELEASE_LOCK?函數(shù)
自增ID
TiDB 的自增列僅保證唯一,也能保證在單個(gè) TiDB server 中自增,但不保證多個(gè) TiDB server 中自增,不保證自動(dòng)分配的值的連續(xù)性,建議不要將缺省值和自定義值混用,若混用可能會(huì)收?Duplicated Error的錯(cuò)誤信息。
TiDB 可通過(guò)?tidb_allow_remove_auto_inc?系統(tǒng)變量開啟或者關(guān)閉允許移除列的?AUTO_INCREMENT?屬性。刪除列屬性的語(yǔ)法是:alter table modify?或?alter table change。
TiDB 不支持添加列的AUTO_INCREMENT屬性,移除該屬性后不可恢復(fù)。
SELECT 的限制
不支持?SELECT ... INTO @變量?語(yǔ)法。
不支持?SELECT ... GROUP BY ... WITH ROLLUP?語(yǔ)法。
TiDB 中的?SELECT .. GROUP BY expr?的返回結(jié)果與 MySQL 5.7 并不一致。MySQL 5.7 的結(jié)果等價(jià)于?GROUP BY expr ORDER BY expr。而 TiDB 中該語(yǔ)法所返回的結(jié)果并不承諾任何順序,與 MySQL 8.0 的行為一致。
視圖
目前TiDB不支持?對(duì)視圖進(jìn)行UPDATE、INSERT、DELETE等寫入操作?。
默認(rèn)設(shè)置差異
字符集
TiDB 默認(rèn):utf8mb4。
MySQL 5.7 默認(rèn):latin1。
MySQL 8.0 默認(rèn):utf8mb4。
排序規(guī)則
TiDB 中?utf8mb4?字符集默認(rèn):utf8mb4_bin。
MySQL 5.7 中?utf8mb4?字符集默認(rèn):utf8mb4_general_ci?。
MySQL 8.0 中?utf8mb4?字符集默認(rèn):utf8mb4_0900_ai_ci。
大小寫敏感
關(guān)于lower_case_table_names的配置
TiDB 默認(rèn):2,且僅支持設(shè)置該值為?2。
MySQL 默認(rèn)如下:
Linux 系統(tǒng)中該值為?0
Windows 系統(tǒng)中該值為?1
macOS 系統(tǒng)中該值為?2
參數(shù)解釋
lower_case_table_names=0 表名存儲(chǔ)為給定的大小和比較是區(qū)分大小寫的。
lower_case_table_names = 1 表名存儲(chǔ)在磁盤是小寫的,但是比較的時(shí)候是不區(qū)分大小寫。
lower_case_table_names=2 表名存儲(chǔ)為給定的大小寫但是比較的時(shí)候是小寫的。
timestamp類型字段更新
默認(rèn)情況下,timestamp類型字段所在數(shù)據(jù)行被更新時(shí),該字段會(huì)自動(dòng)更新為當(dāng)前時(shí)間,而參數(shù)explicit_defaults_for_timestamp控制這一種行為。
TiDB 默認(rèn):ON,且僅支持設(shè)置該值為?ON。
MySQL 5.7 默認(rèn):OFF。
MySQL 8.0 默認(rèn):ON。
參數(shù)解釋
explicit_defaults_for_timestamp=off,數(shù)據(jù)行更新時(shí),timestamp類型字段更新為當(dāng)前時(shí)間
explicit_defaults_for_timestamp=on,數(shù)據(jù)行更新時(shí),timestamp類型字段不更新為當(dāng)前時(shí)間。
外鍵支持
TiDB 默認(rèn):OFF,且僅支持設(shè)置該值為?OFF。
MySQL 5.7 默認(rèn):ON。
編輯:黃飛
?
評(píng)論
查看更多