分析型數(shù)據(jù)庫如何創(chuàng)新?GOTC 2023議題揭秘
2023-05-19 14:56:09AI云資訊729
在群雄逐鹿的 OLAP 數(shù)據(jù)庫市場,開源引擎 ClickHouse 憑借其出色的性能成為公認(rèn)的黑馬。官方稱其性能超過了市場上同類的列式數(shù)據(jù)庫,每臺服務(wù)器每秒可處理數(shù)億到超過十億行、體積達(dá)數(shù)十 GB 的數(shù)據(jù),運(yùn)行速度比傳統(tǒng)數(shù)據(jù)庫快 100-1000 倍。
高效運(yùn)行速度的另一面,還隱含著成本、性能、容量等諸多問題,比如不支持事務(wù),不能夠保證數(shù)據(jù)的一致性和完整性,不存在隔離級別,不支持高并發(fā)等等。這導(dǎo)致 2016 年開源的 ClickHouse 難以應(yīng)對當(dāng)下更加復(fù)雜,數(shù)據(jù)規(guī)模更加巨大的場景需求。
比如在字節(jié)內(nèi)部,從 2018 年引入 ClickHouse,因?yàn)闃I(yè)務(wù)的發(fā)展,要服務(wù)于大量的用戶,數(shù)據(jù)規(guī)模變得越來越巨大。由于 ClickHouse 是 Shared-Nothing 的架構(gòu),每個節(jié)點(diǎn)是獨(dú)立的,不會共享存儲資源等,因而計(jì)算資源和存儲資源是緊耦合的。這導(dǎo)致擴(kuò)縮容成本變高,且會涉及到數(shù)據(jù)遷移,不能實(shí)時(shí)按需的擴(kuò)縮容,從而導(dǎo)致資源的浪費(fèi)。此外,ClickHouse 的緊耦合的架構(gòu)會導(dǎo)致多租戶在共享集群相互影響,另外由于讀寫在一個節(jié)點(diǎn)完成,導(dǎo)致讀寫受到影響,最后 ClickHouse 在復(fù)雜查詢上例如多表 join 等的性能支持并不是很好。
字節(jié) ClickHouse 使用情況
為了解決這些痛點(diǎn),字節(jié)在 ClickHouse 架構(gòu)基礎(chǔ)上進(jìn)行了升級,于 2020 年在內(nèi)部啟動了 ByConity 項(xiàng)目,并于 2023 年 1 月發(fā)布 Beta 版本,將于 5 月底正式對外開源。
ByConity 是一個開源的云原生數(shù)據(jù)倉庫,采用存儲 - 計(jì)算分離的架構(gòu)。它支持多個關(guān)鍵功能特性,如存儲計(jì)算分離、彈性擴(kuò)縮容、租戶資源隔離和數(shù)據(jù)讀寫的強(qiáng)一致性等。通過利用主流的 OLAP 引擎優(yōu)化,如列存儲、向量化執(zhí)行、MPP 執(zhí)行、查詢優(yōu)化等,ByConity 可以提供優(yōu)異的讀寫性能。
ByConity 的架構(gòu)分為三層,如下圖所示,服務(wù)接入層包含負(fù)責(zé)客戶端數(shù)據(jù)和服務(wù)的接入,也就是 ByConity Server;計(jì)算組為 ByConity 的計(jì)算資源層,每個 Virtual Warehouse 是一個計(jì)算組;數(shù)據(jù)存儲層由分布式文件系統(tǒng),如 HDFS、S3 等構(gòu)成。
ByConity 三層技術(shù)架構(gòu)圖
除了兼?zhèn)?ClickHouse 的一些優(yōu)點(diǎn)外,ByConity 還實(shí)現(xiàn)了了諸多新的功能。
ByConity 的一個重要優(yōu)勢是存儲-計(jì)算分離的架構(gòu),它實(shí)現(xiàn)了讀寫分離和彈性擴(kuò)縮容。它的優(yōu)勢是高彈性和高擴(kuò)展性。這種架構(gòu)確保讀操作和寫操作不會相互影響,使得計(jì)算資源和存儲資源解耦,兩者可以按需的且獨(dú)立的擴(kuò)縮容,確保資源高效利用。此外,ByConity 支持多租戶資源隔離功能,保證不同租戶之間不會互相影響,使 ByConity 適用于多租戶環(huán)境,如圖 2。
ByConity 存儲 - 計(jì)算分離,實(shí)現(xiàn)多租戶隔離
ByConity 支持彈性的擴(kuò)縮容,能夠?qū)崟r(shí)、按需的對計(jì)算資源進(jìn)行擴(kuò)縮容,保證資源的高效利用。并且它能對不同的租戶進(jìn)行資源的隔離,租戶之間不會受到相互影響。其另一個重要功能是數(shù)據(jù)讀寫的強(qiáng)一致性,確保數(shù)據(jù)始終是最新的,讀寫之間沒有不一致。此外,ByConity 采用了主流的 OLAP 引擎優(yōu)化,例如列存、向量化執(zhí)行、MPP 執(zhí)行、查詢優(yōu)化等,來保證提供了優(yōu)異的讀寫性能。
之所以采用開源的模式,ByConity 項(xiàng)目組是希望能夠把項(xiàng)目回饋給社區(qū),同時(shí)也希望通過社區(qū)的力量加強(qiáng)和完善 ByConity。接下來,ByConity 在 2023 開源社區(qū)發(fā)展規(guī)劃中,希望增強(qiáng) ByConity 的功能、性能和易用性,重點(diǎn)關(guān)注開發(fā)新的存儲引擎、支持更多的數(shù)據(jù)類型和與其他數(shù)據(jù)管理工具的集成領(lǐng)域。
5 月 28 日,字節(jié)跳動分析型數(shù)據(jù)庫負(fù)責(zé)人陳星將出席 GOTC 2023 “數(shù)據(jù)與數(shù)據(jù)庫技術(shù)” 分論壇,并擔(dān)任講師,帶來《ByConity: 分析型數(shù)據(jù)庫技術(shù)創(chuàng)新與開放之路》主題演講,詳解 ByConity 中的關(guān)鍵技術(shù)選擇,分享 ByConity 開源與開放背后的故事。
敬請期待!
全球開源技術(shù)峰會(Global Open-source Technology Conference),簡稱 GOTC,是由開放原子開源基金會、上海浦東軟件園、Linux 基金會亞太區(qū)和開源中國聯(lián)合發(fā)起的,面向全球開發(fā)者的一場盛大開源技術(shù)盛宴。
5 月 27 日至 28 日,GOTC 2023 將于上海舉辦為期 2 天的開源行業(yè)盛會。大會將以行業(yè)展覽、主題發(fā)言、專題論壇、開源市集的形式展現(xiàn),與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區(qū)塊鏈等熱門技術(shù)主題,以及開源社區(qū)、AIGC、汽車軟件、AI 編程、開源教育培訓(xùn)、云原生等熱門話題,探討開源未來,助力開源發(fā)展。
GOTC 2023報(bào)名通道現(xiàn)已開啟,誠邀全球各技術(shù)領(lǐng)域開源愛好者共襄盛舉!
相關(guān)文章
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動,助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時(shí)延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案