國產(chǎn)數(shù)據(jù)庫共話未來趨勢,Zilliz分享向量數(shù)據(jù)庫新思考
2023-12-08 12:22:03AI云資訊779
無論是“海納百川,有容乃大”的開源環(huán)境,還是“群英薈萃,百家爭鳴”的技術(shù)氛圍,屬于國產(chǎn)數(shù)據(jù)庫的時代大幕已經(jīng)在每一位開發(fā)者的眼前緩緩展開。
近期,【國產(chǎn)數(shù)據(jù)庫·共話未來趨勢】線下沙龍在西湖畔落下帷幕,國產(chǎn)數(shù)據(jù)庫領(lǐng)域資深專家匯聚一堂,共同交流探討數(shù)據(jù)庫技術(shù)。本次內(nèi)容涵蓋 AI 時代的向量數(shù)據(jù)庫、關(guān)系型數(shù)據(jù)庫與 Serverless 等前沿技術(shù)分享,以及如何在 K8s上管理數(shù)據(jù)基礎(chǔ)設(shè)施等議題。
Zilliz 合伙人和技術(shù)總監(jiān) 欒小凡 帶來《當 AI-Native 遇到 Cloud-Native,向量數(shù)據(jù)庫到底應(yīng)該如何做》,分享 Zilliz 在 AI 時代做了哪些事情,以及從 Zilliz 的角度出發(fā)怎么看待向量數(shù)據(jù)庫或者非傳統(tǒng)數(shù)據(jù)庫未來的發(fā)展。
欒小凡首先提出, AI-Native 時代的到來對于數(shù)據(jù)庫提出了更多要求,相應(yīng)地開發(fā)者對其需求也發(fā)生了變化,具體包括以下四個方面:
非結(jié)構(gòu)化數(shù)據(jù)理解困難。非結(jié)構(gòu)化數(shù)據(jù)(長文本、視頻、圖片、音頻、生成分子式、推薦信息)無法通過簡單的機器學(xué)習(xí)算法進行 Zero Shot 的理解,大模型的出現(xiàn)給非結(jié)構(gòu)化數(shù)據(jù)理解和處理提供了新的思路,通過更加通用的方式處理非結(jié)構(gòu)化數(shù)據(jù)成為了可能。
語意正確。AIGC 時代,查詢不再是準確 100% 的“正確性”,相關(guān)和上下文更加重要,基于向量檢索的方案成為主流。
數(shù)據(jù)體量龐大。未來超過80% 的數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù),AIGC 時代數(shù)據(jù)的生成速度遠超過去,系統(tǒng)擴展性性能至關(guān)重要。
缺乏工具。雖然傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)處理并不簡單,但由于 ETL、數(shù)據(jù)庫、數(shù)據(jù)倉庫等工具在過去 30 年的發(fā)展,已經(jīng)變得相對成熟。然而,非結(jié)構(gòu)化數(shù)據(jù)處理的工具鏈才剛剛開始構(gòu)建,這就使得結(jié)構(gòu)化數(shù)據(jù)的處理變得更具挑戰(zhàn)性(相較結(jié)構(gòu)化數(shù)據(jù))。
隨后,欒小凡深度剖析了向量數(shù)據(jù)庫在 AI 時代的變化過程。AI 1.0 時代,向量數(shù)據(jù)已經(jīng)被廣泛應(yīng)用于機器學(xué)習(xí)應(yīng)用中,包括推薦、搜索、翻譯、圖搜、風(fēng)控、安防等;大模型時代的到來,使得向量數(shù)據(jù)涌現(xiàn)出維度更高、體量更大、用途更廣泛的特征。在此過程中,全球領(lǐng)先的向量數(shù)據(jù)庫 Milvus 也經(jīng)歷從了 1.0 架構(gòu)向 2.0 架構(gòu)演進的過程。
提及當時重新搭建 Milvus 2.0 的決定,欒小凡感慨頗深。彼時,隨著用戶數(shù)據(jù)體量的增長,老的架構(gòu)擴展性逐漸成為瓶頸;其次,隨著 AI+大模型的快速發(fā)展,對向量數(shù)據(jù)庫的功能要求越來越高,需要更加靈活的數(shù)據(jù)模型和 API;K8s 和云原生逐漸成熟,搭建分布式系統(tǒng)的難度逐漸降低……多種因素加持下,Milvus——這個集結(jié)了諸多優(yōu)秀技術(shù)人的團隊堅持向【做出世界最先進向量數(shù)據(jù)庫系統(tǒng)】的理想靠近。最終,一個擁有 AI Native + Cloud Native 的 Milvus 2.0 誕生。
Milvus 2.0 架構(gòu)
不過,欒小凡提到,向量數(shù)據(jù)庫絕不僅僅是用來進行簡單的向量檢索,要想真正提升開發(fā)者的開發(fā)效率和使用成本,需要系統(tǒng)開發(fā)者深入理解硬件、存儲、數(shù)據(jù)庫、AI、高性能計算、分布式系統(tǒng)、編譯原理、云原生等方方面面,以確保其穩(wěn)定性、性能和易用性。一個理想的向量數(shù)據(jù)庫應(yīng)該具備以下特性:數(shù)據(jù)持久化和低成本存儲、高性能查詢、數(shù)據(jù)分布、易于使用、穩(wěn)定可用。向量數(shù)據(jù)庫是典型的 Big Data Serving 系統(tǒng),可運維可觀測、智能化。
相關(guān)文章
- 騰訊云論文入選數(shù)據(jù)庫頂會VLDB 2025,REDSQL技術(shù)攻克NL2SQL難點
- 數(shù)據(jù)庫行業(yè)紅海角逐 萬里數(shù)據(jù)庫2025半年度營收逆勢翻倍
- 【喜訊】創(chuàng)鄰科技斬獲 VLDB 2025 最佳論文獎項,以圖智能與AI融合引領(lǐng)數(shù)據(jù)庫新時代
- 守護鐵路安全、提速智慧醫(yī)療,國產(chǎn)數(shù)據(jù)庫賦能國計民生
- 2025數(shù)博會開幕 AI與數(shù)據(jù)庫融合賦能產(chǎn)業(yè)新動能
- 金倉數(shù)據(jù)庫亮相2025數(shù)博會,以AI融合創(chuàng)新賦能產(chǎn)業(yè)升級
- DBdoctor AI輕量版重磅發(fā)布!開啟數(shù)據(jù)庫智能運維“零門檻”時代
- 金倉數(shù)據(jù)庫支撐海南自貿(mào)港“單一窗口”穩(wěn)定運行
- 金倉數(shù)據(jù)庫守護中國鐵路安全運行
- 中國數(shù)據(jù)庫市場格局生變,國產(chǎn)廠商加速核心領(lǐng)域突圍
- 啟明星辰集團數(shù)據(jù)庫安全審計蟬聯(lián)市場份額第一
- 中興通訊金篆數(shù)據(jù)庫GoldenDB榮登中國分布式事務(wù)型數(shù)據(jù)庫市場第一!
- 場景變化驅(qū)動數(shù)據(jù)庫演進,什么才是破局關(guān)鍵?
- “被資本做局了”?國產(chǎn)數(shù)據(jù)庫平替六招破局,核心系統(tǒng)成功“解套”!
- “融合”為體,“AI”為用:金倉數(shù)據(jù)庫在智能時代的破局之道
- 面向AI的融合數(shù)據(jù)庫,國產(chǎn)數(shù)據(jù)庫的新錨點?
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀元
- 未來生活 觸手可得 三星Galaxy智能新品現(xiàn)已開售
- 音質(zhì)升級 煥新登場 三星Galaxy Buds3 FE正式上市
- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能