使用MongoDB 構(gòu)建AI:輕松應(yīng)對從預測式AI到生成式AI
2024-04-12 10:04:33AI云資訊894
毫無疑問,如今從生成式AI (GenAI )中獲益最大的是那些早已運用預測式AI (Predictive AI )的組織。2023年6月,麥肯錫在2023年6月發(fā)布的《生成式人工智能的經(jīng)濟潛力》研究中得出了與此相同的結(jié)論。
原因主要有以下幾點:
1.內(nèi)部文化決定組織是否愿意嘗試和探索人工智能
2.組織是否具備相關(guān)技能,但必須強調(diào)的是相比預測式AI,生成式AI更依賴于開發(fā)者,而不是數(shù)據(jù)科學家
3.組織是否擁有準確無誤、精心挑選的數(shù)據(jù),可隨時輸入到GenAI模型中
但這并不意味著只有具備預測式AI使用經(jīng)驗的團隊才能從生成式AI中獲益。如果分析研究MongoDB“構(gòu)建AI案例研究系列”中的實例,不難發(fā)現(xiàn),許多處于不同AI成熟度階段的組織都在利用MongoDB進行人工智能創(chuàng)新。
本文介紹兩家企業(yè),它們成功地構(gòu)建了預測式AI應(yīng)用程序,并朝著生成式AI的方向邁進:
1.MyGamePlan助力職業(yè)足球運動員和教練提升球隊表現(xiàn)。
2.Ferret.ai利用公開數(shù)據(jù)進行背景調(diào)查,幫助企業(yè)和消費者之間建立信任。
在這兩個案例中,預測式AI成為數(shù)據(jù)驅(qū)動型決策的核心。如今,這兩家公司都正在探索生成式AI,希望通過推出新產(chǎn)品來擴展服務(wù),以提高用戶參與度。兩者的共同之處是他們都選擇了MongoDB Atlas,并將其靈活運用到各種AI用例中。
MyGamePlan: 利用AI驅(qū)動的洞察力提升職業(yè)足球運動員的表現(xiàn)
利用數(shù)據(jù)和分析來提升職業(yè)運動員表現(xiàn)的做法并不新鮮。但是,解決方案往往極其復雜,需要集成來自多個數(shù)據(jù)提供者的數(shù)據(jù),導致成本高昂且洞察時間長。MyGamePlan專注于協(xié)助職業(yè)足球俱樂部和球員改變這種狀況。
很多歐洲優(yōu)秀的球隊工作人員和球員都正在使用MyGamePlan,其中包括勒沃庫森足球俱樂部 (Bayer Leverkusen,目前位列德國足球甲級聯(lián)賽第一名 )、桑德蘭足球俱樂部 (AFC Sunderland,英冠聯(lián)賽 )、卡斯特利翁足球俱樂部 (CD Castellón,目前位列西班牙第三級別聯(lián)賽第一名 )及弗羅茨瓦夫西里西亞足球俱樂部 (Slask Wroclaw,目前位列波蘭足球甲級聯(lián)賽第一名 )。
據(jù)MyGamePlan首席技術(shù)官兼聯(lián)合創(chuàng)始人Dries Deprest介紹,MyGamePlan借助前沿分析、AI技術(shù)及用戶友好型平臺實現(xiàn)了賽事數(shù)據(jù)、球員跟蹤數(shù)據(jù)和視頻資源數(shù)據(jù)的無縫集成,并重新定義了足球分析的方式。平臺可以實現(xiàn)工作流程自動化,幫助教練和球員制定比賽戰(zhàn)術(shù)、促進球員發(fā)展并推動卓越戰(zhàn)略實施,從而助力球隊取得勝利。
MyGamePlay平臺的核心是基于Python的自定義預測式AI模型。這些模型托管在Amazon Sagemaker上,能夠分析比賽的特定時刻,對球員的個人表現(xiàn)及其對球隊的貢獻進行評分。此外,這些模型還可以推測球員的表現(xiàn)和貢獻,并與對手球隊的球員進行比較,以幫助制定比賽日戰(zhàn)術(shù)。
數(shù)據(jù)是確保模型和預測準確性的關(guān)鍵。該公司將MongoDB Atlas作為其數(shù)據(jù)庫,用于存儲:
1.每場比賽的元數(shù)據(jù),包括比賽、球隊和球員的數(shù)據(jù)。
2.每場比賽的事件數(shù)據(jù),如傳球、斷球、犯規(guī)和射門等。
3.跟蹤遙測數(shù)據(jù),可每隔100毫秒捕捉每位球員在場的位置。
這些數(shù)據(jù)可從MongoDB遷移到Python DataFrames,與第三方數(shù)據(jù)流結(jié)合使用,共同訓練公司的ML模型。同時,可從特定比賽序列中生成推論并將其存儲回MongoDB Atlas,供教練和球員進行下游分析。
圖1: 利用MyGamePlan網(wǎng)頁和手機應(yīng)用,教練和球員可以即時評估比賽并制定戰(zhàn)術(shù)。
Deprest表示,MyGamePlan正在使用AI模型持續(xù)豐富數(shù)據(jù),并將這些數(shù)據(jù)用于洞察和分析,因此MongoDB非常適合這一用例。
兩年前,MyGamePlan啟動了開發(fā)項目,從那時起便開始采用MongoDB。數(shù)據(jù)涉及復雜的多向關(guān)系,需要將比賽與球員、事件和跟蹤相互關(guān)聯(lián)。為了更好地表示這種數(shù)據(jù)關(guān)系,MyGamePlan選擇在豐富的文檔結(jié)構(gòu)中使用嵌套元素。這種方法不僅能夠提高開發(fā)者的工作效率,還能夠提升程序運行效率。如果使用外鍵創(chuàng)建關(guān)系模型,再連接關(guān)系數(shù)據(jù)庫中的規(guī)范化表格,這樣極為緩慢且低效。
在開發(fā)方面,Deprest表示,使用PyMongo driver將MongoDB與托管在Sagemaker的Python ML數(shù)據(jù)管道和MongoDB Node.js driver集成在一起,隨后將其用于基于React、面向客戶端的網(wǎng)頁和移動應(yīng)用程序。
Deprest認為,造成MongoDB與NoSQL數(shù)據(jù)之間差異的兩個關(guān)鍵因素在于: 首先,MongoDB更受開發(fā)者的青睞,采用率更高。這就意味著團隊能夠快速熟悉它,并利用它來提高效率。其次,用戶可以直接在實時數(shù)據(jù)的基礎(chǔ)上構(gòu)建應(yīng)用內(nèi)部分析,無需花費時間和金錢將其移動到數(shù)據(jù)倉庫或數(shù)據(jù)湖中。借助MongoDB的聚合管道,用戶可以使用強大的滾動、變換和窗口函數(shù)來處理和分析數(shù)據(jù),以根據(jù)需求對數(shù)據(jù)進行切片和切塊。
除了預測式AI,MyGamePlan團隊正在評估如何利用GenAI來進一步改善用戶體驗。
據(jù)Deprest介紹,MyGamePlan平臺擁有豐富的數(shù)據(jù)和分析,希望讓球員和教練能夠更加輕松地從中獲得洞見。為此,他們正在探索在數(shù)據(jù)之上進行自然語言處理,并通過聊天和問答界面來實現(xiàn)這一目標。借助GenAI,用戶可以輕松地可視化并總結(jié)數(shù)據(jù)。目前,團隊正在評估將OpenAI旗下大型語言模型 (LLM )ChatGPT與復雜的提示工程方法相結(jié)合,同時利用LangChain進行編排,配合使用LlamaIndex和MongoDB Atlas Vector Search來實現(xiàn)檢索增強生成 (RAG )的能力。
基于MongoDB Atlas來構(gòu)建應(yīng)用,使MyGamePlan團隊能夠利用開發(fā)者數(shù)據(jù)平臺的豐富功能,為未來的幾乎所有應(yīng)用和AI需求提供支持。用Deprest的話來說,就是:“由于MyGamePlan的源數(shù)據(jù)保存在MongoDB Atlas數(shù)據(jù)庫中,將其與向量存儲及就地向量搜索結(jié)合使用為我們的開發(fā)者提供了一種非常高效且完美的解決方案?!?
Ferret.ai: 通過AI和MongoDB Atlas生成智能,解析關(guān)系以創(chuàng)建信任,同時降低成本達30%
無論在現(xiàn)實世界還是在數(shù)學世界,我們都在不斷地與他人建立關(guān)系。不論是線上交易、廠商或?qū)I(yè)人士與潛在客戶,還是投資者與企業(yè)創(chuàng)始人或者其他方面,建立新的人際關(guān)系不可避免。在所有這些關(guān)系中,信任必不可少,然而建立信任卻是一件非常具有挑戰(zhàn)性的事情。Ferret.ai正是這樣一款旨在幫助消除猜疑、建立信任的工具。
Ferret是一個AI平臺,專注于為公司和個人提供實時、公正的情報,以識別風險并把握機遇。借助先進的預測式和生成式AI,結(jié)合成千上萬的全球數(shù)據(jù)源及數(shù)十億公開文件,Ferret.ai可提供精心策劃的關(guān)系情報和監(jiān)測服務(wù) (這些服務(wù)以往僅限于金融行業(yè)使用 ),幫助樹立透明度新標準。
Ferret首席技術(shù)官Al Basseri在談及Ferret的工作原理時表示,Ferret.ai從公共來源中獲取個人信息。這些來源包括社交網(wǎng)絡(luò)、交易記錄、法庭文件、新聞檔案、公司所有權(quán)和注冊商業(yè)利益等。相關(guān)數(shù)據(jù)通過Kafka管道傳輸?shù)焦镜腁nyscale/Ray MLops平臺,在這個平臺上,再使用spaCy提取和機器學習模型來進行自然語言處理。Ferret.ai從數(shù)據(jù)源中獲得的所有元數(shù)據(jù) (接近30億個文檔 )及模型推斷均存儲在MongoDB Atlas中。用戶可通過頁面和移動客戶應(yīng)用程序,企業(yè)用戶可通過即將推出API來使用Atlas中的數(shù)據(jù)。
圖2: 人工智能+實時數(shù)據(jù)=來自Ferret.ai的關(guān)系智能
除了預測式AI之外,公司開發(fā)者目前正在嘗試在Ferret平臺上使用GenAI。Basseri表示,Ferret與英偉達的數(shù)據(jù)科學團隊建立了緊密的合作關(guān)系,從而能夠?qū)λ峁┑臄?shù)據(jù)來源和分析進行綜合,以幫助客戶更好地了解聯(lián)系人,并建立良好的關(guān)系。實驗表明,相比那些規(guī)模更大、更通用的大型語言模型,Mistral模型及其混合專家集成系統(tǒng)所需的資源開銷更少。
除了托管來自Ferret的預測式和生成式AI模型數(shù)據(jù)外,客戶數(shù)據(jù)和聯(lián)系人列表也存儲在MongoDB Atlas中。Ferret可對公共記錄源進行持續(xù)監(jiān)測和評分,及時檢測個人身份信息的變化。
正如Basseri所介紹的,通過使用MongoDB Atlas Triggers,Ferret.ai可以監(jiān)測評分的更新,并立即向消費應(yīng)用程序發(fā)送警報,從而使客戶能夠?qū)崟r了解關(guān)系網(wǎng)絡(luò)動態(tài)。這是一種具有反應(yīng)式的、完全基于事件驅(qū)動的程序,開發(fā)者只需進行設(shè)置即可輕松實現(xiàn)。
Basseri還介紹了MongoDB為其開發(fā)者帶來的其它一些優(yōu)勢,其中包括:
-借助Atlas,該服務(wù)以完全托管的形式提供,并融入了最佳實踐。這使開發(fā)者和數(shù)據(jù)科學家可以從數(shù)據(jù)庫運行工作中解脫出來,將精力投入到應(yīng)用程序和AI創(chuàng)新上
-MongoDB Atlas是一種成熟的解決方案,已被廣泛應(yīng)用于許多高增長的企業(yè)
-隨著團隊的迅速擴展,擁有了解MongoDB的工程師變得至關(guān)重要
除了數(shù)據(jù)庫之外,Ferret正將其對MongoDB Atlas平臺的應(yīng)用擴展到文本搜索領(lǐng)域。隨著公司進入谷歌云,其正在從現(xiàn)有的Amazon OpenSearch服務(wù)遷移到Atlas Search。
在談及遷移的驅(qū)動因素時,Basseri表示:“將數(shù)據(jù)庫和搜索統(tǒng)一在同一個API有助于減少開發(fā)者的認知負荷,從而提高他們的工作效率,加快新功能的構(gòu)建。這樣可以消除了數(shù)據(jù)庫和搜索之間同步數(shù)據(jù)帶來的不便,從而縮短了工程周期。此外,這也意味著用戶可以獲得更好的體驗,因為之前的延遲瓶頸已經(jīng)消失,用戶在Ferret平臺上搜索聯(lián)系人和內(nèi)容時,可以得到最新的結(jié)果,而不是過時的數(shù)據(jù)。從OpenSearch遷移到Atlas Search還可以節(jié)省資金成本,并獲得更多的靈活性。通過消除數(shù)據(jù)庫和搜索引擎之間不必要的數(shù)據(jù)冗余,可將每月的總云成本減少30%。由于Atlas是支持多云的開發(fā)者數(shù)據(jù)平臺,因此可以根據(jù)需要在多個云提供商之間遷移?!?
遷移完成后,Basseri及其團隊將能夠使用Atlas Vector Search進行開發(fā),并繼續(xù)構(gòu)建Ferret平臺的GenAI功能。
從以上兩個案例可以看出,無論企業(yè)目前處于AI發(fā)展的哪個階段,MongoDB均可提供支持。
相關(guān)文章
- 通過獨特的可查詢加密技術(shù),MongoDB為數(shù)據(jù)安全提供覆蓋全生命周期的保護
- 利用MongoDB進行數(shù)據(jù)治理,防范構(gòu)建生成式AI應(yīng)用程序時的潛在安全風險
- 多云應(yīng)用安全平臺RegData利用MongoDB簡化數(shù)據(jù)控制和合規(guī)流程
- Questflow借助MongoDB Atlas以AI重新定義未來工作方式
- MongoDB為提供MongoDB數(shù)據(jù)庫服務(wù)的云服務(wù)合作伙伴推出認證計劃
- MongoDB Atlas Vector Search與Amazon Bedrock集成已全面可用
- MongoDB觀點:讓生成式AI成為業(yè)務(wù)增長的新動能,游戲公司可以這樣做
- 使用MongoDB 構(gòu)建AI:輕松應(yīng)對從預測式AI到生成式AI
- 構(gòu)建AI服務(wù)的秘密武器:MongoDB Atlas,4家企業(yè)案例為您揭曉
- MongoDB推出Atlas Stream Processing公共預覽版
- MongoDB助力西門子數(shù)字化工廠構(gòu)建下一代制造執(zhí)行系統(tǒng)
- MongoDB和阿里云攜手驅(qū)動WeLab,引領(lǐng)超千萬用戶邁向智能金融未來
- 阿里云數(shù)據(jù)庫MongoDB版助力吉比特《一念逍遙》游戲斬獲千萬玩家,運營效率成倍增長
- MongoDB與阿里云建立全新合作伙伴關(guān)系
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案