DolphinDB Shark!一個基于遺傳算法的自動因子挖掘平臺
2024-08-29 10:05:50AI云資訊3745
DolphinDB 推出的 CPU-GPU 異構(gòu)計算平臺 Shark,將 DolphinDB 上的復雜指標計算能力無縫切換到 GPU 算力平臺,大幅提升了計算性能。Shark 最新版本給開發(fā)者提供了兩個主要功能:因子挖掘和因子計算。通過使用遺傳算法,因子挖掘功能能夠從歷史金融數(shù)據(jù)中提取出有效因子,提高金融數(shù)據(jù)分析的質(zhì)量和效率。因子計算功能針對金融領(lǐng)域,提供了豐富的函數(shù)庫,為大規(guī)模金融數(shù)據(jù)分析與處理提供了完整解決方案。
自 2023 年 DolphinDB 正式加入“NVIDIA 初創(chuàng)加速計劃(NVIDIA Inception)” 以來,雙方技術(shù)團隊持續(xù)開展技術(shù)交流與探討。此次,DolphinDB 開發(fā)團隊與 NVIDIA 團隊合作,通過利用 NVIDIA RAPIDS 加速 Shark 異構(gòu)計算平臺的因子挖掘算法運行效率,幫助 Shark 將因子挖掘的效率提升 2 - 10 倍;并基于 NVIDIA cuDF 實現(xiàn) Shark 因子高效計算,大幅減少開發(fā)成本,縮短開發(fā)周期。
RAPIDS 的 RMM 是一套開源的內(nèi)存/顯存管理庫,提供 C++ 和 Python 接口,它相比 cuMalloc, cuFree 等操作來講,具有更好的性能和靈活性;RAPIDS libcudf 是基于 GPU 的 C++ DataFrame 庫,提供了基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),并且內(nèi)置了基礎(chǔ)的函數(shù)算子。
當前挑戰(zhàn)
Shark 的因子挖掘功能,通過利用遺傳算法從數(shù)據(jù)中挖掘出有效的因子。在這一場景中,遺傳算法會隨機生成大量因子并進行計算。這一過程會頻繁地創(chuàng)建和釋放臨時空間來存儲中間結(jié)果,直接使用原生的 CUDA C 顯存分配和釋放接口,會嚴重降低執(zhí)行效率。
Shark 的因子計算功能,針對金融領(lǐng)域的數(shù)據(jù)分析與處理,提供了豐富的函數(shù)庫。如果從零開始將 CPU 的函數(shù)遷移至 GPU,需要為 GPU 重新實現(xiàn)一套底層數(shù)據(jù)結(jié)構(gòu)以及基礎(chǔ)計算函數(shù),會導致開發(fā)周期的延長以及開發(fā)成本的增加。
應用方案
基于以上挑戰(zhàn),DolphinDB 開發(fā)團隊與 NVIDIA 團隊及 RAPIDS 開發(fā)團隊合作,通過利用 RAPIDS RMM,解決因子挖掘過程中頻繁申請和釋放顯存導致的性能問題;通過基于 RAPIDS libcudf 進行二次開發(fā),實現(xiàn)因子計算,從而縮短開發(fā)周期,降低開發(fā)成本。
Shark 進行因子挖掘時,會通過遺傳算法隨機生成海量的因子計算公式。這些公式長度不等,接受的參數(shù)數(shù)量也不盡相同。因此在計算時,需要頻繁地申請和釋放臨時空間用于存儲中間結(jié)果。DolphinDB 開發(fā)團隊通過使用 RMM 對顯存進行池化,從而對中間結(jié)果所使用的顯存進行高效地分配、釋放和重用。
Shark 支持用戶輸入自定義的公式,并自動將自定義公式轉(zhuǎn)換為計算圖,并在 GPU 完成計算,從而加快數(shù)據(jù)分析和處理的效率。如果從零開始將 DolphinDB 的計算函數(shù)遷移至 Shark,需要在 GPU 構(gòu)建 array、table 等底層數(shù)據(jù)結(jié)構(gòu),并實現(xiàn)大量基礎(chǔ)計算函數(shù)。經(jīng)過調(diào)研后,DolphinDB 開發(fā)團隊決定基于 RAPIDS libcudf 進行二次開發(fā),復用 cuDF 的 column、table 等底層數(shù)據(jù)結(jié)構(gòu);并借助 cuDF 的 groupby 和 rolling 框架,只需要完成算子的核心計算邏輯,即可完成 DolphinDB 時序算子和橫截面算子的遷移,極大提升了開發(fā)效率,降低了開發(fā)成本。
效果展示
下圖展示了在不同規(guī)模數(shù)據(jù)下,使用 RAPIDS的 RMM 顯存管理庫相對于原生的 CUDA 顯存分配 API,Shark 因子挖掘效率的對比??梢郧宄乜吹?,使用 RMM 可以顯著提升 Shark 因子挖掘效率,最高可達到 10 倍的加速比。
除此之外,Shark 通過使用 RAPIDS libcudf,大大提升了因子的計算效率。下圖中對比了 1000 個 group,每個 group 有 10 萬行的數(shù)據(jù),采用分組方式計算下面的算子??梢钥吹脚c CPU 相比,利用 GPU 總體耗時(包含拷貝時間),基本達到了一個數(shù)量級的加速比。
借助 RAPIDS,Shark 的因子挖掘效率提升了 10 倍。除此之外,基于 cuDF 進行二次開發(fā),只需要實現(xiàn)算子的核心邏輯,就可以達到一個數(shù)量級的加速,并極大降低了算子遷移成本。
相關(guān)文章
- Raythink燧石熱像儀測溫算法Ray Thermal S攻克高精度紅外測溫難關(guān)!
- 諸葛智能「分析師Agent」,入選BPAA全球算法大賽Top50
- 偉輝科技控股有限公司榮獲2024年香港金融科技獎,量子算法引領(lǐng)貴金屬交易新紀元
- 酷狗音樂上線「歌曲過渡」功能,AI算法打造流暢聽感體驗
- 智匯普陀,第五屆BPAA算法大賽總決賽在滬收官
- 偉輝科技控股:以量子算法與AI賦能金融科技,打造全球智能資管新標桿
- 2025長三角(蕪湖)算力算法創(chuàng)新應用大賽正式啟動,聚焦“算力+產(chǎn)業(yè)”融合新實踐
- 融合深度學習與量子計算,微美全息探索Grover算法量子神經(jīng)網(wǎng)絡(luò)模型
- 偉輝科技量子算法交易重塑金融科技版圖 智能資產(chǎn)管理領(lǐng)航貴金屬交易新生態(tài)
- 思必馳自研AI算法突破拾音“禁區(qū)”,驚艷世界頂尖學府
- 微云全息融合Gamma校正與全變分算法, 非線性調(diào)整圖像亮度以提升對比度和清晰度
- 社科院李勇堅:算法為企業(yè)帶來巨大價值,其對經(jīng)濟發(fā)展的貢獻仍被低估
- 靈初智能發(fā)布分層端到端VLA+強化學習算法模型Psi-R1
- 芯馳科技與伊世智能達成戰(zhàn)略合作,推進本土首顆車規(guī)MCU的后量子密碼算法落地
- 北大教授姚洋:算法不依賴觀點推薦,能顯著降低信息獲取成本
- 三維天地智能路徑規(guī)劃引擎:以算法驅(qū)動,重新定義智能路徑優(yōu)化技術(shù)
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案