无人高清视频免费观看在线,男人扒开添女人的下面视频

DolphinDB 推出的 CPU-GPU 異構(gòu)計算平臺 Shark，將 DolphinDB 上的復雜指標計算能力無縫切換到 GPU 算力平臺，大幅提升了計算性能。Shark 最新版本給開發(fā)者提供了兩個主要功能：因子挖掘和因子計算。通過使用遺傳算法，因子挖掘功能能夠從歷史金融數(shù)據(jù)中提取出有效因子，提高金融數(shù)據(jù)分析的質(zhì)量和效率。因子計算功能針對金融領(lǐng)域，提供了豐富的函數(shù)庫，為大規(guī)模金融數(shù)據(jù)分析與處理提供了完整解決方案。

自 2023 年 DolphinDB 正式加入“NVIDIA 初創(chuàng)加速計劃（NVIDIA Inception）” 以來，雙方技術(shù)團隊持續(xù)開展技術(shù)交流與探討。此次，DolphinDB 開發(fā)團隊與 NVIDIA 團隊合作，通過利用 NVIDIA RAPIDS 加速 Shark 異構(gòu)計算平臺的因子挖掘算法運行效率，幫助 Shark 將因子挖掘的效率提升 2 - 10 倍；并基于 NVIDIA cuDF 實現(xiàn) Shark 因子高效計算，大幅減少開發(fā)成本，縮短開發(fā)周期。

RAPIDS 的 RMM 是一套開源的內(nèi)存/顯存管理庫，提供 C++ 和 Python 接口，它相比 cuMalloc, cuFree 等操作來講，具有更好的性能和靈活性；RAPIDS libcudf 是基于 GPU 的 C++ DataFrame 庫，提供了基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)，并且內(nèi)置了基礎(chǔ)的函數(shù)算子。

當前挑戰(zhàn)

Shark 的因子挖掘功能，通過利用遺傳算法從數(shù)據(jù)中挖掘出有效的因子。在這一場景中，遺傳算法會隨機生成大量因子并進行計算。這一過程會頻繁地創(chuàng)建和釋放臨時空間來存儲中間結(jié)果，直接使用原生的 CUDA C 顯存分配和釋放接口，會嚴重降低執(zhí)行效率。

Shark 的因子計算功能，針對金融領(lǐng)域的數(shù)據(jù)分析與處理，提供了豐富的函數(shù)庫。如果從零開始將 CPU 的函數(shù)遷移至 GPU，需要為 GPU 重新實現(xiàn)一套底層數(shù)據(jù)結(jié)構(gòu)以及基礎(chǔ)計算函數(shù)，會導致開發(fā)周期的延長以及開發(fā)成本的增加。

應用方案

基于以上挑戰(zhàn)，DolphinDB 開發(fā)團隊與 NVIDIA 團隊及 RAPIDS 開發(fā)團隊合作，通過利用 RAPIDS RMM，解決因子挖掘過程中頻繁申請和釋放顯存導致的性能問題；通過基于 RAPIDS libcudf 進行二次開發(fā)，實現(xiàn)因子計算，從而縮短開發(fā)周期，降低開發(fā)成本。

Shark 進行因子挖掘時，會通過遺傳算法隨機生成海量的因子計算公式。這些公式長度不等，接受的參數(shù)數(shù)量也不盡相同。因此在計算時，需要頻繁地申請和釋放臨時空間用于存儲中間結(jié)果。DolphinDB 開發(fā)團隊通過使用 RMM 對顯存進行池化，從而對中間結(jié)果所使用的顯存進行高效地分配、釋放和重用。

Shark 支持用戶輸入自定義的公式，并自動將自定義公式轉(zhuǎn)換為計算圖，并在 GPU 完成計算，從而加快數(shù)據(jù)分析和處理的效率。如果從零開始將 DolphinDB 的計算函數(shù)遷移至 Shark，需要在 GPU 構(gòu)建 array、table 等底層數(shù)據(jù)結(jié)構(gòu)，并實現(xiàn)大量基礎(chǔ)計算函數(shù)。經(jīng)過調(diào)研后，DolphinDB 開發(fā)團隊決定基于 RAPIDS libcudf 進行二次開發(fā)，復用 cuDF 的 column、table 等底層數(shù)據(jù)結(jié)構(gòu)；并借助 cuDF 的 groupby 和 rolling 框架，只需要完成算子的核心計算邏輯，即可完成 DolphinDB 時序算子和橫截面算子的遷移，極大提升了開發(fā)效率，降低了開發(fā)成本。

效果展示

下圖展示了在不同規(guī)模數(shù)據(jù)下，使用 RAPIDS的 RMM 顯存管理庫相對于原生的 CUDA 顯存分配 API，Shark 因子挖掘效率的對比?？梢郧宄乜吹?，使用 RMM 可以顯著提升 Shark 因子挖掘效率，最高可達到 10 倍的加速比。

除此之外，Shark 通過使用 RAPIDS libcudf，大大提升了因子的計算效率。下圖中對比了 1000 個 group，每個 group 有 10 萬行的數(shù)據(jù)，采用分組方式計算下面的算子?？梢钥吹脚c CPU 相比，利用 GPU 總體耗時（包含拷貝時間），基本達到了一個數(shù)量級的加速比。

借助 RAPIDS，Shark 的因子挖掘效率提升了 10 倍。除此之外，基于 cuDF 進行二次開發(fā)，只需要實現(xiàn)算子的核心邏輯，就可以達到一個數(shù)量級的加速，并極大降低了算子遷移成本。

精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

DolphinDB Shark！一個基于遺傳算法的自動因子挖掘平臺

相關(guān)文章

人工智能企業(yè)

人工智能硬件

人工智能產(chǎn)業(yè)

人工智能技術(shù)