CSDN「智研社-The Intelliger」共話大模型技術(shù)演進與 AI Infra 創(chuàng)新
2024-07-31 18:20:11AI云資訊8067
活動特別邀請到Stability AI機器學習運維主管、知名 AI 開源組織 LAION 工程負責人 & 創(chuàng)始人Richard Vencu和 CSDN 創(chuàng)始人 & 董事長、中國開源軟件推進聯(lián)盟副主席蔣濤進行深度對話,CSDN 高級副總裁李建忠、Momenta 工程質(zhì)量負責人鄒欣、華為"天才少年"申博、白??萍紕?chuàng)始人盧億雷、榮耀首席專家張軼博等重磅嘉賓到場,匯聚了大模型技術(shù)專家、大廠技術(shù)大牛、大模型公司 CXO、生態(tài)合作伙伴代表?,F(xiàn)場嘉賓一起交流思想、分享經(jīng)驗,進行 AGI 相關(guān)前沿科技的深入探討。
第三期智研社-北京站活動現(xiàn)場合影
「智研社-The Intelliger」由 CSDN CTO 俱樂部重磅升級而來。CSDN 高級副總裁李建忠在開場中為大家介紹了智研社未來發(fā)展的三個方向:
一是為技術(shù)人提供充分溝通交流的平臺;
二是提供AGI 技術(shù)發(fā)展與應(yīng)用實踐的探討與合作空間;
三是帶領(lǐng)中國AGI 技術(shù)人走向全球,參與國際 AGI 技術(shù)交流,抓住 AI 爆發(fā)帶來的機遇。
在當今快速發(fā)展的人工智能領(lǐng)域,大規(guī)模計算資源的管理成為了一個關(guān)鍵挑戰(zhàn)。Stability AI 機器學習運維主管、知名 AI 開源組織 LAION 工程負責人 & 創(chuàng)始人 Richard Vencu 在現(xiàn)場帶來了《在AWS 云上打造 Stability AI 超級計算機》的主題演講,深入闡述了在云環(huán)境中運行 5000 個 GPU 的經(jīng)驗,揭示了這一規(guī)模計算所面臨的挑戰(zhàn)及其解決策略。
Richard Vencu,Stability AI 機器學習運維主管、LAION 工程負責人 & 創(chuàng)始人
核心挑戰(zhàn)在于:
機器學習訓練與推理的差異:Vencu 指出,機器學習訓練本質(zhì)上不是一個網(wǎng)絡(luò)問題,而機器學習推理則是。這種區(qū)別源于推理需要通過標準化的網(wǎng)絡(luò)通道向全球用戶提供服務(wù)。
多團隊需求管理:不同AI 團隊對規(guī)模和上市時間的要求各不相同,導致優(yōu)先級不斷變化。這要求資源管理系統(tǒng)具有高度的靈活性。
共享環(huán)境中的信任問題:在共享的高性能計算(HPC)集群中,用戶通常無法獲得 root 訪問權(quán)限,這限制了系統(tǒng)的靈活性。
大規(guī)模資源管理:主要目標是減少GPU 的閑置時間,提高利用率,并減少因缺陷導致的停機時間。
使用追蹤:需要精確追蹤每個項目和用戶的資源使用情況,以便進行報告、稅務(wù)處理和計費。
作為解決方案,Vencu 推薦使用 SLURM 作為資源調(diào)度器。SLURM 是一個有20多年歷史的開源系統(tǒng),維護良好,提供搶占和重新排隊機制(腳本需要意識到這一點并能夠自行恢復)、跨不同優(yōu)先級的優(yōu)先機制和公平共享機制。這些功能有效解決了最大的挑戰(zhàn)——最小化 GPU 閑置時間。
在現(xiàn)場,Vencu 和到場嘉賓進行了互動,為那些希望在云中部署大規(guī)模 AI 計算資源的開發(fā)者提供了寶貴的見解和實踐指導。云環(huán)境中管理大規(guī)模 GPU 資源是一項復雜的任務(wù),涉及多個方面的挑戰(zhàn)。通過采用適當?shù)馁Y源調(diào)度策略、嚴格的安全措施、靈活的項目管理以及全面的監(jiān)控系統(tǒng),可以顯著提高資源利用率,降低成本,同時滿足不同團隊的需求。
隨著大模型的廣泛應(yīng)用,AI 技術(shù)已經(jīng)在自然語言處理、計算機視覺、多模態(tài)理解等領(lǐng)域取得了顯著的突破。大模型強大的生成能力和理解能力,還在各種領(lǐng)域的實際應(yīng)用中展現(xiàn)了巨大的潛力。然而,大模型的訓練和推理需要龐大的計算資源,AI 基礎(chǔ)設(shè)施(AI Infra)的建設(shè)成為了當前技術(shù)發(fā)展的關(guān)鍵。
為了解答這一系列問題,由Momenta 工程質(zhì)量負責人、CSDN 《新程序員》內(nèi)容顧問鄒欣主持,Stability AI 機器學習運維主管、知名 AI 開源組織 LAION 工程負責人 & 創(chuàng)始人Richard Vencu和 CSDN 創(chuàng)始人 & 董事長、中國開源軟件推進聯(lián)盟副主席蔣濤展開圓桌對話,圍繞"2024 大模型技術(shù)演進與 AI Infra 創(chuàng)新"的話題進行了多個方面的探討。
以下是他們對每一方面內(nèi)容的討論焦點:
計算機系統(tǒng)的架構(gòu)轉(zhuǎn)變
當前,我們正在從以 CPU 為中心向以 GPU 或其他 AI 加速器為中心的模式轉(zhuǎn)變。這種轉(zhuǎn)變意味著計算任務(wù)將更多地依賴于專門化的硬件,以提高處理速度和效率。未來可能進入"軟件 2.0"時代,編程將不再僅僅依靠代碼,而是利用數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)來驅(qū)動程序的執(zhí)行。這表明軟件開發(fā)的方式將發(fā)生根本性的變化,更加依賴算法和數(shù)據(jù)處理能力。多家公司正在開發(fā)專用 AI 芯片,競爭格局尚未明朗。這預(yù)示著未來硬件市場的競爭將非常激烈,且可能會出現(xiàn)新的行業(yè)標準和生態(tài)系統(tǒng)。大模型與小模型并存發(fā)展
超大規(guī)模集群支持的通用大模型將繼續(xù)發(fā)展。這些模型通常需要大量的計算資源,能夠處理復雜的任務(wù)和大規(guī)模的數(shù)據(jù)分析。端側(cè)小模型也很重要,用于特定場景和保護隱私。這意味著在設(shè)備端進行高效且安全的數(shù)據(jù)處理將成為一個重要的研究方向,特別是在涉及敏感信息時。兩種模型各有優(yōu)勢,將并行發(fā)展。這種多樣化的策略可以確保在不同的應(yīng)用場景中都能找到合適的解決方案。開源vs 閉源模型
結(jié)合 NVIDIA CEO 黃仁勛近日提出的"孿生地球"觀點,具體分析 Linux 基金會和 Apache 基金會等典型的開源項目案例,在場嘉賓討論了開源模型未來的商業(yè)化和產(chǎn)業(yè)化問題。如今像 OpenAI 這樣的領(lǐng)先公司仍缺少"護城河",所以長期來看,開源模型可能會超過閉源模型。開源促進了模型的快速迭代和改進,允許更多的開發(fā)者參與到項目中,從而加速了技術(shù)的成熟和應(yīng)用的廣泛性。但在某些領(lǐng)域,閉源模型仍可能保持優(yōu)勢。閉源模型提供了更好的控制和安全性,對于某些對數(shù)據(jù)安全有極高要求的行業(yè)來說尤為重要。數(shù)據(jù)與訓練挑戰(zhàn)
高質(zhì)量訓練數(shù)據(jù)對模型至關(guān)重要。這意味著獲取和標注大量高質(zhì)量的數(shù)據(jù)集將是未來發(fā)展的一個重點。未來可能需要更多物理世界的數(shù)據(jù)。隨著技術(shù)的進步,如何有效地收集和利用現(xiàn)實世界中的數(shù)據(jù)將成為提升模型性能的關(guān)鍵因素之一。數(shù)據(jù)開源和共享可能成為一個重要話題。這不僅有助于提高數(shù)據(jù)的質(zhì)量和多樣性,還促進了跨組織之間的合作和知識共享。AGI 展望
當前,人工智能處于早期階段,業(yè)界對 AGI 實現(xiàn)的時間表和可能性存在不同看法。盡管人工智能已經(jīng)取得了顯著進展,但要達到真正的通用人工智能水平仍然充滿挑戰(zhàn)和不確定性。這需要持續(xù)的研究和技術(shù)突破。在場嘉賓積極提問,就開源閉源之爭、具體工程實現(xiàn)、未來 AI 硬件問題和 AGI 愿景等多個角度展開精彩的交流互動。
現(xiàn)場掠影,嘉賓互動活躍
「智研社-The Intelliger」是由 CSDN 發(fā)起創(chuàng)立的高端技術(shù)領(lǐng)導者社群?!钢茄猩?The Intelliger」的前身為 CTO 俱樂部,自 2009 年由 CSDN 創(chuàng)辦以來,是極具影響力的高端技術(shù)管理者分享與交流的平臺。隨著大模型技術(shù)的迅猛發(fā)展,人工智能將成為未來 10 年最有影響力的技術(shù)力量,必將重塑行業(yè)格局并引領(lǐng)創(chuàng)新浪潮。CTO 俱樂部正式更名為「智研社 The-Intelliger」,意味著其將以全新的面貌迎接 AGI 新紀元的到來。
活動主辦方CSDN作為中文技術(shù)社區(qū)的領(lǐng)導者,通過打造「智研社-The Intelliger」在全球各大技術(shù)中心城市的系列活動,匯聚技術(shù)領(lǐng)導者與行業(yè)精英,洞察技術(shù)趨勢,站在 AGI 的新起點上,推動技術(shù)革新和戰(zhàn)略思維的交融,引領(lǐng)技術(shù)領(lǐng)導者走向全球。
活動聯(lián)合主辦方鼎好超互聯(lián)AGI科技生態(tài)創(chuàng)新空間,鼎好超互聯(lián)"AGI 科技生態(tài)創(chuàng)新空間"由世紀互聯(lián)與鼎好 DH3 共同打造??臻g持續(xù)吸納全國一線 Al 企業(yè)與人才,匯聚市場智算資源、科研資源、資金資源、市場資源和社群資源,為各行各業(yè)面向 AGI 轉(zhuǎn)型提供從訓練到推理的新型基礎(chǔ)設(shè)施,致力于成為中國 AGI 發(fā)展的"助推器"和"加速器"。
相關(guān)文章
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 遠程星智F3E上市首發(fā)!玄武11合1超配搭載,實現(xiàn)效能、可靠、安全性全維躍升
- 人體工學鼠標怎么選?細品SANWA新款,自帶腕托的溫柔
- 小水智能受邀AI創(chuàng)新者大會:AI發(fā)展落地為王,引領(lǐng) AI兒童腕表細分領(lǐng)域
- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀元
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能