谷歌開發(fā)強(qiáng)化學(xué)習(xí)框架以培訓(xùn)人工智能模型
2018-08-29 17:07:51AI云資訊1635
強(qiáng)化學(xué)習(xí)已經(jīng)被應(yīng)用于迄今為止最令人印象深刻的人工智能演示,包括那些在Alpha Go和Dota 2中擊敗了人類職業(yè)玩家的演示。谷歌子公司DeepMind將其用于其Deep Q-Network(DQN)。
建立一個強(qiáng)化學(xué)習(xí)框架需要時間和大量的資源。為了使人工智能充分發(fā)揮其潛力,它需要變得更容易獲取。
從今天開始,谷歌正在開發(fā)一個基于TensorFlow的開源強(qiáng)化框架——它的機(jī)器學(xué)習(xí)庫——可以在GitHub上找到。
谷歌大腦研究人員Pablo Samuel Castro和Marc G. Bellemare在一篇博客文章中寫道:
“靈感來自于大腦中獎賞激勵行為的一個主要組成部分,反映了神經(jīng)科學(xué)與強(qiáng)化學(xué)習(xí)研究之間的強(qiáng)烈歷史聯(lián)系,這個平臺的目的是為了促成一種能夠推動重大發(fā)現(xiàn)的投機(jī)性研究。”
“這個版本還會說明如何使用我們的框架。”
谷歌的框架設(shè)計有三個重點(diǎn):靈活性、穩(wěn)定性和再現(xiàn)性。
該公司為學(xué)習(xí)環(huán)境提供了15個代碼示例——一個使用視頻游戲來評估人工智能技術(shù)性能的平臺——以及四個不同的機(jī)器學(xué)習(xí)模型:C51、前面提到的DQN、隱式量子網(wǎng)絡(luò)和彩虹代理。
強(qiáng)化學(xué)習(xí)是最有效的訓(xùn)練方法之一。如果你在訓(xùn)練一只狗,把它作為對你想要的行為的獎勵,這是在實踐中積極強(qiáng)化的一個關(guān)鍵例子。
培訓(xùn)一臺機(jī)器是一個類似的概念,獎勵被保留為1和0,而不是商品或薪水。
“我們希望,我們的框架的靈活性和易用性將使研究人員能夠嘗試新的想法,無論是漸進(jìn)的還是激進(jìn)的,”Bellemare和Castro寫道?!拔覀円呀?jīng)在積極地將它用于我們的研究,并發(fā)現(xiàn)它給了我們快速迭代許多想法的靈活性?!?/div>相關(guān)文章
- 谷歌Waymo獲準(zhǔn)在舊金山提供機(jī)場接送服務(wù)
- 谷歌公布Gemini使用權(quán)限
- 蘋果為Siri開發(fā)的AI搜索工具或?qū)⒗霉雀璧腉emini AI模型來匯總網(wǎng)絡(luò)信息
- 谷歌已完成AI眼鏡開發(fā),或由HTC代工量產(chǎn)
- 告別短信驗證碼:谷歌測試二維碼驗證技術(shù),讓短信更安全
- 蘋果與谷歌洽談使用Gemini AI模型改造Siri
- 谷歌Gemini人工智能推出全新引導(dǎo)學(xué)習(xí)模式
- 谷歌搜索的AI模式升級,新增作業(yè)識別功能
- 谷歌CEO桑達(dá)爾·皮查伊表示,人工智能對谷歌每個領(lǐng)域的業(yè)務(wù)都產(chǎn)生了積極影響
- 谷歌持續(xù)加碼人工智能領(lǐng)域?qū)е绿寂欧帕吭俅闻噬?較2019年激增51%
- 谷歌發(fā)布新一代AR眼鏡 立訊精密深度賦能
- “5G核心網(wǎng)絡(luò)即服務(wù)”時代來臨:愛立信攜手谷歌云共譜AI新篇章
- 云從科技超越谷歌、OpenAI問鼎全球多模態(tài)榜單 中國自研AI實現(xiàn)歷史性突破
- 谷歌與大朋VR 聚焦AI 眼鏡賽道,技術(shù)布局凸顯行業(yè)新方向
- 蘋果推進(jìn)智能眼鏡暗戰(zhàn)谷歌,Meta/微美全息深耕AR賽道搶占XR市場新機(jī)遇
- 海信通過谷歌Home API拓展ConnectLife平臺,實現(xiàn)第三方設(shè)備兼容
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元
- 未來生活 觸手可得 三星Galaxy智能新品現(xiàn)已開售
- 音質(zhì)升級 煥新登場 三星Galaxy Buds3 FE正式上市
- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能

冀ICP備2022007386號-1 冀公網(wǎng)安備 13108202000871號
AI云資訊 Copyright?2018-2025


