国产成人综合久久精品推,国产精品二三区

谷歌正在開發(fā)一個用于項目的強(qiáng)化學(xué)習(xí)框架來培訓(xùn)人工智能模型。

強(qiáng)化學(xué)習(xí)已經(jīng)被應(yīng)用于迄今為止最令人印象深刻的人工智能演示，包括那些在Alpha Go和Dota 2中擊敗了人類職業(yè)玩家的演示。谷歌子公司DeepMind將其用于其Deep Q-Network(DQN)。

建立一個強(qiáng)化學(xué)習(xí)框架需要時間和大量的資源。為了使人工智能充分發(fā)揮其潛力，它需要變得更容易獲取。

從今天開始，谷歌正在開發(fā)一個基于TensorFlow的開源強(qiáng)化框架——它的機(jī)器學(xué)習(xí)庫——可以在GitHub上找到。

谷歌大腦研究人員Pablo Samuel Castro和Marc G. Bellemare在一篇博客文章中寫道：

“靈感來自于大腦中獎賞激勵行為的一個主要組成部分，反映了神經(jīng)科學(xué)與強(qiáng)化學(xué)習(xí)研究之間的強(qiáng)烈歷史聯(lián)系，這個平臺的目的是為了促成一種能夠推動重大發(fā)現(xiàn)的投機(jī)性研究。”

“這個版本還會說明如何使用我們的框架。”

谷歌的框架設(shè)計有三個重點(diǎn)：靈活性、穩(wěn)定性和再現(xiàn)性。

該公司為學(xué)習(xí)環(huán)境提供了15個代碼示例——一個使用視頻游戲來評估人工智能技術(shù)性能的平臺——以及四個不同的機(jī)器學(xué)習(xí)模型：C51、前面提到的DQN、隱式量子網(wǎng)絡(luò)和彩虹代理。

強(qiáng)化學(xué)習(xí)是最有效的訓(xùn)練方法之一。如果你在訓(xùn)練一只狗，把它作為對你想要的行為的獎勵，這是在實踐中積極強(qiáng)化的一個關(guān)鍵例子。

培訓(xùn)一臺機(jī)器是一個類似的概念，獎勵被保留為1和0，而不是商品或薪水。

“我們希望，我們的框架的靈活性和易用性將使研究人員能夠嘗試新的想法，無論是漸進(jìn)的還是激進(jìn)的，”Bellemare和Castro寫道?！拔覀円呀?jīng)在積極地將它用于我們的研究，并發(fā)現(xiàn)它給了我們快速迭代許多想法的靈活性?！?/div>

AI云資訊（愛云資訊）立足人工智能科技，打造有深度、有前瞻、有影響力的泛科技媒體平臺。

關(guān)于我們聯(lián)系我們免責(zé)聲明會展頻道

冀ICP備2022007386號-1 冀公網(wǎng)安備 13108202000871號

合作QQ：1211461360微信號：icloudnews

精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1