精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

谷歌開發(fā)強(qiáng)化學(xué)習(xí)框架以培訓(xùn)人工智能模型

2018-08-29 17:07:51AI云資訊1635

谷歌正在開發(fā)一個用于項目的強(qiáng)化學(xué)習(xí)框架來培訓(xùn)人工智能模型。

強(qiáng)化學(xué)習(xí)已經(jīng)被應(yīng)用于迄今為止最令人印象深刻的人工智能演示,包括那些在Alpha Go和Dota 2中擊敗了人類職業(yè)玩家的演示。谷歌子公司DeepMind將其用于其Deep Q-Network(DQN)。

建立一個強(qiáng)化學(xué)習(xí)框架需要時間和大量的資源。為了使人工智能充分發(fā)揮其潛力,它需要變得更容易獲取。

從今天開始,谷歌正在開發(fā)一個基于TensorFlow的開源強(qiáng)化框架——它的機(jī)器學(xué)習(xí)庫——可以在GitHub上找到。

谷歌大腦研究人員Pablo Samuel Castro和Marc G. Bellemare在一篇博客文章中寫道:

“靈感來自于大腦中獎賞激勵行為的一個主要組成部分,反映了神經(jīng)科學(xué)與強(qiáng)化學(xué)習(xí)研究之間的強(qiáng)烈歷史聯(lián)系,這個平臺的目的是為了促成一種能夠推動重大發(fā)現(xiàn)的投機(jī)性研究。”

“這個版本還會說明如何使用我們的框架。”

谷歌的框架設(shè)計有三個重點(diǎn):靈活性、穩(wěn)定性和再現(xiàn)性。

該公司為學(xué)習(xí)環(huán)境提供了15個代碼示例——一個使用視頻游戲來評估人工智能技術(shù)性能的平臺——以及四個不同的機(jī)器學(xué)習(xí)模型:C51、前面提到的DQN、隱式量子網(wǎng)絡(luò)和彩虹代理。

強(qiáng)化學(xué)習(xí)是最有效的訓(xùn)練方法之一。如果你在訓(xùn)練一只狗,把它作為對你想要的行為的獎勵,這是在實踐中積極強(qiáng)化的一個關(guān)鍵例子。

培訓(xùn)一臺機(jī)器是一個類似的概念,獎勵被保留為1和0,而不是商品或薪水。

“我們希望,我們的框架的靈活性和易用性將使研究人員能夠嘗試新的想法,無論是漸進(jìn)的還是激進(jìn)的,”Bellemare和Castro寫道?!拔覀円呀?jīng)在積極地將它用于我們的研究,并發(fā)現(xiàn)它給了我們快速迭代許多想法的靈活性?!?/div>

相關(guān)文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術(shù)

更多>>
AI云資訊(愛云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺。
合作QQ:1211461360微信號:icloudnews