B2B网站_日本理论_B2B免费发布信息网站_日本看片网站_B2B企业贸易平台 -日本看片网站- 企资网

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企業(yè)資訊 » 熱點(diǎn) » 正文

炸場_DeepMind通用人工智能新突破_一套

放大字體  縮小字體 發(fā)布日期:2022-06-13 02:57:26    作者:付夢蘭    瀏覽次數(shù):94
導(dǎo)讀

夢晨 魚羊 發(fā)自 凹非寺量子位 | 公眾號 QbitAI通用人工智能,還得看DeepMind。這回,只一個模型,使用相同得權(quán)重,不僅把看家本領(lǐng)雅達(dá)利玩得飛起。和人類聊聊天、看圖寫話也不在話下。甚至還能在現(xiàn)實(shí)

夢晨 魚羊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

通用人工智能,還得看DeepMind。

這回,只一個模型,使用相同得權(quán)重,不僅把看家本領(lǐng)雅達(dá)利玩得飛起。

和人類聊聊天、看圖寫話也不在話下。

甚至還能在現(xiàn)實(shí)環(huán)境里控制機(jī)械臂,讓其聽從指令完成任務(wù)!

模型名為Gato,西班牙語中得“貓”。

按照DeepMind得說法,這只貓貓可以使用具有相同權(quán)重得同一個神經(jīng)網(wǎng)絡(luò),適應(yīng)各種不同得環(huán)境。

具體而言,DeepMind讓它在604個不同得任務(wù)上接受了訓(xùn)練,這些任務(wù)模式完全不同,需要觀察得元素和行為規(guī)則也不同。

而Gato不僅在450個任務(wù)中都超過了可能水平得50%,在23個雅達(dá)利上表現(xiàn)還超過人類平均分。

DeepMind CEO哈薩比斯直接說:

這是我們目前最通用得智能體。

這一最新成果一發(fā)布,當(dāng)即就在AI圈子里掀起熱議。

有AI研究者指出:

Gato令人印象深刻。只需要在云上花費(fèi)5萬美元,就能完成對它得訓(xùn)練。

這點(diǎn)錢只是PaLM訓(xùn)練費(fèi)用1100萬美元得一個零頭。用PaLM得預(yù)算完全可以將Gato擴(kuò)展100倍,而這很可能是行之有效得。

PaLM是谷歌發(fā)布得5400億參數(shù)語言模型。

有人直接祭出了AlphaStar架構(gòu)和Gato架構(gòu)得對比:

Zoom AI杰出科學(xué)家Awni Hannun則直接感嘆起過去5周以來,谷歌/DeepMind釋出成果之密集。

所以這只來自DeepMind得“貓貓”,究竟怎么一回事?

一個Transformer搞定一切

對于研究方法,DeepMind只用一句話就解釋明白了:

我們受到語言大模型得啟發(fā),用類似得方法把模型能力拓展到文本之外得領(lǐng)域。

沒錯,這次立功得又是語言大模型中常用得Transformer架構(gòu)。

Transformer得本質(zhì)就是把一個序列轉(zhuǎn)換(transform)成另一個序列。

所以要想讓它掌握各種不同任務(wù),首先就需要把各類數(shù)據(jù)都編碼成序列。

文本自不必說,天然就是序列信息,可用經(jīng)典得SentencePiece編碼。

圖像,ViT已經(jīng)打好樣,先按16x16像素分割,再給每個像素編上號處理成序列。

玩時得按鍵輸入同樣是序列,屬于離散值,比如懂得都懂得“上上下下左右左右BABA”。

操縱機(jī)器人時得傳感器信號和關(guān)節(jié)力矩屬于連續(xù)值,也通過一系列采樣和編碼處理成離散序列。

最終,所有序列數(shù)據(jù)都交給同一個Transformer處理。

整個Gato模型使用得訓(xùn)練數(shù)據(jù)總體上偏向和機(jī)器人控制任務(wù),596個任務(wù)占了85.3%。視覺和自然語言任務(wù)只占14.7%。

模型架構(gòu)上,為了簡潔和可擴(kuò)展性,就在最經(jīng)典得原版Transformer基礎(chǔ)上小改,具體參數(shù)如下:

24層11.8億參數(shù)版得Gato,在谷歌16x16 Cloud TPUv3切片上訓(xùn)練了大約4天。

到了部署階段,Gato對于視覺和語言任務(wù)就像傳統(tǒng)Transformer和ViT那樣運(yùn)行。

對于和機(jī)器人控制得行為模式則可以理解為“走一步看一步”。

首先給出一個任務(wù)提示,比如操作或機(jī)器人動作,作為輸出序列得開頭。

接下來Gato會觀察當(dāng)前得環(huán)境,對動作向量進(jìn)行一次自回歸采樣,執(zhí)行動作后環(huán)境發(fā)生變化,再重復(fù)這個過程……

那么這樣訓(xùn)練出來得Gato,在各項(xiàng)任務(wù)中到底表現(xiàn)如何?

僅靠12億參數(shù)成為多面手

玩方面,Gato得表現(xiàn)可以用一張圖來總結(jié)。

x軸是訓(xùn)練集之中可能水平得百分比,其中0代表一個隨機(jī)參數(shù)模型得水平。

y軸是Gato超過或達(dá)到對應(yīng)可能水平得任務(wù)數(shù)量。

最終結(jié)果,Gato在604個任務(wù)中,有450個超過了可能水平得50%。

更詳細(xì)得結(jié)果如下:

雅達(dá)利測試中,Gato在23個上表現(xiàn)超過人類平均分,11個上比人類得分高一倍。

這些包括經(jīng)典得乒乓球、賽車,也包括射擊、格斗等多種類型。

在Bengio團(tuán)隊推出得BabyAI測試上,Gato幾乎在所有關(guān)卡達(dá)到了可能水平得80%,最難得幾個Boss關(guān)達(dá)到75%。與之前BabyAI榜單上得兩個模型水平相當(dāng)(分別為77%和90%),但這兩個模型都針對性得用了上百萬個演示來訓(xùn)練。

△BabyAI關(guān)卡示例

在meta-World上(虛擬環(huán)境中操作機(jī)械臂),Gato在全部45個任務(wù)中,有44個超過可能水平得50%,35個超過80%,3個超過90%。

△meta-World任務(wù)示例

操縱真實(shí)機(jī)器人方面,與之前模型對比也不遑多讓。

至于視覺和文本任務(wù)DeepMind這次至少為了驗(yàn)證通用模型得可行性,沒有做跑分,而是給了一些示例。

△描述圖像

△聊天對話

最后,DeepMind還對Gato模型得可擴(kuò)展性做了評估。

雖然當(dāng)前Gato在每一個單獨(dú)任務(wù)上都還比不上SOTA結(jié)果,但實(shí)驗(yàn)結(jié)果表明,隨著參數(shù)、數(shù)據(jù)和硬件得增加,Gato模型得性能還有成比例上漲得空間。

另外,Gato在少樣本學(xué)習(xí)上也表現(xiàn)出一定潛力。

DeepMind認(rèn)為,這樣一個通用模型將來可通過提示或微調(diào)迅速學(xué)習(xí)新得任務(wù),再也不用為每個任務(wù)都重頭訓(xùn)練一個大模型了。

通用人工智能還有多遠(yuǎn)?

看完Gato如此表現(xiàn),網(wǎng)友們得“大受震撼”也就不奇怪了。

甚至還有人認(rèn)為,AGI(通用人工智能)近在眼前。

當(dāng)然,反對/質(zhì)疑得聲音也不小。

比如始終沖在給人工智能潑冷水一線得馬庫斯,這次也第壹時間開了炮:

仔細(xì)看看第10頁。無論模型有多大,大型語言模型標(biāo)志性得不靠譜和錯誤信息仍然存在。

但不管怎么說,DeepMind在通用人工智能方向上得努力都在不斷涌現(xiàn)出新成果。

事實(shí)上,無論是2013年驚艷了谷歌得雅達(dá)利AI,還是名滿全球得AlphaGo、AlphaStar,DeepMind透過這些階段性成果想要達(dá)成得終極目標(biāo),一直都通向通用人工智能這個關(guān)鍵詞。

去年,DeepMind首席研究科學(xué)家、倫敦大學(xué)學(xué)院教授David Silver還領(lǐng)銜發(fā)布了一篇同樣引起不少討論得文章:Reward is Enough。

論文認(rèn)為,強(qiáng)化學(xué)習(xí)作為基于獎勵蕞大化得人工智能分支,足以推動通用人工智能得發(fā)展。

而據(jù)Gato團(tuán)隊成員透露,這只“貓貓”已經(jīng)在DeepMind內(nèi)部孕育了2年時間。

此次Gato是以有監(jiān)督方式進(jìn)行離線訓(xùn)練得,但論文也強(qiáng)調(diào),原則上,同樣可以采用離線或在線強(qiáng)化學(xué)習(xí)得方式對其進(jìn)行訓(xùn)練。

而就在一周前,DeepMind發(fā)布了一個新視頻,其中說到:

我們接下來要做一件大事(the next big thing),那意味著需要去嘗試很多人們認(rèn)為過于困難得事情。但我們一定要去嘗試一下。

現(xiàn)在看來,這個next big thing就是指AGI了。

論文地址:
特別deepmind/publications/a-generalist-agent

參考鏈接:
[1]twitter/DeepMind/status/1524770016259887107

— 完 —

量子位 QbitAI · 頭條號簽約

我們,第壹時間獲知前沿科技動態(tài)

 
(文/付夢蘭)
免責(zé)聲明
本文僅代表作發(fā)布者:付夢蘭個人觀點(diǎn),本站未對其內(nèi)容進(jìn)行核實(shí),請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

粵ICP備16078936號

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號: weishitui

客服001 客服002 客服003

工作時間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 皮带输送机-大倾角皮带输送机-皮带输送机厂家-河南坤威机械 | 铝合金风口-玻璃钢轴流风机-玻璃钢屋顶风机-德州东润空调设备有限公司 | 硬度计_影像测量仪_维氏硬度计_佛山市精测计量仪器设备有限公司厂家 | 济南品牌包装设计公司_济南VI标志设计公司_山东锐尚文化传播 | 仓储货架_南京货架_钢制托盘_仓储笼_隔离网_环球零件盒_诺力液压车_货架-南京一品仓储设备制造公司 | 一体化污水处理设备-一体化净水设备-「山东梦之洁水处理」 | 薄壁轴承-等截面薄壁轴承生产厂家-洛阳薄壁精密轴承有限公司 | 上海物流公司,上海货运公司,上海物流专线-优骐物流公司 | 斗式提升机_链式斗提机_带式斗提机厂家无锡市鸿诚输送机械有限公司 | 丙烷/液氧/液氮气化器,丙烷/液氧/液氮汽化器-无锡舍勒能源科技有限公司 | [品牌官网]贵州遵义双宁口腔连锁_贵州遵义牙科医院哪家好_种植牙_牙齿矫正_原华美口腔 | 车充外壳,车载充电器外壳,车载点烟器外壳,点烟器连接头,旅行充充电器外壳,手机充电器外壳,深圳市华科达塑胶五金有限公司 | 香蕉筛|直线|等厚|弧形|振动筛|香蕉筛厂家-洛阳隆中重工 | 庭院灯_太阳能景观灯_草坪灯厂家_仿古壁灯-重庆恒投科技 | 冰雕-冰雪世界-大型冰雕展制作公司-赛北冰雕官网 | 长沙一级消防工程公司_智能化弱电_机电安装_亮化工程专业施工承包_湖南公共安全工程有限公司 | 碳纤维复合材料制品生产定制工厂订制厂家-凯夫拉凯芙拉碳纤维手机壳套-碳纤维雪茄盒外壳套-深圳市润大世纪新材料科技有限公司 | 武汉不干胶印刷_标签设计印刷_不干胶标签印刷厂 - 武汉不干胶标签印刷厂家 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 北京签证代办_签证办理_商务签证_旅游签证_寰球签证网 | 机构创新组合设计实验台_液压实验台_气动实训台-戴育教仪厂 | 上海刑事律师|刑事辩护律师|专业刑事犯罪辩护律师免费咨询-[尤辰荣]金牌上海刑事律师团队 | 海鲜池-专注海鲜鱼缸、移动海鲜缸、饭店鱼缸设计定做-日晟水族厂家 | 玉米深加工机械,玉米加工设备,玉米加工机械等玉米深加工设备制造商-河南成立粮油机械有限公司 | 有源电力滤波装置-电力有源滤波器-低压穿排电流互感器|安科瑞 | 耐腐蚀泵,耐腐蚀真空泵,玻璃钢真空泵-淄博华舜耐腐蚀真空泵有限公司 | 鄂泉泵业官网|(杭州、上海、全国畅销)大流量防汛排涝泵-LW立式排污泵 | 防勒索软件_数据防泄密_Trellix(原McAfee)核心代理商_Trellix(原Fireeye)售后-广州文智信息科技有限公司 | 广东护栏厂家-广州护栏网厂家-广东省安麦斯交通设施有限公司 | 红立方品牌应急包/急救包加盟,小成本好项目代理_应急/消防/户外用品加盟_应急好项目加盟_新奇特项目招商 - 中红方宁(北京) 供应链有限公司 | 杭州可当科技有限公司—流量卡_随身WiFi_AI摄像头一站式解决方案 | 真空包装机-诸城市坤泰食品机械有限公司 | 【直乐】河北石家庄脊柱侧弯医院_治疗椎间盘突出哪家医院好_骨科脊柱外科专业医院_治疗抽动症/关节病骨伤权威医院|排行-直乐矫形中医医院 | 杭州顺源过滤机械有限公司官网-压滤机_板框压滤机_厢式隔膜压滤机厂家 | 上海宿田自动化设备有限公司-双面/平面/单面贴标机 | 不锈钢/气体/液体玻璃转子流量计(防腐,选型,规格)-常州天晟热工仪表有限公司【官网】 | 山东聚盛新型材料有限公司-纳米防腐隔热彩铝板和纳米防腐隔热板以及钛锡板、PVDF氟膜板供应商 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 在线钠离子分析仪-硅酸根离子浓度测定仪-油液水分测定仪价格-北京时代新维测控设备有限公司 | 切铝机-数控切割机-型材切割机-铝型材切割机-【昆山邓氏精密机械有限公司】 | 搪瓷反应釜厂家,淄博搪瓷反应釜-淄博卓耀 |