【全球熱聞】人類被 AI “毀滅”,一定是從教它玩《我的世界》開始的
上周,幾乎是前后腳,英偉達和國內幾家科研機構分別發布了兩份內容相似的論文。
首先是英偉達宣布開發出了一個全新的游戲 AI 智能體 "VOYAGER",將 AI 大模型 GPT-4 接入了《我的世界》(Minecraft)游戲。基于 GPT-4,VOYAGER 能夠在《我的世界》里擴充著自己的物品和裝備,完成諸如建造房屋、挖礦、收集仙人掌和狩獵等基本生存技能;也能獨立進行開放式探索,去到不同的城市和地點,甚至是自己搭建傳送門。
英偉達稱 VOYAGER 在《我的世界》里獲得的物品增加了 3.3 倍,旅行距離增加了 2.3 倍,解鎖關鍵技能樹的速度也比之前的方法快了 15.3 倍。接著就是商湯科技聯合清華大學、上海人工智能實驗室等機構發布了通才 AI 智能體 "Ghost in the Minecraft(GITM)"。
(資料圖)
同樣是將大語言模型(LLM)整合進《我的世界》,GITM 在《我的世界》內主世界的所有技術挑戰上實現了 100% 的任務覆蓋率(成功通關解鎖了完整的科技樹),而此前所有智能體的總和只能覆蓋 30%;另外在 " 獲取鉆石 " 任務上,GITM 成功率達 67.5%,同樣相比于此前的最佳成績—— OpenAI 的 VPT 方法大幅提高了 47.5%。
GITM 在《我的世界》的任務覆蓋率遠高于現有 AI 智能體直白點說,他們都選擇了《我的世界》這款游戲來訓練 AI,并且 AI 都實現了真人玩家能夠完成的幾乎所有游戲任務,堪比是能以假亂真的效果(這放在幾個月前還是不可能的事)。
我們先拋開看起來艱澀的技術細節不談,為啥他們不約而同都迷上了拿《我的世界》做實驗?
《我的世界》就是個大型 AI 試驗場
要說起在《我的世界》里訓練過的 AI,那可就太多了。
著名的莫拉維克悖論是這么說的:一些任務對于人類而言很困難,例如下棋,但對 AI 來說很簡單;而像《我的世界》這樣開放世界中與環境交互、進行規劃和決策等對人類來說較為簡單的事情,對 AI 來說卻是巨大挑戰。
正因為這種情況的存在,在 AI 還不像現在這么發達的早幾年,科學家們最初只是在《我的世界》里用 AI 完成一些簡單的指令。
比如在 2019 年,Facebook 研發過一款《我的世界》AI 助手 "craftassist bot",這是一個智能協作式的助理機器人,可以執行人類玩家指定的各種任務,如馴服馬匹、建造城市、與村民會面及交易等。也是在 2019 年,卡內基 · 梅隆大學、微軟、DeepMind 和 OpenAI,聯合機器學習頂級會議 NeurIPS 共同舉辦了一個叫做 "MineRL" 的專門針對《我的世界》游戲的 AI 比賽,到 2022 年一共舉辦了四屆。
這個比賽同樣見證了 AI 在《我的世界》中的應用由簡單到復雜的過程。
比如第一屆 MineRL 比的東西還很簡單:看哪個研究團員能夠創造出可以在《我的世界》中成功開采鉆石的 AI。不過很慘,最后參加的 900 多個全球頂尖團隊沒有一個能完成挑戰,一些 AI 擼掉木材卻不會合成,一些 AI 造出了熔爐卻不會冶煉,一些 AI 知道去地下挖礦,但卻選擇了垂直挖……
后來到了第三屆,比賽內容就變成了看誰能訓練出樣本高效的《我的世界》AI 智能體。這一屆的冠軍是以 76.970 分的絕對優勢奪冠的騰訊 AI Lab" 絕悟 "。
各種公司、機構密集開始在《我的世界》中訓練 AI 其實也是最近五年的事。
美國國防高級研究計劃局(DARPA)在 2020 年 8 月啟動了自適應分布式概率任務分配(ADAPT)項目,以期在戰場空間中利用 AI 協助指揮官進行決策,該項目的承包商 Aptima 公司用到的就是《我的世界》來訓練 AI 與人類的互動能力。
2021 年哥本哈根信息技術大學、紐約大學和上海大學的研究者也創建過一個使用 3D 神經元胞自動機(Neural Cellular Automata,NCA)的系統,并將該系統部署在了《我的世界》里,這個時候的 NCA 已經可以建造毛毛蟲、城堡、公寓樓和樹等復雜的實體。
比較出圈的一次實驗是在去年。
OpenAI 去年宣布由他們訓練的 AI 已經做到了熟練游玩《我的世界》。通過引入一種新穎且便捷的 AI 訓練法 " 視頻預訓練(Video PreTraining)",在向 AI" 投喂 " 了 7 萬小時從相關合作方處獲取的《我的世界》演示視頻以及與視頻配套的鍵盤鼠標操作記錄后,OpenAI 旗下的 AI 的操作已經相當傳神,掌握了只有人類才能領悟的高階玩法。
OpenAI 在《我的世界》中的實操演示此外,DeepMind 也在今年年初開發出了能夠媲美 OpenAI 成果的名叫 "DreamerV3" 的 AI 智能體。DreamerV3 在沒有任何人工數據輔助的情況下,被丟進《我的世界》里摸爬滾打了 17 天,驚人地學會了如何從 0 開始挖鉆石,成了世界上第一個純靠自己摸索,就能在《我的世界》里速挖鉆石的 AI 智能體。
當時 MineRL 比賽的發起人之一 William Guss 都忍不住第一時間發來賀電:4 年了," 鉆石挑戰 " 終于被攻克了!
沒有誰比《我的世界》更合適了
《我的世界》面世 12 年,已經成為世界上最受歡迎的一款游戲,被許多玩家形容為電子版的樂高。早在 2019 年,《我的世界》就超過《俄羅斯方塊》成為全球銷量最高的游戲。
《我的世界》" 開放世界 " 的游戲屬性讓它成了科學家們訓練 AI 的絕佳場所。
不同于 LOL 和王者榮耀等單一的戰略對戰游戲,《我的世界》并不預先設定目標,僅有的兩個模式是 " 生存 " 和 " 創造 "。" 生存 " 模式中,玩家要造好房子并收集東西,保證活下來,即使是用來擊退僵尸和蜘蛛的劍也需要玩家用木材和鐵礦來鍛造;" 創造 " 模式則更加自由,玩家使用各種功能的立方體,自由構建建筑物和物體,而且游戲永遠不會結束。
如果說 LOL、王者榮耀或是很多棋類游戲因為簡單的規則和游戲機制,可以讓 AI 以極快的速度學習并超越戰勝人類,《我的世界》游戲過程的復雜程度就幾乎是在挑戰 AI 的極限。
極度多樣的環境、完全靠隨機種子生成的地圖、長決策序列與復雜的技能學習、高自由度玩法帶來的海量策略偏好,都增加了《我的世界》AI 研究的難度。
比如,為了讓 AI 在 15 分鐘內找到鉆石,AI 需要經歷徒手采集原木、合成木板、木棍與木鎬,采集到鐵礦,經過一系列加工才能合成鉆石,看似只是一件小事,但對于 AI 來說,卻需要掌握其中復雜的邏輯關系——這還只是《我的世界》游戲的一部分,除了制造工具,AI 還需要給自己制定目標,學著在游戲世界里探索,直到解鎖所有的游戲任務。
《我的世界》中找鉆石的步驟而如果只是學下棋或是打 LOL,AI 只用知道怎么贏就行了。
是不是覺得,《我的世界》訓練出來的 AI,要比靠下棋、玩 LOL 訓練出來的 AI 高級多了(雖然學習速度可能慢了點)?
事實上在當前的 AI 研究中,科學家們會越來越追求通用人工智能(AGI)的研究,追求打造更通用的 AI 智能體,也就是發展 AI 智能體能夠掌握廣泛的技能,適應各種環境變化,更深入地模擬和應對人類在復雜問題上的能力,像人一樣的進行感知、理解和交互(而不是只會回答簡單問題、下棋能贏人類那種 " 小打小鬧 " 的 AI)。
這就意味著要訓練通用 AI,《我的世界》模擬的環境是非常合適的。
不過,開放世界游戲那么多,為什么又偏偏是《我的世界》呢?
有網友在推特向參與開發了 VOYAGER 的英偉達首席科學家 Jim Fan 發問說,既然 VOYAGER 是為開放世界而生,那為什么沒有選擇在《塞爾達》或者是《艾爾登法環》這樣看上去更加宏大的開放世界游戲中作 AI 訓練?
Jim Fan 的回答是,這中間的主要難點其實并不是算法,而是因為《塞爾達》和《艾爾登法環》這樣的游戲運用了 " 緩慢且難以以編程方式控制高端控制臺 ",并且 " 需要一個好的編碼 API 來控制角色 "。相較之下,《我的世界》的技術門檻要更低,在目標和玩法類似的情況下,《我的世界》實際也為 AI 訓練降低了難度。
另外,《我的世界》對開發者也很友好。許多用于構建《我的世界》的代碼庫都是開源的,所以人們可以很容易修改。并且該游戲也允許研究人員記錄和學習人們是如何一起完成任務的,然后觀察他們將如何與 AI 智能體一起工作。從這些意義上說,沒有誰比《我的世界》來訓練 AI 更合適的了。
這次《我的世界》里的 AI 有什么特別?
此次英偉達開發的 VOYAGER,和商湯科技聯合清華大學、上海人工智能實驗室等機構開發的 GITM,與過去基于《我的世界》訓練的 AI 智能體最大的不同在于,引入了大語言模型(LLM)作為 AI 訓練的核心方法。
以往在《我的世界》中訓練 AI 用到的主流方法則是,模仿學習和強化學習。
即便是此前 OpenAI 和 DeepMind 開發出的最先進的《我的世界》AI 智能體,用到的訓練方法也是模仿學習和強化學習。
打個比方,如果想讓 AI 在《我的世界》里學會挖礦,模擬學習要做的就是先喂給 AI 上萬個游戲視頻,讓它分析學習為什么要擼樹,如何利用工作臺進行分解合成,如何做出第一把鎬子,如何冶煉鐵錠,制作鐵鎬,獲取鉆石,如何避免落入巖漿,如何戰斗等等挖礦的必要步驟。
等到投喂學習結束,AI 接下來就要接受強化學習,也就是把 AI 小人扔進《我的世界》,讓它去 " 真正 " 執行挖礦的任務,通過反復實驗來發現和解決問題,從而真正學會挖礦這一技能。
但在大語言模型的訓練方法下,AI 的學習邏輯是被完全重構的。
依然拿挖礦來說,AI 智能體自身會首先根據 " 盡可能多發現不同的東西來幫助挖礦 " 的總體目標去提問、自動生成許多小任務,通過去存儲有助于成功解決某個任務的行動程序(比如擼掉樹木再去進行合成被驗證是正確的,造出了熔爐就要去冶煉也是正確的),AI 就會逐漸建立起一個如何正確挖礦的技能庫。而往后如果再遇到挖礦任務,AI 就可以根據其描述的嵌入在技能庫中進行檢索。
大語言模型訓練方法下的 GITM也就是說,大語言模型的訓練方法下,AI 是可以自主驅動探索并掌握廣泛技能的,這就使得大語言模型方法更能幫助 AI 成為一個終身學習者,能在較長的時間跨度內逐步獲得、更新、積累和遷移知識,同時緩解了其他持續學習方法中的 " 災難性遺忘 "。
VOYAGER 探索物品量高于其他許多 AI 智能體有點像是一直讓 AI 呆在學校里讀書實習,還是讓 AI 一開始就在社會里摸爬滾打的區別。
總而言之,用大語言模型方法在《我的世界》訓練出來的 AI 更像一個真實的人了。
我們知道,一個理想的 AI 應該具有與人類類似的能力。《我的世界》里的 AI 不管是根據其當前的技能水平和世界狀態提出合適的任務(如果發現自己處于沙漠而不是森林,就會在打鐵前學會獲取沙子和仙人掌),根據環境反饋完善技能并將掌握的技能存入記憶(比如打僵尸和打蜘蛛的技能類似),還是不斷探索世界,以自驅動的方式尋找新任務,其實都已經和現實世界中人類的決策過程和行為方式非常相近。
說《我的世界》已經是一個縮小版的現實世界也許一點也不夸張。
而讓人細思極恐的是,隨著 VOYAGER 和 GITM 的研究成果發布,AI 現在已經能通關《我的世界》了。
這不禁讓人猜想,AI 是不是很快就能在現實世界里如魚得水,它能像人一樣生活,會做飯、會用手機、知道怎么穿衣服、怎么養寵物、怎么坐公交地鐵……更不可思議的是,它還能像人一樣有自己的想法,知道穿哪件衣服好看,怎么做飯能更好吃,電話應該打給誰……沒準在不久的將來,我們在生活中遇到到的 " 人 ",都無法分辨它是不是 AI。
既然都能通關《我的世界》了,AI 過上人的生活從技術上來講也不是不能實現。
人類又會如何選擇呢?
責任編輯:hnmd003
相關閱讀
-
-
每日熱聞!索尼 ZV-1 II 「vlog」相機上手初體驗
索尼在2023年5月23日晚發布了新一代超廣角變焦Vlog相機ZV-1II,這款相機是2020年發布的ZV-1的第二代產品,
2023-06-03 -
大杯超大杯更劃算?iPhone 15 Pro 系列更多細節曝光
按照往年的發布節奏,蘋果新品發布會將會在9月召開,屆時將推出全新的iPhone15系列。而近日,外媒9to5mac放
2023-06-03 -
-
-
環球今頭條!“車內打傘”名場面再現,汽車全景天窗是一個“美麗的錯誤”?
1932年,一家偉大的車企,在一輛汽車的腦門上鑿了個洞,人們第一次從通過車頂獲取到了陽光。那一輛由Austin
2023-06-03
相關閱讀
-
【全球熱聞】人類被 AI “毀滅”,一定是從教它玩《我的世界》開始的
上周,幾乎是前后腳,英偉達和國內幾家科研機構分別發布了兩份內容相似的論文。首先是英偉達宣布開發出了一
-
每日熱聞!索尼 ZV-1 II 「vlog」相機上手初體驗
索尼在2023年5月23日晚發布了新一代超廣角變焦Vlog相機ZV-1II,這款相機是2020年發布的ZV-1的第二代產品,
-
亳州藥都農商行原董事長許紹普被查,安徽農信系統反腐風暴持續
6月2日,據安徽紀檢監察網消息,亳州藥都農村商業銀行股份有限公司原黨委書記、董事長許紹普涉嫌嚴重違紀違
-
當前滾動:擔憂無人機襲擊 俄羅斯將暫停黑海港口塔曼的液化石油氣業務
財聯社6月3日訊(編輯史正丞)據媒體周五援引多位消息人士報道,俄羅斯位于黑海的塔曼港將暫停液化石油氣(
-
重磅!國產首款帶狀皰疹疫苗正式上市!適用人群擴齡至 40 歲及以上
6月3日,在中國疫苗行業協會主辦的水痘-帶狀皰疹病毒全生命期預防策略學術研討會上,長春百克生物科技股份
-
天天快報!烏農業部長:若黑海糧食協議破裂 烏克蘭將祭出備用計劃
財聯社6月3日訊(編輯夏軍雄)當地時間周五(6月2日),烏克蘭農業政策與糧食部長索利斯基表示,如果俄羅斯
-
讓所有事情事半功倍的方法-環球快看點
讓所有事情事半功倍的方法,決定我們生命的大部分,其實是無意識的決策和選擇。
-
天天精選!佛醫保和百萬醫療的區別是什么?哪個好?
保障金額不同,佛醫保的保障金額高達50萬元,而百萬醫療的保障金額則是100萬元。可以看出,百萬醫療的保障
-
年金險的八大功能是什么?多少錢一年?_世界聚焦
1、提供穩定的收入來源:年金險購買后,可以在規定的時間內獲得一定的固定收益,因此可以作為一種穩定的收
-
百萬醫療有沒有寬限期?有什么作用?_熱資訊
并不是所有的保險都有寬限期,百萬醫療險多為一年期的保險產品,是沒有保險寬限期的。如果您想了解是否可以
-
全球快看:中信保誠年金險怎么樣?保什么?
中信保誠年金險作為一種長期儲蓄計劃和退休計劃,對于想要規劃自己未來的客戶非常有利。這個保險產品具有諸
-
年金險安全嗎?年金險怎么買?|世界通訊
安全,保險公司受到銀保監會的嚴格監管,同時采取了十大安全機制。即使保險公司真的破產倒閉,其他保險公司
-
每日熱聞!警方正調查男童之母墜樓是否與網暴有關
根據澎湃新聞,6月2日,多張微信群聊截圖顯示:武漢“小學生校內被老師開車撞死”事件中的小孩母親,在...
-
報道稱半藏森林克隆人年入可達72萬
小冰公司宣布首批網紅“GPT克隆人”上線,其中包括擁有百萬粉絲的女網紅博主“半藏森林”成為首批AI克隆...
-
小狗進入美發店被店員裝麻袋摔死,公司創始人:開除涉事員工,永不錄用
據沸點視頻,6月2日,江西南昌一只小狗跟著顧客進入美發店,隨后男店員用袋子將狗套住,狠狠地摔在地上
-
大杯超大杯更劃算?iPhone 15 Pro 系列更多細節曝光
按照往年的發布節奏,蘋果新品發布會將會在9月召開,屆時將推出全新的iPhone15系列。而近日,外媒9to5mac放
-
人類被 AI “毀滅”,一定是從教它玩《我的世界》開始的
上周,幾乎是前后腳,英偉達和國內幾家科研機構分別發布了兩份內容相似的論文。首先是英偉達宣布開發出了一
-
眾泰董事長請辭:復制別人一時爽,但不能一直爽 全球實時
在很長時間里都沒有消息的眾泰汽車,于近日發布了公告,稱眾泰董事會收到公司董事長黃繼宏的辭職報告,申請
-
環球今頭條!“車內打傘”名場面再現,汽車全景天窗是一個“美麗的錯誤”?
1932年,一家偉大的車企,在一輛汽車的腦門上鑿了個洞,人們第一次從通過車頂獲取到了陽光。那一輛由Austin
-
機器人如何擔任私募基金經理? 今日快訊
作者|唐婧編輯丨周鵬峰一家小型私募連續兩日公告,行業或迎首個AI機器人基金經理——賽博坦。1日,私募...
-
當前熱議!被指參與監控俄羅斯 iPhone 用戶 蘋果公司回應:從未植入后門
財聯社6月2日訊(編輯夏軍雄)當地時間周四(6月1日),俄羅斯安全局表示,他們發現蘋果與美國情報機構合作
-
原行長辭職后被認定“不稱職”,這家銀行經歷了什么?
作者丨唐婧編輯丨周鵬峰圖源丨圖蟲5月31日,青島農村商業銀行股份有限公司(下稱青農商行)披露了即將召開
-
環球關注:羅永浩“三嫁”,京東直播任重道遠
文|雷達財經,作者|孟帥,編輯|深海5月31日,2023年的618大促正式拉開帷幕。與以往不同的是,作為618大促的
-
外媒:美財政部高官會見中國大使,稱雙方進行“坦誠、建設性溝通” 全球時快訊
美國財政部發表聲明稱,美財政部負責國際事務的副部長杰伊·香博當天會見了中國新任駐美國大使謝鋒,雙...
-
全球熱文:咸安統計局:開展經濟普查“兩員”培訓
6月2日,區普查專班人員來到普查試點單位溫泉辦事處肖橋村對選聘的普查指導員,調查員開展經濟普查試點工作
-
福滿滿養老年金險好不好?收益高違規嗎?
福滿滿養老年金險是一款不錯的養老產品。 1 保險金領取豐富 福滿滿養老年金有“三金”,除了基礎的養老...
-
光大永明福運連年(B款)年金保險怎么樣?怎么買?_焦點簡訊
光大永明福運連年(B款)年金保險是一款以穩健理財為主題,提供長期收益和保障的年金保險。該產品的主要特點
-
年金保險屬于壽險嗎?適合什么人買?
是的。 年金險理財屬性突顯,以被保人生存為給付條件,屬于人壽險的一種,但是不僅保生還可以保死,也就是
-
環球消息!逸享人生年金保險怎樣查詢?怎樣領取?
1、中國保險萬事通:客戶可以在微信中搜索關注“中國保險萬事通”微信公眾號,在菜單欄“保單查詢”中登...
-
高庫存壓頂,lululemon欲瓜分耐克們生意,門店狂開到二三線城市
在中國瘋狂開店的lululemon正瓜分Adidas、Nike們的生意。6月1日,加拿大運動服裝品牌lululemon(LULU US)發
精彩推薦
閱讀排行
精彩推送
- 歲歲盈盈年金保險條款是什么?到...
- 【播資訊】“新包頭 新青年”作...
- “最嚴”嬰幼兒配方奶粉國標倒逼...
- 微軟、谷歌、英偉達領軍,紅得發...
- 華為余承東:要用完美主義精神做...
- “應戰” 618,小紅書派出“有...
- 悅安新材:6月2日融資買入459.05...
- 眾安保險退保的錢能要回來嗎?退...
- 平安少兒保險是什么?一年需要多...
- 聚焦:國壽瑞鑫兩全保險怎么樣?...
- 六十歲以上的老人買什么保險?買...
- 百萬醫療保到多少歲?一年需要多...
- 售價220萬!賈躍亭宣布FF 91第...
- 迪士尼樂園有望落戶武漢?官方:...
- E周新勢力 | 理想2.8萬輛創新...
- 我市舉辦“才聚兩都”首場人才懇...
- 沈洋:在平凡崗位上守護群眾平安
- 最新消息:《蒙古馬》奏響大劇院
- 多彩活動 慶“六一”
- 英偉達推出新 AI 模型 Neural...
- 加油卡充值開具普通發票可以報銷嗎
- 15 個簽署國,全面實施
- 張雪峰宣布:公司每周“上四休三...
- 華貴保險回應罰單:已完成全部處...
- 直播或成 B 站新的救命稻草?
- 一聲嘆息!股價僅剩 4 毛 3,...
- 熱點聚焦:西藏雪山下的綠草地電...
- 【新視野】信美相互宜脈相連年金...
- 新資訊:合眾福享金生年金保險怎...
- 太平福滿e生年金保險怎么樣?值...