GAN再進擊！Nvidia打造視覺學習GameGAN，用看的就能模擬出經典遊戲小精靈

近日正逢懷舊電玩小精靈（Pac-man）問世40周年，Nvidia也發表了最新的對抗生成網路（GAN）研究成果GameGAN，可利用經典遊戲小精靈的玩家影片，在四天內就產出一套栩栩如生的小精靈遊戲（如下圖），不僅能讓使用者動手玩，遊戲中的規則、畫面等細節更不需任何程式碼來撰寫設計，等於不需要傳統的遊戲引擎支援，憑著GameGAN視覺學習就能完成。

近年來，Nvidia深耕GAN，在去年先後發表了如假包換的臉部生成網路StyleGAN，以及能將隨手塗鴉轉換成藝術大作的GauGAN。今年，Nvidia再度秀出新成果GameGAN，能靠視覺學習產生遊戲環境，比如小精靈遊戲的場景、規則等。

打造能視覺學習的模擬器

這款GameGAN由Nvidia、多倫多大學、加拿大AI研究院和麻省理工學院（MIT）聯手打造，他們在論文中指出，模擬（Simulation）是機器人系統的核心，但要打造出好用的模擬器，還需撰寫複雜的環境規則，比如，動態代理人該如何表現、代理人行為如何影響其他代理等。

為解決撰寫複雜規則的問題，團隊想出一個方法，要透過觀察代理與環境的互動，來打造模擬器。團隊首先從遊戲下手，利用8個月時間，開發出一套生成式模型GameGAN；這套模擬器，將動畫遊戲視為現實世界的環境，可透過玩遊戲的影片和鍵盤操作，來訓練、模擬出一套遊戲，甚至產生新的關卡。

進一步來說，GameGAN由三大部分組成，首先是一個動態引擎，來維持內部更新的變數，再來是一個外部記憶模組，來記住模型所產生的畫面，保持一致性。也就是說，當遊戲中代理人按一個按鍵，GameGAN就會渲染（Render）、產生下一個螢幕畫面，而記憶模組可建立環境內部地圖，因此當代理人回到之前經過的地方時，畫面就能保持一致。最後一部分則是渲染引擎，可在每個時間實體（Instance）中，對輸出的影像進行解碼。

用4天4個GPU來學習5萬支影片

接著，團隊利用5萬支小精靈的遊戲影片，以及Nvidia DGX系統來訓練GameGAN。這些影片共有上百萬個畫面，內容包括了玩家操控小精靈的畫面，而GameGAN就觀看這些影片，從中學習遊戲規則，比如精靈吃到大力丸時，幽靈會變色、反向逃跑等。這個方法，不需要傳統的遊戲引擎支援，也能建立一套完整的遊戲。

此外，在訓練過程中，GameGAN的渲染引擎還會學習從動態元件中（如吐火的幽靈），拆分出靜態元件（如背景或藍色的牆）。這個作法，還可讓開發者替換背景，比如和馬力歐玩小精靈，或是在自己喜歡的場景中玩遊戲。

Nvidia多倫多研究實驗室主任Sanja Fidler提到，團隊開發完GameGAN後，只用了4天和4個GPU，就成功訓練出小精靈遊戲，還能讓使用者動手玩。此外，她也分享了開發過程中的趣事，「一些訓練影片來自很厲害的亞洲玩家，所以最初GameGAN產生的小精靈，幾乎都不會輸。」

但她也坦言，GameGAN產生的小精靈，還沒辦法模擬原版小精靈的音效。

下一步：開發機器人模擬系統，加速自動化發展

「模擬器是訓練機器人系統的核心，但開發模擬器非常耗時。」Sanja Fidler解釋，模擬器可用來開發夾取物件的倉庫機器人、自駕車、送貨機器人等，讓機器人在其中學習現實世界的物理定律。但也因為這樣，開發者要寫許多規則來打造模擬器，比如物體如何互動、光線如何表現等。

她認為，GameGAN可望解決這個問題，透過觀察代理人與環境的互動，來模仿代理人行為，開發者不必再撰寫複雜的規則，來開發模擬器。

不需要底層遊戲引擎，Nvidia AI查看遊戲歷程就能重建Pac-Man遊戲

Nvidia所開發的人工智慧模型GameGAN，可以透過查看遊戲歷程，就能重新創造出Pac-Man遊戲，這樣的結果讓原本遊戲開發商BANDAI NAMCO都震驚。這個研究的價值在於人工智慧可以透過觀察習得規則，而不需要了解遊戲底層，這個應用可以擴展到機器人或是自動駕駛應用。

GameGAN是生成對抗網路（Generative Adversarial Network，GAN），透過生成網路和判別網路兩個互相競爭的神經網路，進行學習並創建出新的內容。而Nvidia的GameGAN則可在經過5萬回遊戲訓練之後，不需要底層遊戲引擎，就能生成完整的Pac-Man遊戲，也就是說，即便一開始人工智慧不了解遊戲的基本規則，也能夠透過觀察學習，理解遊戲的規則。

BANDAI NAMCO研究人員Koichiro Tsutsumi提到，在看到結果的時候他們很驚訝，人工智慧可以在沒有遊戲引擎的情況下，重新創建他們具代表性的Pac-Man遊戲，而這項技術有許多潛在可能性，對遊戲產業來說，可以提升遊戲開發人員創建新關卡、角色，甚至是遊戲本身的速度。

Nvidia研究人員使用BANDAI NAMCO提供的訓練資料來訓練GameGAN，人工智慧可以追蹤虛擬世界，並且記住已經生成的內容，在影格與影格之間維持視覺的一致性，Nvidia提到，無論應用在哪種遊戲中，生成對抗網路都可以從遊戲歷史記錄學習遊戲規則，BANDAI NAMCO所提供的5萬回訓練資料，包含了遊戲畫面錄影的數百萬影格，以及按鍵記錄資料。

經過訓練的GameGAN模型，會產生環境的靜態元素，諸如一致的迷宮形狀、點以及大力丸（Power Pellets），另外也會產生像是幽靈或是小精靈等動態元素。遊戲規則就像是原始遊戲一樣，小精靈無法穿牆，隨著移動會吃掉點，在吃到大力丸的時候便可以反吃變成藍色的幽靈等。

目前開發各種自動機器人必須仰賴模擬器，像是讓倉庫機器人學會抓握，或是讓送貨機器人學會在指定的路線上運輸物品，Nvidia提到，創建模擬器是一個耗時的工作，開發人員必須要撰寫有關於物件在環境中互動的規則。

而Nvidia的這項研究提供了一種更簡單的可能性，訓練神經網路來取代人類編寫的模擬器，例如在自駕車的應用上，可透過汽車上的攝影機，紀錄道路環境和駕駛員行為，讓模型預測駕駛員在各種情況下的動作，並在發生意外事故時，即時作出反應。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル！🍏

Reply ›

Forums › 👩‍💻電腦、智慧電話 › 電腦資訊

Home

›

Forums

›

Forums Home