微軟麻將AI「Microsoft Suphx」突破日麻高手群,安定段大勝頂級人類玩家、牌譜餵到史上最強!

牌譜餵到史上最強!微軟Suphx突破日麻高手群,安定段大勝頂級人類玩家

「那個超強AI到底是何方神聖?」今年3月起,某個謎一般的強悍AI席捲了國際日本麻將平台天鳳,時隔5個月,這位AI的真面目終於揭曉。

上週,微軟亞洲研究院正式發表麻將AI「Microsoft Suphx」(Super Phoenix),並宣佈其在日本麻將平台天鳳上,取得晉升10段的優異成果。

天鳳是日本著名的麻將網路平台,採用日本麻將規則,分為4人麻與3人麻,並擁有段位、Rating等評價制度。依照級數、段位高低,玩家可使用的桌也有所差異。

至於10段是什麼概念?目前天鳳平台上約有 33萬名玩家,其中到達10段者僅180人 。也就是說,10段代表著全體玩家最頂端的0.0054%,毫無疑問擁有人類頂尖選手層級的麻將技術。

天鳳營運商經常與企業、研究機構合作,共同開發強悍的麻將AI,甚至推出AI專用帳號。玩家可以透過AI帳號專屬的標記,清楚得知對手究竟是人還是機器。

在Suphx現身以前,由東大碩士生水上直紀開發的「爆打」、資訊科技公司多玩國(株式会社ドワンゴ)的「NAGA25」等AI都曾在這個平台上,和玩家們同桌遊戲,但 過去未曾有AI獲得過晉升10段的殊榮 。

Suphx於3月加入天鳳,並在3個月內與人類玩家、其他AI對戰5,000餘局後,6月以特上桌第一名的成績成功晉升10段,這是目前AI專屬帳號所能達到的最高等級,同時 Suphx的勝率也比其餘AI,甚至人類玩家更勝一籌 。

微軟公佈的資料顯示,目前Suphx取得的安定段位分數約為8.7分,而爆打與NAGA25則都只有6.5分上下;10段以上的人類高手則為7.5分。

決勝因素充滿未知,麻將比圍棋、德州撲克難度更高

3年前,AlphaGo大敗韓國棋王李世乭,是AI在遊戲上超越人類的一個重要里程碑,象徵了AI在訊息完全公開遊戲的制霸地位。

自此時開始,各個企業、研究人員開始著眼於訊息不完全公開的遊戲內容,好比說,DeepMind就放眼《星海爭霸》、OpenAI也聚焦《Dota 2》等電競遊戲。

然而,微軟卻將目光對準另一款同樣源自中國,有著上千年歷史的古老遊戲:麻將。

對於訊息不完全公開的遊戲,人類往往依靠經驗、直覺判讀,甚至有時得觀察對手的表情、語氣,好判斷究竟是否是虛張聲勢,而這些人類常用的判斷方法,都相當難以化為AI可使用的數據。

2017年時,由卡內基梅隆大學開發的AI Libratus,曾在20天擊敗4位德州撲克高手,從人類手中贏得價值177萬美元的籌碼,標誌了AI攻佔不完全訊息(資訊不完整)賽局領域的第一步。

但相對於德州撲克,麻將的不確定因素遠要來得更高。根據微軟公佈的資料,德州撲克的隱藏情報量約為10的3次方,也就是1,000種,而 麻將的隱藏情報量卻達到10的48次方 ,完全無法比擬。

也由於麻將的難度,目前一般人能觸及的麻將AI性能大多非常弱,為了確保遊戲樂趣,會選擇讓AI得知玩家的牌。當然,Suphx絕對沒有利用這種不公平的手段,而是與一般玩家自相同起跑點競爭。

藉對戰與自學累積強悍實力,麻將AI將用於金融界

除了與眾多玩家、AI對局外,在登上天鳳以前,Suphx是透過「餵食大量麻將牌譜」的資料庫進行訓練。事實上,微軟之所以選擇與天鳳合作,後者擁有的大量公開牌譜也是重要原因之一。

且Suphx不僅麻將實力堅強, 也懂得依照情況運用策略,以保持自己的分數 。舉例來說,當它認為這局無法勝過第一名的玩家時,對局策略就可能轉向擊敗第3、4名的玩家,以免被系統扣除太多分數。

不過,一個麻將技術高強的AI,在現實中究竟能如何發揮作用,目前還很難確定。日本微軟技術長榊原彰認為,麻將AI的能力將能在金融領域發揚光大,一位優秀的操盤手,必須能夠讀懂市場脈動,而這與麻將AI所擁有的能力十分相似。

順帶一提,達到10段並未讓微軟就此滿足,目前他們正與天鳳商討,能否開放AI專屬帳號晉升天鳳位,這是達到10段最高點數才能獲得的殊榮,目前全遊戲總共只有13人達到此位階。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏