大学生麻雀雑記

麻雀好きな大学生が色々と書いていきます

麻雀AIとは

 

徒然

 昨日公開したブログ記事「麻雀の失敗学を読んだ感想」が朝倉選手本人にリツイートされた。突然のことに驚き、失礼なことを書いてやしないか2,3度記事を読み返すなど慌てていた。著者本人に感想記事を認知されるのは嬉しいものである。

mjplayer.hatenablog.com

麻雀AI

 先日、天鳳を打っていると「ⓝSuphx」というIDの方と同卓した。なんとなく聞いたことのある名前だったので後に検索すると、麻雀AIであった。なんとこのAI、特上卓で10段まで行った実力のある強いAIである。すでに一般の人間よりは強い麻雀AIについて調べてみた。

爆打

 現在最も有名な麻雀AIと言えば、この「爆打(ばくうち)」ではないだろうか。

 

麻雀AI戦術 人工知能「爆打」に聞く必勝法 (近代麻雀戦術シリーズ)

 爆打とは、東京大学の大学院生であった水上直紀さんが開発された麻雀AIであり、現在も改良されながら天鳳でプレイヤー(IDⓝ爆打)として活動している。(爆打関連情報https://twitter.com/bakuuchi_infoによると最終対局2019年2月28日、現在対戦実験休止中)

 さてこの爆打、2015年7月28日から天鳳を打ち始め、その6日後の8月2日に特上卓に上がる資格を得る。その後も特上卓で打ち続け、12月21日に鳳凰卓に上がる資格を得る。2017年5月31日には9段まで到達し、現在(2019年7月6日)は8段である。(参考:天鳳マニアクラブhttps://tenhou.club/n-bakuuchi

 この結果だけでもわかるように、圧倒的な強さを誇る。この「爆打」の打ち方を戦術化した本すら出版されている。

        

  詳しいデータを見てみる。下記の画像は爆打関連情報https://twitter.com/bakuuchi_infoよりお借りした、2019年2月の最新データである。見てわかることは、放銃率が異様に低いということである。(0.102)

 「爆打」の選択は、期待最終順位を算出することによって決定している。例えば打牌選択であるが、ABの選択があった時にAを打った方が最終順位が2.24、Bを打った時は2.25のように瞬時に計算し、期待値が高い方(この場合はA)を選択するのである。

Suphx

 Suphxとは、天鳳の特上卓にてIDⓝSuphxの名前でプレイヤーとして活躍している麻雀AIである。自分が先日対局させていただいたAIがこちらだ。最新の情報としては、Suphxのツイッターに以下の報告がある。

 なんと、特上卓のみで10段まで昇段したのである。先述の「爆打」の最高到達段位が9段であったことを踏まえると、素晴らしい成績だ。

 先日対局したとき、気になった判断としては、以下のリーチがある。f:id:mjplayer:20190706193937j:image

 先手ではあるものの、待ちは非常に悪く、意見が分かれそうな局面である。巡目が早く手替わりも十分にあるため、ダマにする人も多そうだ。自分ならフリーではリーチするが、天鳳ではおそらく打たない。しかし、Suphxはこれを即リーチとした。結果は追いかけリーチを打った対面から5萬を出アガり、5200の収入となった。プラスの収入になったことは結果論として、このような思い切ったリーチもSuphxの強さのうちであるのかもしれない。点差状況、巡目、待ちの数......この場合のすべての状況からプラスであると判断されたのがこのリーチである。

 ほかにも、牌譜を見ていると、無理に染め手に走っているように見える局が結構見られた。Suphxはアルゴリズム等を公開していないため、どのような評価で動いているのかはわからない。しかし、実際に10段まで到達したという実績が存在する。人間がいくら不可解に見える一手であろうと、Suphxからすればそれが一番合理的な打ち筋であり、当然の一手なのだ。

 

NAGA

 次に紹介する麻雀AIは、Dwango Media Villageが開発した「NAGA」である。2018年10月22日からIDⓝNAGA25として天鳳で打ちはじめ、2018年10月29日に4段に昇段し特上卓入りしている。最高到達段位は8段である。(2019年7月6日現在6段)これまでの麻雀AIと違う点は、期待最終順位やモンテカルロ法を採用していた従来のAIに対し、深層学習を採用している点である。深層学習については、「AIとは?AI(人工知能)とDeep Learning(深層学習)を簡単に説明」より

Deep Learning(深層学習)は、その機械学習を発展させた手法です。人間の脳神経回路をモデルにした多層構造アルゴリズム「ディープニューラルネットワーク」を用い、特徴量の設定や組み合わせをAI(人工知能)自ら考えて決定します。

 とある。つまり、大量のデータを与えることで、それらを「自分で学習」させるのだ。

 上記の2つのAIが「機械独自の戦法を確立させよう(結果的にではあるが)」とするのに対し、人間の打つデータを元に学習するため、NAGAは「人間的な最強の打ち方を目指す」ことがコンセプトとしてあるように思える。実際、以下の画像のようにNAGAと人間の行動が近しいことを成果として挙げている。

f:id:mjplayer:20190706201347p:plain

(画像はDMVホームページhttps://dmv.nico/ja/articles/mahjong_ai_naga/#ref_Mizukamiより)
 また、同ホームページ上に、ある半荘についてNAGAが何を考え打牌選択をしたかが公開されている。これは非常に興味深く、また有益である。

総評

 3つの麻雀AIを紹介したが、これらの登場により麻雀に対する研究も変わり始めており、実際の戦略にも影響を与えている。しかし、問題点も多い。

 例えば天鳳においては、24時間無制限に打てることを理由にAIは公式に鳳凰卓で打つことを禁止されている。(ⓝ爆打の鳳凰卓条件達成で考えるべきこと: 天鳳ブログ)スタミナが無尽蔵で休憩の必要ない機械ならではの理由だ。

 また、煩雑なルールのために開発や改善が難しいということもある。強いアルゴリズムができたと思っても、数千半荘は打たないと実証できない。修正に時間がかかるのだ。

 自分は、麻雀AIは「ロマン」だと思っている。人間が麻雀を打てているのだから、処理速度が人間とは比べ物にならないほど速い機械が麻雀を打てないはずがない。突き詰めれば、時間がかかろうと、必ず麻雀AIが人間を下す。近い将来、将棋の「電王戦」のように、麻雀プロと麻雀AIが争う大会が開催されるかもしれない。これをロマンと言わずして何と言おうか。