超一流と一流の差-将棋ソフトはトッププロを超えるか?-

高橋 正人

1月14日に行われたコンピューター将棋ソフトのボンクラーズと米長永世棋聖の対局は、米長氏の敗北という結果に終わった。

米長氏は2003年に現役を引退しているものの、元トップ棋士である(タイトル獲得19期(歴代5位))。また、非公式戦とはいえ、近年の対局でも現役プロ棋士に一勝一敗(注)の成績を残しており、下位のプロ程度の実力は維持していると思われる。その米長氏にボンクラーズは完勝したわけだから、将棋ソフトの実力は、少なくても下位から中位のプロ棋士に匹敵するレベルには到達したと言って良いだろう。

しかし、一部で騒がれているように「羽生善治二冠や渡辺明竜王といった現役のトッププロを追い越すのも時間の問題」とまで言い切れるのだろうか。私はそう簡単にはいかないと考えている。以下で述べるとおり、追いつくための方法には、一流プロ(平均的なプロ)向けと超一流プロ(トッププロ)向けとの間に非連続的な差が存在しているからだ。


まず、将棋ソフトがここまで強くなれた理由を整理するため、将棋の実力を大きく二つの能力に分類する。

(1)指し手を読む力
(2)局面を評価して方針を決める力

(1)の「指し手を読む力」については、パソコンのハードの性能が上がることによって、近年、将棋ソフトの能力が飛躍的に向上した。使用するハードにもよるだろうが、ボンクラーズは1秒間に1,600万手(!)を読むことができる。これだけ膨大な手を読むことができるため、人間が直感的に切り捨ててしまう手も含め、しらみつぶしに指し手を検討することも可能だ。したがって、(1)の能力については、生身の人間では到底適わない域に達している。

(2)の「局面を評価して方針を決める力」は、自分が有利なのか不利なのか等を見極め、この先の戦略(攻めるのか、守るのかなど)を決断するような総合的な判断能力のことを指す。ボンクラーズを始め、近年の将棋ソフトは、局面の評価関数を導入することで判断能力を向上させてきた。評価関数とは、駒の価値や配置など複数のパラメーターを設け、総合得点によって局面を判断するフレームワークである。過去のプロ同士の対局棋譜等を大量に読み込ませ、将棋ソフトの指し手候補とプロの実際の指し手の差がなくなるように評価関数内の各パラメーターの比重などを自己調整させている。

まとめると、パソコンの処理能力の向上により人間を遙かに超える指し手を読む力が備わり、かつ、過去の棋譜を読み込むことで、古今東西のプロ棋士の判断能力も吸収したため、驚異的に強くなったのである。

しかし、このような方法での実力アップでは「局面を評価して方針を決める力」については、時代の最先端を走っている超一流の水準に達しない。なぜなら、まだ誰も気がついていない、もしくは言語化できていない新しい判断軸や価値判断をトッププロは常に追求し続けているからだ。

例えば、羽生二冠が広めた有名な概念として「手渡し」というものがある。お互いの駒組みが最善の状態に達した時や相手に有効な攻め手がない時に、大して価値のない手をわざと指して、手番を譲るという高等戦術である。相手は最善の駒組みを自ら崩す手や、無理やり攻め込む手を強要されることになる。また、その他にも無数の新たな価値判断や局面の考え方が時代の流れの中で生まれている。過去の棋譜を読み込むだけの将棋ソフトはいつまでたっても最先端の新概念には追いつけないし、自分で新しい価値判断を生み出すこともできない。

将棋ソフトの実力が上がったことにより、プロ棋士にとって新しい概念・判断基準を追求することが今まで以上に価値の高い仕事になった。もちろん、棋士に限らず、現代の職業人は総じてコンピューターとの競争に晒されているのだから、同様の状況に置かれている。

(注)
加藤九段に対して一勝一敗(2011年1月:とちぎ将棋まつり、2012年1月:NHK特番)。

高橋 正人(@mstakah)