ニコニコニュース

話題の記事

半年後に将棋の神様が現れるかもしれない話──最強将棋ソフト開発者が語る“ディープラーニング勢の台頭による将棋ソフトの進化”

 藤井聡太二冠、誕生。

 2020年の将棋界は……いや日本全土が、この偉業に打ち震えました。

 藤井フィーバーはとどまるところを知らず、スポーツ雑誌である『Number』が初の将棋特集号を発行して出版不況を吹き飛ばす20万部を売り上げ、盤駒は生産が追いつかず、さらに将棋どころか囲碁のゲームソフトまで売れる【※】という事態を巻き起こしました。

 棋聖、王位と立て続けにタイトルを取った藤井二冠の次の標的は、前期も挑戦者決定戦まで進んで挑戦まであと一歩だった王将戦。
 将棋界最難関といわれる王将リーグといえども、今の藤井二冠を止める者は誰もいない……そんな予想はしかし、意外すぎる形で裏切られます。

 何と……トップ棋士が立て続けに、藤井二冠に対して振り飛車をぶつけ始めたのです!

 しかもそれは、普段はあまり振り飛車を指さない、居飛車党の棋士たちでした。
 結果的に、藤井二冠は王将戦の挑戦権を逃すどころか、リーグからも陥落……。

 もともと将棋ソフトは振り飛車を『不利な戦法』と考えており、ソフトを研究に用いる藤井二冠はデビューから一度も振り飛車を採用していません。
 そして藤井二冠以外のトップ棋士たちも、ソフトを使用して研究しているはず。
 それなのにどうして、不利なはずの振り飛車を敢えて使い、しかも居飛車では止めることができなかった藤井二冠を倒すことができたのでしょう?

 同じ頃、将棋ソフトの世界でも衝撃の発表がありました。
 藤井二冠も使用していると公言する最強のソフト『水匠』(すいしょう)の開発者である杉村達也さんと、その水匠の探索部分を開発した『やねうら王』の磯崎元洋さんがタッグを組んで、将棋ソフトの新たな大会『電竜戦』に出場するというのです!
 
 その名も『みずうら王withお多福ラボ』(以下、みずうら王)。

 そして電竜戦前に公開された『みずうら王』のアピール文章には、おそるべき内容が記されていました。

つまり、水匠は、対抗形を捨てて、その表現力を将棋ソフト同士で進行しやすい戦型の学習に費やしたということである。

「強いソフト」「棋力が高いソフト」というと、あらゆる戦型で棋力が高いというイメージがあるが、水匠は、対抗形をあえて弱くすることで、将棋ソフト同士の対局において実現確率の高い局面の学習にその余力分を回したのである。
みずうら王アピール文書より)

 何と水匠は……対振り飛車での強さを犠牲にして、将棋ソフト同士の対局で頻出する局面に絞って学習させていたというではありませんか!
 これはトップ棋士たちが「水匠で研究している」と公言する藤井二冠に対して振り飛車を使い始めたこととも、不気味な符合を感じさせます。

 さっそく私は、電竜戦が終わった直後のお二人に、お話をうかがいました。

取材・文/白鳥士郎

なぜトップ棋士は藤井二冠に振り飛車をぶつけ始めたのか?

──お久しぶりです! 本日もよろしくお願いします!

磯崎:
 ごぶさたしております。

杉村:
 お疲れ様です。

──先日のインタビュー【※】は大好評でした! あの時、お話を聞かせてくださったお二人が、その後タッグを組んで電竜戦に出場なさるということで、非常に驚いたのですが……もっと驚いたのは、お二人の作った『みずうら王』のアピール文章です。
 ここに書いてあるのは、つまり……『水匠』は、振り飛車の局面を削っていくことで、どんどん強くなっていったと。

杉村:
 はい。

──藤井二冠にトップ棋士の方々が、しかも普段はだいたい居飛車を指している方々が、振り飛車をぶつけ始めた。そこに不思議な一致を見たのですが……。
 そのあたり、開発者の方々にはどう見えるのでしょう? まず杉村さんにうかがいたいのは、水匠は本当に振り飛車が相手だと弱いのか、ということです。

杉村:
 水匠の評価関数の元となっているNNUE(ぬえ)関数というのは、2018年に生まれた技術なんです。これが、それより以前からあったKPPTという形式の評価関数と比べて強くなると。

──KPPTは電王戦の頃によく聞きました。玉を含む三駒の位置関係と手番を使って評価していると。

杉村:
 私はNNUEで学習を進めていったんですけど……2019年の大会の時には既に頭打ち状態だったんです。普通に自己対局を繰り返して、それを教師局面として学習をさせても……これ以上強くならないと。

──普通に対局させて、学習させていくだけでは、頭打ちになってしまったと。

杉村:
 「ふーん、まあこのくらいの実力にしかならないのか……」って思っていたんです。が!

──が?

杉村:
 そこからどうやって強くすればいいかを考えてみたんです。そもそもどうして強くならないのかというと、表現力の限界……要するにたくさん学習しても「もう憶えられません!」っていう感じになりつつあったんです。

──詰め込み教育の弊害みたいな感じですね……。

杉村:
 だとしたら、いらない部分を削って、いる部分だけを学習させればいいと。

──教科書を頭からぜんぶ覚えるんじゃなくて、試験に出てきそうなところに限定して覚えるみたいな?

杉村:
 はい。出そうな局面だけに絞るという方法しかないんじゃないかな、と。

 floodgateというコンピューター同士の対局場があるんですけど、そこで現れやすい戦型において、最も勝率が高くなるような評価関数を作る。そういう方法で学習させていって、勝率を上げていった……というのが、水匠の作り方です。

──と、いうことは、逆に言えば……。

杉村:
 floodgateに現れない戦型では、弱くなってるということですね。そこは磯崎さんの計測でもそうなっているようなんです。

 コンピューター同士の対局で出ない戦型の代表格は、振り飛車。だから振り飛車だと弱い。そういうことです。

──磯崎さんは、どういった方法で水匠の強さを計測なさったんです?

磯崎:
 私が計測に使っていたのは、5年くらい前に作った古い局面集……プロの定跡とかが入っているものです。24手目で互角になっている局面だけを抽出して、それを使って検証しました。ずっとその方法を使っていたので。

 だから杉村さんが時々ツイッターで「水匠これだけ強くなりました!」ってツイートされてたんですけど、その評価関数を私がダウンロードして、自分の評価関数と対戦させても、なんにも強くない。それは結局、杉村さんとは計測の仕方が違うからだったんです。

──プロ棋士の実戦から抽出した、互角と思われる24手目の局面をスタートにして戦わせても、差は生まれなかったと。プロの定跡ですから、そこには当然、振り飛車のものも入っていたわけですね。

磯崎:
 それで計測すると、むしろ私の評価関数より弱くて。「たややん(杉村氏のこと)、こいつ何を言うとるんや?」くらいに思ってたわけですよ(笑)。

──ははは!

磯崎:
 ところが、杉村さんに計測方法なども含めておうかがいしてみると……floodgateの対局から独自に互角局面集【※】を作って、それで計測しているということだったんです。

──磯崎さんは人間の将棋を途中からソフトに指し継がせていて、一方杉村さんはソフトの将棋を指し継がせていたと。

磯崎:
 で、私も「じゃあその局面集くれくれ~」言うて、いただきまして。それで検証してみたら、確かに手数が前のほう……12手目くらいから開始させると、水匠つよいんです!

──ほぉぉ~……。

磯崎:
 コンピューター将棋でよくある棋譜というのは、やっぱり居飛車同士なので。だから水匠も、居飛車同士なら強いんだなと。そういう認識に至ったわけです

 でも、36手目からやると……ちょっとは強いんですけど、そこまで差はない。そして私の互角局面集でやると、むしろレートが30くらい弱いんです。

──ほほう!

磯崎:
 それって終盤の強さも少し捨てて、あと出現しにくい戦型も捨てて、序盤に回してるっていうことなんです。

──では、今のお話からすると……人間のプロ棋士が水匠を使って序盤を評価しようとすると、やねうら王と比べて、ちょっと精度が劣ると?

磯崎:
 居飛車は強いでしょうけど、居飛車対振り飛車の対抗形の場合などは正確とは言いがたい部分もあるでしょうね。

──そのへんの違和感を、プロは感じていた……ということなんでしょうか?

磯崎:
 うーん…………感じれるといえば、感じられるんでしょうけども……。

杉村:
 プロの方々が、どこまで評価関数を比較してるかという話だと思うんですよ。

 私はもともと、振り飛車だと水匠は弱いということは知っていたんです。振り飛車しか指さないソフト……私の作った『振電(しんでん)』とか、Qhapaq(かぱっく)さんの作った『振デレラ(しんでれら)』シリーズだったりと対局させると、対振り飛車が得意なソフトであれば6割5分くらい勝つのに、水匠は5割ちょっとくらいしか勝てないんです。

──かなり勝率が変わりますね……。

杉村:
 振り飛車に対する評価は、おそらくおかしいと。だから対抗形の棋譜の検証について水匠を使うのは……あんまり、たぶん、よくない。

 ただ、それが将棋の内容としてどうなのかというのは、私は棋力がそこまでないのでわからないんですけど……でも、明らかに振り飛車に関しては他の評価関数を使ったほうがいいということは、知っていました。

 さらに言えば、それを調べることは容易なんです。だからプロの先生方も、知っていらっしゃったのかもしれない。

──前回のお話で「どんなソフトを使っているか公言すると、不利になる」というのはそういうことだったんですね。では、それを知っていて、水匠を使っている藤井先生に振り飛車をぶつけたかは……?

杉村:
 それはわからないです(キッパリ)。

磯崎:
 たとえばレーティング【※】50下がっていたところで、人間がそれを察知できるかということもありますからねぇ。

※チェス界における棋力判定方法を将棋界に導入したもの。レーティング差200は、段位で言うと一段の差。

 パソコンを変えた時にレーティングが200くらい変わったら「あ、強くなったな」と実感できるでしょう。でも評価関数を変えても50くらいしかレーティングが変わらなかったとして、それを人間が知覚できるかというと……なかなか……。

──難しいと。

磯崎:
 (人間とソフトが)同じくらいの棋力なら、知覚できるかもしれません。けど、かなりの差がありますから……レーティングが1000ナンボとか離れてる状態ではねぇ。

──わかりました! 結論としては、水匠が振り飛車に弱いのと、トッププロが藤井先生に振り飛車をぶつけ始めたのは、関連があるかわからない……というか、多分ないだろうと。

振り飛車は本当に不利なのか?

磯崎:
 …………ただでも、コンピューター将棋は振り飛車を指した瞬間にガクン! と評価値【※】が落ちますけど……そこまで悪くないんじゃないかというのは、みんな思ってて。

※有利不利の目安を数値として視認化したもの。

──ほう? ソフトを作っていらっしゃる方々も、そう思っていらっしゃったんですか? 以前、『さばきのアーティスト』の久保利明九段からも同じようなことをうかがいました。

磯崎:
 対局を続けているうちに、評価値が回復することがわりとあって。ホンマに悪いならそのまま押し切らないといけないのに、持久戦ぽくなったら互角になってたりと。

──それは、どういう理屈でそうなるんでしょう?

磯崎:
 一手の価値が高い序盤においては、飛車を振るということで評価値が大きく落ちる。けど持久戦模様になった時は、一手の価値がそこまで大きくないので、最初に下がった分の評価値を維持できないんでしょうね。

──あ! なるほど……。

磯崎:
 すぐに戦いを仕掛けられれば、そのまま居飛車が有利になるんでしょう。けどお互いに手を殺し合うような展開になったら……戦いが始まらなかったら、評価値がゼロ近くまで戻ってしまうんです。

磯崎:
 だから「振り飛車、そこまで悪くないんじゃないの?」というのは、誰しもが思ってることなんです。

──みんな「おかしい」と思ってるのに、なぜそうなってしまうんでしょう?

磯崎:
 自己対局をして教師局面を作っているんですけど、自己対局する時の読みの深さって、わりと浅くて。一手あたり一秒未満の対局なんです。

 いうたら弱い者同士が戦ってる感じなので。弱い者同士なので、すぐに戦いが始まって、すぐに決着が付く。でも長い持ち時間で戦わせると、戦いが起こらないんです。

──プロ棋士がお互いの手を殺し合って、なかなか戦いが始まらない……みたいな感じになるんですね。

磯崎:
 だから、短い時間で戦わせた勝率の通りにはならないんです。振り飛車の評価値が悪いのは、短い時間で戦わせて教師を作るから、一手の価値が高くて、そういう評価が出てしまうだけで……長い時間で戦わせれば、あそこまで悪くならないのではと。そんなことを漠然と思ってます。

──非常にわかりやすいご説明でした。そういうことだったんですね……。

評価関数とは何なのか?

──そもそもNNUE関数というのは、どういうものなんでしょう? あの、コンピューターにそんなに詳しくない人にもわかりやすいように教えていただけると……。

磯崎:
 うーん……わかる人に簡単に伝えようとすれば、三層のニューラルネットです。

──アニメとかSF小説とかで聞きますね。ニューラルネット。人間の脳を模しているとか……。

磯崎:
 ニューラルネットって、最近はディープラーニング【※】で何かと登場しますので、聞いたこともあると思うんですが……ディープっていうくらいだから、普通はもっと深いんですね。層が。

※機械学習の手法。

──層がたくさんあるからディープなわけですね。

磯崎:
 三層ってぜんぜんディープやないじゃないですか。

──あ、やっぱ三層だと浅いんですね。

磯崎:
 三層だから、そんなに表現力もなくて。それでも従来の評価関数よりは強かったと。そういう感じです。

──浅いのに強かったのは、どうしてなんですか?

磯崎:
 ニューラルネットって、コンピューターにとって計算しやすいんですね。1回の命令で32個の掛け算とかをできたりするんです。ストリーム演算といいまして、1命令で何個も同時に計算できる。従来の、1つの命令で1つ足し算して……みたいなのより速い。

──32倍のスピードでできちゃうわけですか。

磯崎:
 計算の効率がいいので、そこのスピードで得してる部分もあるかなと。

──電竜戦での解説をうかがっていたら、「キャッシュに乗り切る」みたいな話が……。

磯崎:
 そうですね。従来の評価関数って、ランダムアクセスに近い形なので、いろんなところから取って来る。そうすると、CPUの中にあるメモリから追い出されてしまうんです。「もうここ使わへんやろ」と。

 ところがNNUE評価関数は、CPUのメモリの中に収まるんです。小さいから

──層が浅いから、サイズが小さい。だからCPUのメモリにすっぽり収まる。そこが速度に繋がっていて、強さにも繋がるわけですか。

磯崎:
 CPUの外部にあるメモリには、そんなにアクセスしなくて済む。そういうところで速度が稼げてる部分はあります。

──スレッドリッパー3990Xのような高額なCPUを使うのも、CPUのメモリを大きくするためなんですか?

磯崎:
 いや、もっと古いCPUにも乗るんです。スレッドリッパーを使う利点は、CPUコアの数が多いということです。

──コア数が多いと、速く計算できる。前回のインタビューでうかがったお話ですね。

磯崎:
 CPUキャッシュは、最近になって突然大きくなたっとか、そういうことはないみたいなので。1コア当たりではね。

──水匠は『標準NNUE』ということなんですが、この標準とはどういう意味なんです?

杉村:
 三層であって、その最初の層は256×2個のニューロン。そして2層目に32個のニューロン、3層目に32個のニューロン、という要素しかないNNUE関数ということです。

 開発者の那須悠さんのおかげで、それをもっと深い形にしたり……三層じゃなく何十層にしたり、あと一層をもっと広くしたりもできるんです。(第28回世界コンピュータ将棋選手権 那須さんのアピール文書

──ほぉぉ……。

杉村:
 標準は、開発した那須さんおよびT.N.K.(たぬき)チームが使っていた形式です。で、それを変更したほうが強くなるんじゃないかっていう実験は、当然やられてはいたんです。18年~19年くらいに。

 けど、私が知る限りでは誰も標準NNUEより強いのが見つけられなかったんです。

──2年以上前のものが現在も使えると。よっぽど洗練された技術だったんですね!

杉村:
 ただ、「入力するものを変えたら強くなるんじゃないか?」っていうのは、また別にあって。

 それがHalfKPE9で……そこは私、そんな詳しくないんで、磯崎さんに任せたいところですけど(笑)。

──HalfKPE9って見たことあります! 今回の電竜戦に出場したソフトも、そちらを使っているのいっぱいありましたよね? どうしてこれを使うんでしょう?

杉村:
 そちらのほうが表現力が高いからです。今は、玉と他の駒の距離感というか位置関係しか考えてないんですけど、それにプラスして『利き』というのも特徴として学習させたほうがいいんじゃないかと。そういうスタンスで始まったものなんです。

 ただ、見るべきものが多いので、そうすると評価関数のサイズも大きくなっちゃいますし、速度も落ちるんです。速度が落ちると、読む深さも落ちる。読む深さと引き換えに、大局観を良くしようという。

──サイズを小さくすることで速くして、それで強くなったのがNNUE関数ですよね? その速さを犠牲にしてしまうというのは……上手く行くのでしょうか?

杉村:
 みずうら王側で実験して、学習を進めてみたら……速度が落ちるほうが悪影響だったので。標準NNUEよりも強くならないというのが、私たちの考えです。

──逆の結論にいたった方々は、電竜戦で採用したわけですね。ところで水匠は、玉のまわりにスペースを作って戦うことが多いですよね? それは標準NNUEを使って、玉と他の駒の位置関係だけを見ているからなんでしょうか?

杉村:
 うーん……どうなんですかね? 玉を固める棋風にならなかった理由というのは、よくわからないんです。ただ、振り飛車に対しては穴熊を指すのが相当好きなので……。

──固めるのが嫌い、というわけではないんですね。

杉村:
 相居飛車の場合は、固めないほうが勝ちやすいというふうに勉強したんだなぁと。相当、受けの棋風になりました。固めて受けるというよりは、相手の駒を根絶やしにするという感じで。

──恐ろしいですね…………あっ! 磯崎さん、図を書いてくださったんですか!?

磯崎:
 ここの入力に何を与えるかで、工夫のしようがある。またはここの構成(アーキテクチャ)を変更するところでも、工夫のしようがあると。

 ところがアーキテクチャを変えてもなかなか強くならないし、変えた場合は全くのゼロからまた学習をさせなくてはいけないんです。その計算資源のコストがバカにならなくて、誰もやらないんですよね(笑)。

 結局、たぬきさん【※】が最初に公開した学習済みの標準NNUEに追加で学習させて強くするのをみんなやってて。だからアーキテクチャ変えてるチームって、ほとんどないんです。私とたぬきさんが何個かやってたくらいで。

※T.N.K.(たぬき)チームのメインの開発者。

杉村:
 私もやったんですけど、教師局面が少なかったのか、強くならなかったので……追加学習しかないなと。

磯崎:
 アーキテクチャを変更するのって、なかなかハードルが高い。そこで、入力するものを変えようと。特徴量っていうんですけど。

 今回のHalfKPE9というのは、Kが王様(キング)で、Pが他の駒で、Eが利き(エフェクト)。そして9は3×3の組み合わせで……将棋は1つのマスに、桂馬もあるので最大で10個の利きが集まることがあるんです。

──自分の駒の利きと、敵の駒の利きを組み合わせると、膨大な数になってしまいますね。

磯崎:
 けど、利きって普通は3つも集まらないじゃないですか。

──確かに。むしろ駒が利きすぎてる状態は、効率が悪くて悪手の可能性が高そうです。

磯崎:
 だから、味方の利きが、0か1か2以上かの3通りでやろうと。そして相手の利きも同じく3通りで表現して……。

──3×3で9なんですね! なるほど。

磯崎:
 ただ、駒が無い場所の利きも大きな意味があったりするじゃないですか?

──角の利きとか、飛車の横利きみたいな?

磯崎:
 本当はそういう部分もやりたいんですけど、計算量が増えちゃうんで……なかなか強くならないですよね。

──標準NNUEを使って、学習させるものを絞る水匠のようなアプローチがある一方、NNUEそのものを変えていくアプローチもあると。その2つのNNUEがぶつかり合ったのが、今回の電竜戦なわけですね!

ソフトの評価値は信用できない?

──みずうら王というのは、磯崎さんと杉村さんの、いいところを合体させたわけですよね? いったいどのくらい強くなったんでしょうか?

磯崎:
 そうですね。NNUE評価関数の中では、杉村さんの水匠が一番強いとされています。探索部分も……やねうら王のソースコード(プログラム)は公開はしていますが、開発版とは差があるんです。だから公開しているものよりは、若干強いものを使ったんです。

──将棋ソフトを強くするには、評価関数の他に、この探索部分を改良すればいいんですね?

磯崎:
 評価関数は、大局観に当たる部分です。局面の評価を数字で示してくれる。一方、どこの局面を優先して読むかとか、どの順番で読むべきかを選んでくれるのが探索部分です。

 やねうら王は探索部分のメインなので、そこを強くすれば、評価関数は同じでも強くなったりするんです。

──探索部分については、やねうら王以外のものは今も存在するんですか?

磯崎:
 ディープラーニング系を除けば、やねうら王一択になっています。昔はいっぱいいたんです。でも、やねうら王に……。

──勝てない?

磯崎:
 細かいチューニングの差もありますが……指し手生成のプログラムで、やねうら王よりも速いのってなかなか書けないんです。そういう部分で差が付いてしまう。同じ評価関数を使っても、やねうら王に勝てない。そうすると、やねうら王に勝てないソフトのソースコードを公開しても……。

──使わない、というわけですね。それで最近は、定跡や評価関数を作る方向に人が集まっているわけですか。

磯崎:
 強くするポイントとしては、定跡と、評価関数と、探索部分。大きい枠組みでいくとこうです。

──最強の評価関数である水匠、公開されたものより強いやねうら王、そして定跡はテラショック定跡。これは強くなって当たり前じゃないですか!

磯崎:
 テラショック定跡がね…………これが、強くなくて…………。

──ええ!?

磯崎:
 コンセプトというか、アイデア自体は悪くないんです。けど…………今の将棋ソフトって、序盤、弱いんです。

──え!? 強いですよ?

磯崎:
 何と比較するかという話になってしまうんですけど…………序盤で100点の差が付いても、だいたいどっかで逆転したりどっかで反省【※】したりするんです。特にNNUE評価関数は、序盤の評価値にそこまで信頼性がないので……。

 それでゲームツリーを作って、『一番よい』とされてる局面を目指して進めて行っても……それが実はよくなかったりするんです。

※ソフトが劣勢を認め、評価値が急変すること。

──前回お話をうかがった時も、テラショック定跡にはあまり自信がなさそうな感じでしたもんね……まだまだ穴があると。

磯崎:
 事前に、他の定跡を使ったものと対局させてみたんです。そしたら、他の定跡使ったほうがマシだなというくらいの話だったので……。

──何が問題だったんです?

磯崎:
 一言で言うと、今のソフトの序盤の評価値は信用できないと。

──いやでも、人間からすると、コンピューターの評価値って絶対的なものになりつつあると思うんですよ。永瀬王座がインタビューで「昔は人が思いつかない手を指す人間が天才でしたが、いまは将棋ソフトが答えを出すので、その最善手を指し続けられる、それに近いパフォーマンスを続けられる人間が天才」って言い切っちゃってて……。(『将棋世界』2021年1月号)

磯崎:
 定跡局面に関して言うと、5手先の100点の局面と10手先の200点の局面を比較しないといけないんです。単純に「200点だからこっちがいい!」と言ってしまっていいのかという話です。

──??? は……あ?

磯崎:
 将棋って有利を拡大していくゲームだから。期待勝率で見た時に、評価値が高いほうがいいのかというと、なかなかそうは言い切れない面があって。

──まだあんまりピンと来てないんですけど……開発者の方々って、あんまり評価値を信用していらっしゃらないんですね……。

磯崎:
 1つの局面でAの指し手を指した時は100点、Bの指し手を指した時は200点なら、おそらくBの指し手のほうが良いでしょう。でも、あまりに離れた2つの局面で、それぞれ100点と200点の評価値である時に、本当に200点のほうの局面のほうが良いのかという……。

 それに、ソフトって終盤になっても0点(互角)を付けることがよくあるんですが、終盤なんだからどっちかが勝ってないとおかしい。仮に序盤で-100点となって、この終盤の0点の局面を目指してそれが定跡だと思って進んで行ってしまったら、定跡を抜けた瞬間に頓死することもあり得るわけです。

──結論づけられないまま0点になってしまっていると。そういう評価値が潜んでいるわけですね。

磯崎:
 ゲームツリー全体で見た時に、果たして評価値を比較してしまっていいのかなというのは、あるんじゃないかなと……。

杉村:
 それは私も思っていて、さっきの居飛車と振り飛車の話に繋がる部分もあるんです。

──ほほう!?

杉村:
 今回の電竜戦で、振り飛車ばかりを指すソフトがQhapaqで、それが3位に入ったんです。その将棋をご覧いただければわかると思うんですが……。

 最初に200点くらい、居飛車側が有利って言ってるんです。ですがその200のまま、ずぅっと200なことが多いんです。けど角換わりとか相掛かりの200点って、10手進んだら400点になってるとか600点になってる可能性って相当大きいんです。だとすると、最初に出てきた……。

──200という数字がおかしい?

杉村:
 振り飛車の200点と、角換わりの200点というのは、同じ評価ではない可能性がある

──振り飛車の200点は、どこまで行っても変動しない200点。角換わりの200点は、手数が進めば差が広がっていく200点。確かに全く違いますね!

杉村:
 そうすると、違う戦型・違う手数の局面同士で比較して「こっちの点数のほうが高いからいい戦型だ!」とは、ならんわけだと思うんですよ。

 磯崎さんも言う通り、特定の局面でどちらの指し手が良さそうかを評価することにおいては、評価値というのはまあまあ信用が置けるとは思います。けど、異なる局面と局面でその数字を比較してしまうと……。

──つまり「振り飛車が序盤で点数が悪くなる。だから振り飛車は悪い戦型だ」……という結論は、おかしいと?

杉村:
 本質を見誤っている可能性がある、ということなんでしょうね。

──その辺りにも、コンピューターを使って学習することの危うさのようなものが潜んでいるわけですね……。

杉村:
 そうですね。しかも水匠は振り飛車の評価値が怪しいですし。

──藤井二冠も、評価値は色々な条件で変わりうるから絶対的なものではないとおっしゃっていたように思うんですが……やはりそれは、慧眼なわけですね。

杉村:
 …………藤井先生と私、お話しする機会がありまして。

──おお!

杉村:
 その時にうかがったんですけど……評価値のみを見て、という学習方法ではなく、他のやりかたもやってらっしゃるようでした。

──そうなんですか!? そ、それはどんな……?

杉村:
 それはご本人がおっしゃったら……。

──わかりました。お二人がどんなことをお話になったのか、公開されるのを楽しみにしています!

(藤井二冠と杉村さんの対談は赤旗日曜版新年合併号に掲載されています。気になる方はぜひそちらをご覧ください!)

次のページ » 電竜戦について

  • このエントリーをはてなブックマークに追加

「将棋」の最新記事

新着ニュース一覧

アクセスランキング