探索ルーチン

27 Jul

さて。テストのために作ったとりあえずのアルファベータをまともなものに置き換えよう。現在のところ、10手読みで思考時間が30秒-1分くらい。11手読みなら5分くらい。

さて、どの方法を実装するか。オセロにおいての速度は
PVS > MTD(f) > NegaScout > AlphaBeta
といった感じらしい。でもPVSとMTD(f)の差は1%よりずっと小さいくらいっぽいし、実験環境もよくわらかない。

MTD(f)の実装を見てみて、ムダがあり過ぎる気がした。1ずつずらすんじゃなくてせめて2分探索っぽいやり方にすればいいのに・・・
と思っていて調べたらそれはMTD-biと呼ばれるアルゴリズムらしい。そして、平均的にMTD(f)より 遅 い ら し い 。
あぁ、まだMTD(f)やらPVSがどういう仕組みで動いているのか分からない・・・。1ずつじゃなくてある程度飛んで動きそうな気はするけど、よくわからない。

そもそもいったい何のデータを置換表においておけばいいんだ?局面→評価値だけでいいの?んなはずない。
局面,プレーヤー,評価段階→評価値の上限と下限
くらい?

あぁこれに前向き枝刈りを組み込む方法も考えないと。あぁぁぁ。

でも実装は特にしなかった。

Leave a Reply

Your email address will not be published.