いったいどれだけ・・・?
August 28th, 2004Self-Learningだが、いったいどれくらい学習すればいいのかさっぱり分からん;
とりあえず、12時間学習した段階での強さは、Bear(強)に2石勝ち。実験用の(9手読み/CPCなし)でこの状況だから、悪くはないのでは?おとといの段階では値が発散してた状況から考えれば、進歩か?ある程度の強さまでは教師なし学習でも到達できそう。
オセロのルールを初めて知って、上手な人から教わらずに12時間でここまで強くなると考えると・・・すごいね、コンピュータって。
で、意外なのは定石。現段階で、序盤10手くらいはZebra様の定石に当てはまる。そしてそれは・・・中盤がちゃんと学習されてなくても。なぜ??
中盤の評価値は時に、Zebra様の24手読みの評価が10石以上(+5石とか+10石とかその領域で)外れる(それが、時間をかければ読みきりが可能な範囲で)。これは・・・Zebraの評価関数が不得意とする局面の存在を示唆しているのでは!?と、勝手に都合のいい解釈をしている今日この頃です。
August 30th, 2004 at 8:36 pm
マジでか。すごいな。Zebraのそれは,パターンの線形和の限界だと思うのだが,どうだろうか。
August 30th, 2004 at 9:13 pm
Zebraは昔のバージョンより弱くなってる、という人もいる。探索速度を追求するあまり、MPCで大胆に切りすぎて時たま間違うんじゃないか、とか。ThellやOxelonは評価関数の性質がZebraにきわめてよく似てるので、Zebraの限界は我々の限界でもある気がする……。