いったいどれだけ・・・?

28 Aug

Self-Learningだが、いったいどれくらい学習すればいいのかさっぱり分からん;

とりあえず、12時間学習した段階での強さは、Bear(強)に2石勝ち。実験用の(9手読み/CPCなし)でこの状況だから、悪くはないのでは?おとといの段階では値が発散してた状況から考えれば、進歩か?ある程度の強さまでは教師なし学習でも到達できそう。

オセロのルールを初めて知って、上手な人から教わらずに12時間でここまで強くなると考えると・・・すごいね、コンピュータって。

で、意外なのは定石。現段階で、序盤10手くらいはZebra様の定石に当てはまる。そしてそれは・・・中盤がちゃんと学習されてなくても。なぜ??

中盤の評価値は時に、Zebra様の24手読みの評価が10石以上(+5石とか+10石とかその領域で)外れる(それが、時間をかければ読みきりが可能な範囲で)。これは・・・Zebraの評価関数が不得意とする局面の存在を示唆しているのでは!?と、勝手に都合のいい解釈をしている今日この頃です。

Leave a Reply

Your email address will not be published.