• R/O
  • HTTP
  • SSH
  • HTTPS

learning: List of commits


RSS
Rev. Time Author
594d75c DQN 2018-01-16 17:26:34 yamat0jp

ok

ea542ab 2018-01-16 17:12:07 yamat0jp

動くように修正

5167323 2018-01-16 16:55:02 yamat0jp

後退しております

3d6b53e 2018-01-16 14:17:16 yamat0jp

hdf5ファイルを無視

b15191a 2018-01-16 14:11:05 yamat0jp

理論的にはあってるはずなんですがこれからです

8a3ff3b 2018-01-16 08:49:46 yamat0jp

大きな間違いに気づきました エラーの途中ですがこの方針で行きます

2e6cc99 2018-01-16 00:08:27 yamat0jp

softmaxを外さない限りすべての評価が1でした。

5fcc68a advanced 2018-01-10 08:40:55 yamat0jp

hdf5ファイルをアップするのをやめました
隅の周辺にはおかないように仕込みました。

8059291 2018-01-10 08:34:37 yamat0jp

どうしても弱かったので角っこの周辺に置きにくいように教えました。

僕が間違っていたと思います。このアルゴリズムでは強いオセロAIはできません。たぶん。

62b27a7 2018-01-08 06:49:24 yamat0jp

DQNとしてブランチしました

1763a8a 2018-01-08 06:38:09 yamat0jp

1.DQNが一応実装できました
2.勝利時の報酬も上げて終盤に強くなるかもしれません

316a123 2018-01-08 05:31:02 yamat0jp

LSTMが無理だったのでDQNのようにしてみました。

b75954a 2018-01-07 19:08:23 yamat0jp

hdf5ファイルの書き込みでエラーがあったかも
よくわかりません

658d1d8 2018-01-07 18:59:53 yamat0jp

LSTMはあきらめて畳み込み演算の結果とアンサンブルでスコアを出していますが弱くなりました

b5f7292 2018-01-07 16:21:30 yamat0jp

間違ってました。ゲーム終了時にLSTMで評価させましたが、盤面評価はshale=(8,8)なので入力が一致しません。バッチサイズのことだったかもしれません。

2ac1dae 2018-01-07 16:09:55 yamat0jp

ちょっと気づいたこと
あとでやろうと思っていた盤面評価の入力データの訂正

452c0a8 2018-01-07 13:16:46 yamat0jp

reshapeでもだめです

3d905da 2018-01-07 12:23:50 yamat0jp

整えましたがエラーが出ます

684d753 2018-01-07 07:04:13 yamat0jp

わかりません

3ac65d9 2018-01-07 05:50:59 yamat0jp

修正中

fa3224e 2018-01-07 05:41:26 yamat0jp

盤面評価を取り入れアンサンブル学習をします

e3f474f master 2018-01-06 09:22:33 yamat0jp

細かい見直し 仕上げ

ec18a78 2018-01-06 09:07:33 yamat0jp

temp committ
this is on error

5d8f317 2018-01-06 08:45:08 yamat0jp

使っていないメソッドを削除

475d036 2018-01-06 06:21:13 yamat0jp

少し強くなったかな

落ち着いた手を打つようになりました

bb35d42 2018-01-06 05:51:19 yamat0jp

畳み込み演算を先手に導入
DENSEの調整

1e28592 2018-01-02 18:00:10 yamat0jp

float32

8ef2566 2017-12-30 19:02:15 yamat0jp

冒頭部の宣言を整理しました

922392c 2017-12-30 17:49:29 yamat0jp

predictは自動で10回試行するようです

783bc89 2017-12-30 17:34:07 yamat0jp

学習の成果を比べられるようにファイルをアップ

Show on old repository browser