(55)【Othello AI】CvR-10000 改め CvR-500 に変更する。
CvR-10000の問題点 最初から分かっていたことですが… 時間がかかる・・・ 1回の CvR計測に要する時間は、モデルの規模にもよるが 8秒から 20秒ほど。 これを 1つのモデルについて DQN学習中に… 続きを読む »
CvR-10000の問題点 最初から分かっていたことですが… 時間がかかる・・・ 1回の CvR計測に要する時間は、モデルの規模にもよるが 8秒から 20秒ほど。 これを 1つのモデルについて DQN学習中に… 続きを読む »
【1】やりたいこと 前回の投稿で案出しした内容で、実装を進めたい。 (53)【Othello AI】モンテカルロ法で DQNの教師データを作ろうか? DQN方式オセロAIの訓練データとして、 モンテカルロ探索方式オセロA… 続きを読む »
直近の目標: DQNで MCTSと同レベルの強さのオセロ AIを作ること! 前回の投稿 (52)【Othello AI】古典的AI モンテカルロ探索で CvR 9900に到達 の結果を見て色々と考えた。 【1】試行錯誤 … 続きを読む »
【1】やりたいこと DQNを使ったオセロAI作りを続けているが、ランダム指し手相手に勝率 90%で足踏み状態… ルールが明確な問題に対しては、 第一次AIブーム(1960年前後)の探索・推論技術が強い と聞い… 続きを読む »
前回、前々回の投稿の続きです。 前回 : (46)【Othello AI】オセロAIにも相性がある。 前々回: (45)【Othello AI】強化学習でオセロAIを作る。 勝手に作った指標 CvR CvR 10000 … 続きを読む »
74個のモデルの総当たり対戦 現在までに、超パラメータを変えて学習させた全 74個のモデルがある。 どれもランダム指し手の相手に対して勝率 75%以上の猛者(?)たちだ。 どれが一番強いんだろう? と、ふと気になったので… 続きを読む »
【1】やりたいこと PyTorchの使い方が少しずつわかってきたので、画像分類とは違うテーマにも挑戦してみたい。 次に選んだテーマは… 強化学習でゲームAI作り! 学習しながら楽しめる物が欲しいので、ゲームA… 続きを読む »