-
-
強化学習で三目並べ 第2回|実装例で学ぶQ学習:Tic-Tac-Toe Reverse
2021/1/6 Tic-Tac-Toe Reverse, 三目並べ, 機械学習
強化学習の第1回ではTic-Tac-Toe(○×ゲーム)というゲームを扱ってQ学習の動作を見ました。 しかしTic-Tac-Toeは強化学習を使わなければ解けないということはなく、人間が少し考えれば最 ...
-
-
強化学習で三目並べ 第1回|実装例で学ぶQ学習:Tic-Tac-Toe
2021/1/6 Tic-Tac-To, 三目並べ, 機械学習
強化学習は機械学習が研究され始めた初期の1950年代から存在し、歴史的には「教師あり学習」などの他の機械学習手法の派生元に位置付けられる分野です。 最近では2016年に強化学習を用いたGoogle D ...