-
-
強化学習で三目並べ 第2回|実装例で学ぶQ学習:Tic-Tac-Toe Reverse
2021/2/2 Tic-Tac-Toe Reverse, 三目並べ, 機械学習
強化学習の第1回ではTic-Tac-Toe(○×ゲーム)というゲームを扱ってQ学習の動作を見ました。 しかしTic-Tac-Toeは強化学習を使わなければ解けないということはなく、人間が少し考えれば最 ...
-
-
強化学習で三目並べ 第1回|実装例で学ぶQ学習:Tic-Tac-Toe
2021/2/2 Tic-Tac-To, 三目並べ, 機械学習
強化学習は機械学習が研究され始めた初期の1950年代から存在し、歴史的には「教師あり学習」などの他の機械学習手法の派生元に位置付けられる分野です。 最近では2016年に強化学習を用いたGoogle D ...
-
-
AIをだます!? 敵対的サンプル(Adversarial Example)とは|誤認識の例・対処法
2021/2/2 ディープニューラルネットワーク, 摂動, 敵対的サンプル, 機械学習, 誤認識
こんにちは、インフォマティクスで機械学習系の業務を担当している大橋です。 今回から不定期ではありますが、その時々で気になった論文や技術を紹介していこうと思います。 今回はニューラルネットワークの脆弱性 ...