強化学習

人工知能

【強化学習】自作ゲームにSACを適用してみた(DDPGとの比較)

こんにちは、ヒガシです。 このページでは、以前作成した自作ゲームに、深層強化学習アルゴリズムであるSAC(Soft-Actor-Critic)を適用してみます。 同じゲームに別の深層強化学習アルゴリズムであるDDPGも適用していますので(そ...
人工知能

【AI】自作ゲームに深層強化学習(DDPG)を適用してみた。

こんにちは、ヒガシです! 今回は、前回作成した車の走行風のゲームにこれまた以前紹介した深層強化学習アルゴリズムであるDDPGを適用してみようと思います。 ちなみに私がやるとこんな感じでわりと上手に走らせることができました。 果たしてAIは私...
python

【Python-OpenCV】深層強化学習(DDPG)用のゲームを作成してみた

こんにちは、ヒガシです! 以前の記事にて深層強化学習アルゴリズムであるDDPGを紹介しましたが、それを実際に使ってみたくなったので、まずはそのための環境構築をしようと思います。 (OpenGymなんかを使っても良いですが、やはり自分で環境か...
人工知能

【強化学習】DDPGアルゴリズムの内部イメージを数式なしでざっくり解説!

こんにちは、ヒガシです。 今回は連続値を扱える強化学習アルゴリズムであるDDPG(Deep Deterministic Policy Gradient)を難しい数式抜きにざっくりと画像と言葉で解説していきます。 DDPGについて詳細に解説し...
人工知能

【強化学習】期待値を試行錯誤して求める方法を実演!学習率と精度も検証!

こんにちは、メーカーエンジニアのヒガシです。 強化学習を勉強していると、 「エージェントはこの環境下において最も得られる報酬の期待値が大きい行動を取る・・・」 といった説明をよく目にするのではないでしょうか? 今回はこの期待値に関する話をし...
python

これから強化学習を勉強したい人にオススメしたい本をご紹介!

こんにちは、ヒガシです。 半年ほど前から強化学習の勉強を開始し、ようやく自業務である機械の制御最適化に適用することができるようになってきました。 このページでは、私が強化学習の勉強を行う際に読んで非常に参考になった書籍をご紹介したいと思いま...