【強化学習】教師あり学習とは何が同じで何が違う？【実は共通点も多い！】RL vol. 2

Рет қаралды 10,796

AIcia Solid Project

Күн бұрын

Пікірлер

@me-me-661 Жыл бұрын

楽しみにしてたシリーズをありがとうございます。いろんな所を学習するから今どこをやってるかしっかり意識しなくてはいけない、刺さりました。勉強させていただきます。

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！🎉 是非、抜けないよう、深く刺しておいてください！！！よくわからない混乱のかなりが解決するかと思います！

@小野賢一郎 Жыл бұрын

教師あり学習、教師なし学習、強化学習、今日も学習！楽しい動画をありがとうございます！

@AIcia_Solid Жыл бұрын

小野さん！！！いつもご支援いただきありがとうございます🎉🎉🎉 私も、小野さんに見ていただけてとても嬉しいです😊 是非続きも楽しみにしていてください！🎉

@shm2219 Жыл бұрын

最後の色々なところを学習するという視点を持てたのが今回の最大の収穫でした。

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！それは良かった！🎉 ホントそうなんです、ほんと色んなところをやるので、是非混乱にはお気をつけて、、、！🙏

@ちゃんぽこ-l5l Жыл бұрын

4:05の状態が相関を持つというのは各時刻の状態を確率変数としてみた時にそれぞれ互いに独立ではないということで良いのでしょうか？私が知っている相関があるというのは相関係数の絶対値が1に近いことなのですがこの文脈ではそういう意味では無いのでしょうか？

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！素敵な質問ですね！先に回答しますと、2つとも yes です！詳しく書きます！「相関がある」や「相関を持つ」というのは、一方が変化すればもう一方も変化するように相互に関係することで、つまり、「独立でない」とほぼ同じ意味です。よく使うピアソンの相関係数は、その相関のうち、線形な関係性の強さを測るものです。ピアソンの相関係数が高いことは相関がある（強い）、ことの一種ですが、「相関がある」という概念はもっと広く使われています。もし追加の疑問などありましたら遠慮なくお教えくださませ！

@ちゃんぽこ-l5l Жыл бұрын

@@AIcia_Solid ありがとうございます！相関という言葉は直線以外でも使うのですね。勉強になりました😊

@AIcia_Solid Жыл бұрын

疑問が解けたようで良かったです！また何かあればいつでもお聞きください！🎉

@nire-hj9pe Жыл бұрын

ちょうどmlagentsで遊ぶマイブームがきてたのでありがたいです！

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます🎉 めちゃ楽しそうなことしてますね🤤🤤🤤 なにか面白いことできたら是非教えてください！(^o^)/

@やぁ-h8v Жыл бұрын

unity で現実空間を表現するためのパラメータ調整に強化学習は使えると思いますか？具体的には流体シミュレーションをやりたくて、現実空間でマイクロビーズの動きを観察して、その動きをunityで表現できるように、流体のパラメータを調節したいです。

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！あまり詳しくないですが、感覚的には、あまり向いていない気もします。報酬の設計がうまくできれば良い気がしますが、状態→行動→報酬→状態という定式化ともあまり相性が良くない気がします。ただ、私が思いつく問題点は、門外漢の意見ですので、ここをちゃんと乗り越えるアイデアなどあれば上手くいくかもしれないとは思います！

@chon6917 Жыл бұрын

強化学習のTD3という手法を使って複雑な多目的最適化問題を解いているのですが、学習によって得られた方策が似たり寄ったりになってしまって、、、別の方策を得るには、パラメータを変えるだけでは限界があるのでしょうか、、？(問題の内容によってはDQN等の別の手法の方がいいのでしょうか、、？)

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！めちゃめちゃ深いところで試行錯誤をされているのですね！すごい！ただ、すみません、、、。タスクの性質にかなり依存すると思うので、いただいた情報からではお答えできません🙇‍♀️🙇‍♀️🙇‍♀️ 強化学習を専門でやられてる方などを探して、詳しく相談してみると良いかもしれません！