【強化学習】教師あり学習とは何が同じで何が違う?【実は共通点も多い!】RL vol. 2

  Рет қаралды 10,599

AIcia Solid Project

AIcia Solid Project

Күн бұрын

Пікірлер: 18
@me-me-661
@me-me-661 Жыл бұрын
楽しみにしてたシリーズをありがとうございます。いろんな所を学習するから今どこをやってるかしっかり意識しなくてはいけない、刺さりました。勉強させていただきます。
@AIcia_Solid
@AIcia_Solid Жыл бұрын
ご視聴コメントありがとうございます!🎉 是非、抜けないよう、深く刺しておいてください!!! よくわからない混乱のかなりが解決するかと思います!
@小野賢一郎
@小野賢一郎 Жыл бұрын
教師あり学習、教師なし学習、強化学習、今日も学習!楽しい動画をありがとうございます!
@AIcia_Solid
@AIcia_Solid Жыл бұрын
小野さん!!! いつもご支援いただきありがとうございます🎉🎉🎉 私も、小野さんに見ていただけてとても嬉しいです😊 是非続きも楽しみにしていてください!🎉
@shm2219
@shm2219 Жыл бұрын
最後の色々なところを学習するという視点を持てたのが今回の最大の収穫でした。
@AIcia_Solid
@AIcia_Solid Жыл бұрын
ご視聴コメントありがとうございます! それは良かった!🎉 ホントそうなんです、ほんと色んなところをやるので、是非混乱にはお気をつけて、、、!🙏
@nire-hj9pe
@nire-hj9pe Жыл бұрын
ちょうどmlagentsで遊ぶマイブームがきてたのでありがたいです!
@AIcia_Solid
@AIcia_Solid Жыл бұрын
ご視聴コメントありがとうございます🎉 めちゃ楽しそうなことしてますね🤤🤤🤤 なにか面白いことできたら是非教えてください!(^o^)/
@ちゃんぽこ-l5l
@ちゃんぽこ-l5l Жыл бұрын
4:05の状態が相関を持つというのは各時刻の状態を確率変数としてみた時にそれぞれ互いに独立ではないということで良いのでしょうか? 私が知っている相関があるというのは相関係数の絶対値が1に近いことなのですがこの文脈ではそういう意味では無いのでしょうか?
@AIcia_Solid
@AIcia_Solid Жыл бұрын
ご視聴コメントありがとうございます! 素敵な質問ですね! 先に回答しますと、2つとも yes です! 詳しく書きます! 「相関がある」や「相関を持つ」というのは、一方が変化すればもう一方も変化するように相互に関係することで、つまり、「独立でない」とほぼ同じ意味です。 よく使うピアソンの相関係数は、その相関のうち、線形な関係性の強さを測るものです。 ピアソンの相関係数が高いことは相関がある(強い)、ことの一種ですが、 「相関がある」という概念はもっと広く使われています。 もし追加の疑問などありましたら遠慮なくお教えくださませ!
@ちゃんぽこ-l5l
@ちゃんぽこ-l5l Жыл бұрын
@@AIcia_Solid ありがとうございます! 相関という言葉は直線以外でも使うのですね。勉強になりました😊
@AIcia_Solid
@AIcia_Solid Жыл бұрын
疑問が解けたようで良かったです! また何かあればいつでもお聞きください!🎉
@やぁ-h8v
@やぁ-h8v Жыл бұрын
unity で現実空間を表現するためのパラメータ調整に強化学習は使えると思いますか? 具体的には流体シミュレーションをやりたくて、現実空間でマイクロビーズの動きを観察して、その動きをunityで表現できるように、流体のパラメータを調節したいです。
@AIcia_Solid
@AIcia_Solid Жыл бұрын
ご視聴コメントありがとうございます! あまり詳しくないですが、感覚的には、あまり向いていない気もします。 報酬の設計がうまくできれば良い気がしますが、 状態→行動→報酬→状態 という定式化ともあまり相性が良くない気がします。 ただ、私が思いつく問題点は、門外漢の意見ですので、ここをちゃんと乗り越えるアイデアなどあれば上手くいくかもしれないとは思います!
@chon6917
@chon6917 Жыл бұрын
強化学習のTD3という手法を使って複雑な多目的最適化問題を解いているのですが、学習によって得られた方策が似たり寄ったりになってしまって、、、 別の方策を得るには、パラメータを変えるだけでは限界があるのでしょうか、、?(問題の内容によってはDQN等の別の手法の方がいいのでしょうか、、?)
@AIcia_Solid
@AIcia_Solid Жыл бұрын
ご視聴コメントありがとうございます! めちゃめちゃ深いところで試行錯誤をされているのですね!すごい! ただ、すみません、、、。タスクの性質にかなり依存すると思うので、いただいた情報からではお答えできません🙇‍♀️🙇‍♀️🙇‍♀️ 強化学習を専門でやられてる方などを探して、詳しく相談してみると良いかもしれません!
@カワイカトリ
@カワイカトリ Жыл бұрын
Q-learningの「Q」って、何かの頭文字なのでしょうか? Qの語源が気になりました。
@AIcia_Solid
@AIcia_Solid Жыл бұрын
ご視聴コメントありがとうございます!🎉 Q-learning の Q は行動価値関数の Q で、どうもその Q は quality から来ているという説があるようです。 私も詳しくは分からないので、調べていただけるのが良いと思います!
Quando A Diferença De Altura É Muito Grande 😲😂
00:12
Mari Maria
Рет қаралды 45 МЛН
BAYGUYSTAN | 1 СЕРИЯ | bayGUYS
36:55
bayGUYS
Рет қаралды 1,9 МЛН
みんな大好き強化学習 #devio2022
11:43
クラスメソッド | DevelopersIO | AWSや生成AIなど最新技術のやってみた動画
Рет қаралды 881
【強化学習#1】強化学習の概要
11:02
データサイエンス研究所
Рет қаралды 4,7 М.
【6分で分かる】強化学習について解説!
6:36
スタビジ【誰でもAIデータサイエンス】byウマたん
Рет қаралды 3 М.
【8分で分かる】ChatGPTなどのベースとなっているTransformerとは!?
8:17
スタビジ【誰でもAIデータサイエンス】byウマたん
Рет қаралды 28 М.
для всей семьи
0:56
Стакановец
Рет қаралды 191 М.
🪄Вечная спичка #diy #выживание #поход
1:00
Короче, ВИ
Рет қаралды 2,8 МЛН
Проверил, как вам?
1:01
Коннор
Рет қаралды 964 М.
(✋❌)kageihina VS siajiwoo VS meosimmyyt VS oxzung#tiktok #shorts
0:12
В Европе заставят Apple сделать в айфонах USB Type-C
0:18
Короче, новости
Рет қаралды 1,1 МЛН