【強化学習】On-policy と Off-policy - 実は定義が曖昧な概念【強化学習の基礎概念】RL vol. 16

  Рет қаралды 2,757

AIcia Solid Project

AIcia Solid Project

Күн бұрын

Пікірлер: 14
@jyoan_ai-yy1ip
@jyoan_ai-yy1ip 7 ай бұрын
最近機械学習の勉強を始めました。 新作の投稿ありがとうございます。 応援しております。
@AIcia_Solid
@AIcia_Solid 7 ай бұрын
ご視聴コメントありがとうございます!🎉 これからも良き動画を生成できるようがんばります!🔥 ともに勉強していきましょー!(^o^)
@gesonanko6356
@gesonanko6356 7 ай бұрын
めっち以前フレンドに上手く説明出来なくてモヤモヤしてた内容だったのでめっちゃ納得しました!ありがとうございます!
@AIcia_Solid
@AIcia_Solid 7 ай бұрын
げそんさんどうも! ご視聴コメントありがとうございます🤩 いやーーー、もやりますよね、これ😇 この理解ご活用いただけると嬉しいです!とともに、プロの視点からツッコミ発見したりしたらぜひ教えてください!!!
@nire-hj9pe
@nire-hj9pe 7 ай бұрын
いつもありがとうございます。 まさかそんな野菜と果物みたいなノリだったとは…笑 これを念頭に置いてもう一度教科書読んでみます!
@AIcia_Solid
@AIcia_Solid 7 ай бұрын
そのたとえ素敵ですね🤣 ありがとうございます🥕 この視点で見ると色々理解が深まりやすいと思います(^o^) 是非トライしてみてください!
@otoppi7
@otoppi7 7 ай бұрын
いつも分かりやすい解説ありがとうございます。On-Policyであることの本質は、次の行動a'までのワンセット(SARSA)でとらえて学習させるかということかなと見ています。次の行動をとらえるには当然それを決める方針が必要で今の行動に対する方針と同一でなければならないのは当然かと。予想すべきは行動ではなく方針だとでも言いたそうな...結果的には、よりリスクに敏感で安定した探索が可能だが、遅くなりがち...そこを何とかできないものか?
@AIcia_Solid
@AIcia_Solid 7 ай бұрын
ご視聴コメントありがとうございます! 素敵な考察だと思います! 次回、n-step TD の話の中で n-step Q 学習を紹介しようと思います。それが On か Off か、自分なりに検討してみていただけると嬉しいです!
@niruru9560
@niruru9560 7 ай бұрын
on-policy / off-policy 知らなかったです
@AIcia_Solid
@AIcia_Solid 7 ай бұрын
ご視聴コメントありがとうございます! 便利な概念ではあるので、是非ご活用くださいませ😊
@とおるくん-k7q
@とおるくん-k7q 6 ай бұрын
理学部数学科卒のアラフィフのおっさんです。アナログ世代でこんな動画があったらと思います。外資系製造でファイナンシャルコントローラーしているけど。数学のほうが断然好きです。会計ファイナンスはサラリーマンとして生きていくため仕方なく勉強した。このシリーズハマってます。データサイエンスの仕事したいな。
@AIcia_Solid
@AIcia_Solid 5 ай бұрын
ご視聴コメントありがとうございます!🎉 実は強化学習は、まだそんなに仕事が多くはないのですが、、、! この先増えると思いますので、先立って勉強しておくのは悪くないと思います! データサイエンスはデータサイエンスでそれなりに泥臭い仕事ではありますが、興味を持っていただいてとても嬉しく感じます!
小丑女COCO的审判。#天使 #小丑 #超人不会飞
00:53
超人不会飞
Рет қаралды 16 МЛН
人是不能做到吗?#火影忍者 #家人  #佐助
00:20
火影忍者一家
Рет қаралды 20 МЛН
Animation vs. Physics
16:08
Alan Becker
Рет қаралды 32 МЛН
Evolving AIs - Predator vs Prey, who will win?
12:15
Pezzza's Work
Рет қаралды 2,9 МЛН
Теория струн (ScienceClic)
16:01
VoicePower
Рет қаралды 2,5 МЛН
one year of studying (it was a mistake)
12:51
Jeffrey Codes
Рет қаралды 232 М.
What does it feel like to invent math?
15:08
3Blue1Brown
Рет қаралды 4,2 МЛН
Animation vs. Math
14:03
Alan Becker
Рет қаралды 79 МЛН
The moment we stopped understanding AI [AlexNet]
17:38
Welch Labs
Рет қаралды 1,5 МЛН
This is How Easy It Is to Lie With Statistics
18:55
Zach Star
Рет қаралды 6 МЛН