【強化学習】On-policy と Off-policy - 実は定義が曖昧な概念【強化学習の基礎概念】RL vol. 16

【強化学習】n-step TD 法 - 一番使われる基礎的手法だよ【強化学習の基礎アルゴリズム】RL vol. 17 #182 #VRアカデミア #ReinforcementLearning

Why “probability of 0” does not mean “impossible” | Probabilities of probabilities, part 2

Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn

😺🍫 خدعة الشوكولاتة المذهلة لقطتي! شاهد كيف تعلمني قطتي القيام بها! 😂🎉

小丑女COCO的审判。#天使 #小丑 #超人不会飞

人是不能做到吗？#火影忍者 #家人 #佐助

【強化学習】On-policy と Off-policy - 実は定義が曖昧な概念【強化学習の基礎概念】RL vol. 16

Рет қаралды 2,757

AIcia Solid Project

AIcia Solid Project

Күн бұрын

Пікірлер: 14

@jyoan_ai-yy1ip

@jyoan_ai-yy1ip 7 ай бұрын

最近機械学習の勉強を始めました。新作の投稿ありがとうございます。応援しております。

@AIcia_Solid 7 ай бұрын

ご視聴コメントありがとうございます！🎉 これからも良き動画を生成できるようがんばります！🔥 ともに勉強していきましょー！(^o^)

@gesonanko6356 7 ай бұрын

めっち以前フレンドに上手く説明出来なくてモヤモヤしてた内容だったのでめっちゃ納得しました！ありがとうございます！

@AIcia_Solid 7 ай бұрын

げそんさんどうも！ご視聴コメントありがとうございます🤩 いやーーー、もやりますよね、これ😇 この理解ご活用いただけると嬉しいです！とともに、プロの視点からツッコミ発見したりしたらぜひ教えてください！！！

@nire-hj9pe 7 ай бұрын

いつもありがとうございます。まさかそんな野菜と果物みたいなノリだったとは…笑これを念頭に置いてもう一度教科書読んでみます！

@AIcia_Solid 7 ай бұрын

そのたとえ素敵ですね🤣 ありがとうございます🥕 この視点で見ると色々理解が深まりやすいと思います(^o^) 是非トライしてみてください！

@otoppi7 7 ай бұрын

いつも分かりやすい解説ありがとうございます。On-Policyであることの本質は、次の行動a'までのワンセット（SARSA）でとらえて学習させるかということかなと見ています。次の行動をとらえるには当然それを決める方針が必要で今の行動に対する方針と同一でなければならないのは当然かと。予想すべきは行動ではなく方針だとでも言いたそうな．．．結果的には、よりリスクに敏感で安定した探索が可能だが、遅くなりがち．．．そこを何とかできないものか？

@AIcia_Solid 7 ай бұрын

ご視聴コメントありがとうございます！素敵な考察だと思います！次回、n-step TD の話の中で n-step Q 学習を紹介しようと思います。それが On か Off か、自分なりに検討してみていただけると嬉しいです！

@niruru9560 7 ай бұрын

on-policy / off-policy 知らなかったです

@AIcia_Solid 7 ай бұрын

ご視聴コメントありがとうございます！便利な概念ではあるので、是非ご活用くださいませ😊

@とおるくん-k7q 6 ай бұрын

理学部数学科卒のアラフィフのおっさんです。アナログ世代でこんな動画があったらと思います。外資系製造でファイナンシャルコントローラーしているけど。数学のほうが断然好きです。会計ファイナンスはサラリーマンとして生きていくため仕方なく勉強した。このシリーズハマってます。データサイエンスの仕事したいな。

@AIcia_Solid 5 ай бұрын

ご視聴コメントありがとうございます！🎉 実は強化学習は、まだそんなに仕事が多くはないのですが、、、！この先増えると思いますので、先立って勉強しておくのは悪くないと思います！データサイエンスはデータサイエンスでそれなりに泥臭い仕事ではありますが、興味を持っていただいてとても嬉しく感じます！

【強化学習】n-step TD 法 - 一番使われる基礎的手法だよ【強化学習の基礎アルゴリズム】RL vol. 17 #182 #VRアカデミア #ReinforcementLearning

27:31

【強化学習】n-step TD 法 - 一番使われる基礎的手法だよ【強化学習の基礎アルゴリズム】RL vol. 17 #182 #VRアカデミア #ReinforcementLearning

AIcia Solid Project

Рет қаралды 3,2 М.

Why “probability of 0” does not mean “impossible” | Probabilities of probabilities, part 2

10:01

Why “probability of 0” does not mean “impossible” | Probabilities of probabilities, part 2

3Blue1Brown

Рет қаралды 3 МЛН

Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn

00:57

Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn

超人夫妇

Рет қаралды 60 МЛН

😺🍫 خدعة الشوكولاتة المذهلة لقطتي! شاهد كيف تعلمني قطتي القيام بها! 😂🎉

00:30

😺🍫 خدعة الشوكولاتة المذهلة لقطتي! شاهد كيف تعلمني قطتي القيام بها! 😂🎉

PuffPaw Arabic

Рет қаралды 17 МЛН

小丑女COCO的审判。#天使 #小丑 #超人不会飞

00:53

小丑女COCO的审判。#天使 #小丑 #超人不会飞

超人不会飞

Рет қаралды 16 МЛН

人是不能做到吗？#火影忍者 #家人 #佐助

00:20

人是不能做到吗？#火影忍者 #家人 #佐助

火影忍者一家

Рет қаралды 20 МЛН

Harvard Professor Explains Algorithms in 5 Levels of Difficulty | WIRED

25:47

Harvard Professor Explains Algorithms in 5 Levels of Difficulty | WIRED

WIRED

Рет қаралды 3,4 МЛН

Animation vs. Physics

16:08

Animation vs. Physics

Alan Becker

Рет қаралды 32 МЛН

Evolving AIs - Predator vs Prey, who will win?

12:15

Evolving AIs - Predator vs Prey, who will win?

Pezzza's Work

Рет қаралды 2,9 МЛН

Why do prime numbers make these spirals? | Dirichlet’s theorem and pi approximations

22:21

Why do prime numbers make these spirals? | Dirichlet’s theorem and pi approximations

3Blue1Brown

Рет қаралды 6 МЛН

Теория струн (ScienceClic)

16:01

Теория струн (ScienceClic)

VoicePower

Рет қаралды 2,5 МЛН

one year of studying (it was a mistake)

12:51

one year of studying (it was a mistake)

Jeffrey Codes

Рет қаралды 232 М.

What does it feel like to invent math?

15:08

What does it feel like to invent math?

3Blue1Brown

Рет қаралды 4,2 МЛН

Animation vs. Math

14:03

Animation vs. Math

Alan Becker

Рет қаралды 79 МЛН

The moment we stopped understanding AI [AlexNet]

17:38

The moment we stopped understanding AI [AlexNet]

Welch Labs

Рет қаралды 1,5 МЛН

This is How Easy It Is to Lie With Statistics

18:55

This is How Easy It Is to Lie With Statistics

Zach Star

Рет қаралды 6 МЛН

Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn

00:57

Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn

超人夫妇

Рет қаралды 60 МЛН