KZ
bin
Негізгі бет
Қазірдің өзінде танымал
Тікелей эфир
Ұнаған бейнелер
Қайтадан қараңыз
Жазылымдар
Кіру
Тіркелу
Ең жақсы KZbin
Фильм және анимация
Автокөліктер мен көлік құралдары
Музыка
Үй жануарлары мен аңдар
Спорт
Ойындар
Комедия
Ойын-сауық
Тәжірибелік нұсқаулар және стиль
Ғылым және технология
【強化学習】n-step TD 法 - 一番使われる基礎的手法だよ【強化学習の基礎アルゴリズム】RL vol. 17 #182 #VRアカデミア #ReinforcementLearning
27:31
Why “probability of 0” does not mean “impossible” | Probabilities of probabilities, part 2
10:01
Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn
00:57
😺🍫 خدعة الشوكولاتة المذهلة لقطتي! شاهد كيف تعلمني قطتي القيام بها! 😂🎉
00:30
小丑女COCO的审判。#天使 #小丑 #超人不会飞
00:53
人是不能做到吗?#火影忍者 #家人 #佐助
00:20
【強化学習】On-policy と Off-policy - 実は定義が曖昧な概念【強化学習の基礎概念】RL vol. 16
Рет қаралды 2,757
Facebook
Twitter
Жүктеу
1
Жазылу 58 М.
AIcia Solid Project
Күн бұрын
Пікірлер: 14
@jyoan_ai-yy1ip
7 ай бұрын
最近機械学習の勉強を始めました。 新作の投稿ありがとうございます。 応援しております。
@AIcia_Solid
7 ай бұрын
ご視聴コメントありがとうございます!🎉 これからも良き動画を生成できるようがんばります!🔥 ともに勉強していきましょー!(^o^)
@gesonanko6356
7 ай бұрын
めっち以前フレンドに上手く説明出来なくてモヤモヤしてた内容だったのでめっちゃ納得しました!ありがとうございます!
@AIcia_Solid
7 ай бұрын
げそんさんどうも! ご視聴コメントありがとうございます🤩 いやーーー、もやりますよね、これ😇 この理解ご活用いただけると嬉しいです!とともに、プロの視点からツッコミ発見したりしたらぜひ教えてください!!!
@nire-hj9pe
7 ай бұрын
いつもありがとうございます。 まさかそんな野菜と果物みたいなノリだったとは…笑 これを念頭に置いてもう一度教科書読んでみます!
@AIcia_Solid
7 ай бұрын
そのたとえ素敵ですね🤣 ありがとうございます🥕 この視点で見ると色々理解が深まりやすいと思います(^o^) 是非トライしてみてください!
@otoppi7
7 ай бұрын
いつも分かりやすい解説ありがとうございます。On-Policyであることの本質は、次の行動a'までのワンセット(SARSA)でとらえて学習させるかということかなと見ています。次の行動をとらえるには当然それを決める方針が必要で今の行動に対する方針と同一でなければならないのは当然かと。予想すべきは行動ではなく方針だとでも言いたそうな...結果的には、よりリスクに敏感で安定した探索が可能だが、遅くなりがち...そこを何とかできないものか?
@AIcia_Solid
7 ай бұрын
ご視聴コメントありがとうございます! 素敵な考察だと思います! 次回、n-step TD の話の中で n-step Q 学習を紹介しようと思います。それが On か Off か、自分なりに検討してみていただけると嬉しいです!
@niruru9560
7 ай бұрын
on-policy / off-policy 知らなかったです
@AIcia_Solid
7 ай бұрын
ご視聴コメントありがとうございます! 便利な概念ではあるので、是非ご活用くださいませ😊
@とおるくん-k7q
6 ай бұрын
理学部数学科卒のアラフィフのおっさんです。アナログ世代でこんな動画があったらと思います。外資系製造でファイナンシャルコントローラーしているけど。数学のほうが断然好きです。会計ファイナンスはサラリーマンとして生きていくため仕方なく勉強した。このシリーズハマってます。データサイエンスの仕事したいな。
@AIcia_Solid
5 ай бұрын
ご視聴コメントありがとうございます!🎉 実は強化学習は、まだそんなに仕事が多くはないのですが、、、! この先増えると思いますので、先立って勉強しておくのは悪くないと思います! データサイエンスはデータサイエンスでそれなりに泥臭い仕事ではありますが、興味を持っていただいてとても嬉しく感じます!
27:31
【強化学習】n-step TD 法 - 一番使われる基礎的手法だよ【強化学習の基礎アルゴリズム】RL vol. 17 #182 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 3,2 М.
10:01
Why “probability of 0” does not mean “impossible” | Probabilities of probabilities, part 2
3Blue1Brown
Рет қаралды 3 МЛН
00:57
Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn
超人夫妇
Рет қаралды 60 МЛН
00:30
😺🍫 خدعة الشوكولاتة المذهلة لقطتي! شاهد كيف تعلمني قطتي القيام بها! 😂🎉
PuffPaw Arabic
Рет қаралды 17 МЛН
00:53
小丑女COCO的审判。#天使 #小丑 #超人不会飞
超人不会飞
Рет қаралды 16 МЛН
00:20
人是不能做到吗?#火影忍者 #家人 #佐助
火影忍者一家
Рет қаралды 20 МЛН
25:47
Harvard Professor Explains Algorithms in 5 Levels of Difficulty | WIRED
WIRED
Рет қаралды 3,4 МЛН
16:08
Animation vs. Physics
Alan Becker
Рет қаралды 32 МЛН
12:15
Evolving AIs - Predator vs Prey, who will win?
Pezzza's Work
Рет қаралды 2,9 МЛН
22:21
Why do prime numbers make these spirals? | Dirichlet’s theorem and pi approximations
3Blue1Brown
Рет қаралды 6 МЛН
16:01
Теория струн (ScienceClic)
VoicePower
Рет қаралды 2,5 МЛН
12:51
one year of studying (it was a mistake)
Jeffrey Codes
Рет қаралды 232 М.
15:08
What does it feel like to invent math?
3Blue1Brown
Рет қаралды 4,2 МЛН
14:03
Animation vs. Math
Alan Becker
Рет қаралды 79 МЛН
17:38
The moment we stopped understanding AI [AlexNet]
Welch Labs
Рет қаралды 1,5 МЛН
18:55
This is How Easy It Is to Lie With Statistics
Zach Star
Рет қаралды 6 МЛН
00:57
Little Coco was manipulated, and the kind-hearted Harley Quinn saved everyone #Joker #HarleyQuinn
超人夫妇
Рет қаралды 60 МЛН