CS885 Lecture 14c: Trust Region Methods

  Рет қаралды 21,975

Pascal Poupart

Pascal Poupart

Күн бұрын

Пікірлер: 22
@junchaoli1062
@junchaoli1062 5 жыл бұрын
very clear! thank you pascal!
@Houd1ny
@Houd1ny 3 жыл бұрын
This is great. Finally, understand TRPO
@naifalkhunaizi4372
@naifalkhunaizi4372 3 жыл бұрын
Thank you Professor Pascal!
@kamiladamsky
@kamiladamsky 5 жыл бұрын
Great lecture!
@kadaj2k7
@kadaj2k7 3 жыл бұрын
Thank you for this video! Very helpful.
@johntrash4962
@johntrash4962 4 жыл бұрын
Thank you for your clear explanation!
@hariprasad-qk8vs
@hariprasad-qk8vs 2 жыл бұрын
Very beautifully explained thank you
@万杨阳
@万杨阳 4 жыл бұрын
I see several textbooks or blogs write that "trust region is dual method to line search", I can't agree with it. I think trust region is a superior method to line search because it's a quadratic approximation to the original function rather than a linear approximation, besides, it defines a region which parameters can't jump out of. Linear search actually has implicitly defined a region for step dt such that f(x+dt)>=0. If min{f(x)} < 0, we should define a trust region for linear search. Am I right or I have ignored something?
@cucumcumber
@cucumcumber 2 жыл бұрын
I guess the dual space of l1 in line search is l_infinity in trust region.
@yehiamoustafa9801
@yehiamoustafa9801 2 жыл бұрын
Great Lecture Thank you!
@MiiiiiiTube
@MiiiiiiTube 3 жыл бұрын
really nice, thank you so much! :D
@jonnychan785
@jonnychan785 4 жыл бұрын
Good lecture thankyou!
@BillHaug
@BillHaug Жыл бұрын
thank you
@НиколайНовичков-е1э
@НиколайНовичков-е1э 2 жыл бұрын
Thank you!
@cyberpunk_edgerunners
@cyberpunk_edgerunners Жыл бұрын
thank you ,sir
@李凯-f1d
@李凯-f1d 4 жыл бұрын
Thanks prof, really helpful
@AJ-et3vf
@AJ-et3vf 2 жыл бұрын
great video sir! thank you!
@mahsatech
@mahsatech 9 ай бұрын
man that was great
@alimaster5292
@alimaster5292 6 жыл бұрын
how to answer this question What is the main motivation behind Trust region methods? What could be a signal to enlarge the Trust region in the next step? What is the Cauchy point?
@金飘飘-o2o
@金飘飘-o2o 5 жыл бұрын
Do u have idea now?
@jfigueroa789
@jfigueroa789 3 жыл бұрын
You can find all the information in the Nocedal’s book “Numerical Optimization”.
@alexanderyau6347
@alexanderyau6347 6 жыл бұрын
Good very intuitive
CS885 Lecture 15b: Proximal Policy Optimization (Presenter: Ruifan Yu)
18:14
Random Emoji Beatbox Challenge #beatbox #tiktok
00:47
BeatboxJCOP
Рет қаралды 65 МЛН
How To Choose Mac N Cheese Date Night.. 🧀
00:58
Jojo Sim
Рет қаралды 49 МЛН
Players vs Pitch 🤯
00:26
LE FOOT EN VIDÉO
Рет қаралды 126 МЛН
Haunted House 😰😨 LeoNata family #shorts
00:37
LeoNata Family
Рет қаралды 12 МЛН
11. Unconstrained Optimization; Newton-Raphson and Trust Region Methods
53:30
Trust Regions
28:48
BYU FLOW Lab
Рет қаралды 6 М.
CS885 Lecture 8b: Bayesian and Contextual Bandits
1:17:00
Pascal Poupart
Рет қаралды 13 М.
CS885 Lecture 8a: Multi-armed bandits
57:15
Pascal Poupart
Рет қаралды 22 М.
CS885 Module 1: Trust region & proximal policy optimization
22:18
Pascal Poupart
Рет қаралды 8 М.
Descent methods and line search: first Wolfe condition
12:43
Michel Bierlaire
Рет қаралды 18 М.
CS885 Lecture 7b: Actor Critic
35:06
Pascal Poupart
Рет қаралды 12 М.
CS480/680 Lecture 19: Attention and Transformer Networks
1:22:38
Pascal Poupart
Рет қаралды 350 М.
CS885 Lecture 1b: Markov Processes
23:40
Pascal Poupart
Рет қаралды 11 М.
Random Emoji Beatbox Challenge #beatbox #tiktok
00:47
BeatboxJCOP
Рет қаралды 65 МЛН