CS885 Lecture 14c: Trust Region Methods

  Рет қаралды 22,187

Pascal Poupart

Pascal Poupart

Күн бұрын

Пікірлер
@junchaoli1062
@junchaoli1062 5 жыл бұрын
very clear! thank you pascal!
@kamiladamsky
@kamiladamsky 6 жыл бұрын
Great lecture!
@Houd1ny
@Houd1ny 3 жыл бұрын
This is great. Finally, understand TRPO
@naifalkhunaizi4372
@naifalkhunaizi4372 3 жыл бұрын
Thank you Professor Pascal!
@kadaj2k7
@kadaj2k7 3 жыл бұрын
Thank you for this video! Very helpful.
@johntrash4962
@johntrash4962 4 жыл бұрын
Thank you for your clear explanation!
@yehiamoustafa9801
@yehiamoustafa9801 2 жыл бұрын
Great Lecture Thank you!
@hariprasad-qk8vs
@hariprasad-qk8vs 2 жыл бұрын
Very beautifully explained thank you
@李凯-f1d
@李凯-f1d 4 жыл бұрын
Thanks prof, really helpful
@jonnychan785
@jonnychan785 4 жыл бұрын
Good lecture thankyou!
@万杨阳
@万杨阳 5 жыл бұрын
I see several textbooks or blogs write that "trust region is dual method to line search", I can't agree with it. I think trust region is a superior method to line search because it's a quadratic approximation to the original function rather than a linear approximation, besides, it defines a region which parameters can't jump out of. Linear search actually has implicitly defined a region for step dt such that f(x+dt)>=0. If min{f(x)} < 0, we should define a trust region for linear search. Am I right or I have ignored something?
@cucumcumber
@cucumcumber 2 жыл бұрын
I guess the dual space of l1 in line search is l_infinity in trust region.
@MiiiiiiTube
@MiiiiiiTube 3 жыл бұрын
really nice, thank you so much! :D
@AJ-et3vf
@AJ-et3vf 2 жыл бұрын
great video sir! thank you!
@mahsatech
@mahsatech 11 ай бұрын
man that was great
@cyberpunk_edgerunners
@cyberpunk_edgerunners 2 жыл бұрын
thank you ,sir
@НиколайНовичков-е1э
@НиколайНовичков-е1э 2 жыл бұрын
Thank you!
@alimaster5292
@alimaster5292 6 жыл бұрын
how to answer this question What is the main motivation behind Trust region methods? What could be a signal to enlarge the Trust region in the next step? What is the Cauchy point?
@金飘飘-o2o
@金飘飘-o2o 5 жыл бұрын
Do u have idea now?
@jfigueroa789
@jfigueroa789 4 жыл бұрын
You can find all the information in the Nocedal’s book “Numerical Optimization”.
@BillHaug
@BillHaug Жыл бұрын
thank you
@alexanderyau6347
@alexanderyau6347 6 жыл бұрын
Good very intuitive
CS885 Module 1: Trust region & proximal policy optimization
22:18
Pascal Poupart
Рет қаралды 8 М.
Quando eu quero Sushi (sem desperdiçar) 🍣
00:26
Los Wagners
Рет қаралды 15 МЛН
1% vs 100% #beatbox #tiktok
01:10
BeatboxJCOP
Рет қаралды 67 МЛН
It works #beatbox #tiktok
00:34
BeatboxJCOP
Рет қаралды 41 МЛН
Trust Regions
28:48
BYU FLOW Lab
Рет қаралды 6 М.
Levenberg-Marquardt Algorithm
57:14
Engineering Educator Academy
Рет қаралды 25 М.
11. Unconstrained Optimization; Newton-Raphson and Trust Region Methods
53:30
CS885 Lecture 15b: Proximal Policy Optimization (Presenter: Ruifan Yu)
18:14
Katya Scheinberg: "Recent advances in Derivative-Free Optimization and its connection to reinfor..."
52:00
Institute for Pure & Applied Mathematics (IPAM)
Рет қаралды 2,5 М.
Line Search 1
28:59
BYU FLOW Lab
Рет қаралды 6 М.
CS885 Lecture 10: Bayesian RL
1:22:28
Pascal Poupart
Рет қаралды 9 М.
Terence Tao at IMO 2024: AI and Mathematics
57:24
AIMO Prize
Рет қаралды 654 М.
8.2 Quasi Newton and BFGS
43:55
Constantine Caramanis
Рет қаралды 20 М.
Quando eu quero Sushi (sem desperdiçar) 🍣
00:26
Los Wagners
Рет қаралды 15 МЛН