DeepSpeed: All the tricks to scale to gigantic models

  Рет қаралды 18,405

Mark Saroufim

Mark Saroufim

3 жыл бұрын

References
github.com/microsoft/DeepSpeed
github.com/NVIDIA/Megatron-LM
github.com/cybertronai/gradie...
github.com/msr-fiddle/pipedream
Zero: arxiv.org/abs/1910.02054

Пікірлер: 17
@mekaneeky
@mekaneeky Жыл бұрын
Thanks Mark! Quite a thorough and useful explanation.
@darrenbrien
@darrenbrien 3 жыл бұрын
Thanks Mark great vid. Good update on SOTA in distributed training since horovod
@randolphzeng6051
@randolphzeng6051 Жыл бұрын
Thanks for such an inspiring and insightful video. What a knowledge feast to enjoy !
@sandraviknander7898
@sandraviknander7898 3 жыл бұрын
If you just add a pair of aviator sunglasses then this is a Yannic Kilcher video. Instant 100k sub upgrade. Jokes aside, this was a great explanation of a great library!
@user-vl2fp9ye5n
@user-vl2fp9ye5n 7 ай бұрын
Thanks mark!. You have been helping me understand concepts better.
@saratbhargavachinni5544
@saratbhargavachinni5544 Жыл бұрын
Great Video Mark! A few corrections, A100 is available in 40 GB and 80 GB variants.
@limitlesslife7536
@limitlesslife7536 Жыл бұрын
amazing!
@user-wp8yx
@user-wp8yx Жыл бұрын
Nice explanation, but how to do in ooba?
@adriangabriel3219
@adriangabriel3219 2 жыл бұрын
Hi Mark, great vid. Could you make a video on how to fine-tune large transformer models (e.g. T5 B-11) without running into CUDA errors?
@marksaroufim
@marksaroufim 2 жыл бұрын
Great suggestion! Yes I’ll do it
@adriangabriel3219
@adriangabriel3219 2 жыл бұрын
@@marksaroufim great! There is a lot information about fine-tuning T-5 base , but not about fine-tuning models above T-5 base
@JordanArsenaultYT
@JordanArsenaultYT Жыл бұрын
@@adriangabriel3219 Did you ever get t5-11b working?
@Georgesbarsukov
@Georgesbarsukov 9 ай бұрын
You're looking at RAM, not vRAM btw.
@AndersOland
@AndersOland 10 ай бұрын
A 2080ti with 30 gigs? 🤭 If only my 4090 had that much RAM 😅
Microsoft DeepSpeed introduction at KAUST
1:11:36
KAUST Supercomputing Laboratory
Рет қаралды 6 М.
Зачем он туда залез?
00:25
Vlad Samokatchik
Рет қаралды 3 МЛН
THEY made a RAINBOW M&M 🤩😳 LeoNata family #shorts
00:49
LeoNata Family
Рет қаралды 42 МЛН
I Can't Believe We Did This...
00:38
Stokes Twins
Рет қаралды 123 МЛН
БОЛЬШОЙ ПЕТУШОК #shorts
00:21
Паша Осадчий
Рет қаралды 11 МЛН
The moment we stopped understanding AI [AlexNet]
17:38
Welch Labs
Рет қаралды 733 М.
Why Does Diffusion Work Better than Auto-Regression?
20:18
Algorithmic Simplicity
Рет қаралды 239 М.
Scientific Concepts You're Taught in School Which are Actually Wrong
14:36
Trends in Deep Learning Hardware: Bill Dally (NVIDIA)
1:10:58
Paul G. Allen School
Рет қаралды 19 М.
Coding a Web Server in 25 Lines - Computerphile
17:49
Computerphile
Рет қаралды 329 М.
New Recipe for Pi - Numberphile
14:29
Numberphile
Рет қаралды 229 М.
WHY IS THE STACK SO FAST?
13:46
Core Dumped
Рет қаралды 142 М.
How AI 'Understands' Images (CLIP) - Computerphile
18:05
Computerphile
Рет қаралды 186 М.
Battery  low 🔋 🪫
0:10
dednahype
Рет қаралды 12 МЛН
СТРАШНЫЙ ВИРУС НА МАКБУК
0:39
Кринжовый чел
Рет қаралды 1,4 МЛН
Красиво, но телефон жаль
0:32
Бесполезные Новости
Рет қаралды 1,4 МЛН
Samsung laughing on iPhone #techbyakram
0:12
Tech by Akram
Рет қаралды 656 М.