【人工智能】DeepSeek开源推理模型R1 | R1-Zero | 蒸馏小模型 | 绕过监督微调直接强化学习 | 媲美o1 | 顿悟时刻 | GRPO | 奖励设计 | 冷启动 | 再现价格屠夫

  Рет қаралды 12,328

Best Partners TV

Best Partners TV

Күн бұрын

Пікірлер: 81
번쩍번쩍 거리는 입
0:32
승비니 Seungbini
Рет қаралды 182 МЛН
Transformers (how LLMs work) explained visually | DL5
27:14
3Blue1Brown
Рет қаралды 4,4 МЛН
深度发问:为什么国产车都打不过Model Y?
7:23
大刘科普
Рет қаралды 10 М.
DeepSeek R1 Just Revolutionized AI Forever
21:06
Cole Medin
Рет қаралды 5 М.
Why the Future of AI & Computers Will Be Analog
17:36
Undecided with Matt Ferrell
Рет қаралды 559 М.