LLM. Лекция 4. Inference: обзор.

  Рет қаралды 306

Евгений Разинков

Евгений Разинков

Күн бұрын

Пікірлер: 5
@alkenkurmanov9339
@alkenkurmanov9339 20 сағат бұрын
Классная лекция
@razinkov
@razinkov 20 сағат бұрын
Спасибо, я очень рад)
@kiryllshynharow9058
@kiryllshynharow9058 Сағат бұрын
2:00 жаль, конечно, что Вы зареклись самоограничиться LLM было бы интересно, например, от Вас разбор идеи Mamba услышать разве разбор LLAMa 3.1 было не захватывающий опыт? можно конечно ответить что кому очень интересно "beyond" те сами разберутся но проблема даже не в том что сейчас слишком много всего интересного появляется чтобы все читать проблема в том что без экспертного совета проблема даже успевать понять что может быть интересно/перспективно, а что нет
@kiryllshynharow9058
@kiryllshynharow9058 Сағат бұрын
22:40 я чуток подзапутался речь же идёт про трансформер, который (если я правильно понял) на каждом новом шаге учитывает ("видит") предыдущий сгенерированный токен (или пусть даже оценку распределения вероятностей таких токенов) каким образом мы можем заставить его учитывать температуру (подшаманить аргумент softmax?)/установить отсечку в 95% вероятных токенов? это модификация самого внутри трансформера, получается? спасибо
@razinkov
@razinkov Сағат бұрын
Да, можно сказать так. Если вы запускаете модель у себя. Но и ChatGPT при обращении через API позволяет пользователю регулировать температуру, например.
Предел развития НЕЙРОСЕТЕЙ
18:53
Onigiri
Рет қаралды 211 М.
Как работает ChatGPT: объясняем нейросети просто
39:04
RationalAnswer | Павел Комаровский
Рет қаралды 1,4 МЛН
Mom Hack for Cooking Solo with a Little One! 🍳👶
00:15
5-Minute Crafts HOUSE
Рет қаралды 23 МЛН
Правильный подход к детям
00:18
Beatrise
Рет қаралды 11 МЛН
So Cute 🥰 who is better?
00:15
dednahype
Рет қаралды 19 МЛН
Введение в большие языковые модели (LLM)
45:28
Антон Полухин - Грязные C++ трюки из userver и Boost
1:00:00
C++ Russia — Конференция по разработке на Cpp
Рет қаралды 5 М.
LLM. Лекция 28.
1:25:32
Евгений Разинков
Рет қаралды 1,2 М.
Transformers (how LLMs work) explained visually | DL5
27:14
3Blue1Brown
Рет қаралды 4,3 МЛН