Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

  Рет қаралды 7,608

DeepSchool

DeepSchool

Күн бұрын

Пікірлер: 27
@БоряДикий
@БоряДикий 9 күн бұрын
Оченьк коротко и очень по делу! Благодарочка!
@TheFemenistka
@TheFemenistka 4 ай бұрын
спасибо! такое милое видео! звучит очень интересно, надеюсь получиться записаться на ваш курс
@deep_school
@deep_school 4 ай бұрын
Спасибо! Будем рады видеть вас на курсе)
@hsqlk
@hsqlk 9 күн бұрын
LLM всегда предсказывает следующий токен
@bakaai445
@bakaai445 4 ай бұрын
Интересно
@HeydrMustafayev-ht9fm
@HeydrMustafayev-ht9fm 3 ай бұрын
Спасибо!!!
@stask7258
@stask7258 4 ай бұрын
Срастбо.
@MrGoudvin
@MrGoudvin 4 ай бұрын
ролик в духе "скелетон" )
@IvanLesnov
@IvanLesnov Ай бұрын
Как дообучить модель в оффлайне?
@internetnickname8923
@internetnickname8923 4 ай бұрын
Расскажите плз, как можно слить 2 LLM в 1, если есть необходимость объединить знания обеих моделей и получить гибрид)
@deep_school
@deep_school 4 ай бұрын
Есть хороший блогпост на эту тему huggingface.co/blog/mlabonne/merge-models Сливают обычно модели одной и той же архитектуры, например вариации того же Mixtral-8x7b. Делается это зачастую линейной интерполяцией весов между двумя моделями с различными параметрами. Есть различные инструменты - какие-то требуют задать параметры руками, какие-то пытаются откалибровать эти параметры проходом по датасету. В некоторых merged (слитых) моделях авторы пишут, каким подходом и какие модели они объединяли, например huggingface.co/vicgalle/Merge-Mixtral-Prometheus-8x7B Список инструментов (не полный): github.com/Gryphe/BlockMerge_Gradient github.com/arcee-ai/mergekit github.com/Gryphe/MergeMonster
@internetnickname8923
@internetnickname8923 4 ай бұрын
@@deep_school Супер) А есть способ выжать из модели полный датасет, на которой она обучалась?
@daniyarkalmanbetov7271
@daniyarkalmanbetov7271 3 ай бұрын
Пни если ответят плиз ​@@internetnickname8923
@antonmanukyan3307
@antonmanukyan3307 2 ай бұрын
А где цены на курс?
@deep_school
@deep_school 2 ай бұрын
Запись на курс мы открываем за несколько недель до старта, тогда же публикуем изменения в программе и цены. Вы можете оставить свои контакты в анкете предзаписи deepschool.ru/llm - чтобы мы сообщили вам о новом потоке и условиях в первую очередь :)
@fodezargames
@fodezargames 3 ай бұрын
У меня 2080 super и 32 гб памяти, какую модель смогу запустить? так чтоб не фигня была, а чтото умела
@daniyarkalmanbetov7271
@daniyarkalmanbetov7271 3 ай бұрын
Gemma2 - 8b?
@Zganshin
@Zganshin Ай бұрын
У меня вообще видеокарты нет, сервер dell r430 с одним слабым xeon процом, ну и апиративы 64 стоит последняя лама от Nvidia, всё работает , но медленно , сообщение может минут 10 писать, у тебя на GPU будет в разы быстрей ​@@daniyarkalmanbetov7271
@nz792006
@nz792006 Ай бұрын
поставь LM Studio и проверь, что религия не позволяет?
@usersimple562
@usersimple562 4 ай бұрын
как же заработать на макбук
@thirteeenth
@thirteeenth 2 ай бұрын
Супер. Благодарность до 7го неба ) А скажи , просто оч интересно , какая у тебя профильная деятельность ? чем ты занимаешься в основном ?
@deep_school
@deep_school 2 ай бұрын
Илья занимается обучением различных LLM-моделей, любит распределённое обучение и нейросети, еще Илье очень нравится рассказывать об этом студентам)
@romanbolgar
@romanbolgar 3 ай бұрын
Сколько мучений. Оно то конечно интересно но отвлекает. Как говорится сапожник без сапог. Хотя я вообще видео не делаю потому что вот из-за этого. Всё никак не найду бесплатного диктора с искусственным интеллектом желательно чтобы говорил моим голосом. Ну это опять же надо обучать. Кстати этот текст в комментарии я тоже говорю. Но это уже другая технология. Речь в текст. В принципе уже давно есть и текст в речь Тоже давно пользуюсь. Но многим режет слух Голос робота. Хотя сейчас вроде уже и голоса есть хорошие. Более того есть сервисы на базе того же искусственного интеллекта Которые видеоряд подбирают. А то тема сложная не всё понятно.
RAG vs. Fine Tuning
8:57
IBM Technology
Рет қаралды 91 М.
LLM. Валентин Мамедов | Под Капотом
1:16:33
人是不能做到吗?#火影忍者 #家人  #佐助
00:20
火影忍者一家
Рет қаралды 20 МЛН
Арыстанның айқасы, Тәуіржанның шайқасы!
25:51
QosLike / ҚосЛайк / Косылайық
Рет қаралды 700 М.
The evil clown plays a prank on the angel
00:39
超人夫妇
Рет қаралды 53 МЛН
Как создавать AI‑ассистентов
27:50
Yandex Cloud
Рет қаралды 8 М.
Qwen Just Casually Started the Local AI Revolution
16:05
Cole Medin
Рет қаралды 115 М.
Введение в большие языковые модели (LLM)
45:28
Сравниваем: RAG на Local LLM vs GPT-4
5:19
AI Experience Exchange
Рет қаралды 9 М.
What is Retrieval-Augmented Generation (RAG)?
6:36
IBM Technology
Рет қаралды 835 М.
Prompt Engineering, RAG, and Fine-tuning: Benefits and When to Use
15:21
Купила Новый iPad Air для учёбы с КЛАВИАТУРОЙ / ОБЗОР
22:48
Ксения Куприкова
Рет қаралды 107 М.
🪫 intel vs snapdragon 🔋
0:48
Не шарю!
Рет қаралды 419 М.
Чудик раз*е*ал PS5 просто так🤡
0:37
Арбуз
Рет қаралды 1,3 МЛН
Which one made you like this video?#keyboard
0:32
Tapkx
Рет қаралды 10 МЛН
Dyson vs Philips süpürge karşılaştırma
0:11
İncelemedeyim
Рет қаралды 3,7 МЛН