Jak serwować LLM Bielik-11B 🦅 - Tutorial #17

  Рет қаралды 4,273

ML-Workout

ML-Workout

Күн бұрын

Пікірлер: 23
@szczeles
@szczeles 9 күн бұрын
Wow, Panowie, przepięknie zrealizowany tutorial. Nie dość, że "od zera do bohatera", to jeszcze nie zapomnieliście o zabezpieczeniu endpointu. I nawet cenowo ten g5.xlarge w AWS wychodzi całkiem znośnie, piątak za godzinę to uczciwa cena 🙂
@ml-workout
@ml-workout 9 күн бұрын
Dzięki 🫶🏻
9 күн бұрын
Film o polskim LLMie? Nie muszę włączać a już klikam like. POLSKA GUROM
@seitaishogun
@seitaishogun 3 күн бұрын
Kibicuję! Pomyślności panowie !
@ml-workout
@ml-workout 3 күн бұрын
Dzięki ☺
@jacekmikolajczyk6661
@jacekmikolajczyk6661 5 күн бұрын
Bielik. 👍👍
@tiaamat
@tiaamat 3 күн бұрын
🎉bielik!
@sxsxryn
@sxsxryn 9 күн бұрын
Super przedstawione, mega ciekawy materiał. Fajnie, że jednak coś jest w naszym ojczystym języku. Bielik!
@ml-workout
@ml-workout 9 күн бұрын
Dzięki!
@mpfmorawski
@mpfmorawski 9 күн бұрын
Ale idealnie trafiliście! Sam planowałem postawić Bielika w chmurze, żeby się nim pobawić (i przy okazji poduczyć, jak z technicznego punktu widzenia najlepiej to zrobić). A z Waszym filmem i materiałami będzie to o wiele prostsze! Dzięki, że robicie takie materiały :D PS: Bielik 🦅
@ml-workout
@ml-workout 9 күн бұрын
Dzięki, bardzo nam miło!
@asqu
@asqu 9 күн бұрын
Po co się męczyć, masz przecież LM Studio lub Jan i model skwantyzowany w formacie GGUF, uruchomisz zapewne na swoim kompie.
@ml-workout
@ml-workout 9 күн бұрын
@@asqu Do zabawy lokalnie jak najbardziej. My pokazujemy wdrożenie serwerowe.
@emiliabunko4518
@emiliabunko4518 5 күн бұрын
bielik
@inout3394
@inout3394 6 күн бұрын
Mi by się przydała wersja small Q4 np. 1B/1.5B/2B/2.5B/3B by uruchomić ją na telefonie np. w aplikacji ChatterUI
@polishmotorfan
@polishmotorfan 2 күн бұрын
Czy da się to uruchomić na rtx 3060 na laptopie?
@grzesiekzysk
@grzesiekzysk 9 күн бұрын
Czy Bielika można wcześniej nakarmić danymi aby był czymś w rodzaju "bazy wiedzy"?
@ml-workout
@ml-workout 9 күн бұрын
Masz na myśli fine tuning z własnymi danymi? Raczej w tym przypadku sugerowałbym podejście typu RAG (Retrieval Augmented Generation) - czyli używasz model instruct, a swoje dane umieszczasz jako część prompta. Dane muszą być wcześniej zwektoryzowane, a ich znalezienie odbywa się przez porównanie podobieństwa wektora "zapytania" do wektora "dokumentu". Opowiadamy o tym podejściu w naszym filmiku "Zbuduj z nami Chatbota QA z LLM"
@grzesiekzysk
@grzesiekzysk 9 күн бұрын
@@ml-workout Tak, dzięki. Juz odpalam film!
@madrag
@madrag 8 күн бұрын
Da sie to "obsluzyc" poprzez ollame?
@ml-workout
@ml-workout 8 күн бұрын
Da się, pamiętając o tym, że Ollama jest nastawiona bardziej na uruchomianie modeli do potrzeb lokalnych, a nie serwerowych, tak jak wykorzystany przez nas vLLM.
@sylwekkaluza7873
@sylwekkaluza7873 9 күн бұрын
Bielik
@zbigniews497
@zbigniews497 5 күн бұрын
Bielik
AI Model Serving w FastAPI - Tutorial #16
27:41
ML-Workout
Рет қаралды 1,4 М.
Ostra Uczy - Stateless
1:36:05
Ostra Piła
Рет қаралды 100
Quando eu quero Sushi (sem desperdiçar) 🍣
00:26
Los Wagners
Рет қаралды 13 МЛН
Farmer narrowly escapes tiger attack
00:20
CTV News
Рет қаралды 15 МЛН
Mom Hack for Cooking Solo with a Little One! 🍳👶
00:15
5-Minute Crafts HOUSE
Рет қаралды 21 МЛН
Laravel 5 - jak zacząć, podstawy budowania aplikacji #30
1:13:43
Od zera do WebDeva
Рет қаралды 27 М.
Git i GitHub w 60 minut
1:20:14
Jak nauczyć się programowania
Рет қаралды 220 М.
PydanticAI - The NEW Agent Builder on the Block
21:45
Sam Witteveen
Рет қаралды 25 М.
JSON - wszystko co musisz o nim wiedzieć
17:25
Twórca Stron
Рет қаралды 49 М.
Fine-Tuning Large Language Models (LLMs)
1:16:12
Oren Sultan, AI Research Scientist & Engineer
Рет қаралды 5 М.
Agent AI w 10 minut, bez programowania | N8N w praktyce
19:09
UW-TEAM.org
Рет қаралды 22 М.
Building Real-time Apps with Go | Azim Pulat
54:58
Azim Pulat
Рет қаралды 43 М.
Narzędzia AI, które MUSISZ poznać przed 2025
33:50
Jak nauczyć się programowania
Рет қаралды 10 М.