Llama.cpp for FULL LOCAL Semantic Router

  Рет қаралды 12,346

James Briggs

James Briggs

Күн бұрын

Using fully local semantic router for agentic AI with llama.cpp LLM and HuggingFace embedding models.
There are many reasons we might decide to use local LLMs rather than use a third-party service like OpenAI. It could be cost, privacy, compliance, or fear of the OpenAI apocalypse. To help you out, we made Semantic Router fully local with local LLMs available via llama.cpp like Mistral 7B.
Using llama.cpp also enables the use of quantized GGUF models, reducing the memory footprint of deployed models and allowing even 13-billion parameter models to run with hardware acceleration on an Apple M1 Pro chip. We also use LLM grammars to enable high output reliability even from the smallest of models.
In this video, we'll use HuggingFace's MiniLM encoder, and llama.cpp's Mistral-7B-instruct GGUF quantized.
⭐ GitHub Repo:
github.com/aur...
📌 Code:
github.com/aur...
🔥 Semantic Router Course:
www.aurelio.ai...
👋🏼 AI Consulting:
aurelio.ai
👾 Discord:
/ discord
Twitter: / jamescalam
LinkedIn: / jamescalam

Пікірлер: 29
How to Make RAG Chatbots FAST
21:02
James Briggs
Рет қаралды 39 М.
NEW AI Framework - Steerable Chatbots with Semantic Router
14:34
James Briggs
Рет қаралды 42 М.
Synyptas 4 | Арамызда бір сатқын бар ! | 4 Bolim
17:24
Хасанның өзі эфирге шықты! “Қылмыстық топқа қатысым жоқ” дейді. Талғарда не болды? Халық сене ме?
09:25
Демократиялы Қазақстан / Демократический Казахстан
Рет қаралды 349 М.
ROSÉ & Bruno Mars - APT. (Official Music Video)
02:54
ROSÉ
Рет қаралды 114 МЛН
Это было очень близко...
00:10
Аришнев
Рет қаралды 6 МЛН
host ALL your AI locally
24:20
NetworkChuck
Рет қаралды 1,2 МЛН
Semantic Chunking for RAG
29:56
James Briggs
Рет қаралды 25 М.
All You Need To Know About Running LLMs Locally
10:30
bycloud
Рет қаралды 163 М.
What are AI Agents?
12:29
IBM Technology
Рет қаралды 554 М.
Demo: Rapid prototyping with Gemma and Llama.cpp
11:37
Google for Developers
Рет қаралды 67 М.
OpenAI's NEW 256-d Embeddings vs. Ada 002
12:29
James Briggs
Рет қаралды 8 М.
Steerable AI with Pinecone + Semantic Router
11:31
James Briggs
Рет қаралды 6 М.
Run your own AI (but private)
22:13
NetworkChuck
Рет қаралды 1,6 МЛН
Local RAG with llama.cpp
8:38
Learn Data with Mark
Рет қаралды 5 М.
Synyptas 4 | Арамызда бір сатқын бар ! | 4 Bolim
17:24