MEJORES y BARATOS: Cómo es que RAG está revolucionando los modelos de lenguaje

  Рет қаралды 12,578

Feregrino

Feregrino

Күн бұрын

Descubre cómo las RAG ofrecen resultados precisos y verificables sin los costos prohibitivos de entrenamiento y actualización continua. Sumérgete en el mundo de la eficiencia en IA, donde menos es más y el conocimiento está al alcance de todos.
Video sobre LLMs: • No todo es ChatGPT - I...
Prompt engineering: • Interactuando con Mode...
Embeddings: • La magia del Machine L...
RAG: • MEJORES y BARATOS: Cóm...
Código: feregri.no/rag
APÓYAME:
Únete al canal y disfruta de beneficios: www.youtube.com/@feregri_no/join
Cómprame un cafecito: www.buymeacoffee.com/feregrino
SOCIALES:
/ feregri_no
/ feregri_no
twitch.com/feregri_no
/ feregri_no
github.com/fferegrino
kaggle.com/ioexception
feregri.no
TIMESTAMPS:
00:00:00 Inicio
00:01:45 Todos quieren un GPT
00:05:39 Consulta tradicional a LLM
00:08:27 Sistemas RAG
00:11:52 Qué nos ofrece un sistema RAG
00:13:31 Cómo se hace la recuperación de contexto
00:15:58 Poblando una BD vectorial
00:17:53 Qué hacer con el query del usuario
00:18:38 Sistema RAG completo
00:20:04 Proyecto práctico
00:20:56 Componentes del proyecto
00:23:02 En dónde encontrar el código
00:24:37 Introducción al dataset
00:26:39 Un ejemplo motivante
00:28:59 Trabajando con el dataset
00:33:31 Introducción al Chunking
00:35:58 Haciendo chunking en nuestros documentos
00:39:42 Procesando los chunks para indexarlos
00:41:46 De dónde sacamos los embeddings
00:43:03 Creando embeddings para nuestros documentos
00:45:21 Base de datos vectorial
00:46:46 Insertando en la BD vectorial
00:50:33 Ejecutando queries en la BD
00:51:26 Obteniendo respuestas potenciales
00:53:19 Generando respuestas RAG
00:53:56 Generando respuestas con mis documentos
00:58:14 Siguientes pasos
01:00:14 En conclusión

Пікірлер: 57
@VladPalacios
@VladPalacios 5 ай бұрын
Oro puro, gracias por explicarlo de manera sencilla, no se si esto también esta en libros, o si es algo tan nuevo que aún no se han escrito libros al respecto
@feregri_no
@feregri_no 5 ай бұрын
Mil gracias, también gracias por volverte miembro del canal. Recuerda que en la pestaña de la comunidad están los recursos extra: www.youtube.com/@feregri_no/community
@gabrielcastillo6244
@gabrielcastillo6244 Ай бұрын
Gracias por iluminar el camino, excelente video
@nicolaselguapo6225
@nicolaselguapo6225 4 ай бұрын
El mejor contenido que he encontrado hasta el momento, espectacular, muchas gracias por toda la informacion, super fácil de entender!!!!
@feregri_no
@feregri_no 4 ай бұрын
Con mucho gusto, que bueno que te sirvió :D
@matiasparouy
@matiasparouy 5 ай бұрын
Excelente contenido! muchas gracias por esta serie de videos!
@feregri_no
@feregri_no 4 ай бұрын
A ti por tu comentario 😌
@rusbelbermudez238
@rusbelbermudez238 2 ай бұрын
Curiosamente te seguia en twitter/x quería agradecerte por la master class tus materiales son de excelente calidad.
@feregri_no
@feregri_no Ай бұрын
¡Muchas gracias!
@javaboy6581
@javaboy6581 Ай бұрын
Muy buen vídeo, me lo guardo para verlo más veces porque hay que asimilar muchas cosas. Un esfuerzo titánico el de este vídeo y te ha quedado de 10, ojalá sigas esta temática tan interesante. Yo añadiría cómo implementar un chatbot al estilo web de ollama para conversar con nuestro RAG, si se pudiese. Me interesa muchísimo este tema y me encanta tu contenido, no sé si se podrá hacer esto, pero es superinteresante. Te animo a seguir pues tienes mucha calidad. Saludos!
@feregri_no
@feregri_no Ай бұрын
Muchas gracias, me quedo con tu solicitud para desarrollarla un poco más.
@nicoux9581
@nicoux9581 5 ай бұрын
Ta bueno! me gustó. Muchas gracias Fere!
@feregri_no
@feregri_no 4 ай бұрын
Gracias a ti :D
@rodolfolopezp
@rodolfolopezp 12 күн бұрын
Excelente 👌
@alejandrobrun
@alejandrobrun 3 ай бұрын
Muchas gracias por compartir tu conocimiento.
@feregri_no
@feregri_no 3 ай бұрын
Con mucho gusto :)
@TheDojoMX
@TheDojoMX 5 ай бұрын
¡Gracias por esta serie! Creo que estas contribuyendo mucho a la información en español.
@feregri_no
@feregri_no 5 ай бұрын
Muchas gracias, que gusto que el aporte se valore.
@DevDes-AE
@DevDes-AE 3 ай бұрын
Muchas gracias!!! ... ¿Cómo preparas tu data set?, pls un videíto sobre ese tema, por otro lado estaria super genial que nos compartas sobre como montar nuestro propio chat en una demo usando Gradio o Streamlit, lo estaré esperando. Me super suscribo a tu canal ....A por más!!
@pedroandresgonzales402
@pedroandresgonzales402 4 ай бұрын
Nos falto esto en Boocamp machine learning de Código Facilito
@feregri_no
@feregri_no 4 ай бұрын
Para el de LLMOps 😏
@damianquijano1706
@damianquijano1706 2 ай бұрын
Muy buena explicación, suscrito.
@feregri_no
@feregri_no 2 ай бұрын
Gracias. ¡Saludos!
@AzzynTeam
@AzzynTeam 2 ай бұрын
Genial gracias por compartir el conocimiento lo intentare pero usando Go
@feregri_no
@feregri_no Ай бұрын
Excelente. ¿Qué tal te fue?
@jonathannarvaez7876
@jonathannarvaez7876 5 ай бұрын
tremendo, tenia un concepto vago sobre que era un RAG y esto me lo dejo mucho mas claro, gracias por compartir!!
@feregri_no
@feregri_no 4 ай бұрын
A ti por comentar :D
@fernandofrias8322
@fernandofrias8322 20 күн бұрын
muchas gracias. Ahora unos de tutoriales de Langchain--> (LangChain Expression Language (LCEL)) ->Langgraph
@feregri_no
@feregri_no 19 күн бұрын
Lo tendré en cuenta :)
@WillliamMEndez
@WillliamMEndez 2 ай бұрын
Gracias y claro me gustaría ver el tutorial con LlamaÍndex, excelente video
@feregri_no
@feregri_no 2 ай бұрын
Lo tendré en cuenta :)
@tecomAGS
@tecomAGS 2 ай бұрын
Excelente video
@feregri_no
@feregri_no 2 ай бұрын
Gracias :)
@mejia414
@mejia414 Ай бұрын
buen video mi amgo gracias
@feregri_no
@feregri_no Ай бұрын
Gracias gracias
@eudigitalizo
@eudigitalizo Ай бұрын
Excelente video. Realizado en forma muy profesional y muy didáctica. Realmente debes ser una fuente obligatoria de consulta. No sé si habrá algún correo o link donde uno pueda concertar contigo alguna reuni+on virtual para poder efectuar un joint venture en proyectos de empresas a las cuales les presto asesoría.
@pw4645
@pw4645 2 ай бұрын
Entonces cuales son las formas adecuadas de hacer los Chunks en produccion??
@joseleonardosanchezvasquez1514
@joseleonardosanchezvasquez1514 3 ай бұрын
Muchas gracias, que métrica usas para saber que el RAG está bien
@manuonda
@manuonda 2 ай бұрын
Muchas gracias por el video y los projects que realizas. Quería consultarte como seria para establecer los chunks o profundizar mas en el tema. Gracias . Saludos.
@feregri_no
@feregri_no Ай бұрын
Hay diversas maneras, pero haré un video al respecto.
@manuonda
@manuonda Ай бұрын
@@feregri_no Gracias Profe,
@ricardofernandez2286
@ricardofernandez2286 2 ай бұрын
@feregri_no Me gusta tu estilo, simple y conciso. Felicitaciones! Me has motivado a suscribirme a tu canal. Tengo una pregunta para ti. Ya he implementado varios de estos sistemas y sistemáticamente me encuentro con esta situación: si en mi texto original hay una frase como por ejemplo "el examen constaba de 8 secciones", y la pregunta que le hago al sistema es "cuantas partes tenía la prueba" el sistema muchas veces me responde que no tiene la información. Asumo, que puede ser porque en realidad la búsqueda es por similitud de texto y no de conceptos, y al usar distintas palabras, si bien estoy hablando de lo mismo, el modelo no lo entiende. También es justo decir que mi esquema de chunking es muy básico dado que las herramientas que uso solo me permiten un tamaño fijo de chunk y una superposición. Te suena familiar? Cómo sugieres solucionarlo? Muchas gracias! Un saludo!
@feregri_no
@feregri_no 2 ай бұрын
¡Te sugiero que lo debuguees! revisa que chunks recupera para esa pregunta en específico, puede ser que tu chunking esté partiendo ese texto. Encima de todo los LLMs no son muy buenos cuando se trata de lidiar con números, pero depurar es el primer paso.
@DinoRossYT
@DinoRossYT Ай бұрын
Está bien interesante! Me imagino un híbrido MoE y RAG haciendo fine-tuning del contexto y dándole la razón a gpt4o 🤙🤤
@feregri_no
@feregri_no Ай бұрын
Que bueno que te gustó :)
@edgargomero3307
@edgargomero3307 11 күн бұрын
quiero trabajar con modelos multimodales texto audio.
@dervismedina3051
@dervismedina3051 Ай бұрын
el link esta roto
@feregri_no
@feregri_no Ай бұрын
¿Cuál?
@edwincaicedo8539
@edwincaicedo8539 2 ай бұрын
Muy, buena explicación muchas gracias fue de mucha utilidad, solo una pregunta Rag depende de la capacidad de la ventana de contexto, por ejemplo en el caso de llama3 solo recibe 8.000 tokens y en el caso de superar esa ventana de contexto el modelo no sería capaz de generar una respuesta aumentada
@feregri_no
@feregri_no 2 ай бұрын
Ex correcto, el tamaño de la ventana es una restricción a considerar cuando desarrollas un RAG. Hay frameworks o herramientas que te permiten contar el número de tokens y seleccionar la cantidad de "chunks" adecuada para que no mandes más tokens de los que el LLM soporta.
@Oscar-bo6ox
@Oscar-bo6ox 2 ай бұрын
Por qué tanto texto?
@JavierTorres-st7gt
@JavierTorres-st7gt 18 күн бұрын
Pero para las empresas la informacion no tiene ninguna seguridad
@sergiocesardossantos1419
@sergiocesardossantos1419 11 күн бұрын
Se pueden aplicar medidas de seguridad, todo depende de como lo hagas.
¿Apple Intelligence? 🤔 ME ENCANTA
4:09
Feregrino
Рет қаралды 292
La magia del Machine Learning: Embeddings
1:22:09
Feregrino
Рет қаралды 3,4 М.
HOW DID HE WIN? 😱
00:33
Topper Guild
Рет қаралды 40 МЛН
Who has won ?? 😀 #shortvideo #lizzyisaeva
00:24
Lizzy Isaeva
Рет қаралды 34 МЛН
I CAN’T BELIEVE I LOST 😱
00:46
Topper Guild
Рет қаралды 105 МЛН
Final muy increíble 😱
00:46
Juan De Dios Pantoja 2
Рет қаралды 53 МЛН
Transforma ChatGPT en AutoGPT con un solo Mensaje
8:18
Academia SEO - Javier Cantero
Рет қаралды 188 М.
How to Improve LLMs with RAG (Overview + Python Code)
21:41
Shaw Talebi
Рет қаралды 33 М.
Lo que necesitas saber de IA como Developer: Modelos vs Ollama vs LangChain
16:57
CodelyTV - Redescubre la programación
Рет қаралды 16 М.
Adding Agentic Layers to RAG
19:40
AI User Group
Рет қаралды 16 М.
"En 3 años puede que ya NO trabaje" - Avital Balwit, Anthropic
30:43
Xavier Mitjana
Рет қаралды 35 М.
Descifrando los nombres de modelos LLM abiertos en Hugging Face
33:11
La Hora Maker
Рет қаралды 2,1 М.
[2024] La ProductConf: "Inteligencia Artificial e Innovación"
58:34
Jose Maria Alonso
Рет қаралды 53 М.
QLoRA-How to Fine-tune an LLM on a Single GPU (w/ Python Code)
36:58
Hisense Official Flagship Store Hisense is the champion What is going on?
0:11
Special Effects Funny 44
Рет қаралды 2,9 МЛН
Samsung Galaxy Unpacked July 2024: Official Replay
1:8:53
Samsung
Рет қаралды 22 МЛН