MEJORES y BARATOS: Cómo es que RAG está revolucionando los modelos de lenguaje

Рет қаралды 12,578

Күн бұрын

Descubre cómo las RAG ofrecen resultados precisos y verificables sin los costos prohibitivos de entrenamiento y actualización continua. Sumérgete en el mundo de la eficiencia en IA, donde menos es más y el conocimiento está al alcance de todos.
Video sobre LLMs: • No todo es ChatGPT - I...
Prompt engineering: • Interactuando con Mode...
Embeddings: • La magia del Machine L...
RAG: • MEJORES y BARATOS: Cóm...
Código: feregri.no/rag
APÓYAME:
Únete al canal y disfruta de beneficios: www.youtube.com/@feregri_no/join
Cómprame un cafecito: www.buymeacoffee.com/feregrino
SOCIALES:
/ feregri_no
/ feregri_no
twitch.com/feregri_no
/ feregri_no
github.com/fferegrino
kaggle.com/ioexception
feregri.no
TIMESTAMPS:
00:00:00 Inicio
00:01:45 Todos quieren un GPT
00:05:39 Consulta tradicional a LLM
00:08:27 Sistemas RAG
00:11:52 Qué nos ofrece un sistema RAG
00:13:31 Cómo se hace la recuperación de contexto
00:15:58 Poblando una BD vectorial
00:17:53 Qué hacer con el query del usuario
00:18:38 Sistema RAG completo
00:20:04 Proyecto práctico
00:20:56 Componentes del proyecto
00:23:02 En dónde encontrar el código
00:24:37 Introducción al dataset
00:26:39 Un ejemplo motivante
00:28:59 Trabajando con el dataset
00:33:31 Introducción al Chunking
00:35:58 Haciendo chunking en nuestros documentos
00:39:42 Procesando los chunks para indexarlos
00:41:46 De dónde sacamos los embeddings
00:43:03 Creando embeddings para nuestros documentos
00:45:21 Base de datos vectorial
00:46:46 Insertando en la BD vectorial
00:50:33 Ejecutando queries en la BD
00:51:26 Obteniendo respuestas potenciales
00:53:19 Generando respuestas RAG
00:53:56 Generando respuestas con mis documentos
00:58:14 Siguientes pasos
01:00:14 En conclusión

Пікірлер: 57

@VladPalacios 5 ай бұрын

Oro puro, gracias por explicarlo de manera sencilla, no se si esto también esta en libros, o si es algo tan nuevo que aún no se han escrito libros al respecto

@feregri_no 5 ай бұрын

Mil gracias, también gracias por volverte miembro del canal. Recuerda que en la pestaña de la comunidad están los recursos extra: www.youtube.com/@feregri_no/community

@gabrielcastillo6244 Ай бұрын

Gracias por iluminar el camino, excelente video

@nicolaselguapo6225 4 ай бұрын

El mejor contenido que he encontrado hasta el momento, espectacular, muchas gracias por toda la informacion, super fácil de entender!!!!

@feregri_no 4 ай бұрын

Con mucho gusto, que bueno que te sirvió :D

@matiasparouy 5 ай бұрын

Excelente contenido! muchas gracias por esta serie de videos!

@feregri_no 4 ай бұрын

A ti por tu comentario 😌

@rusbelbermudez238 2 ай бұрын

Curiosamente te seguia en twitter/x quería agradecerte por la master class tus materiales son de excelente calidad.

@feregri_no Ай бұрын

¡Muchas gracias!

@javaboy6581 Ай бұрын

Muy buen vídeo, me lo guardo para verlo más veces porque hay que asimilar muchas cosas. Un esfuerzo titánico el de este vídeo y te ha quedado de 10, ojalá sigas esta temática tan interesante. Yo añadiría cómo implementar un chatbot al estilo web de ollama para conversar con nuestro RAG, si se pudiese. Me interesa muchísimo este tema y me encanta tu contenido, no sé si se podrá hacer esto, pero es superinteresante. Te animo a seguir pues tienes mucha calidad. Saludos!

@feregri_no Ай бұрын

Muchas gracias, me quedo con tu solicitud para desarrollarla un poco más.

@nicoux9581 5 ай бұрын

Ta bueno! me gustó. Muchas gracias Fere!

@feregri_no 4 ай бұрын

Gracias a ti :D

@rodolfolopezp 12 күн бұрын

Excelente 👌

@alejandrobrun 3 ай бұрын

Muchas gracias por compartir tu conocimiento.

@feregri_no 3 ай бұрын

Con mucho gusto :)

@TheDojoMX 5 ай бұрын

¡Gracias por esta serie! Creo que estas contribuyendo mucho a la información en español.

@feregri_no 5 ай бұрын

Muchas gracias, que gusto que el aporte se valore.

@DevDes-AE 3 ай бұрын

Muchas gracias!!! ... ¿Cómo preparas tu data set?, pls un videíto sobre ese tema, por otro lado estaria super genial que nos compartas sobre como montar nuestro propio chat en una demo usando Gradio o Streamlit, lo estaré esperando. Me super suscribo a tu canal ....A por más!!

@pedroandresgonzales402 4 ай бұрын

Nos falto esto en Boocamp machine learning de Código Facilito

@feregri_no 4 ай бұрын

Para el de LLMOps 😏

@damianquijano1706 2 ай бұрын

Muy buena explicación, suscrito.

@feregri_no 2 ай бұрын

Gracias. ¡Saludos!

@AzzynTeam 2 ай бұрын

Genial gracias por compartir el conocimiento lo intentare pero usando Go

@feregri_no Ай бұрын

Excelente. ¿Qué tal te fue?

@jonathannarvaez7876 5 ай бұрын

tremendo, tenia un concepto vago sobre que era un RAG y esto me lo dejo mucho mas claro, gracias por compartir!!

@feregri_no 4 ай бұрын

A ti por comentar :D

@fernandofrias8322 20 күн бұрын

muchas gracias. Ahora unos de tutoriales de Langchain--> (LangChain Expression Language (LCEL)) ->Langgraph

@feregri_no 19 күн бұрын

Lo tendré en cuenta :)

@WillliamMEndez 2 ай бұрын

Gracias y claro me gustaría ver el tutorial con LlamaÍndex, excelente video

@feregri_no 2 ай бұрын

Lo tendré en cuenta :)

@tecomAGS 2 ай бұрын

Excelente video

@feregri_no 2 ай бұрын

Gracias :)

@mejia414 Ай бұрын

buen video mi amgo gracias

@feregri_no Ай бұрын

Gracias gracias

@eudigitalizo Ай бұрын

Excelente video. Realizado en forma muy profesional y muy didáctica. Realmente debes ser una fuente obligatoria de consulta. No sé si habrá algún correo o link donde uno pueda concertar contigo alguna reuni+on virtual para poder efectuar un joint venture en proyectos de empresas a las cuales les presto asesoría.

@pw4645 2 ай бұрын

Entonces cuales son las formas adecuadas de hacer los Chunks en produccion??

@joseleonardosanchezvasquez1514 3 ай бұрын

Muchas gracias, que métrica usas para saber que el RAG está bien

@manuonda 2 ай бұрын

Muchas gracias por el video y los projects que realizas. Quería consultarte como seria para establecer los chunks o profundizar mas en el tema. Gracias . Saludos.

@feregri_no Ай бұрын

Hay diversas maneras, pero haré un video al respecto.

@manuonda Ай бұрын

@@feregri_no Gracias Profe,

@ricardofernandez2286 2 ай бұрын

@feregri_no Me gusta tu estilo, simple y conciso. Felicitaciones! Me has motivado a suscribirme a tu canal. Tengo una pregunta para ti. Ya he implementado varios de estos sistemas y sistemáticamente me encuentro con esta situación: si en mi texto original hay una frase como por ejemplo "el examen constaba de 8 secciones", y la pregunta que le hago al sistema es "cuantas partes tenía la prueba" el sistema muchas veces me responde que no tiene la información. Asumo, que puede ser porque en realidad la búsqueda es por similitud de texto y no de conceptos, y al usar distintas palabras, si bien estoy hablando de lo mismo, el modelo no lo entiende. También es justo decir que mi esquema de chunking es muy básico dado que las herramientas que uso solo me permiten un tamaño fijo de chunk y una superposición. Te suena familiar? Cómo sugieres solucionarlo? Muchas gracias! Un saludo!

@feregri_no 2 ай бұрын

¡Te sugiero que lo debuguees! revisa que chunks recupera para esa pregunta en específico, puede ser que tu chunking esté partiendo ese texto. Encima de todo los LLMs no son muy buenos cuando se trata de lidiar con números, pero depurar es el primer paso.

@DinoRossYT Ай бұрын

Está bien interesante! Me imagino un híbrido MoE y RAG haciendo fine-tuning del contexto y dándole la razón a gpt4o 🤙🤤

@feregri_no Ай бұрын

Que bueno que te gustó :)

@edgargomero3307 11 күн бұрын

quiero trabajar con modelos multimodales texto audio.

@dervismedina3051 Ай бұрын

el link esta roto

@feregri_no Ай бұрын

¿Cuál?

@edwincaicedo8539 2 ай бұрын

Muy, buena explicación muchas gracias fue de mucha utilidad, solo una pregunta Rag depende de la capacidad de la ventana de contexto, por ejemplo en el caso de llama3 solo recibe 8.000 tokens y en el caso de superar esa ventana de contexto el modelo no sería capaz de generar una respuesta aumentada

@feregri_no 2 ай бұрын

Ex correcto, el tamaño de la ventana es una restricción a considerar cuando desarrollas un RAG. Hay frameworks o herramientas que te permiten contar el número de tokens y seleccionar la cantidad de "chunks" adecuada para que no mandes más tokens de los que el LLM soporta.