Aprende sobre Embeddings de OpenAI

  Рет қаралды 49,631

AMP Tech

AMP Tech

Күн бұрын

Пікірлер: 194
@miguelangelmurillo1297
@miguelangelmurillo1297 Жыл бұрын
Un consejo qué les doy a todos para almacenar los archivos con los embediings es que nos los guarden en csv, sino en un archivo pickle, de esta manera al leer el archivo nos aseguramos de que los embediings se lean como arreglos de numpy y no como un str. Para hacer eso con el mismo pandas: pd.to_pickle('nameFile.pkl') Para leerlo se usa: pd.read_pickle('nameFile.pkl')
@miguelangelmurillo1297
@miguelangelmurillo1297 Жыл бұрын
Podría hacerle una pull request al repositorio
@AMPTech
@AMPTech Жыл бұрын
Claro que si!
@cristopherjaque3965
@cristopherjaque3965 Жыл бұрын
No he podido conectarlo ni a Whatsapp ni a IG, como puedo solucionarlo?
@andresbuitront2564
@andresbuitront2564 Жыл бұрын
@@cristopherjaque3965 cual es el procedimiento que estas siguiendo o en que repo esta para revisar
@ivnaqn8521
@ivnaqn8521 10 ай бұрын
Que opinas de guardarlo en base de datos con json_array_pack, es mas costoso en base de datos o en archivos?
@inforob8549
@inforob8549 9 ай бұрын
Cada sílabas que has compartido la he saboreado. 100% .
@roman_ramos
@roman_ramos Жыл бұрын
Excelente Alex,.como siempre.....Me interesa aprender más sobre Lang Chain, Llama y gradio. Espero puedas dedicar algún próximo video a estos temas. Saludos
@AMPTech
@AMPTech Жыл бұрын
Anotado a la lista de siguientes ideas!
@vazquezelectronics8334
@vazquezelectronics8334 Жыл бұрын
@@AMPTech igual yo saludos
@apoc2004
@apoc2004 Жыл бұрын
La clase de video que hace falta en internet. Muchas gracias .
@fedex602
@fedex602 Жыл бұрын
El profesor Alex es el más chingón y el más actualizado 😎👌🏽
@johndeleon8741
@johndeleon8741 Жыл бұрын
Muchas gracias, con este vídeo se puede ver un poco de cómo funciona ChatGPT por dentro, muy bien explicado!
@davferod
@davferod Жыл бұрын
Genial ver más videos así, lo de gradio también parece interesante
@luksquian
@luksquian Жыл бұрын
La explicación mas clara que vi hasta ahora sobre embeddings! gracias!
@Anubis3003
@Anubis3003 Жыл бұрын
Saludos, si, que bueno un curso sobre Lang Chain!!!
@AMPTech
@AMPTech Жыл бұрын
Anotado! Saludos
@andresbarilin9524
@andresbarilin9524 Жыл бұрын
Exelente video, muy claro y consiso, me gustaria aprender mas sobre langChain de tu mano!
@AMPTech
@AMPTech Жыл бұрын
No se diga mas! Ya esta anotado para alguno de los siguientes videos. Gracias por tu comentario
@santiagomoebio
@santiagomoebio Жыл бұрын
¡Excelente! El ejemplo es perfecto para mí por que mis hijos juegan Magic y me han intentado explicar las reglas, sin éxito. Voy a montar este ejemplo y testarlo con mis hijos. Un par de comentarios: cuando se hace el troceo de los textos conviene dejar un poco de solapamiento, porque a veces gran parte del significado está en la relación entre dos textos contiguos. Lo segundo es que aunque obtener la lista de párrafos (o trozos) más parecidos a la pregunta, y por lo tanto más cerca de proveer una respuesta, está genial, lo que tal vez es mejor es aprovechar chatgpt para que busque en ese contenido la respuesta a tu pregunta. Aprovechando que no hay que pasarle el pdf completo sino sólo un grupo pequeños de textos, se puede hacer un prompt que los incluya junto con la pregunta. Las ventajas son que la respuesta puede venir de forma muy concisa, en forma de respuesta, y que además usó información de múltiples trozos, incluso que vienen de partes diferentes del texto.
@AMPTech
@AMPTech Жыл бұрын
Hola Santiago, Tienes razón. De hecho si tenia pensado explicar el tema de solapamiento con embeddings, pero por alguna razón al momento de hacer el código final lo olvide por completo. Es algo que tal vez actualizare en el repositorio para los que lo usen puedan ver ahi el parámetro y sepan un poco sobre lo que hace. Saludos!
@jomaku1514
@jomaku1514 Жыл бұрын
Wow, la idea de pasar los párrafos como promts es algo que no había pensado. Tengo curiosidad, ¿ya lo has probado? De ser así, ¿cuál fue tu resultado?
@geopablus
@geopablus Жыл бұрын
Muchas gracias por el vídeo, como siempre claro y con ejemplos prácticos. Me uno a la petición de LangChain y de gradio, saludos.
@AMPTech
@AMPTech Жыл бұрын
Se me esta juntando la chamba! jaja Muchas gracias por el comentario y listo ya tengo contemplado esos dos videos para el futuro no muy lejano. Saludos!
@fernandopuig178
@fernandopuig178 Жыл бұрын
Excelente video, muy ilustrador , gracias x compartir y difundir conocimiento ‼️
@SonGoku-pc7jl
@SonGoku-pc7jl Жыл бұрын
Queremos aprender más sobre LangChain y ya de paso gradio, pero sobre todo langchain :) muhcas gracias
@AMPTech
@AMPTech Жыл бұрын
Ya esta en mi lista para siguientes videos. Creo que es una herramienta suuper valiosa para acelerar y escalar soluciones con LLMs. Saludos!
@gonzalofdc3151
@gonzalofdc3151 6 ай бұрын
Extraordinario tutorial. Enhorabuena
@TiranoEstudios
@TiranoEstudios Ай бұрын
Eres un crack, muy buenas explicaciones
@AMPTech
@AMPTech Ай бұрын
Muchas gracias! Que bueno que te interesaron los videos.
@camilotorres5352
@camilotorres5352 Жыл бұрын
Excelente ! Mas que una explicación es un taller para aprender como funciona prácticamente!
@AMPTech
@AMPTech Жыл бұрын
Jaja si! siempre empiezo con un video de 5-10 minutos en mente y termino entrando a detalle en mas cosas y termina uno como este video. Pero pues es mejor entenderlo todo a quedarse con algunas dudas. Muchas gracias por tu comentario!
@bryanotavalo1203
@bryanotavalo1203 Жыл бұрын
Muchas gracias, me ha servido muchísimo!
@AMPTech
@AMPTech Жыл бұрын
Me da mucho gusto! Saludos!
@Christianlvm22
@Christianlvm22 Жыл бұрын
muchas gracias, lo explicaste muy claro ahora entiendo como funciona mejor todo esto
@juancazares-du4vs
@juancazares-du4vs Жыл бұрын
Gran aporte tuyo... gracias por esta importante divulgación de tu conocimiento... 👍
@AMPTech
@AMPTech Жыл бұрын
Muchas gracias por el comentario Juan, que bueno que te sirvió!
@PZMaTTy
@PZMaTTy Жыл бұрын
Buenísima la explicación, puntos extra por MTG!
@demianclarke
@demianclarke Жыл бұрын
Excelente contenido! Gracias por explicar Vector embedding de una manera tan fácil de comprender. Grande Abrazo desde Barcelona!
@AMPTech
@AMPTech Жыл бұрын
Muchas gracias Demian
@dloperab
@dloperab Жыл бұрын
Excelente Alex...se aclaran muchos conceptos. Excelente video!
@mespinoza1388
@mespinoza1388 Жыл бұрын
Excelente, existen muchos tutoriales en ingles y sería bueno tenerlo en español, me interesa aprender sobre Lang Chain, Llama Index.
@AMPTech
@AMPTech Жыл бұрын
Hola Miguel! Gracias por el comentario, agregado entonces estos temas a mi lista de ideas para siguientes videos!
@rafaelquintero2874
@rafaelquintero2874 Жыл бұрын
X2...
@ansea1234
@ansea1234 Жыл бұрын
X3
@javi_v7.0
@javi_v7.0 Жыл бұрын
Muchas gracias, ¡saludos!
@gabrielparra5562
@gabrielparra5562 Жыл бұрын
Alex muchísimas gracias por tu tiempo para este agregado a las herramientas de IA. Ojalá puedas hacer un video con modelos open source que tengan un alto porcentaje de comparación con el de openAI, y si no es mucho pedir otro video con tu expertice sobre AutoChatGPT. Saludos.
@joseradowvisky6292
@joseradowvisky6292 Жыл бұрын
Excelente como siempre. Muy bien explicado. Felicitaciones!!!
@AMPTech
@AMPTech Жыл бұрын
Muchas gracias José!
@konycatstudio9762
@konycatstudio9762 Жыл бұрын
Excelente video, y solamente usaste lo mas simple y basico ya que hay ejemplo que usan Pinecone como base de datos de Vectores, aunque me surgio la duda que beneficios tiene si lo puedes tener un un archivo.
@ziroks51
@ziroks51 Жыл бұрын
Excelente como siempre Alex! Muy agradecido con tu contenido!
@AMPTech
@AMPTech Жыл бұрын
Muchas gracias!
@victorreyesalvarado8329
@victorreyesalvarado8329 Жыл бұрын
Excelente vídeo! gracias por compartir
@dimitri2k
@dimitri2k Жыл бұрын
Genial todo el contenido Yo si quisiera conocer acerca d LangChain
@AMPTech
@AMPTech Жыл бұрын
Trabajando en ese video ahorita mismo!
@jeffmagallanes7385
@jeffmagallanes7385 Жыл бұрын
Excelente video!, he visto algunos tik toks de gente usando IA para usar la voz de algun cantante famoso y hacer que cante lo que ellos quieran, conoces de que IA se trata?
@CeroCool212004
@CeroCool212004 Жыл бұрын
.
@DeviIlustration
@DeviIlustration Жыл бұрын
genial bro, me ayudaste a entender esto de los embeddins, pensé que solo se usaba para diagramas de datos y así
@AMPTech
@AMPTech Жыл бұрын
Que bueno que te ayudó para aclararlos. Si, al principio es un concepto muy ambiguo, pero ya que lo entiendes empiezas a ver todo como embeddings jajaja
@kevinherrera196
@kevinherrera196 Жыл бұрын
Excelente contenido, me gustaría ver la explicación y el uso de la herramienta Gradio. 👍
@aspirezr
@aspirezr Жыл бұрын
Muchas gracias, excelente video.
@SD-sq5mc
@SD-sq5mc Жыл бұрын
Me interesa mucho lo que mocionas de hacer un video sobre cómo generar la interfaz gráfica 😊
@neuralmimosa
@neuralmimosa Жыл бұрын
Magnífica explicación, muy buen contenido , saludos
@valcreen2
@valcreen2 Жыл бұрын
Hola, gracias por compartir tu conocimiento. Una pregunta pará realizar análisis de información estadista, qué me sugieres. La idea qué traigo es realizar análisis del censo de población y sus diferentes segmentos qué tiene, haciendo predicciones
@marckio_1667
@marckio_1667 Жыл бұрын
Gracias por este video. Lo has explicado muy claro 🙂👍
@ronaldrojasrodriguez375
@ronaldrojasrodriguez375 Жыл бұрын
Excelente, gracias. LangChain por favor!
@AMPTech
@AMPTech Жыл бұрын
Anotado!
@hoat23
@hoat23 Жыл бұрын
Excelente video doc!!! te has ganado un nuevo seguidor.
@AMPTech
@AMPTech Жыл бұрын
Muchas gracias!
@Maximiliano.R
@Maximiliano.R Жыл бұрын
Hola Alex! mucho gusto! Soy maxi, me enseñarias que preciso dominar para usar de referencia el historial de respuestas de una ACC de wasap mia? me gustaria que aprenda a responder como yo, y que solo me llegue una notificacion cuando digan determinada palabra, por ejemplo COMPRAR o Significados similares.
@AdrianFernandezFazio
@AdrianFernandezFazio Жыл бұрын
Excelente video, muy clara la explicación!
@AMPTech
@AMPTech Жыл бұрын
Muchas gracias Adrian!
@_owl
@_owl Жыл бұрын
Muy buen tutorial!!! Gracias por compartir!
@raulerazovera
@raulerazovera Жыл бұрын
Gracias amigo estaba esperando algo asi ya que los tutoriales y otros no estan tan claros
@AMPTech
@AMPTech Жыл бұрын
Con gusto! Intente ser muy claro en la explicación, por eso los 20 minutos jaja
@Gustavosalazar20
@Gustavosalazar20 Жыл бұрын
esta interesante para un chat bot sobre un tema en especifico, pero solo se ajusta a la base de datos que se le asigne
@nicolasfernandez5256
@nicolasfernandez5256 Жыл бұрын
Super poderosa esta herramienta la verdad, gracias
@AMPTech
@AMPTech Жыл бұрын
Totalmente, aparte esta divertido, porque como son números pues puedes ponerte creativo a ver que puedes hacer (como el ejemplo de las sumas)
@nicolasfernandez5256
@nicolasfernandez5256 Жыл бұрын
@@AMPTech Bro dame un route map para poder programar eso como tu por fa
@danielromerocalero6720
@danielromerocalero6720 2 ай бұрын
Muy buen trabajo Alex, tus vídeos son increíbles. Tengo una duda, cómo puedo incluir en un promots un conjunto de embeddings muy grandes como contexto en el system prompt? Necesito enviar una serie de datos bastante grande en cada llamada a la API de OPEN AI y estoy teniendo el problema de que superó los máximo de tokens por minuto que puedo enviar en una llamada a la API
@rafaelquintero2874
@rafaelquintero2874 Жыл бұрын
Muy interesante el contenido... 🤘
@AMPTech
@AMPTech Жыл бұрын
Muchs gracias, Rafael
@iteligentrosario8847
@iteligentrosario8847 Жыл бұрын
Hola, muy buenos tus videos, puedes hacer uno con un archivo pickle, como comento Miguel Murillo? y probarlo, Gracias por ofrecernos tu tiempo y conocimientos.
@iam.p3p0
@iam.p3p0 Жыл бұрын
Muy interesante, muchas gracias!... Podrías trabajar en este mismo sentido con AI que funcionan de manera local como por ejemplo ChatGPT4ALL ?
@AMPTech
@AMPTech Жыл бұрын
Si, ahorita he hecho unas pruebas con gpt4all y aun no esta integrado el tema de embeddings. La ventaja que tienen es que desde hace una semana usan gptj en vez de llama. El desempeño es peor jaja pero se puede usar un estornos comerciales a diferencia de Llama
@edgareduardomendozamorelos7195
@edgareduardomendozamorelos7195 Жыл бұрын
Buen vídeo hermano, me gustaría que hicieras un vídeo dedicado a lang chain, siento que puede ser una herramienta muy fuerte a explotar en este caso Gracias
@AMPTech
@AMPTech Жыл бұрын
Totalmente! Acabo de publicar un intro y estaré subiendo unos ejemplos prácticos estas semanas.
@victoraguilardiaz1168
@victoraguilardiaz1168 Жыл бұрын
Muchas gracias👍
@user-kx8li1dk6d
@user-kx8li1dk6d 8 ай бұрын
Gracias por tus buenos vídeos, te pregunto, podría realizar esto conectándolo a una base de datos que tiene varios registros?
@alumnoprimero1
@alumnoprimero1 Жыл бұрын
Impecable! Excelente explicación!.... Se puede descargar el archivo de embeddings para trabajarlo en forma local?
@alxx736
@alxx736 Жыл бұрын
Hola! Muy bueno ! Sigo sin entender como se haría si el usuario pregunta cualquier cosa fuera de contexto para no responder
@jorgefernandez4812
@jorgefernandez4812 Жыл бұрын
esto de es mucha utilidad, gracias por compartir
@AMPTech
@AMPTech Жыл бұрын
Me da mucho gusto escuchar eso!
@programadornovato
@programadornovato Жыл бұрын
Sabras si se puede colocar un historial,algo asi como lo que se hace con catgpt, donde chatgpt te da seguimiento a tu conversacion.
@mauriciogomez1111
@mauriciogomez1111 Жыл бұрын
Excelente contenido
@metacortex1
@metacortex1 Жыл бұрын
Mano, muchas gracias por compartir tus conocimientos tan generosamente. Disculpa mi ignorancia hermanito: veo que con el split y langchain indexas el texto en un array y de ahí el langchain interpreta a vectores cada una de esas líneas. Mi pregunta es si es posible aplicar el corte de forma dinámica en el split, es decir, si en lugar de cortar a 300, le dices al sistema que corte el texto cada vez que se encuentre con un punto y aparte, eso es posible? Gracias.
@patriciodiaz2377
@patriciodiaz2377 Жыл бұрын
Muchas gracias bro! Todo muy bien explicado, solamente tengo una duda. Si tengo varios PDFs como fuente de datos cómo le podría hacer para que el chatbot logre identificar si le están preguntando sobre algún pdf en específico o si el usuario quiere la respuesta más completa utilizando toda la información de los pdfs?
@cristobalartetacmah
@cristobalartetacmah 6 ай бұрын
queria consultar en base a tu experiencia , me podrias ayudar con algunas ideas para realizar un trabajo final de MASTER ? tengo varias ideas relacionado con el tema del video pero quizas con tus ideas imnovadoras podria ser mejor . gracias .
@dibluuee3777
@dibluuee3777 Жыл бұрын
Como se haría con información que está cambiando constantemente y se requiere que el sistema conteste en base a lo que se actualiza ? Ejemplo en una asignación de citas medicas tengo 10 citas pero después ya bajan a 8 citas y así sucesivamente incluso se aumenta de más citas disponibles
@CeroCool212004
@CeroCool212004 Жыл бұрын
.
@CanalIFES
@CanalIFES Жыл бұрын
Hola alex. Genial tu video como siempre. En cuanto al problema q citás en el final de tu video respecto de la posibilidad de que ante una pregunta que nada tenga q ver con el tema que trata tu pdf pueda responder cualquier cosa, no hay una forma de ver el nivel de confianza de la respuesta de modo de que si ése nivel es bajo pueda responder algo como NO TENGO RTA P ESA PREGUNTA?
@lamsiglo2170
@lamsiglo2170 Жыл бұрын
perfecto
@joseeduardoortiz1769
@joseeduardoortiz1769 Жыл бұрын
Interesante video es lo que estaba buscando, pero si hacemos una pregunta que no tiene nada que ver con la base de datos o la respuesta no es lo que esperábamos, podemos hacer que solite información y la almacene para tener una respuesta en el futuro?
@saulroa851
@saulroa851 Жыл бұрын
Excelente video! Si, haz más contenido así, y de LangChain! :D Pregunta Alex, se puede hacer PCA sobre los embeddings? y así quizas ahorrarse feria $? Gracias, saludos!
@AMPTech
@AMPTech Жыл бұрын
Justo estoy trabajando LangChain. Para ahorrarte el dinero, también estoy viendo hacer un video con unos embeddings de huggingface que no requieren $$$
@RaycelGraterol
@RaycelGraterol 7 ай бұрын
Gracias amigos una pregunta se puede hacer este mismo codigo en NodeJS tienes algun ejemplo?
@maycolsteven1170
@maycolsteven1170 Жыл бұрын
Hola, muchas gracias por compartir tu conocimiento en este tema que muy pocos comprenden. Podrias por favor decime porque al ejecutar esta linea "datos["Similitud"] = datos['Embedding'].apply(lambda x: cosine_similarity(x ,busqueda_embed))" me sale este error -> UFuncTypeError: ufunc 'multiply' did not contain a loop with signature matching types (dtype('
@Victor-rs4ku
@Victor-rs4ku Жыл бұрын
Creo que puede ser porque existe algún inconveniente con utils. Si el inconveniente es con el cosine_similarity, podrías crear la función, que es la misma que se encuentra en el github de openai def cosine_similarity(a, b): return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
@s.a1387
@s.a1387 Жыл бұрын
Para preguntar a una base de datos de PDF de 600 páginas, ¿Qué es mejor Fine Tuning o Embedding?
@user-fv1fn1ej2j
@user-fv1fn1ej2j Жыл бұрын
Qué diferencia hay entre hacer los embeddings con OpenAI y hacerlos con LLaMaIndex o Langchain?
@miguela.cuevas6629
@miguela.cuevas6629 Жыл бұрын
Me fascino este video y ya estoy jugando con estas tecnologías, una duda ¿hay forma de que si a respuesta no esta en la base de conocimiento pueda dar un simple: no lo se...insertando algún tipo de libreria o quizá una condicional en el código?😅 y por supuesto que me gustaría mucho saber mas de gradio y langchain, y mucha gracias por compartir tu conocimiento bro..
@AMPTech
@AMPTech Жыл бұрын
Imagino podrias ponerle que si no cumple con un umbral de similutud, entonces usas chatGPT para generarla. Pero pues con el tema de posibles alucinaciones.
@gocodeart
@gocodeart Жыл бұрын
Genial, exelente video. Una consulta de estas posibles respuestas, ejemplo tomo la primera y pudiera pasarle a chatgpt para que la randomize y no se sienta tan repetitivo?
@AMPTech
@AMPTech Жыл бұрын
Si se puede hacer. Solo incluyes la respuesta que te dan los embedding al prompt hacia gpt. Y le mencionas a gpt convertir el texto a algo mas casual, formal, o le das unos ejemplos del estilo que te gustaría.
@ennioagc
@ennioagc Жыл бұрын
Pero como se hace para detectar que detecte que no puede responder la pregunta con los embeddings que tiene? como en el caso de la tienda, si pregunto por un producto que no tiene, pero igual vectoriza la respuesta que se relacione y efectivamente se va a relacionar más ese vector a un vector generico de negación ej. si pregunto en una tiene de ropa, cuanto cuesta la camisa roja (y no tienen camisa roja, pero si blanca) lo va a asociar a la camisa blanca y no a una respuesta "no tenemos ese producto"
@hbmichang
@hbmichang Жыл бұрын
Buen vídeo! Pero me quedé con la duda con respecto al tamaño 300, me hace pensar que habrá párrafos que serán cortados a la mitad si tiene por ejemplo 350 de tamaño, y al brindar una respuesta que coincida con ese párrafo, de una respuesta incorrecta 😅
@AMPTech
@AMPTech Жыл бұрын
En ese caso lo mejor es experimentar para tu caso de uso. Si usaba un tamaño muy grande no me podia responder bien. Ahorita que me preguntas esto me di cuenta que olvide explicar un parametro que se puede poner que es overlap, para que permitas tambien que entre bloques se empalmen, para asegurarte de no tomar la parte inicial o la final sino una especia de conjunto.
@brianmartinez0014
@brianmartinez0014 Жыл бұрын
¿Puedo utilizar este mismo método en Java o PHP? O todavía no existen las bibliotecas para hacer esto mismo y trabajar con IA
@nicolasfernandez5256
@nicolasfernandez5256 Жыл бұрын
Consulta, el significado semantico quien se lo otorga a la herramienta, esto ya viene desde Open IA, entiendo bien?
@AMPTech
@AMPTech Жыл бұрын
Por la manera en la que lo entrenan, el modelo aprende a asignarlo. Dependiendo de la relación que tiene una palabra con todas las palabras que lo rodean, sumale esto a un set de datos gigante. El modelo entendiendo "el significado" de algunas palabras y su relación con las demás.
@roilopez5992
@roilopez5992 Жыл бұрын
langchain con otros llm para trabajar en local, por favor! LLama creo que se podria?
@joserodriguezgarcia513
@joserodriguezgarcia513 Жыл бұрын
Teniendo en cuenta la velocidad de procesamiento y optimización ¿que es mejor guardar el embedding en un fichero o en una base de datos?
@dumvsu
@dumvsu Жыл бұрын
buen video, existe la forma de usarlo en local? o hay alguna otra alternativa sin tener que enviar los datos a openia? gracias
@CeroCool212004
@CeroCool212004 Жыл бұрын
.
@MaximoPower2024
@MaximoPower2024 5 ай бұрын
Si alguien se pregunta por qué "casa" se parece tanto a "león", puede que sea porque ambas son palabras en español, que denotan sustantivos, y además ambas son cosas que existen en el mundo físico.
@gazorbpazorbian
@gazorbpazorbian Жыл бұрын
por favor, detalla mas el tema de guardar el archivo en una base de datos para despues utilizarlo. existe alguna manera de usar otros motores con embedings para no utilizar openAI? o se podrian crear embedings de manera local?
@clonetrooper-cr0390
@clonetrooper-cr0390 Жыл бұрын
Hola soy nuevo en esto, tengo una duda como se puede hacer un servicio API para consumir esos datos y mostrar en un chatbot?
@yarlosilva1
@yarlosilva1 9 ай бұрын
No pude emmbeber un pdf porque no me deja instalar las paqueterias de OpenAI. Será que del momento que lo hiciste a hoy cambio algo?
@diegofernandoriveragomez4440
@diegofernandoriveragomez4440 Жыл бұрын
Alex podrías explicar como guardar los embedding en un diccionario para un archivo de pdf, para que no me cobren a cada rato y pueda hacer el chatbot de ese texto? te lo agradezco
@CeroCool212004
@CeroCool212004 Жыл бұрын
.
@AMPTech
@AMPTech Жыл бұрын
Hola Diego, En el código viene una linea donde grabo el dataframe a un csv. Asi puedes hacerlo, y cuando necesites solo lees el CSV. Saludos!
@alekfgh9734
@alekfgh9734 Жыл бұрын
y como vas con tu proyecto del asistente virtual ?
@CeroCool212004
@CeroCool212004 Жыл бұрын
.
@AMPTech
@AMPTech Жыл бұрын
Ahorita lo he estado probando con la ultima actualización del video. He visto varias areas que tengo que mejorar y hacer mas robustas. Y ya empece a meterme un poco con algunas camaras para integrarle visión. Apenas tenga mas avance habrá otro video!
@alekfgh9734
@alekfgh9734 Жыл бұрын
@@AMPTech Gracias, muy bien!
@fernandocieri
@fernandocieri Жыл бұрын
Me gustaría hacer esto con archivos CSV, pero no me queda claro cómo enfocarlo o dividir la info de los CSV
@raulcamposnascimento
@raulcamposnascimento Жыл бұрын
Não poderia¿No sería posible configurar la salida del chatbot con un umbral de similitud? es decir, si la respuesta no llega al índice, pones una respuesta estándar como “no entendí, ¿podrías preguntar de otra manera?”.
@AMPTech
@AMPTech Жыл бұрын
Si se puede hacer sin problema. Seria una buena idea para que intenten formular la pregunta de otra manera.
@oscarbertel1449
@oscarbertel1449 Жыл бұрын
Claro que es posible, igualmente es recomendable ajustar bien el humbral.
@Josetamayo5
@Josetamayo5 Жыл бұрын
Cómo se haría esto que comentáis?
@oscarbertel1449
@oscarbertel1449 Жыл бұрын
Esto puede hacer porque cuando se hace el calculo de la cosine similarity esta retorna un valor contra los datos que estas buscando, al final el algoritmo retorna los más cercanos pero también es posible que límites la similaridad usando algún valor, pero eso cambia según la vector database que uses y es muy difícil de ajustar a un valor adecuado ya que tu vector es un vector multidimencional.
@nadanada5304
@nadanada5304 Жыл бұрын
disculpa que editor de texto estas usando no se si es google colab o visual studio
@aldo_negri
@aldo_negri Жыл бұрын
Gracias por tus videos! Son muy interesantes!. Entiendo la lógica de vectorizar y guardar la información, pero no tengo muy claro cómo funcionan las consultas: Cada vez que se consulta el modelo, se están utilizando tokens con toda la información indexada?. Eso cómo es viable?. Gracias
@AMPTech
@AMPTech Жыл бұрын
Si, cada vez que haces un embedding te cobran. Peeero, puedes salvar los embeddings que ya tienes hechos en una base de datos y ya solo consultas directo de ahi. Ejemplo, perro siempre va a tener el mismo embedding, asi que si sabes que vas a usar mas de una vez ese dato, pasalo a una base de datos, una columna el vector y otra columna la palabra.
@freestyletow1
@freestyletow1 Жыл бұрын
como hacer fine tuning de un model LLM como dolly 2 de un data set armado con extraccion pdf embeddings
@novacode999
@novacode999 Жыл бұрын
Una pregunta, en que ID lo esta programando? es VS code? como haces para que se vea asi por pasos?
@miguelangelmurillo1297
@miguelangelmurillo1297 Жыл бұрын
Amigo, seguimos esperando los vídeos de langchain!
@AMPTech
@AMPTech Жыл бұрын
Esta semana que viene sale una intro y después codigo.
@gerardoguzman1079
@gerardoguzman1079 Жыл бұрын
E#xcelente!
@AMPTech
@AMPTech Жыл бұрын
Gracias!
@diegocratz
@diegocratz Жыл бұрын
Muito bom 🎉
@leonardoespejo
@leonardoespejo Жыл бұрын
crack
@gazorbpazorbian
@gazorbpazorbian Жыл бұрын
el video esta super genial pero le faltaria ver los costos para ver que tan caro puede salirme hacer las pruebas jaja
@AMPTech
@AMPTech Жыл бұрын
Todas las pruebas que corrí para este video tuvieron un costo de $0.10 USD. Si vas a hacer pruebas te recomendaría que empieces con unos archivos chicos para que veas mas o menos el costo para el uso que tienes en mente. La plataforma te muestra en casi tiempo real (con unos 5 o 10 minutos de retraso) cuantos tokens y dolares has consumido.
@danielmartinmonge4054
@danielmartinmonge4054 Жыл бұрын
Pregunto. En el ejemplo se utiliza un PDF muy pequeño. El contexto de GPT4 es mayor que eso. Funcionaría con archivos mayores, véase libros completos de 500- mil páginas?
@AMPTech
@AMPTech Жыл бұрын
Con embeddings si se puede, no importa la longitud. Con gpt4 si estas limitado al numero máximo de tokens que procesa.
@danielmartinmonge4054
@danielmartinmonge4054 Жыл бұрын
@@AMPTech Entonces, eso es para mí una herramienta súper poderosa. Apenas estoy comenzando a programar. Creo que lo voy a tomar como proyecto de aprendizaje
@dibluuee3777
@dibluuee3777 Жыл бұрын
Ya vi la solución a mi problema de código jajaja
@inganvf
@inganvf Жыл бұрын
Hola, estoy buscando quien me haga una app integrada con OpenAI, tu das ese servicio?
@xaviersandler3305
@xaviersandler3305 Жыл бұрын
Hola amigo. He estafó buscando un bot virtual interactivo y no lo encuentro. Podrías asesorar como empezaría hacer mi propio robot virtual interactivo que lo pueda usar como maestro de inglés?
Fine-tuning a GPT3 Para Que Haga Lo Que Sea
16:42
AMP Tech
Рет қаралды 35 М.
Intro a LangChain: Construye sobre LLMs/GPT4
8:03
AMP Tech
Рет қаралды 26 М.
Fake watermelon by Secret Vlog
00:16
Secret Vlog
Рет қаралды 4,7 МЛН
Dale memoria a ChatGPT
13:43
Julio Andres Dev
Рет қаралды 13 М.
Testing out OLLAMA - Your own ChatGPT locally! [ENGLISH SUBTITLES]
14:40
Las Matemáticas detrás de la IA
14:39
sammas24
Рет қаралды 6 М.
Langchain 1: Modelos y Prompts
32:31
AMP Tech
Рет қаралды 19 М.
LANGCHAIN 🤯 Chateando con un PDF
13:04
SensIO
Рет қаралды 18 М.
Cómo usar CHATGPT (api) sobre la base de datos de tu Empresa [Y te regalo la APP]
17:13
IA para mejorar mi dia a dia
4:53
AMP Tech
Рет қаралды 4,9 М.
SAM: La IA de Meta que LO SEGMENTA TODO!
17:52
Dot CSV
Рет қаралды 343 М.
Fake watermelon by Secret Vlog
00:16
Secret Vlog
Рет қаралды 4,7 МЛН