Muy bien video porfesor una pregunta como podría entrenar un modelo que mediante atractivos turísticos me de una ruta de destinos acorde a las preferencias del usuario y donde podría obtener información para poder hacer eso
@rusbelbermudez238Ай бұрын
Muy buen video y contenido
@NechuBM13 күн бұрын
Gracias 🎉💃
@JoseValencia-pj5nn Жыл бұрын
Hola una pregunta, cómo puedo hacer para que me imprima la predicción de la clasificiación de nuevos datos el modelo con código? Quiero meter varios comentarios y que me los clasifique y me arroje la clasificación.
@NechuBM Жыл бұрын
Buenas Jose, te comparto dos videos para entender como realizar predicciones con un LLM. kzbin.info/www/bejne/aHmbpoCehquIn7M En este vídeo vemos en detalle que es un modelo y un tokenizer y como utilizarlos. Si no quieres entrar tanto en detalle aquí tienes un segundo vídeo donde llegar al resultado más rápido: kzbin.info/www/bejne/qnSpdYONZ8innas
@sergioandresriosgomez24404 ай бұрын
excelente la clase... muchas gracias 🤗
@NechuBM4 ай бұрын
¡Muchas gracias!
@gonzaloponce177753672 ай бұрын
Me encantó el tutorial gracias 🎉
@NechuBMАй бұрын
¡Un placer!
@ouaelmohamed11 ай бұрын
Muchas gracias por tus esfuerzos, tiene mucho valor la información que compartes. Una pregunta, estoy pensando en entrenar el modelo en local prestando GPU´s para luego integrarlo a un proyecto en desarrollo, qué problemas/desventajas se pueden generar por esta decisión? Se puede realizar este proceso de forma gratis? Habrá alguna forma para lidiar con limitaciones de la longitud de Tokens? Gracias por tu tiempo!
@NechuBM11 ай бұрын
¿Te refieres a hacer un entrenamiento desde cero o a hacer fine-tunning? El proceso que suelo seguir es el siguiente (más fácil y rápido a más complejo): • Utilizar un modelo preentrenado de Hugging Face • Prompt engineering (mejorar las prompts) • Retrieval Augmented Generation (RAG): Aportar contexto a la pregunta o prompt de fuentes externas • Fine-Tunning: A partir de un modelo preentrenado, recolectar datos de entrenamiento para nuestro caso de uso y realizar el nuevo entrenamiento. Fine-tunning es una técnica muy potente, pero a la vez compleja. Requiere de un buen conocimiento del modelo, de las etapas de entrenamiento de un modelo de IA y recursos de procesamiento. Es una tarea realmente interesante porque ajustas los entresijos del modelo y aprendes mucho. Si consigues un buen entrenamiento las respuestas del modelo pueden mejorar enormemente. Al mismo tiempo puede ocurrir que tras mucho esfuerzo y recursos te encuentres con un modelo igual o incluso pero que el anterior. Si deseas aprender y explorar el proceso de fine-tunning es una gran idea. Si tienes recursos limitados y necesitas dar una respuesta eficiente a tu cliente prueba los puntos anteriores, pueden devolverte las respuestas que esperas requiriendo menos esfuerzo. Para realizar el entrenamiento puedes hacerlo en local o la nube. En local saldrá más ‘barato’ si tienes la GPU pero no podrás sacarle todo el partido a la paralelización que permite la nube. En vez de trabajar con 1 GPU puedes trabajar con múltiples al mismo tiempo reduciendo enormemente el tiempo de entrenamiento. Ten en cuenta que estos grandes modelos requieren de mucha capacidad para realizar el entrenamiento. ¡Gracias por el comentario!
@ouaelmohamed11 ай бұрын
@@NechuBM Muchas gracias por tu respuesta, estoy muy agradecido y lo valoro mucho! Pienso hacer un fine tunning a un modelo de generación de texto de hugging face, ya que busco lograr entrenar el modelo de forma que pueda evaluar trabajos científicos según criterios claros con la máxima eficiencia, también necesito minimizar el coste del desarrollo. Sé lo difícil que sería aplicar la idea, dado que usaré GPU´s de la universidad en el fine tunning del modelo elegido en local. Me gustaría tener una oportunidad para hablar contigo sobre este tema, ya que admiro el trabajo que haces y compartes y creo en que una conversación corta contigo me va a ser muy útil. Saludos
@NechuBM11 ай бұрын
@@ouaelmohamed ¡Suena muy interesante el proyecto que quieres realizar! Si que tiene pinta de ser complejo, pero estoy seguro de que aprenderás mucho en el camino. Si quieres escríbeme por privado al LinkedIn y charlamos un rato del tema. www.linkedin.com/in/daniel-benzaquen-moreno/
@dandradejose Жыл бұрын
Buenísimo. Oye, y ¿qué tal si pongo datasets en español?¿Qué debo tener en cuenta?¿Cuál modelo utilizar: Halcón (el de Manu), Falcon, etc? No se dónde hay ejemplos e instrucciones de fine-tuning con datasets en español. Agradezco tu ayuda.
@NechuBM Жыл бұрын
¡Gracias por el feedback! Puedes utilizar perfectamente un dataset en español con modelos como Falcon. Lo importante es analizar si el modelo que quieres utilizar fue entrenado con datos en español, lo indican en la carta del modelo que publican en HF. Por ejemplo, Falcon si fue entrenado con texto en español, pero el modelo Llama publicado por Meta no lo fue. Si no fue entrenado con datos en español vas a necesitar muchas más horas de entrenamiento y ejemplos. Encontraras datasets en español en la sección de ‘datasets’ solo tienes que filtrar por idioma e identificar el que mas se ajuste a tu caso de uso. A nivel de código no afecta tanto el idioma, puedes probar con este código y ver que resultados te devuelve, en base a eso iterar y realizar cambios si fuese necesario (es interesante tener en cuenta cómo tratar los acentos, por ejemplo). Fine-tune es una tarea super interesante y a la vez compleja, puede llevarte mucho tiempo y recursos. Lanzarse en el fine-tune de un ‘Larga Language Model’ para aprender es muy recomendable, pero si busca una forma más asequible y directa de resolver tu caso de uso échale un vistazo a ‘prompt engineering’ y ‘Retrieval Augmented Generation (RAG)’. Empezaría por aquí y si no pudiese resolverlo me lanzaría al fine-tunning. Espero que esta información te sea de ayuda, ¡nos vemos en los próximos videos!
@dax_161 Жыл бұрын
4:54 cuales son los links, estoy muy interesado en hacer un buen fituning
@NechuBM11 ай бұрын
Aún no he grabado los vídeos, te mantendré informado cuando los publique ☺️
@josearmandodelgadocamarill88199 ай бұрын
Hola, quiero hacer un proyecto en español, pero tengo un par de dudas, ¿Puedo utilizar un dataset recopilado por mi? y una cosa más, cuantos elementos debó tener para tener una precision razonable¿?
@NechuBM9 ай бұрын
¡Claro! Puedes utilizar tu propio conjunto de datos. ¿Qué tipo de entrenamiento tienes en mente? Sin muchos detalles, es difícil estimar, pero podrías empezar con unos cientos de ejemplos, aunque te recomendaría intentar con miles.
@pacolopez640411 ай бұрын
Enhorabuena por todos estos videos! un currazo y queda todo super claro. Tengo una pregunta, si quisiese entrenar un modelo para una organización y esos datos no pudiesen ser públicos, si no subo ese modelo a Hugging y lo guardo en local, no habría problema, ¿no? Muchas gracias!
@NechuBM11 ай бұрын
¡Gracias por el mensaje tan positivo! Hay dos cosas a diferenciar en lo que me comentas. Por un lado, tenemos los datos que eso no debería nunca salir de vuestra organización o control. Por otro lado, tenemos el modelo entrenado con esos datos. Existe una opción de subir los modelos de forma privada a HuggingFace pero como siempre puede dar lugar a que un fallo haga públicos estos modelos. Si quieres asegurarte de no compartir el modelo y evitar problemas, tenerlo almacenado en local es una buena opción. Otra cosa para tener en cuenta es el Model Data Leakage, esto ocurre cuando el modelo memoriza datos de entrenamiento. Por ejemplo, si le preguntas donde vive @pacolopez6404 y memorizo esta información en la fase de entrenamiento puede devolver este dato que debería de ser privado. Aunque esto último esta fuera del alcance de la pregunta me parece interesante y curioso.
@pacolopez640411 ай бұрын
@@NechuBM Entiendo! muchas gracias y sigue haciendo estos vídeos que son una gran ayuda!
@NechuBM10 ай бұрын
¡Muchas gracias @@pacolopez6404! Nos vemos en los próximos vídeos
@v464e698 ай бұрын
@@NechuBM nechu que tal, buen dia me gusta como explicas pero soy nuevo y me confunde como llegas a ese lugar 0:00 en el video anterior tambien iniciaste en ese punto ¿como lo encuentro? quiero ver detenidamente los modelos para guiarme, gracias
@NechuBM8 ай бұрын
@@v464e69 Buenas! Lo tienes en la descripción del vídeo donde pone: ""🐍 Python Notebook: colab.research.google.com/drive/1-HeF5_LQCom7vMDkzkZEA08LH4gl2y9c " Para entender como utilizar Google colab te dejo estos dos vídeos cortos que te pueden ser muy útiles: Introducción Google Colab (1/2): kzbin.info/www/bejne/q5qpaaCwq9-cbZY Introducción Google Colab (2/2): kzbin.info/www/bejne/i5a0lZSnpsminac
@SonGoku-pc7jl Жыл бұрын
muchas gracias por todos estos videos, me están encantando para situarme mejor en hugging :) una pregunta, por los 80 i 40 entrenamientos te cobra google o huging? o lo ha procesado tu propio pc? un abrazo!
@NechuBM Жыл бұрын
¡Nunca pensé que Goku se uniría al canal, bienvenido! En este caso estamos realizando el entrenamiento en Google Colab, por lo tanto, se está procesando en los servidores de Google con la capa gratuita, no es necesario pagar nada. Google Colab tiene un cierto número de horas gratuitas diarias (12h) que puedes utilizar para entrenar tu modelo, cuando llegues al límite te avisa. Si tienes un ordenador potente, puedes descargarte el notebook y ejecutarlo en local para aprovechar todo su rendimiento.
@shyrleiyou5 ай бұрын
Hola primero que nada muchas gracias por el tutorial... ¿Que IDE para codigo estas usando?
@NechuBM4 ай бұрын
Estoy utilizando Google Colab, tienes el enlace al código y al IDE en la descripción. Te lo añado aquí también: colab.research.google.com/drive/1-HeF5_LQCom7vMDkzkZEA08LH4gl2y9c
@hvillada19995 ай бұрын
Que diferencia tienen estos modelos con las redes neuronales?
@NechuBM5 ай бұрын
Este tipo de modelos conocido como Transformer comparte muchos componentes cruciales con las redes neuronales pero su arquitectura es muy diferente. Si quieres aprender más sobre la parte técnica de los modelos te comparto el siguiente curso donde podrás entender los límites de las redes neuronales para la generación de texto y sobre todo como funciona el Transformer: kzbin.info/aero/PLxJ3eugu174Jm7Zj1Gx6Ex8-nGbPHFCEh
@tellmefred5 ай бұрын
Hola buenas tardes, tienes Instagram tengo una idea de negocio no quiero dar muchos detalles pero es para una ia en República Dominicana 🇩🇴 un país en el mar caribe necesito orientación en el tema de entrenamiento y de dataset para el mismo entrenamiento.
@NechuBM4 ай бұрын
Buenas, puedes escribirme por Linkedin y comentamos las ideas y opciones: www.linkedin.com/in/daniel-benzaquen-moreno/