Duelo de modelos de vision: Llama 3. 2 frente a MiniCPM-V usando Msty, un nuevo programa

  Рет қаралды 1,410

La Hora Maker

La Hora Maker

Күн бұрын

En el episodio de hoy vamos a poner frente a frente a dos de los modelos de visión más recientes y accesibles: Llama 3.2 y MiniCPM-V. Para ello utilizaremos un herramienta multiplataforma llamada Msty, que nos permitirá ver las salidas de los modelos de lenguaje lado a lado. Comprobaremos cuál es el rendimiento de estos modelos identificando elementos en imágenes, respondiendo preguntas, extrayendo texto, organizando la información visual y mucho más.
Si tienes alguna propuesta para pruebas futuras o quieres saber más sobre Msty, deja tu comentario y dale a like!
Msty App: msty.app
Modelo Llama 3.2 11B Vision: huggingface.co...
Modelo MiniCPM-V 2.6: huggingface.co...

Пікірлер: 11
@javaboy6581
@javaboy6581 Күн бұрын
Que grande eres, maestro! A mi me encantan los modelos de clonacion de voz, que por desgracia para Español no esta muy alla, suena mucho a lata todavia, aunque lo que ha dicho otro comentario de los OCR tampoco me desagradan, aunque para eso uso CHATGPT que lo hace de lujo
@ramir4327
@ramir4327 Күн бұрын
Hola. Faltó ver el tema de fórmulas matemáticas, si detecta las integrales y si las resolvería. Muy bueno el video. Un saludo
@jaimemunoz3025
@jaimemunoz3025 2 күн бұрын
gran aporte master
@CyberIngeniero
@CyberIngeniero 3 күн бұрын
Excelente video! Te dejo una pregunta: Para sistemas que trabajan sobre documentos legales, que se esta usando? Que modelos resultan efectivos?
@LaHoraMaker
@LaHoraMaker 4 күн бұрын
¿Que tipo de pruebas os gustaría ver en los próximos vídeos?
@JorgeLamaVarela
@JorgeLamaVarela 4 күн бұрын
Comparativas de los mejores modelos para OCR, sobre todo para texto manuscrito
@ane2301
@ane2301 4 күн бұрын
Te podria interesar mirar FlowiseAI, en pocas palabras te permite configurar rag y agentes a traves de una webui en local
@LaHoraMaker
@LaHoraMaker 4 күн бұрын
@@JorgeLamaVarelagracias por la sugerencia. Una duda, por si lo tienes claro: los manuscritos originales están bajo dominio público, pero ¿sabes cuál es la licencia de las imágenes digitalizadas y de las transcripciones existentes de las mismas? Si tenemos acceso a ambos conjuntos de datos podríamos afinar algún modelo de visión para esta tarea :)
@JorgeLamaVarela
@JorgeLamaVarela 4 күн бұрын
@@LaHoraMaker mi idea inicial era utilizarlo para transcribir mis propias notas manuscritas, a través de libretas tipo RocketBook
@TheEltictacdicta
@TheEltictacdicta 3 күн бұрын
Hola muy buen video, hace poco estuve viendo una herramienta nueva que combina Colqwen y ColPali que son codificadores de visión diseñados para la recuperación eficiente de documentos utilizando únicamente la representación de imágenes de las páginas de los documentos y generación de respuestas con modelos de lenguaje visual. Es una técnica que demuestra ser mas eficaz que los tradicionales métodos de OCR. Yo he hecho pruebas y combinando Colqwen y GPT4o las respuestas son bastante precisas, también se puede usar otros modelos como Qwen2-VL-7B-Instruct, LLAMA-3.2-11B-Vision, Pixtral-12B-2409, Molmo-7B-O-0924 y Google Gemini. Muy recomendable para que hagas pruebas en tu canal y así difundir la herramienta. La herramienta se llama localGPT-Vision y la puedes encontrar en github.com/PromtEngineer/localGPT-Vision
黑的奸计得逞 #古风
00:24
Black and white double fury
Рет қаралды 25 МЛН
小蚂蚁会选到什么呢!#火影忍者 #佐助 #家庭
00:47
火影忍者一家
Рет қаралды 120 МЛН
SISTER EXPOSED MY MAGIC @Whoispelagheya
00:45
MasomkaMagic
Рет қаралды 13 МЛН
Extrae los datos de tus facturas usando IA - Video 1 de 2
11:21
La Hora Maker
Рет қаралды 7 М.
Procesar Facturas con Inteligencia Artificial IA
5:01
Agustín Bustos Piasentini
Рет қаралды 1,4 М.
Curso evaluacion LLM con Promptfoo - episodio 1
45:43
La Hora Maker
Рет қаралды 1,1 М.
Bolt.new Tutorial for Beginners (the Cursor AI and V0 Killer)
33:31
Greg Isenberg
Рет қаралды 75 М.
Chatea con tus documentos y videos, RAG Local, y más con Llama 3.2
24:38
Evaluando LLMs que evaluan LLMs para RAG - El ejemplo de Justicio
21:10
黑的奸计得逞 #古风
00:24
Black and white double fury
Рет қаралды 25 МЛН