FRANCIA adelanta a OpenAI y su GPT4-o 🤯 Modelo con VOZ... ¡YA DISPONIBLE!

  Рет қаралды 10,549

Xavier Mitjana

Xavier Mitjana

Күн бұрын

¡Una IA tan rápida que te interrumpe! Moshi adelanta a GPT4-o
Recibe toda la INFO de mi ACADEMIA:
👉 bit.ly/curso_ia_
SUSCRÍBETE a mi NEWSLETTER y recibe un GPT de regalo:
👉 bit.ly/ia-newsletter_
ENLACES DEL VIDEO
👉 moshi.chat/
MARCAS DE TIEMPO
00:00 Intro
01:15 Tutorial
02:30 Ejemplos
---
✅ SUCRÍBETE A MI CANAL: bit.ly/suscribirse_XM​​​​
📕 Descarga mi guía gratuita para Stable Diffusion:
👉 snip.ly/guia-IA
---
Instagram: / xavier_mitjana
Twitter: / xavier_mitjana
Contacto comercial: xavmit.yt@gmail.com
*Al realizar una compra a través de cualquiera de estos enlaces de afiliado, recibimos una comisión muy pequeña sin costo adicional para ti. Esto me ayuda a hacer el canal sostenible y seguir ofreciendo contenido de calidad.
#inteligenciaartificial

Пікірлер: 64
@juanjosepajares2166
@juanjosepajares2166 16 күн бұрын
Xavier, te quiero agradecer el haberme prestado 5 minutos de tu atención tras tu charla del Talent Land y, a demás, haberlo hecho con tanta amabilidad y simpatía. Tu contenido es genial, pero lo que te hace más grande aún es la sencillez y cercanía con lo que lo haces, haciéndonos sentir a los demás que somos capaces de subirnos a este tren alucinante que es la IA. Un saludo!
@XavierMitjana
@XavierMitjana 16 күн бұрын
Hola Juan José, no hay de qué. Siempre digo que la parte que más me gusta de una ponencia son las preguntas de después. Así que gracias a ti por acercarte, por mi fue un placer poder dedicaros un poco de tiempo.
13 күн бұрын
Bello Xavi
@guillermosalazar52
@guillermosalazar52 16 күн бұрын
Felicidades Xavier eres un Crack... siempre al día con las noticias de IA
@AragamiMusic
@AragamiMusic 16 күн бұрын
Lo acabo de probar y no funciona bien, no me escucha, o si me escucha me responde a los 15 segundos, probablemente sea un tema de que estoy en Colombia, pero igual no lo entiendo
@LeiviSS
@LeiviSS 16 күн бұрын
Saludos desde Cuba!
@LaSopaDeRockwell
@LaSopaDeRockwell 16 күн бұрын
creo que no se compara con lo que tiene para lanzar Open AI
@oscar4070ti
@oscar4070ti 16 күн бұрын
...todavía.
@LaSopaDeRockwell
@LaSopaDeRockwell 16 күн бұрын
@@oscar4070ti si pero dudo que esa emprsa logre superarlo aun en el futuro
@XavierMitjana
@XavierMitjana 16 күн бұрын
Se compara en cuanto a concepto. Por lo demás es la primera demo de este tipo que podemos probar y encima open source. A ver como evoluciona todo de aquí a que OpenAI abra la función para todo el mundo.
@LaSopaDeRockwell
@LaSopaDeRockwell 15 күн бұрын
@@XavierMitjana el experto eres tu, de hecho me entero de las noticias de IA por tu canal y me gusta mucho, no me convencio mucho la demo de este producto y creo que el chatgpt por voz que tenemos hoy en dia aun con lo que demora en responder es superior, entiendo que es una empresa pequeña y es un logro pero no creo que pueda competir con gpt-o cuando saque el nuevo producto de voz con expresiones, ni hablar de vision y las demas cosas
@diegosoyu3941
@diegosoyu3941 16 күн бұрын
Excelente Javier ! Para practicar/aprender ingles, q IA recomiendas ? Gracias
@HarpaAI
@HarpaAI 16 күн бұрын
🎯 Key points for quick navigation: 00:00 *🇫🇷 Introduction of France's low-latency AI model Moshi* - France introduces the first low-latency conversational AI called Moshi, - Moshi is open-source and developed by Kutai, an AI research lab. 02:18 *💻 Testing Moshi: Setup and User Experience* - Experimental AI with fluid conversation capabilities, - Differences in demo experience based on location (EU vs. US), - Limited conversation duration (5 minutes), and seamless signup process. 05:37 *🧐 Functionality and Conversational Depth of Moshi* - Demonstrates fluent conversations in English, lacks depth, - Limited Spanish language support, - AI gets repetitive, especially when asked abstract or humorous questions. 07:41 *🎯 Conclusion: Potential and Limitations of Moshi* - Moshi showcases potential of fluid voice interactions with AI, - Current limitations include language support and conversational depth, - Indicates competitive landscape before OpenAI's GPT-4 voice model release. Made with HARPA AI
@DigifanaticElCuervo
@DigifanaticElCuervo 16 күн бұрын
Estuve probando a Moshi desde ayer, y personalmente, aunque sean muy buenas noticias de que este sea Open-Source (y la gente luego se ponga a modificar y crear sus propias cosas) esta muy lejos de parecerse a GPT-4o... por ejemplo, Moshi es totalmente incapaz de saber si estas hablandole con tono triste, alegre o enojado, cosa que GPT-4o si es capaz de interpretar (o al menos es lo que nos dan a entender si recordamos la respiracion exagerada que hubo en la presentacion del modelo, para que analizara que tan acelerada estaba la persona) hasta donde he probado, el modelo transcribe lo que decimos a texto (aunque no lo veamos) y luego ya nos contesta, al menos es mi impresion, ya que aunque mi ingles es malisimo, he visto que a veces no toma correctamente lo que le dices, yo he tenido problemas horribles para que "interpretara" al pirata. Por otro lado, siento que el modelo esta extrañam,ente condicionado a contestar ciertas preguntas, siendo que tiene la capacidad de interpretar al pirata, probe intentando a que intentase interpretar por ejemplo a un cuervo, a una vaca, y otros animales, para mi sorpresa, Moshi se quedaba callada, no habia respuesta del modelo, y cuando le preguntaba si habia entendido lo que le decia, desplegaba informacion del animal, por lo que, en teoria, si que habia escuchado mi peticion, pero, ni siquiera respondia nada. Tambien vi que en realidad no es un modelo multi-modal... Sino que, fusiona el texto con el TTS, no vi la presentacion entera pero, algo asi entendi en otras noticias, y, creo que realmente es asi, debido a que, si modificamos la temperatura de la voz (la creatividad o que tanta libertad tiene para "alucinar") despues de que ya le das un tema de conversacion, y te quedas callado con el microfono apagado, Moshi empezara a hablar sola, lo interesante es que, lo que dice, no lo registra en el log del chat, por lo que, esto al menos a mi me confirma que, funciona de una manera bastante... "transformer" al estilo de pegar piezas de robots unas con otras, es decir, que, Moshi en realidad ejecuta un model ode texto por detras al mismo tiempo que uno de voz, lo cual para mi... al menos de lo que mostro OpenAI, lo hace muy diferente. No se que opines tu Xavi, pero, sin duda alguna, yo soy de los que piensa que si es un gran paso si es que liberan al modelo, para la IA en lo Open Source, pero tambien pienso que si lo intentan vender como producto... esta bastante atras de lo que la gente podria esperar de uno, ya que las limitaciones del mismo, y con ello no me refiero a su inteligencia, dejan mucho que desear, siendo incluso mejor la narrativa que tiene actualmente GPT-4o, picandole a la bocina para que te lea el texto. Un saludo y buen video.
@XavierMitjana
@XavierMitjana 16 күн бұрын
En este caso lo que importa es la funcionalidad, más que la capacidad. Acaban de liberar un modelo capaz de interactuar voz a voz en tiempo real, ahora es cuestión de tiempo que esta tecnología se implemente en modelos más grandes, ya sea entrenando modelos nuevos, ya sea integrando sistemas con varios modelos que permitan experimentar con una latencia igual de baja.
@omar_guirao
@omar_guirao 14 күн бұрын
La app de Chat gpt tiene voz hace tiempo ya y la de gemini también, aunque de momento solo en el móvil
@XavierMitjana
@XavierMitjana 14 күн бұрын
Hola Omar, no es la interacción por voz, es que el modelo funcione de modo nativo por voz. La interacción actual con ChatGPT no es con el modelo multimodal.
@fernandodiaz8231
@fernandodiaz8231 10 күн бұрын
¿Kyutai tiene soporte para API?
@AdretuireiTeberlitz
@AdretuireiTeberlitz 16 күн бұрын
A esas ia les falta el acceso a camara para que puedan ver los gestos de uno y puedan decidir si interrumpir o entender cuando deben parar, la velocidad de respuesta de Moshi, es extraordinaria, solo falta qe lo integren bien con un buen modelo y le den capacidades multimodales y más manejos de idiomas y será genial, como la promesa que estamos esperando de chatgpt.
@XavierMitjana
@XavierMitjana 16 күн бұрын
De ChatGPT... y de Google con su project Astra. A ver si el Open Source les pone las pilas y les obliga a moverse un poco.
@oscarmau
@oscarmau 16 күн бұрын
👍
@jadams2k18
@jadams2k18 16 күн бұрын
jejeje, la probe y es un poco bruta jajaja... pero me asusta lo que viene,,, adios a los asistentes humanos... hola IA, el mejor asistente de soporte del mundo...
@edithcastaneda3190
@edithcastaneda3190 16 күн бұрын
Yo lo uso con gpt4o sin problema. Podemos platicar hasta varias personas al mismo tiempo.
@viangelo4z595
@viangelo4z595 16 күн бұрын
Una demo prácticamente pero es muy bueno para ser el primero 🥇
@azhuransmx126
@azhuransmx126 16 күн бұрын
Es muy rápida, la latencia es cero pero está medio loca jaja alucina mucho, eso es porque el modelo de inteligencia al que le conectaron es de solo 7 billones de parámetros, debieron haberle conectado a Mistral 56 billones que es un excelente modelo. Solo habla en Inglés y en Francés.
@MILENIOZERO
@MILENIOZERO 15 күн бұрын
Lo acabo de probar y lo único bueno que tiene es la velocidad de respuesta pero entender entiende bien poco
@walterk14
@walterk14 16 күн бұрын
Moshi? En japonés decir moshi moshi significa como decir : alo Cuando atiendes el teléfono
@GibGiab-gc7qm
@GibGiab-gc7qm 16 күн бұрын
La gracia es la asombrosa compression audio no mas. No tiene sentido comparar el modelo que usa. De echo es.un modelo de 7B , lo de gpt de 400
@XavierMitjana
@XavierMitjana 16 күн бұрын
Es que el vídeo se centra solo en este aspecto, por lo demás es una demo. Pero una demo open source. A saber lo que tendremos en un par de meses construido sobre este modelo.
@guersomtucumani
@guersomtucumani 16 күн бұрын
Tengo q aprender ingles 😅
@alrimvt02
@alrimvt02 16 күн бұрын
character ai hace lo mismo si habla en español y es mejor y cuando pagas los 9,99 al mes contesta aun mas rapido y puedes conversar con ella
@FranciscoJavier-
@FranciscoJavier- 16 күн бұрын
no he pagado este mes y aun me mantienen los servicios. asi que no me puedo quejar con GPT4
@diegoortegadiaz8261
@diegoortegadiaz8261 15 күн бұрын
no lo entiendo yo hablo que gpt dandole a los cascos
@bhicham
@bhicham 15 күн бұрын
He probado el chat y es: very very bad. Creo que esta empresa sacó esto para darse a conocer aprovechando del buz que hizo el nuevo chat por voz de OpenIA
@XavierMitjana
@XavierMitjana 14 күн бұрын
Es una demo de modelo con capacidad de voz nativa. Lo bueno es que es OpenSource y la comunidad ya podrá empezar a experimentar con esta capacidad.
@acastro008
@acastro008 16 күн бұрын
¿Nos estamos dando cuenta del punto crucial en el que nos encontramos? Los servicios de atención al cliente de muchas grandes compañías tales como bancos o servicios de gas, luz, comunicaciones, etc usan servicios muy deficientes. EJEMPLO: "En este momento no hay ningún operador disponible" ... Música y a esperar, o te ponen aun operador sin experiencia o mal cualificado que no te resuelve nada, etc. Creo que las operadoras telefónicas se van a quedar sin trabajo en pocos años y los servicios de atención al cliente podrán mejorara muchísimo.
@omarhr8300
@omarhr8300 16 күн бұрын
Sucederá, probablemente, en 50 años. Ni siquiera lo que inició todo, ChatGPT, entiende al 100 % lo que el humano quiso decir, aun poniéndole contexto se equivoca muchas veces. La IA está demasiado verde para lo que se piensa hacer, pero lo que tenemos comparado con lo que había es un grandísimo avance, ahí está la diferencia, avanzamos mucho en tecnología pero todavía no es aplicable.
@acastro008
@acastro008 16 күн бұрын
@@omarhr8300 Yo digo que unos 8 años. El ritmo de crecimiento de la IA es brutal y no es fácil dar una cifra, pero dudo mucho que tengamos que esperar 50 años.. Además estamos hablando de un servicios en los cuales no parece especialmente complicado el entrenamiento. Un porcentaje pequeño de consultas o servicios podría ser derivado a un selecto grupito de operadores capaces de desatascar situaciones excepcionales.
@XavierMitjana
@XavierMitjana 16 күн бұрын
Los servicios de atención al cliente creo que van a automatizarse muy pronto. No completamente, pero con sistemas de árboles de decisiones estoy seguro que la IA podrá filtrar un buen número de llamadas de modo eficiente sin tener que llegar al operario humano. Y para lo complicado, quedarán los humanos. Debemos tener en cuenta no es necesario que la IA pueda hacer el 100% del trabajo humano en cuanto a capacidades, si se cumple pareto, posiblemente siendo capaz de resolver el 20% de casuísticas más habituales le de para atender el 80% de las situaciones.
@azhuransmx126
@azhuransmx126 16 күн бұрын
​@@omarhr8300 50 años jaja, ya un GPT4 actual puede perfectamente resolver el 100% de las consultas genéricas más sencillas si se alimenta al modelo con una gran cantidad de información del producto p servicio. Pueden resolver cerca del 50% de las consultas de complejidad media y ya para cosas más técnicas y complejas esto va a requerir mejor una intervención humana ya que esas situaciones complejas también son delicadas para la empresa y es mejor que las supervise un humano pero todo depende de niveles. El problema era la latencia y la incapacidad de detectar las inflexiones y las emociones del lenguaje pero ya los GPTs están llegando a ese punto. Las demás empresas son las que al parecer aún no llegan pero de aquí al otro año lo van a hacer, esto no tomará 50 años, ni siquiera 5 años. SORA parecía muy complejo y Runway se le ha acercado mucho, claro seguro ya Open Ai tiene un SORA 2 y están trabajando en el 3 así como DallE1, 2 y 3.
@azhuransmx126
@azhuransmx126 16 күн бұрын
​@omarhr8300 50 años jaja, ya un GPT4 actual puede perfectamente resolver el 100% de las consultas genéricas más sencillas si se alimenta al modelo con una gran cantidad de información del producto p servicio. Pueden resolver cerca del 50% de las consultas de complejidad media y ya para cosas más técnicas y complejas esto va a requerir mejor una intervención humana ya que esas situaciones complejas también son delicadas para la empresa y es mejor que las supervise un humano pero todo depende de niveles. El problema era la latencia y la incapacidad de detectar las inflexiones y las emociones del lenguaje pero ya los GPTs están llegando a ese punto. Las demás empresas son las que al parecer aún no llegan pero de aquí al otro año lo van a hacer, esto no tomará 50 años, ni siquiera 5 años. SORA parecía muy complejo y Runway se le ha acercado mucho, claro seguro ya Open Ai tiene un SORA 2 y están trabajando en el 3 así como DallE1, 2 y 3.
@CristianChacinCastro
@CristianChacinCastro 16 күн бұрын
Creo que cuando salga GPT4-o voice va a hacer que todas estas empresas se queden en pañales con lo que se va a poder hacer...
@XavierMitjana
@XavierMitjana 16 күн бұрын
Pues mira, yo con OpenAI cada vez tengo más dudas. Me parece que son los reyes del marketing y que cuando las herramientas llegan y las puedes probar realmente, meh. No, meh al nivel de Google, pero sí decepcionantes. Con el tiempo que dan entre presentación y lanzamiento yo creo que sí que es posible que la competencia se les haya acercado lo suficiente.
@CristianChacinCastro
@CristianChacinCastro 16 күн бұрын
@@XavierMitjana es el problema con los tiempos de lanzamiento y dar a entender lo que puede hacer el modelo antes de lanzarlo en eso creo que si tienen una gran falla 😬...
@pjcl5589
@pjcl5589 16 күн бұрын
Sacar cosas a medias y mal hechas no es competir con chatgpt
@XavierMitjana
@XavierMitjana 16 күн бұрын
No digo compite. Digo se adelanta. Y aquí el matiz es clave, ya que lo que nos ofrecen es un motor de inferencia hiperrápido voz a voz de código libre. Esto significa que la comunidad ahora ya tiene una herramienta para escalar el concepto a modelos más grandes. Ya sea creando nuevos modelos, ya sea combinando su funcionalidad con modelos ya existentes. En otras palabras, ya existe algo que "replica" el concepto, ahora es cuestión de "poco" tiempo que lo mejoren para que sea funcional en contextos prácticos. Vamos, que de aquí a que OpenAI libere su función de voz (se especula que pueden ser unos 4 meses) estoy seguro que ya habrá algo muy similar a nivel de concepto y prestaciones en la competencia.
@user-sx6nd8zl5k
@user-sx6nd8zl5k 16 күн бұрын
moshi es la misma experiencia de comunicarse en español , con el tipico gringo que medio entiende pero no hbla casi nada😏, con respecto a la voz de gpt no se cual es el escandalo si esto ya debio de haberse superado con alexa de amazon que llevamos casi una decada habando con una IA primitiva
@XavierMitjana
@XavierMitjana 16 күн бұрын
Hombre, pero es que Alexa es muy primitiva xD.
@ecoclasico
@ecoclasico 16 күн бұрын
Lo probé, y honestamente, es vergonzoso. No sólo no habla español, sino que no se puede hablar bien en inglés. No entiende las preguntas ni el contexto que uno quiere conversar. Cuando le dije "Do you speak spanish?", me respondió "Yes, I am German". Cuando le pregunté "Do you speak english?", me respondió "Yes, spanish is a Puerco Rico languages". La verdad, personalmente, no se puede comparar con GPT-4o. Si se trata de una demo, justamente las demos están para que uno sienta interés al producto y que aumente sus expectativas cuando salga el producto final. Si es una demo mal hecha, a nadie le va a interesar...
@XavierMitjana
@XavierMitjana 16 күн бұрын
Es una demo de funcionalidad, pero lo cortés no quita lo valiente, es la primera que podemos probar.
@ecoclasico
@ecoclasico 15 күн бұрын
@@XavierMitjana No le veo relación. No es cuestión de que si a uno u otro le gusta o no éste modelo de IA. Sino que desde donde uno lo mire, por más que sea una demo, está mal hecho.
@MILENIOZERO
@MILENIOZERO 15 күн бұрын
Pues sino está en español entonces no han creado nada útil
@CarlosGermanCruzEspinoza
@CarlosGermanCruzEspinoza 16 күн бұрын
Primero en comentarios 😊
@Arion-tt8ju
@Arion-tt8ju 16 күн бұрын
No funciona bien esa herramienta
@XavierMitjana
@XavierMitjana 16 күн бұрын
Es una demo de funcionalidad, más que una herramienta. Pero lo bueno es que es OpenSource y podrá implementarse en otros proyectos.
@user-he1kd2uv8l
@user-he1kd2uv8l 16 күн бұрын
De momento es una porquería 😂🎉
@XavierMitjana
@XavierMitjana 16 күн бұрын
Es una demo de funcionalidad y de código libre, la pieza que hace falta para que en pocos meses haya más modelos o herramientas más capaces con esta característica.
@Tinshits
@Tinshits 16 күн бұрын
Acabo de usarlo y truló. Ni en castellano , ni en inglés. Las primeras preguntas respondió bien, pero terminó respondiendo en blucle, sin importar lo que preguntase, "Gracias, estoy aquí para ayudar a la sociedad" (en inglés) blucle total. Anda como el orto... XD
@XavierMitjana
@XavierMitjana 16 күн бұрын
Es una demo de funcionalidad, pero para ser justos, son los primeros que lanzan algo similar que todos podamos probar. A ver que se construye a partir de ahora encima de esto.
@burnoutcycle
@burnoutcycle 16 күн бұрын
Es una perdida de tiempo, no funciona correctamente.
@XavierMitjana
@XavierMitjana 16 күн бұрын
Es una demo de funcionalidad, ahora a ver que se construye encima.
@cellowify
@cellowify 16 күн бұрын
Me parecio bastante mal educada y borde
@luismejias6478
@luismejias6478 16 күн бұрын
No es bueno para nada , y no habla español
GPT-4o vs Llama 3.1 ¿Quién gana? 🤯 Combate a 10 asaltos
19:30
Xavier Mitjana
Рет қаралды 8 М.
"En 3 años puede que ya NO trabaje" - Avital Balwit, Anthropic
30:43
Xavier Mitjana
Рет қаралды 35 М.
Beautiful gymnastics 😍☺️
00:15
Lexa_Merin
Рет қаралды 15 МЛН
Now THIS is entertainment! 🤣
00:59
America's Got Talent
Рет қаралды 39 МЛН
Spot The Fake Animal For $10,000
00:40
MrBeast
Рет қаралды 145 МЛН
Por qué Excel es una habilidad blanda
17:22
Platzi
Рет қаралды 207 М.
Jaron Lanier analiza el futuro de la Inteligencia Artificial | AI IRL
24:01
Bloomberg en Español
Рет қаралды 357 М.
OpenAI a un paso de la AGI 🤯 Novedades del proyecto Q*
12:13
Xavier Mitjana
Рет қаралды 28 М.
🤖🚀 Noticias IA: Llega la voz a la IA ¡BRUTAL! 😲🎤
38:09
Inteligencia Artificial
Рет қаралды 71 М.
Nuevo GPT-4 O 🚀 ¡No creerás lo que AHORA ChatGPT puede hacer! 🤯
10:56
Looks very comfortable. #leddisplay #ledscreen #ledwall #eagerled
0:19
LED Screen Factory-EagerLED
Рет қаралды 2 МЛН
Новые iPhone 16 и 16 Pro Max
0:42
Romancev768
Рет қаралды 839 М.
Телефон-електрошокер
0:43
RICARDO 2.0
Рет қаралды 1,3 МЛН
Лазер против камеры смартфона
1:01
NEWTONLABS
Рет қаралды 660 М.