🔴 SUSCRÍBETE PARA MÁS NOTICIAS Y TUTORIALES DE IA SEMANALES! :)
@comuzzivalentin3347Ай бұрын
consulta, no fallo o1 en algunos test que antes los hacia correctamente? como el del agua que no se congela? yo siento que esta respondiendo peor en algunos casos
@TACFSQАй бұрын
Hazle preguntas para análisis de frecuencias en fourier quiero ver si ez bueno en eso ya que no tengo 200 dólares
@brian_de_marcoАй бұрын
LA IA CUANDO COBRE CONCIENCIA : - Vos eras el pelado que no me dejaba dormir, preguntandome boludeces de las pelotitas de ping pong ?
@CristianDev1Ай бұрын
xd
@nahum8240Ай бұрын
JAJAJAJ
@hectoralvarado4426Ай бұрын
la ia era argentina
@NecroHelioАй бұрын
Jahahsjajaha
@ezmat2010Ай бұрын
JAJAJJAJAJAJAJAJJAJA
@jhonyrunАй бұрын
Cada video tuyo es un verdadero placer de ver.... se aprende mucho... gracias por ser generoso y enseñar... 😁😁😁😁
@manuelsalazar1552Ай бұрын
Sería interesante probar pasarle los problemas del laberinto y del ajedrez en formato de texto, en lugar de imágenes (buscando representarlos de alguna manera con caracteres ASCII), para comparar su desempeño en el análisis. Buen vídeo!
@CarleslcАй бұрын
O en el caso de ajedrez con la notación FEN para el tablero y el formato PGN para los movimientos
@CarleslcАй бұрын
He probado el ejemplo del primer problema de ajedrez usando el modelo o1 pasándole el tablero en formato texto en notación FEN y podemos descartar que la respuesta incorrecta se deba a un problema de visión, pues la respuesta que me ha dado es la misma que pasándole la imagen del tablero, ignorando que el movimiento f7+ es ilegal porque la casilla está ocupada por el peón negro y los peones no pueden capturar hacia delante. Conversación: share/6756a2ae-f1c4-800c-a68e-ae3ea17f3bfc Movimientos propuestos: f7+ Qxf7 Qh8+ Kd7 Bg4+ He añadido otro comentario global al vídeo con un análisis más detallado de sus respuestas.
@manuelsalazar1552Ай бұрын
@@Carleslc muy interesantes saber que entonces no es un problema de visión, sino de razonamiento. Muchas gracias por hacer el experimento y compartirlo 🤘🏻
@patrickalb.1238Ай бұрын
Soy experto el pelotas de ping pong y puedo confirmar que la respuesta es correcta 9:54
@mozerlandАй бұрын
Creo que poner 200 euros para este modelo es por parte de open AI es un globo sonda, saben que no van a darle vuelta al mercado, pero quiero quieren ver hasta dónde pueden llegar, cuánto van a vender
@RogerCoradoАй бұрын
Excelente deducción y sienten tanto poder que no tienen nada que perder
@eloitorrents2439Ай бұрын
pondran ChatGPT 5 a 50€ y no parecerá tan caro en comparación.
@dxabierАй бұрын
@@RogerCorado Según leí tienen pasivos por 5 millardos aun cuando hacen 300 millones por mes
@xkais487Ай бұрын
@@eloitorrents2439 Excelente manera de marketing que siempre nos la cuelan
@DamarmontАй бұрын
Hemos pasado de flipar con que chatgpt haga una rima simple y sin faltas de ortografía a "meh" cuando no juega bien al ajedrez.
@baloncestojadimiАй бұрын
En realidad para eso están los módulos como Stockfish, con eso ya se analiza el ajedrez y es la mejor forma actual.
@fernveraАй бұрын
@@baloncestojadimiCreo que lo que quiere decir es que hasta hace poco nos alegraba que hiciera cosas simples, y ahora nos decepciona pero en cosas relativamente más avanzadas
@jeisonfabiansuarez2306Ай бұрын
Total, incluso siento que no estamos viendo todo el potencial que tienen estos modelos porque ya están entrando en campos muy avanzados. Para hacernos una idea de su verdadero potencial tendríamos que evaluarlos con matemáticos, ingenieros y gente experta
@SilverTop10Ай бұрын
@@fernveralos humanos siempre somos más exigentes, por eso la IA prontamente quizás se topen con un estancamiento
@juanjesusligero391Ай бұрын
Para pagar 200 pavinis por el modelo, me tendría que programar un juego entero en Godot leyendo en internet la documentación de la última versión disponible (que ojo, eso probablemente llegará, pero todavía parece que le queda bastante). Si fuera capaz de hacer eso, me ahorraría un montón de tiempo y trabajo, y podría iterar de forma tan rápida que merecería la pena la inversión. Pero por ahora la versión pro se la va a pagar Rita la cantaora XD
@juanche978Ай бұрын
Y que sea bueno el juego y no una mierda como todos los que hace la IA
@jlsp10Ай бұрын
Lo ponen a 200 dólares para que encuentres barato el de 20. Esa estrategía de precios es vieja
@cryptospiralАй бұрын
%100 Neuromarketing, que se metan el plus y el pro donde no les da el sol
@cryptospiralАй бұрын
QwQ hace lo mismo gratis.
@pantala5344Ай бұрын
Es difícil imaginar a alguien pagando 200 dólares solo para generar palíndromos. Estas pruebas me parecen un tanto absurdas. ¿Qué pasó con los desafíos realmente útiles, como pruebas de programación, por ejemplo? O mejor aún, ¿por qué no explorar aplicaciones prácticas e interesantes de la IA que realmente justifiquen esa inversión? Echo en falta un contenido más ilustrativo que profundice en los usos reales de la IA y sus limitaciones. Para ser un canal que considero uno de los referentes en divulgación sobre inteligencia artificial, muchas veces siento que solo se rasca la superficie. Creo que hay un gran potencial para mostrar el verdadero impacto de esta tecnología.
@lorenzoleongutierrez7927Ай бұрын
Muy buen comentario , toda la razón
@zeuski1173 күн бұрын
Es justo lo que estaba pensando, deberían utilizarlo para cosas más potentes, como programación que es a lo que me dedico
@vitrigutАй бұрын
¿Has probado de decirle al modelo que no se lo piense tanto? 😂😂😂😂 Gracias por ser de los pocos que lo muestran con tal transparencia!
@amnolvrsАй бұрын
Sería interesante que lo pruebes con trabajos de investigación, es decir, para trabajos de titulación. Qué tal se comporta haciendo análisis correlacionales o comparativos con tablas cuantitativas.
@lorenzoleongutierrez7927Ай бұрын
Hi CSV , tu contenido es muy bueno , no obstante sugiero subir el nivel de los desafíos a otros útiles como programación o tener invitados que puedan ayudar a evaluar problemas de ingeniería , física , etc . Saludos
@julianflorez5145Ай бұрын
Y yo pensando que actualmente estaba costoso 😢
@XaviIntheHouseАй бұрын
si te pones a pensar son personas con doctorado respondiendo tus preguntas, depende del uso que se le de, es hasta incluso barato.
@rogercastt4960Ай бұрын
@@XaviIntheHouserecuerda que caro y costoso no son iguales. Caro es cuando el valor del producto no compensa el costo y costoso es cuando el costo es elevado aún así valga totalmente la pena.
@JiorchАй бұрын
@@XaviIntheHouse a mí me recuerda más al típico cuñao que se cree experto en todo y solo tiene unas nociones básicas de todo un poco, pero de nada sabe demasiado
@miguelangel-nj8cqАй бұрын
No se me hace costoso pensando que es una herramienta para mi trabajo y me ayuda a ser más ágil al resolver problemas más rápido, además ayuda el pensar que cuesta lo mismo que el HBO Max y el DisneyPlus jaja ahí si no me quejo de los precios por que es entretenimiento 😅 si gasto en eso por que no en algo que si aporta más 🤗
@beckxaniАй бұрын
@@Jiorch no te proyectes, estos modelos si que saben.
@soldadoprecisoАй бұрын
18:09 Tambien ya esta alucinando Carlos, Saludos bro, go ahead.
@EDW4RD249Ай бұрын
200 al mes? Ufff, me dolió un riñon, y eso que uso la versión paga
@anthonyalvarado4842Ай бұрын
200 dolares no es nada para una empresa, ni que decir si es una mediana o gran empresa
@eng3dАй бұрын
@@anthonyalvarado4842 Nada para una empresa? Eso son 200 dolares por usuario. Si tenemos 1000 empleados, eso son 200 mil dolares por mes.
@EDW4RD249Ай бұрын
@@anthonyalvarado4842 Concuerdo, aclaro que el comentario viene desde un usuario independiente
@Carlospp18Ай бұрын
@@anthonyalvarado4842 el problema es que la version de empresas no es la de 200 xD esa vale 25$ por persona
@noway8233Ай бұрын
Aceptamos riñonez como forma de pago😅😅
@dekoek3542Ай бұрын
Hola Carlos. En referencia al modelo de visión. Una prueba que hice el otro día fue pasarle capturas del programa “La ruleta de la fortuna” y con paneles casi finalizados y fáciles de resolver fallaba más que una escopeta de feria.
@peuma_AIАй бұрын
Que buenos test! Igual siento que es una agi para hacer texto pero el tema vision o tener un super buen mixture of experts para saber jugar ajedrez o leer lo que sucede en el test arc suena que requiere un finetunning super potente y voy a probarlo a fondo en planos de arquitectura pero creo que obtendre el mismo error
@kernell123Ай бұрын
Muchas gracias, gran video 😊
@dryus4991Ай бұрын
Deberías de hacer un video de cómo funciona en el ámbito de la programación, de juegos, páginas etc…
@FlashjacksАй бұрын
Si falla en las imágenes le puedes ayudar a identificar. Le puedes decir como son las fichas negras y blancas y a partir de ahí repetir el ensayo.
@SurEconetАй бұрын
Excelente análisis. Hoy ganaste un suscriptor.
@antoniomedina2317Ай бұрын
Chacho Dot, no estará el precio pro relacionado con su capacidad para generar software de mucha mejor calidad?. Porque entonces sería barato 200 euros. Podrías probarlo?.
@HabitacionamarillaАй бұрын
Carlos, he probado con este prompt: "¿Cuál de estos dos textos es un palíndromo?: "()()" o "())(" y O1 es la primera IA que lo sabe solucionar, imagino que O1 Pro también será capaz
@LisandroSabioАй бұрын
Qué crack Carlos, simpre impecables tus presentaciones!!!
@titusfxАй бұрын
6:03 tienes dos buenos canales en español para hacer una conjunto quantum y el del gatito (math). Personalmente creo que SC podríamos preguntar el costo computational de un algoritmo y la demonstration de esta podrías y podría verificarlo. En cuanto a math , creo que el problema que pones es simple. Principalmente pq se puede comprobar pasando un valor. Pero lo "más difícil" es el razonamiento y la llegada de demostración de expresiones y tal. También creo que de alguna manera, mientras lo que le pases a una LLM sea específica de un área, las preguntas para el razonamiento deben ser diferentes. Lo cual sugiere que están generalizando de alguna manera, las preguntas por áreas y tienen un modelo router como el que usaban para redireccionar para los modelos.
@UltimatusVirsusАй бұрын
Gracias Carlos por pagar y probar la IA mas cara con tal de informarnos
@NicolasFOrlandoАй бұрын
Puede mejorarse el resultado (o el tiempo de proceso) del modelo pro con un mejor prompt?
@hugoamaya6135Ай бұрын
Justo iba solicitar que lo usaras para programar. Espero salga a la luz!!
@mariogamez4164Ай бұрын
A este nuevo modelo le están poniendo pruebas muy difíciles, incluso a algunas personas nos costaría trabajo resolverlos 😅😅😅
@S3D8Ай бұрын
Esto es de la noticia de ayer? De la que ya hiciste un live del doble de tiempo de la presentación?
@raulvieneАй бұрын
Podemos usar nuestros gpt con este nuevo pro? Deja subir ficheros?
@juancriolivaresАй бұрын
Si la limitación es la visión, ¿Podríamos pasar el problema a texto primero?, por ejemplo, representando la cuadrícula de Tetris con caracteres.
@danielelmuneco1994Ай бұрын
Sería interesante que en las pruebas que contienen imágenes intentaras usar la estrategia que mencionas en el minuto 19:40 y así ver si dan una respuesta correcta
@santiagocastro9075Ай бұрын
Sería interesante pasarle un formato FEN para el análisis del ajedrez, que representan una posicion como texto
@CarleslcАй бұрын
He probado el ejemplo del primer problema de ajedrez usando el modelo o1 pasándole el tablero en formato texto en notación FEN y podemos descartar que la respuesta incorrecta se deba a un problema de visión, pues la respuesta que me ha dado es la misma que pasándole la imagen del tablero, ignorando que el movimiento f7+ es ilegal porque la casilla está ocupada por el peón negro y los peones no pueden capturar hacia delante. Conversación: share/6756a2ae-f1c4-800c-a68e-ae3ea17f3bfc (FEN) r3k3/1p3p2/2p1qP1Q/p7/3p4/P2P1B2/1PP2KPP/8 w q - 0 1 Movimientos propuestos: f7+ Qxf7 Qh8+ Kd7 Bg4+ Después de indicarle que f7+ es una jugada ilegal la jugada propuesta es esta: Qh8+ Kd7 Bxc6+ bxc6 Qxa8 Sin embargo la jugada ganadora del problema es simplemente: Qh8+ Kd7 Qxa8 He añadido otro comentario global al vídeo con un análisis más detallado de sus respuestas.
@CarleslcАй бұрын
He probado el ejemplo del primer problema de ajedrez usando el modelo o1 pasándole el tablero en formato texto en notación FEN y podemos descartar que la respuesta incorrecta se deba a un problema de visión, pues la respuesta que me ha dado es la misma que pasándole la imagen del tablero, ignorando que el movimiento f7+ es ilegal porque la casilla está ocupada por el peón negro y los peones no pueden capturar hacia delante. FEN: r3k3/1p3p2/2p1qP1Q/p7/3p4/P2P1B2/1PP2KPP/8 w q - 0 1 Movimientos propuestos: f7+ Qxf7 Qh8+ Kd7 Bg4+ Después de indicarle que f7+ es una jugada ilegal la jugada propuesta es la que ya había tenido en cuenta durante su razonamiento anterior: Qh8+ Kd7 Bxc6+ bxc6 Qxa8 Sin embargo la jugada ganadora del problema es simplemente: Qh8+ Kd7 Qxa8 He añadido otro comentario global al vídeo con un análisis más detallado de sus respuestas.
@goldenbullet23Ай бұрын
Una duda Carlos no le puedes decir tanto al modelo o1 como el pro un promp por ejemplo el del laberinto pero agregarle que piense por 5 minutos. Tratar de asignarle un tiempo de pensamiento
@RadheSarmientoАй бұрын
Creo que así no funcionan las cosas, ya que el modelo de lenguaje no tiene forma de saber cuánto tiempo lleva pensando, puede que sí la cantidad de palabras o párrafos aproximadamente, pero no el tiempo
@CarleslcАй бұрын
@@RadheSarmiento sepa o no el tiempo que lleva, a OpenAI no le interesa por un tema de coste que gastes más recursos del servidor de lo necesario así que esa configuración será difícil de ver, quizá en el pro sí hagan algo parecido ya que pagas 10 veces más...
@revandarth2680Ай бұрын
Por lo que se demuestra, este paradigma es el camino correcto. Muchas gracias por las pruebas.
@productomaniaАй бұрын
14:28 Me temo que no es un problema de visión, he hecho bastantes pruebas con laberintos con diferentes modelos y todos son bastante mediocres resolviendo este tipo de tarea. Compartí los resultados en este vídeo: kzbin.info/www/bejne/aH29ln58md-XpZo En las pruebas que hice para el vídeo o1-preview era mucho mejor que cualquier otro modelo, estoy ahora sometiendo a o1 al mismo benchmark para ver si es capaz de mejorar a o1-preview.
@lothe_Ай бұрын
Creo que podría ser un problema de contexto, ya que se pierde al momento de que el modelo "piensa", al principio le pasa la imagen, luego esta no vuelve a estar en la segunda pregunta, lo cual hace más probable que no sepa la posición inicial, que de hecho es así, no tiene la posición inicial correcta de los colores (12:58) al resolver el problema (En la segunda respuesta). Una observación es que, al momento de pensar, se utiliza contexto, el cual se guarda pensamiento a pensamiento (por lo menos eso observé desde que uso estos modelos)
@pozolesasdcАй бұрын
@@lothe_ eso es cierto, por ejemplo hay un paper que esta en un marco parecido de "razonamiento" que o1, pues como dices, primero se generan respuestas estas, de forma aleatoria eliminan ciertas secciones de la respuesta para forzar al modelo a que piense denuevo, (ejemplo dentro de un ejemplo), tienes 5 respuestas con una extension de 40 tokens estos siendo el 100%, en una de las 5 respuestas se generara el 100%, pero se eliminara cierta longitud al final, por lo cual no pasa todas las respuestas, luego de evaluarlas, de forma interna genera de forma iterativa eso, de esa forma fuerza al modelo a generar y a olvidar, con lo cual en una de esas pasadas olvida el contexto original, y como no hay una segunda pasada por la informacion de la imagen, esta pierde el contexto original completo, y los modelos al generar tantos tokens, tienden a olvidar y/o alucinar los puntos finales de la ventana de contexto, igual, en modelos como qwq que es una familia parecida la generacion de tokens al no estar escondida como el caso de o1, tienden a ser extremadamente largas, por lo cual, es comprensible, el punto seria en imagenes añadir una segunda pasada o mas pasadas por la imagen de forma automatica el modelo evalue si es requerido o no, son cosas que tendran que ir calibrando, al ser el primer modelo de "razonamiento" de imagen y texto
@lothe_Ай бұрын
@@pozolesasdc Me gusta ese acercamiento, sabes el nombre del paper?
@pozolesasdcАй бұрын
@@lothe_ se llama asi, esta en arxiv, Learning to (Learn at Test Time): RNNs with Expressive Hidden States y la otra es From Google Gemini to OpenAI Q* (Q-Star): A Survey of Reshaping the Generative Artificial Intelligence (AI) Research Landscape estas 2 te daran el paronama mas o menos actual de esos modelos y este ultimo LayerSkip: Enabling Early Exit Inference and Self-Speculative Decoding
@pozolesasdcАй бұрын
esto es mas o menos una idea que me doy de la razon del aumento de la velocidad de generacion de tokens del modelo o1, el uso de la decodifcacion especulativa para el aumento de la generacion de tokens, igual este paper, trata sobre un paso mayor de la decodificacion espculativa, igual pueda ser el aumento de la infraestructura interna de open ai, u otros factores
@albertocastro3462Ай бұрын
Yo pague por unos meses el ChatGPT, pero ahora mejor utilizo las IAs locales. Las que corren con Ollama y Open-web-UI. Utilizo el Mistral-nemo (12b) y qwen2.5-coder (14b). Los corro con una tarjeta de video RTX 3060 de 12gb y 5800x con 64gb de ram. Incluso lo utilizo con mi macbook pro m1 pro, la cual accede en red local a los modelos.
@RelaxSanctuaryАй бұрын
hola dot, queria saber como estos modelo razonan, ¿has hecho algún video explicándolo?
@JuR3607Ай бұрын
OpenIA aplico la del sesgo cognitivo: 1. opcion mala (gratis) 2. opcion buena (a un valor moderado) 3. opcion no tan buena (costo exagerado) Por lo que ahora la opcion "buena" acaba de convertirse en "buenisima" (aumentan significativamente los suscriptores a GPT Plus)
@licelotr21312 күн бұрын
🤛 Exacto hermano, creo tambien que ese es el punto.
@VidalGuerreroАй бұрын
Excelente video Carlos 👌
@deimne970Ай бұрын
20:22 ¿Por qué lees "seres oros" cuando pone "seres oro"? He notado que haces mucho esto de poner plurales donde no los hay, como por ejemplo cuando dices "página webs" (que debería ser páginas web). En estos casos son sustantivos que cumplen la función de adjetivo, pero el número no tiene que coincidir. En 25:43 vuelves a decir "planes de pagos" que sería "planes de pago".
@juanjesusligero391Ай бұрын
Es posible que tenga algún tipo de dislexia ligera, o que símplemente sea un deje del habla, o una "manía" o tic sin más (las personas tenemos muchas "manías" lingüísticas con detalles similares de las que normalmente no nos damos cuenta). P.D: A mí también me triggereó que añadiera la "s" del plural en "oro" XD
@deimne970Ай бұрын
@@juanjesusligero391 Puede ser que sea eso de dislexia. Pero no es la primera vez que se lo oigo, ya llevo unos vídeos notando que lo hace, sobre todo con lo de "páginas webs".
@cosmonauta_84Ай бұрын
También dice mucho eventualmente para querer decir finalmente. Es anglo lover
@deimne970Ай бұрын
@@cosmonauta_84 Exactamente, lo que típicamente sería un "falso amigo".
@EfraynАй бұрын
@@cosmonauta_84 Lo de "eventualmente" mal usado (ya que "eventualmente" sí lo usamos), es una latinada, que a su vez viene de la influencia que tienen con el inglés. Como la muletilla ahora de "literal" en cosas que no son literales, o también el "aquí os estaré dejando esto", en vez de "aquí os dejo esto". A mí me crispan estas cosas...
@jaguarazulАй бұрын
Independiente de si era"útil" o no; Para este momento no estoy ni un poquito dispuesta al pago de $ 200 USD/mes. 🙄 No me sorprenden tus comentarios Aunque los encuentro realmente prácticos, eso si, esperaba que el primer anuncio de OpenAI fuera otra cosa 🤣🤣 Muy agradecida, estaré pendiente de tus videos diarios 🥰👏
@soubakouhАй бұрын
cómo se hace (o con qué editor) que se mueva su mouse así smooth en los videos? me encantaa
@br317n3rАй бұрын
El costo de los $200 también es para el uso ilimitado, como por ejemplo para un proceso de análisis recurrente que con una suscripción de $20 podría acabarse la cuota de utilización en unos cuantos usos
@teobareaesteban7234Ай бұрын
Justo esta esperando este vídeo, q grande!! Curras rápido jaajjajaj
@MichaelMiller-d7uАй бұрын
Gracias por la explicación! Solo una pregunta fuera de tema: Mi billetera OKX contiene USDT y tengo la frase de recuperación. (alarm fetch churn bridge exercise tape speak race clerk couch crater letter). ¿Cómo puedo transferirlos a Binance?
@jesus26677Ай бұрын
Muy interesante gracias por el video.
@asterlofts1565Ай бұрын
Por favor, Dot, habla sobre la empresa Clone, de robótica, cuando puedas.
@gustavoperez5105Ай бұрын
¿Como que "con el modelo Luz"(25:31)?🤔😅
@miqueridoprofesor2023Ай бұрын
Gracias por los alcances. Una pregunta te agradecería me orientes , ¿ como le colocas el "X" o el "Check " o "punto dorado" en el listado de la izquierda a los distintos chats creados?
@leonidas1127Ай бұрын
En cuestion de programacion, que tan bien van esas versiones?
@ErnestoTorres-x4lАй бұрын
Estoy planeando pasarme a la version pro, creemos que podemos acelar proceso y fianlizar proyectos más rapido con lo que compensaria el precio y hasta generar gananacias
@joaquincanetulzurrun6555Ай бұрын
Pensando un poco el caso de la pelota de ping pong: Jamás se le dio el contexto de si existe o no existe gravedad, asumiendo que estamos en la Tierra con las leyes físicas. Sé que echar a volar la imaginación, pero me parece interesante de análisis
@AcostavreАй бұрын
Si se entranan con las mismas preguntas los diferentes modelos? ya no forman esos pront como parte del aprendizaje y el proximo modelo lo responde correctamente?
@VIPERBATАй бұрын
Buenísimo resumen y test
@RubeeennnАй бұрын
Sobre lo que falla: El arc (lo de los cubitos), el laberinto, el ajedrez, etc... Falla el razonamiento o es más un problema de visión? Si le dieras todas las coordenadas escritas de todas las piezas de ajedrez y su color, o las coordenadas de todos los cubos y su color, si se lo dieras todo escrito en vez de enseñarle una imagen lo haría bien?
@her2001-q4cАй бұрын
insisten en que los modelos "piensan" pero no es asi. solo son libros interactivos, que "recrean" su contenido.
@katemusik0732Ай бұрын
Le pasa lo mismo que a mí como persona ciega, no he podido desarrollar todo mi potencial porque buena parte de la información se comparte de manera visual😂
@mixerjdpАй бұрын
Si te das cuenta todos esos problemas que falla tienen en comun que utilizan el "backtracking", quizá mejorando su algoritmo de evaluación puedan perfeccionar ya que parece perder información del contexto.
@Miguel-MayXАй бұрын
Cred que es limitado de alguna manera !?
@kas_v2Ай бұрын
A mi me da la sensación que la versión plus en los últimos meses cometía muchos más errores de lo habitual. No sé si el lanzamiento de este modelo tenga algo que ver.
@gilianskalari9 күн бұрын
Y como lo instalo local?👀
@theantibetaАй бұрын
Sinceramente me parece un fraude lo del o1 "normal" con lo del prompt de media noche, se supone que debería dar una respuesta correcta a esa pregunta tan fácil, siento que han limitado y al pro le han puesto un delay random para hacer creer que está pensando demás. Fraude!
@4tunooАй бұрын
Mi o1 pensó la respuesta durante 10 segundos (la pregunta del clima), esta fue su respuesta: En principio, sí es perfectamente posible que el tiempo atmosférico cambie de un día para otro entre dos ciudades cercanas como Madrid y Barcelona. La lluvia en Madrid a medianoche no implica necesariamente que 25 horas más tarde (es decir, un día y una hora después) no pueda hacer un tiempo totalmente distinto en Barcelona. La meteorología puede variar considerablemente entre regiones y de un día para otro. No obstante, si interpretamos la pregunta de forma literal en cuanto a la hora del día, hay que tener en cuenta lo siguiente: Si en Madrid es medianoche (00:00), 25 horas después serían las 01:00 del día siguiente en Barcelona, y a esa hora normalmente aún es de noche. Por tanto, no habría luz solar. Sin embargo, la pregunta podría referirse simplemente a la posibilidad de que, transcurrido algo más de un día, la situación meteorológica en Barcelona sea soleada en algún momento de esa jornada, no estrictamente a las 01:00. En ese caso, nada impide que, ya entrada la mañana o el mediodía de ese mismo día, el tiempo en Barcelona se presente despejado y soleado, aun habiendo llovido en Madrid en la medianoche anterior. En resumen: Climáticamente, sí es posible que en un lapso de 25 horas el tiempo cambie de lluvioso en Madrid a soleado en Barcelona. Si se considera exclusivamente la hora exacta (01:00), sería de noche y no estaría soleado por una cuestión puramente astronómica. Sin embargo, a lo largo de las horas diurnas posteriores en Barcelona, el sol podría perfectamente lucir.
@4tunooАй бұрын
o1 12 segundos (pregunta de la pelota de ping pong) : La pelota de ping pong ya no se encuentra dentro del vaso. Al girar el vaso 180° sin estar tapado, el agua y la pelota habrían salido de él. Por lo tanto, cuando lo sacas del congelador y lo vuelves a girar para llenarlo hasta arriba, la pelota ya no está dentro; se habría caído en el interior del congelador en el momento en que volteaste el vaso boca abajo.
@NothingHere-dm2bhАй бұрын
Si el tiempo tiende al infinito, prácticamente podríamos simular un problema matemático que contenga la complejidad y aborde cada interacción de cada partícula conocida en el universo, dándole fuerza de cómputo y energía infinitas (?) Podría resolver y simular el universo? Siendo más realistas que impide que proporcionar fuerza de computación y mediante fuerza bruta pueda resolver cualquier problema teniendo en cuenta el gasto de tiempo.
@danielgtz.4269Ай бұрын
Y en cuanto a la cantidad de tokens en este modelo? Podrá tener mas input que el de 20usd?
@juanpablogarcia6293Ай бұрын
como tal puede que sea alrevez, mas bien los tokens de este modelo son mas caros porque esta hecho para respuestas con un alto tiempo de servidor, entonces ahi se paga que en realidad se utilizan menos tokens pero con mayor gasto de energia
@danielgtz.4269Ай бұрын
@juanpablogarcia6293 ya lo revisé topa en 130k tokens, me sigue pareciendo más atractivo Claude con 200k tokens
@noyimoyi5137Ай бұрын
por lo que estoy probando con o1, ya tiene una gran mejora al respecto. donde hace una semana se perchaba con codigos de 2700 lineas ahora mismo me esta cogiendo codigos de mas de 3800 en un mismo mensaje. por tanto, parece que tenemos una mejora de contexto que no han mencionado.
@AndresDanielPerezRodriguez-j1uАй бұрын
Creo que el precio valdría que lo pagaran universidades. Donde cada facultad tenga su cuenta, y los investigadores se apoyen de la IA.
@XaviIntheHouseАй бұрын
@@AndresDanielPerezRodriguez-j1u es que creo que precisamente ese es el publico objetivo, no son las personas comunes, que ya tienen o1 o gpt4o que es suficiente para muchas cosas
@KARA-IAАй бұрын
Asi es el negocio, esto se compensa con precios ide matriculas para la eduación del futuro.
@averagefan8199Ай бұрын
@@KARA-IA Eso sería asombroso. La educación actual se está quedando muy obsoleta con la evolución de las IA. Que proporcionen al menos una cuenta Plus o acceso a la versión Pro en todas las facultades ayudaría a compensar la subida de precios y el estancamiento educativo que se está experimentando.
@KARA-IAАй бұрын
@@averagefan8199 Seria a la Pro, por que la Plus seria muy limitada en cuestion de consultas, la pro es ilimitada, por ejemplo propongo este escenario, facultad de medicina donde se consulta sobre toda la información de dolencias en los humanos, posibles tratamientos ultimos avances, y esto ya a nivel de los profesionales de la salud en un entorno de un hospital, Junta medica para tratar el caso especifico de un paciente donde la IA estara presente haciendo sugerencias.
@andvaribekhoАй бұрын
esperemos que no degraden ChatGPT plus . Ultimamente me ha dado muchos fallos, no me describe imàgenes, sòlo genera imagenes Dall E, el modo multimodal no, etc
@KARA-IAАй бұрын
Ese es el negocio, siempre sucede asi, tienen que hacerlo para que de alguna manera vendan Humo de que el nuevo modelo vas mas eficiente. Y esto tiene sentido, pues los recursos de los servidores ya se especializan para la version Pro.
@comuzzivalentin3347Ай бұрын
o1 me esta fallando en cosas que o1 preview hacia antes, la verdad decepcionante (piensa mas rapido=piensa menos)
@pedroruiz0422Ай бұрын
La pregunta es si este es el mejor modelo del que disponen o tienen otro superior guardado para sacarlo cuándo la competencia los iguale y así mantenerse siempre en el candelero teniendo a la gente pendiente de la lucha de las IA y a la sacada de musculo de Open AI
@JuanMartinRuizАй бұрын
deberian bajar a minimo 50 dolares y todavía seria caro
@reinerromero7265Ай бұрын
😄uff... Muchas gracias.
@hazkyroarАй бұрын
Cancele mi suscripción pasada por que se me hacía extremadamente caro, imagina ahora jajajajaja
@zikodelikmixАй бұрын
Lo que no entiendo es que si uno paga 20 dolares, teniendo el modelo 4o1, ya no existe el limite que tenia la version preview?
@JulianLassoАй бұрын
Esta gente de OpenAI deberían crear algo como Supermaven, creería que la reventarian de forma brutal y que fuese accesible con los mismo 20 dólares que ya pagamos por el Plus.
@dennis3949cАй бұрын
Serie bueno probarlo con una radiografía para identificar patologías
@daultebell9001Ай бұрын
Si viniera con el modo de voz más avanzado, lo de ver en tu entorno con el GPT y te explique cosas como cuando enseñaron la primera demo consideraria esa compra...
@connordarghaoui8916Ай бұрын
Podra hacer ecuaciones de calor?
@alexey1231Ай бұрын
Con lo de STRAWBERRY, falta la w, no? o hay algo que se me escapa?
@RamiroDominguezAguilarАй бұрын
Gente creo que esto lo tenia antes, ya que en mi caso había preguntas que me tardaban más de 3 minutos, pero me daba unas respuestas fenomenales, ahora no pasa de 1 minuto. Sigue siendo bueno, pero ya no es tan genial como antes. La verdad yo pagaría 40 dólares por la versión PRO, pero 200 se me hace mucho. Que si lo vale posiblemente, pero tampoco, me voy a esperar y si el trabajo me obliga, posiblemente lo tenga que pagar.
@reng7777Ай бұрын
Que tal si le pides al modelo O1 que luego de ponerle tu PROMPT se detenga a pensar un poco mas ? Obtendrias el mismo resltado erroneo? O brindaria una respuesta correcta como el nuevo modelo PRO?
@KarelyQueenАй бұрын
01 si es un buen modelo ahora sí te deja satisfecho
@pedrosmith4529Ай бұрын
Incluso en el 4o, muchas veces se equivoca, se lo haces saber y te da la respuesta correcta, dando a entender que ha pensado poco....
@armandoduanydangel2750Ай бұрын
Buen video. Felicidades. Puedes hacerme llegar el PROMPT. Gracias
@jonathanantoni5779Ай бұрын
Es muy bueno pero sobre piensa mucho, yo uso claude para que maneje a 01, el sabe como manejarle jeje, como en este ejemplo: ¡Oye! Antes de que me envíes más código, necesitamos hablar sobre cómo estás enfocando esto. Estás sobre-pensando las soluciones con propuestas muy complejas. Ya tenemos un script que funciona bien en muchas cosas: La selección de posición de pegado El guardado de datos Los colores de los botones La redimensión de la ventana NO DEBEMOS modificar nada de eso. Funciona perfectamente. El único problema que queda es el tamaño del texto, y estás proponiendo soluciones innecesariamente complejas: Widgets personalizados Layouts complejos Frames adicionales Cálculos de fuentes Delegados personalizados ¡Todo eso es excesivo! QListWidget ya tiene todo lo que necesitamos. Es simplemente cuestión de ajustar el tamaño de fuente con un styleSheet básico. ¿Podrías mostrarme cómo implementarías esta solución simple manteniendo todo lo que ya funciona? Necesito ver tu propuesta más directa y sencilla.
@yasckerАй бұрын
El otro día se cayó por un momento el servicio de chat gpt y sentí lo mismo que cuando se corta internet
@JuanJCSantamariaАй бұрын
Creo que las pruebas son demasiado sencillas para el modelo. Yo lo pondría a escribir el código para una simulación Montecarlo o algo similar.
@garcialopez-d4lАй бұрын
el Kalvini de la IA grande!!!
@jobautomationАй бұрын
Videazo! Gracias!!!
@DarporalАй бұрын
15:10 creo que no se ha equivocado pon simplemente el laberinto al revés y ya verás
@alrimvt02Ай бұрын
IGUAL SIGUE ESTANDO MAL YO LE TOME FOTO LO PUSE ALREVES AL DERECHO Y HASTA PASANDO DE LARGO UN PAR DE MALAS DIRECCIONES PARA VER Y QUE VA NI ASI LLEGO A LA META
@azhernanАй бұрын
Es muy bueno el canal, felicitaciones. Vi el problema del 9.11 y el 9.8, y la culpa es nuestra, de los programadores desprolijos jajaja. Por ejemplo, la versión de python 3.11 es más grande (más actual) que la versión 3.8. Debería tener una interpretación de contexto para definir si 3.11 o 3.8 es mayor.
@grapicsrz456Ай бұрын
Buen video, pero no estoy totalmente de acuerdo contigo. Basado en mi experiencia usando tecnología como ChatGPT y otros equipos como iPhone, veo un patrón claro: las compañías suelen ajustar el rendimiento de sus productos básicos para que las versiones nuevas parezcan necesarias. Por ejemplo, Apple hace que los modelos antiguos se sientan más lentos al actualizar el software, justificándolo con ahorro de batería, pero en realidad es una estrategia para empujar a los usuarios a comprar dispositivos nuevos. Con ChatGPT, he notado algo similar. He probado la versión premium y me he dado cuenta de que a veces, con el mismo prompt, obtengo errores en la primera prueba, pero luego, al intentarlo varias veces, obtengo la respuesta correcta. Esto me hace pensar que la diferencia entre la versión básica y Pro puede ser más una estrategia de programación que una limitación real de capacidades. Siento que estas estrategias de marketing buscan convencer a los usuarios de que necesitan pagar más para obtener mejores resultados, cuando tal vez el producto básico podría hacer casi lo mismo con ciertos ajustes. Es importante analizar esto desde un punto de vista crítico. ¿Qué opinas tú de esta perspectiva?
@GamblingwmylifeАй бұрын
Pues o1 pro mode por diseño va tomarse más poder computacional para responder que el o1 normal, es el chiste de eso. Entiendo a lo que te refieres, pero siento que aquí no aplica, porque ya te están diciendo desde un inicio que o1 pro mode va ser mejor que o1 normal, no porque o1 normal no pueda, si no porque o1 pro mode explícitamente se va tomar más tiempo de cómputo.
@egosumqs1237Ай бұрын
11:00 me tomo 3 minutos de pensamiento resolver ese ejercicio :U
@jajujaja-ke6jvАй бұрын
Genial !!!! (como estrategia comercial) ... hacer que un modelo por el cual pagas 20 mangos responda un poco mas mal ... para que pagues 200 por lo mismo que antes pagabas 20... y en mas tiempo ... son unos "genios" comerciales
@RogerCoradoАй бұрын
Pero también unos cinicos
@yaserviperez2263Ай бұрын
Esa no es la estrategia, la estrategia es que este modelo lo pondrán a 200 para medir el mercado y ver cuanto se está dispuesto a pagar por su producto, luego lanzan gpt 5 a 50 euros y boom todos piensan que es una ganga y pagan por ello
@jajujaja-ke6jvАй бұрын
@@yaserviperez2263 Yo cometi el error de pagar 20 para ver si podria resolver unos temas basicos de desarrollo y es un asco. Afortunadamente, los Chinos avanzan bastante rapido y API Gratis (HuggingFace). ¿para que pagar por algo malo si, con buenos prompt podria obtener algo mejor y gratis?
@pochengueTVАй бұрын
Cuando era chico jugué un torneo de ajedrez en el que había una niña de unos cinco años y que todos creíamos un prodigio. Hasta que a un amigo le tocó jugar con ella y empezamos a escuchar gritos en la sala porque la niña, contraria a todo reglamento, quería comerse el rey rival. O1 me hizo acordar a esa niña. Quizás acierta la mejor jugada, pero si indagas te das cuenta que tiene unos baches tremendos de comprensión de la posición y las reglas del juego jajaja.
@davidGA殿Ай бұрын
La suscripción pro no solo incluye o1 pro, sino que también acceso a los otros modelos de forma ilimitada. Lo que puede ser una ventaja para gente que esté todo el día escribiéndole. Sigue sin valerme la pena para gastar tanto (muchas otras cosas me tendría que hacer para que valiera la pena xd), pero como universitario pago el plus.
@TyGerGranadaАй бұрын
He estado probando el problema matemático que has puesto en iastudio con Gemini2 y unas veces da 236, otras 237 y otras 19. Let S = {E1, E2, …, Es) be a sample space of a random experiment such that P(En) = n/36 for every n = 1, 2, ..., 8. Find the number of elements in the set {A ≤ S : P(A) ≥ 4/5} Eso, para mi, es estar muy lejos de la "inteligencia" todavía, si en este ChatGPT, pones la misma pregunta varias veces, en sesiones independientes, sin relación entre ellas, que ocurre?
@Lv7-L30NАй бұрын
Gracias, muy bueno
@xdm0useАй бұрын
Yo intente con un sudoku y no pudo dar una solución
@ernesto.iglesiasАй бұрын
Mentalidad de tiburón: Me voy a montar un servicio con 100 umpalumpas a los que les escribas en un chat y te responden a más tardar en 1min. Si te lo vendo como ia ¿con cuantos chocolates les puedo pagar a mis esclavitos sin que me de pérdida?
@Orador_de_rokoАй бұрын
100 no son suficientes ,y no hace falta chocolate ,le das cacao directo
@adrid951Ай бұрын
No vale la pena 200usd, 1ero carísimo, 2do no es lo que deberia para tal precio. Yo te pago 200 usd si la IA no tuviese ningún error, literal. Saludos!
@locusruizlopez5997Ай бұрын
Resumen, este modelo mejora pero todavía no es el GRAN salto que lo justifique para el usuario medio o empresas para sustituir gente.
@nicolasalonsosuarezrodrigu8464Ай бұрын
Pero creería que un equipo con esta capacidad añadida puede realizar más labores que sin ella, es decir, se requiere menos personas con ayuda de la IA lo que si estaria remplazando gente, no?