NEW CHATGPT o1 PRO! - Is it worth PAYING $200? (Demo and review)

Рет қаралды 117,738

Dot CSV Lab

Күн бұрын

Пікірлер: 383

@DotCSVLab Ай бұрын

🔴 SUSCRÍBETE PARA MÁS NOTICIAS Y TUTORIALES DE IA SEMANALES! :)

@comuzzivalentin3347 Ай бұрын

consulta, no fallo o1 en algunos test que antes los hacia correctamente? como el del agua que no se congela? yo siento que esta respondiendo peor en algunos casos

@TACFSQ Ай бұрын

Hazle preguntas para análisis de frecuencias en fourier quiero ver si ez bueno en eso ya que no tengo 200 dólares

@brian_de_marco Ай бұрын

LA IA CUANDO COBRE CONCIENCIA : - Vos eras el pelado que no me dejaba dormir, preguntandome boludeces de las pelotitas de ping pong ?

@CristianDev1 Ай бұрын

@nahum8240 Ай бұрын

JAJAJAJ

@hectoralvarado4426 Ай бұрын

la ia era argentina

@NecroHelio Ай бұрын

Jahahsjajaha

@ezmat2010 Ай бұрын

JAJAJJAJAJAJAJAJJAJA

@jhonyrun Ай бұрын

Cada video tuyo es un verdadero placer de ver.... se aprende mucho... gracias por ser generoso y enseñar... 😁😁😁😁

@manuelsalazar1552 Ай бұрын

Sería interesante probar pasarle los problemas del laberinto y del ajedrez en formato de texto, en lugar de imágenes (buscando representarlos de alguna manera con caracteres ASCII), para comparar su desempeño en el análisis. Buen vídeo!

@Carleslc Ай бұрын

O en el caso de ajedrez con la notación FEN para el tablero y el formato PGN para los movimientos

@Carleslc Ай бұрын

He probado el ejemplo del primer problema de ajedrez usando el modelo o1 pasándole el tablero en formato texto en notación FEN y podemos descartar que la respuesta incorrecta se deba a un problema de visión, pues la respuesta que me ha dado es la misma que pasándole la imagen del tablero, ignorando que el movimiento f7+ es ilegal porque la casilla está ocupada por el peón negro y los peones no pueden capturar hacia delante. Conversación: share/6756a2ae-f1c4-800c-a68e-ae3ea17f3bfc Movimientos propuestos: f7+ Qxf7 Qh8+ Kd7 Bg4+ He añadido otro comentario global al vídeo con un análisis más detallado de sus respuestas.

@manuelsalazar1552 Ай бұрын

@@Carleslc muy interesantes saber que entonces no es un problema de visión, sino de razonamiento. Muchas gracias por hacer el experimento y compartirlo 🤘🏻

@patrickalb.1238 Ай бұрын

Soy experto el pelotas de ping pong y puedo confirmar que la respuesta es correcta 9:54

@mozerland Ай бұрын

Creo que poner 200 euros para este modelo es por parte de open AI es un globo sonda, saben que no van a darle vuelta al mercado, pero quiero quieren ver hasta dónde pueden llegar, cuánto van a vender

@RogerCorado Ай бұрын

Excelente deducción y sienten tanto poder que no tienen nada que perder

@eloitorrents2439 Ай бұрын

pondran ChatGPT 5 a 50€ y no parecerá tan caro en comparación.

@dxabier Ай бұрын

@@RogerCorado Según leí tienen pasivos por 5 millardos aun cuando hacen 300 millones por mes

@xkais487 Ай бұрын

@@eloitorrents2439 Excelente manera de marketing que siempre nos la cuelan

@Damarmont Ай бұрын

Hemos pasado de flipar con que chatgpt haga una rima simple y sin faltas de ortografía a "meh" cuando no juega bien al ajedrez.

@baloncestojadimi Ай бұрын

En realidad para eso están los módulos como Stockfish, con eso ya se analiza el ajedrez y es la mejor forma actual.

@fernvera Ай бұрын

@@baloncestojadimiCreo que lo que quiere decir es que hasta hace poco nos alegraba que hiciera cosas simples, y ahora nos decepciona pero en cosas relativamente más avanzadas

@jeisonfabiansuarez2306 Ай бұрын

Total, incluso siento que no estamos viendo todo el potencial que tienen estos modelos porque ya están entrando en campos muy avanzados. Para hacernos una idea de su verdadero potencial tendríamos que evaluarlos con matemáticos, ingenieros y gente experta

@SilverTop10 Ай бұрын

@@fernveralos humanos siempre somos más exigentes, por eso la IA prontamente quizás se topen con un estancamiento

@juanjesusligero391 Ай бұрын

Para pagar 200 pavinis por el modelo, me tendría que programar un juego entero en Godot leyendo en internet la documentación de la última versión disponible (que ojo, eso probablemente llegará, pero todavía parece que le queda bastante). Si fuera capaz de hacer eso, me ahorraría un montón de tiempo y trabajo, y podría iterar de forma tan rápida que merecería la pena la inversión. Pero por ahora la versión pro se la va a pagar Rita la cantaora XD

@juanche978 Ай бұрын

Y que sea bueno el juego y no una mierda como todos los que hace la IA

@jlsp10 Ай бұрын

Lo ponen a 200 dólares para que encuentres barato el de 20. Esa estrategía de precios es vieja

@cryptospiral Ай бұрын

%100 Neuromarketing, que se metan el plus y el pro donde no les da el sol

@cryptospiral Ай бұрын

QwQ hace lo mismo gratis.

@pantala5344 Ай бұрын

Es difícil imaginar a alguien pagando 200 dólares solo para generar palíndromos. Estas pruebas me parecen un tanto absurdas. ¿Qué pasó con los desafíos realmente útiles, como pruebas de programación, por ejemplo? O mejor aún, ¿por qué no explorar aplicaciones prácticas e interesantes de la IA que realmente justifiquen esa inversión? Echo en falta un contenido más ilustrativo que profundice en los usos reales de la IA y sus limitaciones. Para ser un canal que considero uno de los referentes en divulgación sobre inteligencia artificial, muchas veces siento que solo se rasca la superficie. Creo que hay un gran potencial para mostrar el verdadero impacto de esta tecnología.

@lorenzoleongutierrez7927 Ай бұрын

Muy buen comentario , toda la razón

@zeuski117 3 күн бұрын

Es justo lo que estaba pensando, deberían utilizarlo para cosas más potentes, como programación que es a lo que me dedico

@vitrigut Ай бұрын

¿Has probado de decirle al modelo que no se lo piense tanto? 😂😂😂😂 Gracias por ser de los pocos que lo muestran con tal transparencia!

@amnolvrs Ай бұрын

Sería interesante que lo pruebes con trabajos de investigación, es decir, para trabajos de titulación. Qué tal se comporta haciendo análisis correlacionales o comparativos con tablas cuantitativas.

@lorenzoleongutierrez7927 Ай бұрын

Hi CSV , tu contenido es muy bueno , no obstante sugiero subir el nivel de los desafíos a otros útiles como programación o tener invitados que puedan ayudar a evaluar problemas de ingeniería , física , etc . Saludos

@julianflorez5145 Ай бұрын

Y yo pensando que actualmente estaba costoso 😢

@XaviIntheHouse Ай бұрын

si te pones a pensar son personas con doctorado respondiendo tus preguntas, depende del uso que se le de, es hasta incluso barato.

@rogercastt4960 Ай бұрын

@@XaviIntheHouserecuerda que caro y costoso no son iguales. Caro es cuando el valor del producto no compensa el costo y costoso es cuando el costo es elevado aún así valga totalmente la pena.

@Jiorch Ай бұрын

@@XaviIntheHouse a mí me recuerda más al típico cuñao que se cree experto en todo y solo tiene unas nociones básicas de todo un poco, pero de nada sabe demasiado

@miguelangel-nj8cq Ай бұрын

No se me hace costoso pensando que es una herramienta para mi trabajo y me ayuda a ser más ágil al resolver problemas más rápido, además ayuda el pensar que cuesta lo mismo que el HBO Max y el DisneyPlus jaja ahí si no me quejo de los precios por que es entretenimiento 😅 si gasto en eso por que no en algo que si aporta más 🤗

@beckxani Ай бұрын

@@Jiorch no te proyectes, estos modelos si que saben.

@soldadopreciso Ай бұрын

18:09 Tambien ya esta alucinando Carlos, Saludos bro, go ahead.

@EDW4RD249 Ай бұрын

200 al mes? Ufff, me dolió un riñon, y eso que uso la versión paga

@anthonyalvarado4842 Ай бұрын

200 dolares no es nada para una empresa, ni que decir si es una mediana o gran empresa

@eng3d Ай бұрын

@@anthonyalvarado4842 Nada para una empresa? Eso son 200 dolares por usuario. Si tenemos 1000 empleados, eso son 200 mil dolares por mes.

@EDW4RD249 Ай бұрын

@@anthonyalvarado4842 Concuerdo, aclaro que el comentario viene desde un usuario independiente

@Carlospp18 Ай бұрын

@@anthonyalvarado4842 el problema es que la version de empresas no es la de 200 xD esa vale 25$ por persona

@noway8233 Ай бұрын

Aceptamos riñonez como forma de pago😅😅

@dekoek3542 Ай бұрын

Hola Carlos. En referencia al modelo de visión. Una prueba que hice el otro día fue pasarle capturas del programa “La ruleta de la fortuna” y con paneles casi finalizados y fáciles de resolver fallaba más que una escopeta de feria.

@peuma_AI Ай бұрын

Que buenos test! Igual siento que es una agi para hacer texto pero el tema vision o tener un super buen mixture of experts para saber jugar ajedrez o leer lo que sucede en el test arc suena que requiere un finetunning super potente y voy a probarlo a fondo en planos de arquitectura pero creo que obtendre el mismo error

@kernell123 Ай бұрын

Muchas gracias, gran video 😊

@dryus4991 Ай бұрын

Deberías de hacer un video de cómo funciona en el ámbito de la programación, de juegos, páginas etc…

@Flashjacks Ай бұрын

Si falla en las imágenes le puedes ayudar a identificar. Le puedes decir como son las fichas negras y blancas y a partir de ahí repetir el ensayo.

@SurEconet Ай бұрын

Excelente análisis. Hoy ganaste un suscriptor.

@antoniomedina2317 Ай бұрын

Chacho Dot, no estará el precio pro relacionado con su capacidad para generar software de mucha mejor calidad?. Porque entonces sería barato 200 euros. Podrías probarlo?.

@Habitacionamarilla Ай бұрын

Carlos, he probado con este prompt: "¿Cuál de estos dos textos es un palíndromo?: "()()" o "())(" y O1 es la primera IA que lo sabe solucionar, imagino que O1 Pro también será capaz

@LisandroSabio Ай бұрын

Qué crack Carlos, simpre impecables tus presentaciones!!!

@titusfx Ай бұрын

6:03 tienes dos buenos canales en español para hacer una conjunto quantum y el del gatito (math). Personalmente creo que SC podríamos preguntar el costo computational de un algoritmo y la demonstration de esta podrías y podría verificarlo. En cuanto a math , creo que el problema que pones es simple. Principalmente pq se puede comprobar pasando un valor. Pero lo "más difícil" es el razonamiento y la llegada de demostración de expresiones y tal. También creo que de alguna manera, mientras lo que le pases a una LLM sea específica de un área, las preguntas para el razonamiento deben ser diferentes. Lo cual sugiere que están generalizando de alguna manera, las preguntas por áreas y tienen un modelo router como el que usaban para redireccionar para los modelos.

@UltimatusVirsus Ай бұрын

Gracias Carlos por pagar y probar la IA mas cara con tal de informarnos

@NicolasFOrlando Ай бұрын

Puede mejorarse el resultado (o el tiempo de proceso) del modelo pro con un mejor prompt?

@hugoamaya6135 Ай бұрын

Justo iba solicitar que lo usaras para programar. Espero salga a la luz!!

@mariogamez4164 Ай бұрын

A este nuevo modelo le están poniendo pruebas muy difíciles, incluso a algunas personas nos costaría trabajo resolverlos 😅😅😅

@S3D8 Ай бұрын

Esto es de la noticia de ayer? De la que ya hiciste un live del doble de tiempo de la presentación?

@raulviene Ай бұрын

Podemos usar nuestros gpt con este nuevo pro? Deja subir ficheros?

@juancriolivares Ай бұрын

Si la limitación es la visión, ¿Podríamos pasar el problema a texto primero?, por ejemplo, representando la cuadrícula de Tetris con caracteres.

@danielelmuneco1994 Ай бұрын

Sería interesante que en las pruebas que contienen imágenes intentaras usar la estrategia que mencionas en el minuto 19:40 y así ver si dan una respuesta correcta

@santiagocastro9075 Ай бұрын

Sería interesante pasarle un formato FEN para el análisis del ajedrez, que representan una posicion como texto

@Carleslc Ай бұрын

He probado el ejemplo del primer problema de ajedrez usando el modelo o1 pasándole el tablero en formato texto en notación FEN y podemos descartar que la respuesta incorrecta se deba a un problema de visión, pues la respuesta que me ha dado es la misma que pasándole la imagen del tablero, ignorando que el movimiento f7+ es ilegal porque la casilla está ocupada por el peón negro y los peones no pueden capturar hacia delante. Conversación: share/6756a2ae-f1c4-800c-a68e-ae3ea17f3bfc (FEN) r3k3/1p3p2/2p1qP1Q/p7/3p4/P2P1B2/1PP2KPP/8 w q - 0 1 Movimientos propuestos: f7+ Qxf7 Qh8+ Kd7 Bg4+ Después de indicarle que f7+ es una jugada ilegal la jugada propuesta es esta: Qh8+ Kd7 Bxc6+ bxc6 Qxa8 Sin embargo la jugada ganadora del problema es simplemente: Qh8+ Kd7 Qxa8 He añadido otro comentario global al vídeo con un análisis más detallado de sus respuestas.

@Carleslc Ай бұрын

He probado el ejemplo del primer problema de ajedrez usando el modelo o1 pasándole el tablero en formato texto en notación FEN y podemos descartar que la respuesta incorrecta se deba a un problema de visión, pues la respuesta que me ha dado es la misma que pasándole la imagen del tablero, ignorando que el movimiento f7+ es ilegal porque la casilla está ocupada por el peón negro y los peones no pueden capturar hacia delante. FEN: r3k3/1p3p2/2p1qP1Q/p7/3p4/P2P1B2/1PP2KPP/8 w q - 0 1 Movimientos propuestos: f7+ Qxf7 Qh8+ Kd7 Bg4+ Después de indicarle que f7+ es una jugada ilegal la jugada propuesta es la que ya había tenido en cuenta durante su razonamiento anterior: Qh8+ Kd7 Bxc6+ bxc6 Qxa8 Sin embargo la jugada ganadora del problema es simplemente: Qh8+ Kd7 Qxa8 He añadido otro comentario global al vídeo con un análisis más detallado de sus respuestas.

@goldenbullet23 Ай бұрын

Una duda Carlos no le puedes decir tanto al modelo o1 como el pro un promp por ejemplo el del laberinto pero agregarle que piense por 5 minutos. Tratar de asignarle un tiempo de pensamiento

@RadheSarmiento Ай бұрын

Creo que así no funcionan las cosas, ya que el modelo de lenguaje no tiene forma de saber cuánto tiempo lleva pensando, puede que sí la cantidad de palabras o párrafos aproximadamente, pero no el tiempo

@Carleslc Ай бұрын

@@RadheSarmiento sepa o no el tiempo que lleva, a OpenAI no le interesa por un tema de coste que gastes más recursos del servidor de lo necesario así que esa configuración será difícil de ver, quizá en el pro sí hagan algo parecido ya que pagas 10 veces más...

@revandarth2680 Ай бұрын

Por lo que se demuestra, este paradigma es el camino correcto. Muchas gracias por las pruebas.

@productomania Ай бұрын

14:28 Me temo que no es un problema de visión, he hecho bastantes pruebas con laberintos con diferentes modelos y todos son bastante mediocres resolviendo este tipo de tarea. Compartí los resultados en este vídeo: kzbin.info/www/bejne/aH29ln58md-XpZo En las pruebas que hice para el vídeo o1-preview era mucho mejor que cualquier otro modelo, estoy ahora sometiendo a o1 al mismo benchmark para ver si es capaz de mejorar a o1-preview.

@lothe_ Ай бұрын

Creo que podría ser un problema de contexto, ya que se pierde al momento de que el modelo "piensa", al principio le pasa la imagen, luego esta no vuelve a estar en la segunda pregunta, lo cual hace más probable que no sepa la posición inicial, que de hecho es así, no tiene la posición inicial correcta de los colores (12:58) al resolver el problema (En la segunda respuesta). Una observación es que, al momento de pensar, se utiliza contexto, el cual se guarda pensamiento a pensamiento (por lo menos eso observé desde que uso estos modelos)

@pozolesasdc Ай бұрын

@@lothe_ eso es cierto, por ejemplo hay un paper que esta en un marco parecido de "razonamiento" que o1, pues como dices, primero se generan respuestas estas, de forma aleatoria eliminan ciertas secciones de la respuesta para forzar al modelo a que piense denuevo, (ejemplo dentro de un ejemplo), tienes 5 respuestas con una extension de 40 tokens estos siendo el 100%, en una de las 5 respuestas se generara el 100%, pero se eliminara cierta longitud al final, por lo cual no pasa todas las respuestas, luego de evaluarlas, de forma interna genera de forma iterativa eso, de esa forma fuerza al modelo a generar y a olvidar, con lo cual en una de esas pasadas olvida el contexto original, y como no hay una segunda pasada por la informacion de la imagen, esta pierde el contexto original completo, y los modelos al generar tantos tokens, tienden a olvidar y/o alucinar los puntos finales de la ventana de contexto, igual, en modelos como qwq que es una familia parecida la generacion de tokens al no estar escondida como el caso de o1, tienden a ser extremadamente largas, por lo cual, es comprensible, el punto seria en imagenes añadir una segunda pasada o mas pasadas por la imagen de forma automatica el modelo evalue si es requerido o no, son cosas que tendran que ir calibrando, al ser el primer modelo de "razonamiento" de imagen y texto

@lothe_ Ай бұрын

@@pozolesasdc Me gusta ese acercamiento, sabes el nombre del paper?

@pozolesasdc Ай бұрын

@@lothe_ se llama asi, esta en arxiv, Learning to (Learn at Test Time): RNNs with Expressive Hidden States y la otra es From Google Gemini to OpenAI Q* (Q-Star): A Survey of Reshaping the Generative Artificial Intelligence (AI) Research Landscape estas 2 te daran el paronama mas o menos actual de esos modelos y este ultimo LayerSkip: Enabling Early Exit Inference and Self-Speculative Decoding

@pozolesasdc Ай бұрын

esto es mas o menos una idea que me doy de la razon del aumento de la velocidad de generacion de tokens del modelo o1, el uso de la decodifcacion especulativa para el aumento de la generacion de tokens, igual este paper, trata sobre un paso mayor de la decodificacion espculativa, igual pueda ser el aumento de la infraestructura interna de open ai, u otros factores

@albertocastro3462 Ай бұрын

Yo pague por unos meses el ChatGPT, pero ahora mejor utilizo las IAs locales. Las que corren con Ollama y Open-web-UI. Utilizo el Mistral-nemo (12b) y qwen2.5-coder (14b). Los corro con una tarjeta de video RTX 3060 de 12gb y 5800x con 64gb de ram. Incluso lo utilizo con mi macbook pro m1 pro, la cual accede en red local a los modelos.

@RelaxSanctuary Ай бұрын

hola dot, queria saber como estos modelo razonan, ¿has hecho algún video explicándolo?

@JuR3607 Ай бұрын

OpenIA aplico la del sesgo cognitivo: 1. opcion mala (gratis) 2. opcion buena (a un valor moderado) 3. opcion no tan buena (costo exagerado) Por lo que ahora la opcion "buena" acaba de convertirse en "buenisima" (aumentan significativamente los suscriptores a GPT Plus)

@licelotr2131 2 күн бұрын

🤛 Exacto hermano, creo tambien que ese es el punto.

@VidalGuerrero Ай бұрын

Excelente video Carlos 👌

@deimne970 Ай бұрын

20:22 ¿Por qué lees "seres oros" cuando pone "seres oro"? He notado que haces mucho esto de poner plurales donde no los hay, como por ejemplo cuando dices "página webs" (que debería ser páginas web). En estos casos son sustantivos que cumplen la función de adjetivo, pero el número no tiene que coincidir. En 25:43 vuelves a decir "planes de pagos" que sería "planes de pago".

@juanjesusligero391 Ай бұрын

Es posible que tenga algún tipo de dislexia ligera, o que símplemente sea un deje del habla, o una "manía" o tic sin más (las personas tenemos muchas "manías" lingüísticas con detalles similares de las que normalmente no nos damos cuenta). P.D: A mí también me triggereó que añadiera la "s" del plural en "oro" XD

@deimne970 Ай бұрын

@@juanjesusligero391 Puede ser que sea eso de dislexia. Pero no es la primera vez que se lo oigo, ya llevo unos vídeos notando que lo hace, sobre todo con lo de "páginas webs".

@cosmonauta_84 Ай бұрын

También dice mucho eventualmente para querer decir finalmente. Es anglo lover

@deimne970 Ай бұрын

@@cosmonauta_84 Exactamente, lo que típicamente sería un "falso amigo".

@Efrayn Ай бұрын

@@cosmonauta_84 Lo de "eventualmente" mal usado (ya que "eventualmente" sí lo usamos), es una latinada, que a su vez viene de la influencia que tienen con el inglés. Como la muletilla ahora de "literal" en cosas que no son literales, o también el "aquí os estaré dejando esto", en vez de "aquí os dejo esto". A mí me crispan estas cosas...

@jaguarazul Ай бұрын

Independiente de si era"útil" o no; Para este momento no estoy ni un poquito dispuesta al pago de $ 200 USD/mes. 🙄 No me sorprenden tus comentarios Aunque los encuentro realmente prácticos, eso si, esperaba que el primer anuncio de OpenAI fuera otra cosa 🤣🤣 Muy agradecida, estaré pendiente de tus videos diarios 🥰👏

@soubakouh Ай бұрын

cómo se hace (o con qué editor) que se mueva su mouse así smooth en los videos? me encantaa

@br317n3r Ай бұрын

El costo de los $200 también es para el uso ilimitado, como por ejemplo para un proceso de análisis recurrente que con una suscripción de $20 podría acabarse la cuota de utilización en unos cuantos usos

@teobareaesteban7234 Ай бұрын

Justo esta esperando este vídeo, q grande!! Curras rápido jaajjajaj

@MichaelMiller-d7u Ай бұрын

Gracias por la explicación! Solo una pregunta fuera de tema: Mi billetera OKX contiene USDT y tengo la frase de recuperación. (alarm fetch churn bridge exercise tape speak race clerk couch crater letter). ¿Cómo puedo transferirlos a Binance?

@jesus26677 Ай бұрын

Muy interesante gracias por el video.

@asterlofts1565 Ай бұрын

Por favor, Dot, habla sobre la empresa Clone, de robótica, cuando puedas.

@gustavoperez5105 Ай бұрын

¿Como que "con el modelo Luz"(25:31)?🤔😅

@miqueridoprofesor2023 Ай бұрын

Gracias por los alcances. Una pregunta te agradecería me orientes , ¿ como le colocas el "X" o el "Check " o "punto dorado" en el listado de la izquierda a los distintos chats creados?

@leonidas1127 Ай бұрын

En cuestion de programacion, que tan bien van esas versiones?

@ErnestoTorres-x4l Ай бұрын

Estoy planeando pasarme a la version pro, creemos que podemos acelar proceso y fianlizar proyectos más rapido con lo que compensaria el precio y hasta generar gananacias

@joaquincanetulzurrun6555 Ай бұрын

Pensando un poco el caso de la pelota de ping pong: Jamás se le dio el contexto de si existe o no existe gravedad, asumiendo que estamos en la Tierra con las leyes físicas. Sé que echar a volar la imaginación, pero me parece interesante de análisis

@Acostavre Ай бұрын

Si se entranan con las mismas preguntas los diferentes modelos? ya no forman esos pront como parte del aprendizaje y el proximo modelo lo responde correctamente?

@VIPERBAT Ай бұрын

Buenísimo resumen y test

@Rubeeennn Ай бұрын

Sobre lo que falla: El arc (lo de los cubitos), el laberinto, el ajedrez, etc... Falla el razonamiento o es más un problema de visión? Si le dieras todas las coordenadas escritas de todas las piezas de ajedrez y su color, o las coordenadas de todos los cubos y su color, si se lo dieras todo escrito en vez de enseñarle una imagen lo haría bien?

@her2001-q4c Ай бұрын

insisten en que los modelos "piensan" pero no es asi. solo son libros interactivos, que "recrean" su contenido.

@katemusik0732 Ай бұрын

Le pasa lo mismo que a mí como persona ciega, no he podido desarrollar todo mi potencial porque buena parte de la información se comparte de manera visual😂

@mixerjdp Ай бұрын

Si te das cuenta todos esos problemas que falla tienen en comun que utilizan el "backtracking", quizá mejorando su algoritmo de evaluación puedan perfeccionar ya que parece perder información del contexto.

@Miguel-MayX Ай бұрын

Cred que es limitado de alguna manera !?

@kas_v2 Ай бұрын

A mi me da la sensación que la versión plus en los últimos meses cometía muchos más errores de lo habitual. No sé si el lanzamiento de este modelo tenga algo que ver.

@gilianskalari 9 күн бұрын

Y como lo instalo local?👀

@theantibeta Ай бұрын

Sinceramente me parece un fraude lo del o1 "normal" con lo del prompt de media noche, se supone que debería dar una respuesta correcta a esa pregunta tan fácil, siento que han limitado y al pro le han puesto un delay random para hacer creer que está pensando demás. Fraude!

@4tunoo Ай бұрын

Mi o1 pensó la respuesta durante 10 segundos (la pregunta del clima), esta fue su respuesta: En principio, sí es perfectamente posible que el tiempo atmosférico cambie de un día para otro entre dos ciudades cercanas como Madrid y Barcelona. La lluvia en Madrid a medianoche no implica necesariamente que 25 horas más tarde (es decir, un día y una hora después) no pueda hacer un tiempo totalmente distinto en Barcelona. La meteorología puede variar considerablemente entre regiones y de un día para otro. No obstante, si interpretamos la pregunta de forma literal en cuanto a la hora del día, hay que tener en cuenta lo siguiente: Si en Madrid es medianoche (00:00), 25 horas después serían las 01:00 del día siguiente en Barcelona, y a esa hora normalmente aún es de noche. Por tanto, no habría luz solar. Sin embargo, la pregunta podría referirse simplemente a la posibilidad de que, transcurrido algo más de un día, la situación meteorológica en Barcelona sea soleada en algún momento de esa jornada, no estrictamente a las 01:00. En ese caso, nada impide que, ya entrada la mañana o el mediodía de ese mismo día, el tiempo en Barcelona se presente despejado y soleado, aun habiendo llovido en Madrid en la medianoche anterior. En resumen: Climáticamente, sí es posible que en un lapso de 25 horas el tiempo cambie de lluvioso en Madrid a soleado en Barcelona. Si se considera exclusivamente la hora exacta (01:00), sería de noche y no estaría soleado por una cuestión puramente astronómica. Sin embargo, a lo largo de las horas diurnas posteriores en Barcelona, el sol podría perfectamente lucir.

@4tunoo Ай бұрын

o1 12 segundos (pregunta de la pelota de ping pong) : La pelota de ping pong ya no se encuentra dentro del vaso. Al girar el vaso 180° sin estar tapado, el agua y la pelota habrían salido de él. Por lo tanto, cuando lo sacas del congelador y lo vuelves a girar para llenarlo hasta arriba, la pelota ya no está dentro; se habría caído en el interior del congelador en el momento en que volteaste el vaso boca abajo.

@NothingHere-dm2bh Ай бұрын

Si el tiempo tiende al infinito, prácticamente podríamos simular un problema matemático que contenga la complejidad y aborde cada interacción de cada partícula conocida en el universo, dándole fuerza de cómputo y energía infinitas (?) Podría resolver y simular el universo? Siendo más realistas que impide que proporcionar fuerza de computación y mediante fuerza bruta pueda resolver cualquier problema teniendo en cuenta el gasto de tiempo.

@danielgtz.4269 Ай бұрын

Y en cuanto a la cantidad de tokens en este modelo? Podrá tener mas input que el de 20usd?

@juanpablogarcia6293 Ай бұрын

como tal puede que sea alrevez, mas bien los tokens de este modelo son mas caros porque esta hecho para respuestas con un alto tiempo de servidor, entonces ahi se paga que en realidad se utilizan menos tokens pero con mayor gasto de energia

@danielgtz.4269 Ай бұрын

@juanpablogarcia6293 ya lo revisé topa en 130k tokens, me sigue pareciendo más atractivo Claude con 200k tokens

@noyimoyi5137 Ай бұрын

por lo que estoy probando con o1, ya tiene una gran mejora al respecto. donde hace una semana se perchaba con codigos de 2700 lineas ahora mismo me esta cogiendo codigos de mas de 3800 en un mismo mensaje. por tanto, parece que tenemos una mejora de contexto que no han mencionado.

@AndresDanielPerezRodriguez-j1u Ай бұрын

Creo que el precio valdría que lo pagaran universidades. Donde cada facultad tenga su cuenta, y los investigadores se apoyen de la IA.

@XaviIntheHouse Ай бұрын

@@AndresDanielPerezRodriguez-j1u es que creo que precisamente ese es el publico objetivo, no son las personas comunes, que ya tienen o1 o gpt4o que es suficiente para muchas cosas

@KARA-IA Ай бұрын

Asi es el negocio, esto se compensa con precios ide matriculas para la eduación del futuro.

@averagefan8199 Ай бұрын

@@KARA-IA Eso sería asombroso. La educación actual se está quedando muy obsoleta con la evolución de las IA. Que proporcionen al menos una cuenta Plus o acceso a la versión Pro en todas las facultades ayudaría a compensar la subida de precios y el estancamiento educativo que se está experimentando.

@KARA-IA Ай бұрын

@@averagefan8199 Seria a la Pro, por que la Plus seria muy limitada en cuestion de consultas, la pro es ilimitada, por ejemplo propongo este escenario, facultad de medicina donde se consulta sobre toda la información de dolencias en los humanos, posibles tratamientos ultimos avances, y esto ya a nivel de los profesionales de la salud en un entorno de un hospital, Junta medica para tratar el caso especifico de un paciente donde la IA estara presente haciendo sugerencias.

@andvaribekho Ай бұрын

esperemos que no degraden ChatGPT plus . Ultimamente me ha dado muchos fallos, no me describe imàgenes, sòlo genera imagenes Dall E, el modo multimodal no, etc

@KARA-IA Ай бұрын

Ese es el negocio, siempre sucede asi, tienen que hacerlo para que de alguna manera vendan Humo de que el nuevo modelo vas mas eficiente. Y esto tiene sentido, pues los recursos de los servidores ya se especializan para la version Pro.

@comuzzivalentin3347 Ай бұрын

o1 me esta fallando en cosas que o1 preview hacia antes, la verdad decepcionante (piensa mas rapido=piensa menos)

@pedroruiz0422 Ай бұрын

La pregunta es si este es el mejor modelo del que disponen o tienen otro superior guardado para sacarlo cuándo la competencia los iguale y así mantenerse siempre en el candelero teniendo a la gente pendiente de la lucha de las IA y a la sacada de musculo de Open AI

@JuanMartinRuiz Ай бұрын

deberian bajar a minimo 50 dolares y todavía seria caro

@reinerromero7265 Ай бұрын

😄uff... Muchas gracias.

@hazkyroar Ай бұрын

Cancele mi suscripción pasada por que se me hacía extremadamente caro, imagina ahora jajajajaja

@zikodelikmix Ай бұрын

Lo que no entiendo es que si uno paga 20 dolares, teniendo el modelo 4o1, ya no existe el limite que tenia la version preview?

@JulianLasso Ай бұрын

Esta gente de OpenAI deberían crear algo como Supermaven, creería que la reventarian de forma brutal y que fuese accesible con los mismo 20 dólares que ya pagamos por el Plus.

@dennis3949c Ай бұрын

Serie bueno probarlo con una radiografía para identificar patologías

@daultebell9001 Ай бұрын

Si viniera con el modo de voz más avanzado, lo de ver en tu entorno con el GPT y te explique cosas como cuando enseñaron la primera demo consideraria esa compra...

@connordarghaoui8916 Ай бұрын

Podra hacer ecuaciones de calor?

@alexey1231 Ай бұрын

Con lo de STRAWBERRY, falta la w, no? o hay algo que se me escapa?

@RamiroDominguezAguilar Ай бұрын

Gente creo que esto lo tenia antes, ya que en mi caso había preguntas que me tardaban más de 3 minutos, pero me daba unas respuestas fenomenales, ahora no pasa de 1 minuto. Sigue siendo bueno, pero ya no es tan genial como antes. La verdad yo pagaría 40 dólares por la versión PRO, pero 200 se me hace mucho. Que si lo vale posiblemente, pero tampoco, me voy a esperar y si el trabajo me obliga, posiblemente lo tenga que pagar.

@reng7777 Ай бұрын

Que tal si le pides al modelo O1 que luego de ponerle tu PROMPT se detenga a pensar un poco mas ? Obtendrias el mismo resltado erroneo? O brindaria una respuesta correcta como el nuevo modelo PRO?

@KarelyQueen Ай бұрын

01 si es un buen modelo ahora sí te deja satisfecho

@pedrosmith4529 Ай бұрын

Incluso en el 4o, muchas veces se equivoca, se lo haces saber y te da la respuesta correcta, dando a entender que ha pensado poco....

@armandoduanydangel2750 Ай бұрын

Buen video. Felicidades. Puedes hacerme llegar el PROMPT. Gracias

@jonathanantoni5779 Ай бұрын

Es muy bueno pero sobre piensa mucho, yo uso claude para que maneje a 01, el sabe como manejarle jeje, como en este ejemplo: ¡Oye! Antes de que me envíes más código, necesitamos hablar sobre cómo estás enfocando esto. Estás sobre-pensando las soluciones con propuestas muy complejas. Ya tenemos un script que funciona bien en muchas cosas: La selección de posición de pegado El guardado de datos Los colores de los botones La redimensión de la ventana NO DEBEMOS modificar nada de eso. Funciona perfectamente. El único problema que queda es el tamaño del texto, y estás proponiendo soluciones innecesariamente complejas: Widgets personalizados Layouts complejos Frames adicionales Cálculos de fuentes Delegados personalizados ¡Todo eso es excesivo! QListWidget ya tiene todo lo que necesitamos. Es simplemente cuestión de ajustar el tamaño de fuente con un styleSheet básico. ¿Podrías mostrarme cómo implementarías esta solución simple manteniendo todo lo que ya funciona? Necesito ver tu propuesta más directa y sencilla.

@yascker Ай бұрын

El otro día se cayó por un momento el servicio de chat gpt y sentí lo mismo que cuando se corta internet

@JuanJCSantamaria Ай бұрын

Creo que las pruebas son demasiado sencillas para el modelo. Yo lo pondría a escribir el código para una simulación Montecarlo o algo similar.

@garcialopez-d4l Ай бұрын

el Kalvini de la IA grande!!!

@jobautomation Ай бұрын

Videazo! Gracias!!!

@Darporal Ай бұрын

15:10 creo que no se ha equivocado pon simplemente el laberinto al revés y ya verás

@alrimvt02 Ай бұрын

IGUAL SIGUE ESTANDO MAL YO LE TOME FOTO LO PUSE ALREVES AL DERECHO Y HASTA PASANDO DE LARGO UN PAR DE MALAS DIRECCIONES PARA VER Y QUE VA NI ASI LLEGO A LA META

@azhernan Ай бұрын

Es muy bueno el canal, felicitaciones. Vi el problema del 9.11 y el 9.8, y la culpa es nuestra, de los programadores desprolijos jajaja. Por ejemplo, la versión de python 3.11 es más grande (más actual) que la versión 3.8. Debería tener una interpretación de contexto para definir si 3.11 o 3.8 es mayor.

@grapicsrz456 Ай бұрын

Buen video, pero no estoy totalmente de acuerdo contigo. Basado en mi experiencia usando tecnología como ChatGPT y otros equipos como iPhone, veo un patrón claro: las compañías suelen ajustar el rendimiento de sus productos básicos para que las versiones nuevas parezcan necesarias. Por ejemplo, Apple hace que los modelos antiguos se sientan más lentos al actualizar el software, justificándolo con ahorro de batería, pero en realidad es una estrategia para empujar a los usuarios a comprar dispositivos nuevos. Con ChatGPT, he notado algo similar. He probado la versión premium y me he dado cuenta de que a veces, con el mismo prompt, obtengo errores en la primera prueba, pero luego, al intentarlo varias veces, obtengo la respuesta correcta. Esto me hace pensar que la diferencia entre la versión básica y Pro puede ser más una estrategia de programación que una limitación real de capacidades. Siento que estas estrategias de marketing buscan convencer a los usuarios de que necesitan pagar más para obtener mejores resultados, cuando tal vez el producto básico podría hacer casi lo mismo con ciertos ajustes. Es importante analizar esto desde un punto de vista crítico. ¿Qué opinas tú de esta perspectiva?

@Gamblingwmylife Ай бұрын

Pues o1 pro mode por diseño va tomarse más poder computacional para responder que el o1 normal, es el chiste de eso. Entiendo a lo que te refieres, pero siento que aquí no aplica, porque ya te están diciendo desde un inicio que o1 pro mode va ser mejor que o1 normal, no porque o1 normal no pueda, si no porque o1 pro mode explícitamente se va tomar más tiempo de cómputo.

@egosumqs1237 Ай бұрын

11:00 me tomo 3 minutos de pensamiento resolver ese ejercicio :U

@jajujaja-ke6jv Ай бұрын

Genial !!!! (como estrategia comercial) ... hacer que un modelo por el cual pagas 20 mangos responda un poco mas mal ... para que pagues 200 por lo mismo que antes pagabas 20... y en mas tiempo ... son unos "genios" comerciales

@RogerCorado Ай бұрын

Pero también unos cinicos

@yaserviperez2263 Ай бұрын

Esa no es la estrategia, la estrategia es que este modelo lo pondrán a 200 para medir el mercado y ver cuanto se está dispuesto a pagar por su producto, luego lanzan gpt 5 a 50 euros y boom todos piensan que es una ganga y pagan por ello

@jajujaja-ke6jv Ай бұрын

@@yaserviperez2263 Yo cometi el error de pagar 20 para ver si podria resolver unos temas basicos de desarrollo y es un asco. Afortunadamente, los Chinos avanzan bastante rapido y API Gratis (HuggingFace). ¿para que pagar por algo malo si, con buenos prompt podria obtener algo mejor y gratis?

@pochengueTV Ай бұрын

Cuando era chico jugué un torneo de ajedrez en el que había una niña de unos cinco años y que todos creíamos un prodigio. Hasta que a un amigo le tocó jugar con ella y empezamos a escuchar gritos en la sala porque la niña, contraria a todo reglamento, quería comerse el rey rival. O1 me hizo acordar a esa niña. Quizás acierta la mejor jugada, pero si indagas te das cuenta que tiene unos baches tremendos de comprensión de la posición y las reglas del juego jajaja.

@davidGA殿 Ай бұрын

La suscripción pro no solo incluye o1 pro, sino que también acceso a los otros modelos de forma ilimitada. Lo que puede ser una ventaja para gente que esté todo el día escribiéndole. Sigue sin valerme la pena para gastar tanto (muchas otras cosas me tendría que hacer para que valiera la pena xd), pero como universitario pago el plus.

@TyGerGranada Ай бұрын

He estado probando el problema matemático que has puesto en iastudio con Gemini2 y unas veces da 236, otras 237 y otras 19. Let S = {E1, E2, …, Es) be a sample space of a random experiment such that P(En) = n/36 for every n = 1, 2, ..., 8. Find the number of elements in the set {A ≤ S : P(A) ≥ 4/5} Eso, para mi, es estar muy lejos de la "inteligencia" todavía, si en este ChatGPT, pones la misma pregunta varias veces, en sesiones independientes, sin relación entre ellas, que ocurre?

@Lv7-L30N Ай бұрын

Gracias, muy bueno

@xdm0use Ай бұрын

Yo intente con un sudoku y no pudo dar una solución

@ernesto.iglesias Ай бұрын

Mentalidad de tiburón: Me voy a montar un servicio con 100 umpalumpas a los que les escribas en un chat y te responden a más tardar en 1min. Si te lo vendo como ia ¿con cuantos chocolates les puedo pagar a mis esclavitos sin que me de pérdida?

@Orador_de_roko Ай бұрын

100 no son suficientes ,y no hace falta chocolate ,le das cacao directo

@adrid951 Ай бұрын

No vale la pena 200usd, 1ero carísimo, 2do no es lo que deberia para tal precio. Yo te pago 200 usd si la IA no tuviese ningún error, literal. Saludos!

@locusruizlopez5997 Ай бұрын

Resumen, este modelo mejora pero todavía no es el GRAN salto que lo justifique para el usuario medio o empresas para sustituir gente.

@nicolasalonsosuarezrodrigu8464 Ай бұрын

Pero creería que un equipo con esta capacidad añadida puede realizar más labores que sin ella, es decir, se requiere menos personas con ayuda de la IA lo que si estaria remplazando gente, no?