ChatGPT o1 preview: il test dell'IA che "pensa"

Рет қаралды 13,438

Күн бұрын

OpenAI ha rilasciato i nuovi modelli o1 preview e o1 mini progettati per "ragionare" e risolvere complesse attività matematiche, scientifiche e di scrittura del codice. La mia demo in italiano completa.
#ia #intelligenzaartificiale #chatgpt
o1 benchmark openai.com/ind...
✉️ Iscriviti alla mia newsletter: vincos.substac...
🎓 Scopri i miei corsi di formazione sull'IA Generativa vincos.it/cors...

Пікірлер: 47

@alfadelta-d1d 3 күн бұрын

12:28 il fatto che abbia veramente capito il senso della barzelletta della mucca pazza mi ha veramente impressionato!

@user-sx4ii5vb2x 5 күн бұрын

Non ti ha mostrato il CoT della frase palindroma perché “i topi non avevano nipoti” è una frase estremamente celebre tra quelle palindrome, molto probabilmente - più che troppo facile - era già presente nel dataset tale e quale.

@VincenzoCosenza 4 күн бұрын

grazie, potrebbe essere come dici.

@DaveJ6515 4 күн бұрын

@@VincenzoCosenza e tra l’altro è quello che succede anche con gli esseri umani: uno stesso problema può risultare difficilissimo per chi lo vede per la prima volta, mentre chi lo ha già incontrato, molto semplicemente si ricorda il percorso per rispondere. Ed è un grosso confounder quando devi valutare le doti di pensiero creativo.

@CRESCOCHANNEL 4 күн бұрын

Confermo. E’ veramente il palindromo più celebre in assoluto, credo.

@alfadelta-d1d 3 күн бұрын

@@CRESCOCHANNEL ...dopo "amori di roma" ovviamente! ; )

@CRESCOCHANNEL 3 күн бұрын

@@alfadelta-d1d E "Ai lati d'Italia" :)

@bat84car 4 күн бұрын

Ho testato sonnet 3.5 e GPT4o con molti dei tuoi test, e sonnet 3.5 non ha sbagliato quasi nulla nei ragionameni, elencandomi anche i passaggi. Credo che Anthropics stia facendo un grande lavoro.

@VincenzoCosenza 4 күн бұрын

nei miei testi invece li sbagliava i miei prompt. strano

@bat84car 3 күн бұрын

@@VincenzoCosenza Un esempio sul test delle 12 sorelle con Sonnet 3.5, risposte strutturate in modo simile al nuovo modello di openai. Per rispondere correttamente a questa domanda, dobbiamo fare alcune considerazioni: 1. Sappiamo che Carla ha 12 sorelle e 12 fratelli. 2. Carla stessa è una delle sorelle nella famiglia. 3. Andrea è uno dei fratelli di Carla. Quindi, per calcolare quante sorelle ha Andrea, dobbiamo: 1. Contare tutte le sorelle di Carla (12) 2. Aggiungere Carla stessa al conteggio, perché è anche lei una sorella di Andrea Quindi, il calcolo è: 12 (sorelle di Carla) + 1 (Carla stessa) = 13 Quindi, Andrea ha 13 sorelle.

@Francesco_Ambrosino. 5 күн бұрын

Porta dei video sul reddito di base universale

@PerseRos285 5 күн бұрын

Ottimo video, tra i più approfonditi sul web! Grazie

@VincenzoCosenza 5 күн бұрын

Mi fa piacere Grazie!

@Romafood 4 күн бұрын

Complimenti per i 10k iscritti 👏

@VincenzoCosenza 3 күн бұрын

grazie!

@alfadelta-d1d 3 күн бұрын

mi spingo a considerare che le risposte ai test da te fatti possono essere considerate con un indulgente "non male" da noi, cioe' una fascia del 20% di popolazione evoluta e acculturata che sta su internet. La verità e' che su fermassi la gente per strada, l' 80% della gente risponderebbe "in che senso?" alla domanda sulla "terza parola della tua risposta" e "...e che diavolo e'?" alla domanda sul palindromo. Se poi girassi nei paraggi della stazione, mi sa che una buona percentuale di individui non capirebbe nemmeno la lingua usata per fare la domanda... Tutto cio' per dire che l' AI magari non raggiunge ancora i livelli del ragionamento umano... ma comunque sembra che nel frattempo il livello medio stia scendendo un sacco per facilitargli il traguardo!

@paolosorgente7097 4 күн бұрын

ciao Vincenzo ottimo video alla portata di tutti , mi permetto un osservazione volume microfono credo sia un po' basso , c'è chi come me nei ritagli di tempo , metro.. o traffico riesce a percepire a fatica

@VincenzoCosenza 4 күн бұрын

grazie Paolo! Ci farò attenzione

@Francesco_Ambrosino. 5 күн бұрын

quanto manca al 100% di guida autonoma di livello 5 sicura! e a che livello di guida autonoma siamo ora? Tesla ha raggiunto un livello 3 avanzato? o sono sfumature di un livello 4? (intendo l'inizio)

@FedericoGiampietro 4 күн бұрын

Finalmente qualcuno che cerca di capire quanto una intelligenza artificiale sia realmente intelligente e non quanto sia precisa. I miei complimenti, più unico che raro.

@VincenzoCosenza 4 күн бұрын

Grazie Federico, molto gentile!

@FedericoGiampietro 4 күн бұрын

@@VincenzoCosenza Dovuto Vincenzo, da una intelligenza mi aspetto che sia... intelligente. Essere precisa è già una cosa differente e non necessariamente determinate, perché a differenza delle macchine le capacità cognitive sono basate su processi deduttivi e non numerici. Mi sono iscritto al tuo canale, nella notte dei tempi mi ritrovai con un master annuale in mkt, mai usato come tale, però mi ha insegnato come rendere adatto alle richieste del mercato il più importante dei prodotti: me stesso! Un ripasso non farà male 😉

@LucaGiovanniGuelfo 4 күн бұрын

Ottimi test credo un ottimo passo avanti per attività specifiche di ricerca medica o scientifica non per giocare con le parole.

@VincenzoCosenza 4 күн бұрын

assolutamente si. Forse tra 10 anni daremo un nobel ad un'AI :)

@francescolamazza5594 3 күн бұрын

Servono a risolvere quei problemi complessi... tipo contare le lettere di una parola

@dariomartino3747 4 күн бұрын

nell'ultima richiesta 24:54 sta usando GPT 4o, non o1

@VincenzoCosenza 4 күн бұрын

subito dopo la stessa richiesta la faccio fare a o1 per confrontarle

@dariomartino3747 4 күн бұрын

@@VincenzoCosenza Ah è vero 😅

@lipranditoys 4 күн бұрын

Ho testato ChatGPT in lungo e in largo, sono un informatico di mestiere: in realtà commette frequenti e grossolani errori. Quelli che esegue non sono veri ragionamenti.

@VincenzoCosenza 4 күн бұрын

tipo?

@vincenzo42garcia75 5 күн бұрын

Ciao quando apro chatgpt non mi compaiono i modelli che compaiono a te nel video c'è tutt'altra schermata

@GiornalediSistema 4 күн бұрын

@@vincenzo42garcia75 hai la versione a pagamento?

@VincenzoCosenza 4 күн бұрын

hai la versione a pagamento?

@PhotoSlash 5 сағат бұрын

bah non mi pare cosi degno di un iscrizione mensile ancora, secondo me il livello di creatività è ancora acerbo

@stefaniaciaschi 2 күн бұрын

molto bravo

@VincenzoCosenza 2 күн бұрын

Grazie Stefania

@pyroflash64 5 күн бұрын

si chiama gpt o1 non gpt4 o1

@VincenzoCosenza 5 күн бұрын

sorry la fretta. Comunque il nome corretto è solo o1

@pyroflash64 5 күн бұрын

@@VincenzoCosenza tranquillo sono io che sono pignolo. bè a dirla tutta è vero il nome è solamente o1

@VincenzoCosenza 4 күн бұрын

@@pyroflash64 no hai fatto bene a precisarlo, fanno un casino con questi nomi. grazie

@giuseppestorelli8177 4 күн бұрын

Onestamente credo che i test che hai effettuato non siano esattamente centrati rispetto ai punti di forza di questo nuovo modello ovvero programmazione, calcolo e analisi dati. Chiaramente hai lavorato utilizzando i prompt della tua nicchia professionale e ci sta.

@VincenzoCosenza 4 күн бұрын

Si certo, non è il mio campo. Ma ho detto per cosa è il modello. L'obiettivo era capire se può essere utile nella mia nicchia