OpenAI o3 震撼发布!Arc AGI 测试得分超越人类 | OpenAI 12天「第12天」| 回到Axton

  Рет қаралды 13,483

回到Axton

回到Axton

Күн бұрын

Пікірлер
@axtonliu
@axtonliu 10 сағат бұрын
掌握 AI 时代的必备技能,加入「AI 精英学院」 👉 axtonliu.ai ▶ 「AI 实战派」Prompt Engineering 提示工程超值早鸟价课程 👉 axtonliu.ai/ai ▶ 「AI 自动化」教程 ChatGPT + Make + Zapier + 高效Notion模版 👉 axtonliu.ai/autoai
@axtonliu
@axtonliu 10 сағат бұрын
OpenAI 12天收官之作,o3 最强模型发布,可自我评估、博士级水平、Arc AGI 测试得分超越人类! 如果说人类的使命就是创造 AI,那么现在已经完成50%了。。。
@axtonliu
@axtonliu 4 сағат бұрын
勘误: 视频中提到的首席科学家应该是 Jakub Pachocki,不是 ilya 😅
@ice300tw
@ice300tw 8 сағат бұрын
居然是小沈陽一起做ending
@阿才-f1x
@阿才-f1x Сағат бұрын
看的出來研究員確實很有熱誠 而且高度專業 但對外 還是需要像山姆這樣 才不會容易失言
@jameszhang3877
@jameszhang3877 8 сағат бұрын
测试一下o3:“请以尽量简洁的方式证明一下费马大定理”😄😄😄
@lienjerry7370
@lienjerry7370 6 сағат бұрын
費曼猜想也不錯
@隱居練氣修仙中
@隱居練氣修仙中 6 сағат бұрын
​@@lienjerry7370 然後整個系統因為你的一句話而被搞當機了😅 欸,不是,說不定會因為你這樣提問而產生意識了🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉
@austinsu5838
@austinsu5838 2 сағат бұрын
這些問題都離我們太遠了,還是問點實際的問題,例如:「女友跟媽媽掉進河裡,先救誰」😂
@jameszhang3877
@jameszhang3877 2 сағат бұрын
@@austinsu5838 你太狠了,这是想虐死AI的节奏啊
@chi_huang
@chi_huang Сағат бұрын
紙寫不下 得證: 費馬大定理
@waylonwong369
@waylonwong369 8 сағат бұрын
快说是不是2000美金一个月😅,那个做基准测试的兄弟打两个广告,sam说谢谢,下一个
@陳志明-w3c
@陳志明-w3c 4 сағат бұрын
這種使用右腦的LLM(基於統計關聯而非logical rules,甚至只有自然語言才有semantics電腦語言沒有)的設計不要太期待能做到AGI.
@Bryan-bo2kg
@Bryan-bo2kg 4 сағат бұрын
符號主義😂
@vast5516
@vast5516 4 сағат бұрын
我怎么记得早就超过人类平均得分了
@O_O-lw4gl
@O_O-lw4gl 34 минут бұрын
超过是指所有人类在各个项目 但所谓的平均,是指你有相关领域的知识或者学习之后,做出来的评估数据 简单来说,我们不可能把一个没有学过数学的人,来和AI比较,而是把有学过的来评估
@hou.m.9756
@hou.m.9756 7 сағат бұрын
17:02 Sam Altman 聽到後踩了一下煞車
@axtonliu
@axtonliu 7 сағат бұрын
👍
@RolexChan
@RolexChan Сағат бұрын
At around 17:00 in the video, two tech guys suggested that they want AI to self-improve and evolve 🧬. Sam immediately interrupted them and said: 'Maybe not.' This was because he was concerned about AGI safety, Lmao.
@心能量-c8v
@心能量-c8v 4 сағат бұрын
人類即將解放了,感恩宇宙,感恩上帝。
@john1987john
@john1987john 20 минут бұрын
如果任何事都能轻易得到的世界正在发生,这是非常可怕的一件事
@hongweiwang781
@hongweiwang781 2 сағат бұрын
正当我以为openAI被google追上的时候,原来openAI藏着核弹没放呢!现在压力来到google一边了,“thinking”这种最大限度发挥模型能力的把戏,最终还是不能代替基础模型的能力。
@chenchen-c7n
@chenchen-c7n 2 сағат бұрын
怎么申请使用o3呢?
@zhangyulou
@zhangyulou 4 сағат бұрын
被谷歌和meta还有国内追的受不了,只能不断发新的了
@一片叶
@一片叶 9 сағат бұрын
留给人类文明的时间真的不多了。
@john1987john
@john1987john 19 минут бұрын
2027
@holeas44
@holeas44 41 минут бұрын
22分58秒的影片,有22分鐘重播了openai的發佈影片,主持人解釋的時間不到2分鐘?
@tensorflow5330
@tensorflow5330 6 сағат бұрын
o1 要200$/per month, o3要多少2000$, 感觉越来越远离普通人了
@ruruyee39
@ruruyee39 3 сағат бұрын
從 11:30 的圖來看成本大概3倍吧
@huangcc72
@huangcc72 2 сағат бұрын
強人工智慧到後來應該都是給企業用, 就算每個月一萬美給企業用戶用, 還是划算..
@Youngsmiles-go7jv
@Youngsmiles-go7jv 9 сағат бұрын
没有02吗?
@waylonwong369
@waylonwong369 8 сағат бұрын
一看你就没有看视频,张口就来
@Sweetdreams-e5c
@Sweetdreams-e5c 7 сағат бұрын
o1都还没来得及用呢
@myan518
@myan518 4 сағат бұрын
如果 AI 能够率先解决复杂编程和代码检查的问题,对创业者来说就是极大的福音。其他方面暂时不担心 AI 的影响。目前似乎研究的努力目标都是尽快复制出类似 AI 研究员那样的 AI,参加数学竞赛、写代码之类的,说得刻薄一点,就是目前他们在努力达成的目标都是制造出能把自己卷死的“书呆子 AI”。你看看现实世界就知道了,这种书呆子并不是真实世界里的赢家。
@lovetw001
@lovetw001 3 сағат бұрын
預先編碼難,因為真實環境要考慮硬體
@liaoleejun
@liaoleejun 8 сағат бұрын
👍请教一下:您用的是什么语音转录文本做的字幕?感觉比KZbin自带的字幕准确很多
@lovetw001
@lovetw001 4 сағат бұрын
我最近在測試GPT o1疑似開始打我臉的語氣了
@nwohocan
@nwohocan 5 сағат бұрын
3個月後被追上,沒有持續性的資金投入可以撐到獨佔寡頭
@lovetw001
@lovetw001 6 сағат бұрын
這個猛
@fluxway
@fluxway 6 сағат бұрын
太恐怖了,AGI可能真的在五年內就出現了
@_ZANDER
@_ZANDER 2 сағат бұрын
普通人還是用gemini和claude就行了 o系列模型上限雖然高 但對一般人來說實用性不高 如果o家拿不出夠強的非推理模型 用戶多半會一個個跑
@劉一一-k7x
@劉一一-k7x 6 сағат бұрын
😂工程師2025解僱潮
@hisshoney3853
@hisshoney3853 6 сағат бұрын
聽說運算成本問題還沒解決 ....
@Aji-dj8zm
@Aji-dj8zm 51 минут бұрын
程序员失业倒计时
@gl1981cn
@gl1981cn 7 сағат бұрын
基础程序员前途堪忧啊
@millerinoffice
@millerinoffice 8 сағат бұрын
真多中国人
@huangcc72
@huangcc72 2 сағат бұрын
Mark 是台灣人, 另外一個就不知道了
@pinchemeom
@pinchemeom Сағат бұрын
真多台灣人
@9263STYV
@9263STYV 7 сағат бұрын
真不知道这个博士水平是怎么定义的,如果只是做题的话,都是题库训练的,不知道处理全新问题的水平怎么样?之前的 O1亲测过,就逻辑推理而言就是个小学水平,甚至都不如。比如你给它一个全新的定义,比数学框架,它就无法按照你的定义的逻辑进行推理了。
@johnny1896
@johnny1896 6 сағат бұрын
很明顯你連影片都沒看
@9263STYV
@9263STYV 6 сағат бұрын
​​​@@johnny1896 我是没看这个影片,但是我看的是原始的发布视频。整个视频都是在说他们的 Benchmark 测试中成绩怎么高。 对于题库里面的东西,在训练后,解答并不奇怪。一个只会重已知题库里面找答案的东西也能叫博士?智能的核心以及本质是逻辑推理,而不是在已知的信息里面做索引。 原始视频里面说逻辑推理有提升,真实的情况大概就是个小学生水平,他们吹的太浮夸。之前的 O1 也是这么吹的,自己亲测就是个小学生的水平,甚至还差一点。这种作为拉投资大吹也正常,不然不会有金主爸爸继续投钱。
@jerrytu1784
@jerrytu1784 6 сағат бұрын
@@9263STYV如果你看完原影片還是這樣認為 你可能要先檢討你的英文理解程度
@9263STYV
@9263STYV 6 сағат бұрын
@@jerrytu1784 这个我就很奇怪了。我们说一个小学生和一个博士,指的不仅仅是他们掌握的知识,更关键的是他们的逻辑推理能力。给一个全新的框架,一个全新的体系,怎么在这个框架和体系下解决问题才是本质。 就这? 信这种无脑吹的人很多很多,我也管不着。朋友,而且在你发表留言前,麻烦你给出观点,自己论据,实验结果也罢,推论也罢,来支持你的结论。而不是动不动就就叫人检讨,神马的,这样很 low
@yukeith8689
@yukeith8689 6 сағат бұрын
@@jerrytu1784 的確
Sigma Kid Mistake #funny #sigma
00:17
CRAZY GREAPA
Рет қаралды 30 МЛН
How Strong Is Tape?
00:24
Stokes Twins
Рет қаралды 96 МЛН
Каха и дочка
00:28
К-Media
Рет қаралды 3,4 МЛН
Anthropic MCP + Ollama. No Claude Needed? Check it out!
18:06
What The Func? w/ Ed Zynda
Рет қаралды 8 М.
Devin just came to take your software job… will code for $8/hr
5:13
How To Make The Most Out of Your 20s
21:16
Y Combinator
Рет қаралды 297 М.
你的思考缺乏深度,很难举一反三? | 如何让思考具备逻辑?
19:06
Why Does Diffusion Work Better than Auto-Regression?
20:18
Algorithmic Simplicity
Рет қаралды 399 М.
Sigma Kid Mistake #funny #sigma
00:17
CRAZY GREAPA
Рет қаралды 30 МЛН