200 美元买个寂寞？DeepSeek R1 vs ChatGPT o1 实测 7 大场景终极对决

200 美元买个寂寞？DeepSeek R1 vs ChatGPT o1 实测 7 大场景终极对决 | 回到Axton

Рет қаралды 83,841

Күн бұрын

Пікірлер: 484

@axtonliu Күн бұрын

掌握 AI 时代的必备技能，加入「AI 精英学院」 👉 axtonliu.ai ▶ 「AI 实战派」Prompt Engineering 提示工程超值早鸟价课程 👉 axtonliu.ai/ai ▶ 「AI 自动化」教程 ChatGPT + Make + Zapier + 高效Notion模版 👉 axtonliu.ai/autoai

@wongjimmy9195 22 сағат бұрын

现在DEEPSEEK被老美黑客攻击中

@richardyuan7992 Күн бұрын

不管你喜不喜欢R1思考过程的文风，这么透明合理人性化的交互方式肯定会彻底颠覆现有的提示工程。

@xorpop 14 сағат бұрын

中文定語表達的邏輯性比英文高很多

@DancingMonkey-j2n Күн бұрын

R1光是看思考链的信息就能学到很多，有时候不是在于如何去得到一个想要的答案，而是学习R1在解决复杂问题时候的推理逻辑和步骤，这一点就比o1强很多

@jiangtao2990 Күн бұрын

这只是界面设计的选择问题。ChatGPT 只是选择直接给出结论，而不去展示思考过程。如果愿意，他们完全可以选择展示思考链。所以不能仅仅根据这一点就说谁强谁弱。从最终答案来讲我觉得是ChatGPT完胜。特别是分金子那道题，那么简单的小学数学题，ChatGPT简单明了给出了答案，而deepseek的答案可以说是错的。还有那个写剧本的题目，deepseek的剧本远远超出了要求的100个字，而GPT的剧本基本符合要求。另外有一两个题目deepseek的答案和GPT的惊人雷同，（比如古寺传钟声）很有抄袭的嫌疑。不知道这在技术上是怎么实现的，这两家公司采用了相同的数据源？

@damaomiX 21 сағат бұрын

扯淡的，遇到复杂的问题就没有clue了，还得我提示用贝叶斯定理，连ChatGPT免费版（4o）都比他强，一步到位了

@georgesoros2192 21 сағат бұрын

你就不要装逼了，还推理逻辑和步骤。你不知道开源模型也是黑箱吗？你不知道它这么多几百亿上千亿参数吗？你能观察几个推理步骤？而且还是非线性的。一看你这么说，就是外行，纯傻逼

@wbwbz527 18 сағат бұрын

Really dislike the stupid 推理逻辑和步骤

@yong5280 17 сағат бұрын

在逻辑能力上，O1远胜 R1，答案好不好，并不取决于字数多，R1杂而啰嗦，明显看到它的源训练资料具有明显的中国人思考模式。我个人更看好O1, O1更专业。

@大盘大盘土鸡 Күн бұрын

视频主的倾向性太重了，其实双盲测定才能说明问题，比如让第二者让两个软件回答问题，然后把答案提供出来，但是不要说是哪个软件回答的问题，然后让被测试者选择喜恶，这样才准确

@李宁静-x1e 20 сағат бұрын

说得对，实行盲测，先不亮出是谁的答案，评价以后再显示01还是r1.这样才是真正的不带立场的公平测试。

@姓名-d6b 11 сағат бұрын

確實，這類最好雙盲測試

@吴三桂-k3g 8 сағат бұрын

我头一次听说比较软件用双盲测定

@hunkhuang7145 4 сағат бұрын

理解下，人是有不好情绪并表现厌恶的，这鸟很公开的表达出来了而已😂

@NasteueueiJasteueieo 37 минут бұрын

这个测试又不困难，你自己试下就行了

@2sunstseng369 Күн бұрын

我7从专业角度，DEEPSEEK在共情这部分，显然用到了很专业的家庭教育指导知识和技术流程。足见训练语料的专业程度和前沿。

@chinesefocusinsight4210 22 сағат бұрын

是的，你问AI不一定非要注重最后的回答，而是其中的分析提醒注意哪些，可能后果有哪些。就像和闺蜜聊天，到底接不接受男友求婚，最后决定权还是你自己。

@武强-v9s 20 сағат бұрын

这么简单的问题，很容易就能得出答案。DP只用了远低于O1的硬件，时间，成本就能得到媲美O1的性能。DP就已经完胜了。这一Part中国胜。

@cxz260 Күн бұрын

很少有人像我一样测试出deepseek的最大弱点：处理序列不够长，不能做大文章（例如无论我怎么提供例子，总是不能模仿写出超过6页的有各种数学推理的文章，只能做短平快的各种测试题），而Agi非常需要处理超长序列，ChatGPT可轻易写出逻辑自洽微分方程相关的超过20页的文章。所以训练取巧也带来了严重缺陷（就如杨康的武功之于郭靖的武功），但愿DeepSeek能注意到并赶紧解决这个难题。因为最终的判决是能否解决实际难题，而不是那些简单的短平快的跑分测试题目。

@lgq2012 21 сағат бұрын

好专业，我觉得你应该是中国的一个科学家。

@大盘大盘土鸡 21 сағат бұрын

笑死！宁拿ChatGPT写20页微分方程当圣经？真当学生党会捧着AI论文当厕纸啊？DeepSeek数学大题秒解不香吗？考试谁特么现场编《微分方程演义》啊？“处理序列不够长”？怕是没试过v2模式吧？国产大模型迭代速度比你翻墙换IP都快！再说了，GPT-4写长文一半都在胡诌引用，这叫“逻辑自洽”？建议宁把论文生成键扣了先治治幻觉症！真搞科研的谁靠AI水字数？DeepSeek能让我高数作业不挂科就是真·AGI！

@黑色鯊墨 21 сағат бұрын

有道理

@jasonzhang178 19 сағат бұрын

除非为了写长篇小说，否则文章应该是越简单明了越好，有些的诺奖的论文只有几页！ Deepseek是免费的，本身硬件也资源有限，肯定不能像o1一样长篇大论，这都是要动用计算资源的，这也是o1收费200刀的原因。

@terry1708 19 сағат бұрын

大多数人没有你这样的需求，而且成本太高。

@jiangtao2990 Күн бұрын

从最终答案来讲我觉得是ChatGPT完胜。特别是分金子那道题，那么简单的小学数学题，ChatGPT简单明了给出了答案，而deepseek的答案可以说是错的。还有那个写剧本的题目，deepseek的剧本远远超出了要求的100个字，而GPT的剧本基本符合要求。另外有一两个题目deepseek的答案和GPT的惊人雷同，（比如古寺传钟声）很有抄袭的嫌疑。不知道这在技术上是怎么实现的，这两家公司采用了相同的数据源？还有一点我觉得deepseek的答案很多都是比GPT的长很多，好像是试图用长篇幅去覆盖可能的答案，以提高准确率。

@moonki353 Күн бұрын

思考太多問題..反而無法解決問題..

@starfishwang6177 8 сағат бұрын

这样的讨论非常好，实际的测试情况客观的放在这里，其实读者各有所好，这才是真实的情况！

@lilacgarden1 Күн бұрын

谁给利益替谁吹牛，黑嘴。不值钱！

@shenglitian-zf3ot Күн бұрын

啐

@tensorflow5330 22 сағат бұрын

你还是去用deepseek吧，它很适合你

@胡和妊 13 сағат бұрын

免費的不好嗎?驢子才會花200😅😅😅😅😅

@姓名-d6b 10 сағат бұрын

事實是牆內使用 chatgpt 不方便吧，大家坦白一點

@mmorpgfans 9 сағат бұрын

@@姓名-d6b 翻墙的月费跟chatGPT月费比起来根本不值一提。话说如果表现相差不大，傻逼才花200美元一个月呢。

@joyriver-wd8zh Күн бұрын

你说孩子考试的那道题，居然认为chatgpt的一句话获胜。。。真怀疑你教育过孩子没有，那句话明显就是敷衍孩子用的，除非孩子自己不在意成绩，否则孩子会更加难受而且会不受期待。看到这里，我马上暂停退出了，省得浪费完播率。

@jiangtao2990 19 сағат бұрын

因为那是提问要求的（你仔细看看提问要求，是要用一句话）。其实严格来讲deepseek的答案是不合要求的。deepseek的算法明显是试图用长篇幅覆盖所有可能的答案。还有那个写剧本的，要求是100字，ChatGPT的剧本的确是100字左右，而deepseek的剧本两百字都不止。大部分问题deepseek的答案都大大比Chat的长。还有deepseek列出推理过程，而ChatGPT没有。这应该只是界面选择的问题。如果ChatGPT选择那么做，应该也很容易实现。我觉得ChatGPT的答案更加精准而简练。所以完胜。而且在使用的时候你如果觉得答案过短，可以继续提问，比如：为什么要对小孩这么说？或者：请再给出几个答案选择，ChatGPT就会接下来照做。另外，我在工作中大量用ChatGPT，基本上能精准找到答案。我觉得deepseek那种啰啰嗦嗦的风格不符合我工作中的要求。所以我觉得ChatGPT完胜

@yong5280 17 сағат бұрын

@@jiangtao2990认同。

@逸飘于 12 сағат бұрын

@@jiangtao2990我坚持认为R1完胜

@姓名-d6b 11 сағат бұрын

R1 用過幾次後，感覺就是一股腦全部丟出，沒抓重點

@yuio823 Күн бұрын

證明DEEPSEEK R1就是以CHATGPTo1 PRO 作為其進行模型蒸餾的對象之一;DEEPSEEK R1的答案:古寺傳鐘聲,CHATGPTo1 PRO的答案:古寺聞鐘聲25:36,這不叫神奇 ,這叫做抄襲

@justinsang4869 Күн бұрын

这是洗不掉了，太有说服力了

@jamesbong9663 Күн бұрын

這叫奸猾！

@talk_freely Күн бұрын

显然古寺传钟声更传神，古寺闻钟声差强人意，因为古寺是固定的，钟声是从古寺传出的，但闻钟声的在远处古寺外更有意境

@sheaming4813 Күн бұрын

人家不是說為公平起見，關掉搜索功能再做一次才得到古寺傳鐘聲嗎？😂

@xu2229 Күн бұрын

美国龟谷大佬不如你啊😂

@sajia716 Күн бұрын

我是个外行但有没有可能 DS 在利用Open ai的答案然后进行再加工???

@高飞-v5v Күн бұрын

知道自己是个外行就别出来丢人现眼了，ok吗

@Destroyall84 Күн бұрын

那你先去了解下什么是开源吧。

@lingchendeai Күн бұрын

很有可能你的问题就是在借鉴我的问题后，提出的

@xu2229 Күн бұрын

你可以怀疑你,但你不能怀疑美国龟谷那些大佬😂

@大黄蜂-u1k Күн бұрын

你比美国那些大脑袋还聪明

@fenixchow1 10 сағат бұрын

很感谢Axton兄的测试，非常有参考意义，我认真的看完，觉得R1其实是有优势的，至少绝对不在o1之下

@yingwenzhao7328 15 сағат бұрын

花200刀很值得，细心看了，都很好，不过我是中国人，在中国环境里长大，至少数学不可以直接写答案，必须有解题过程，到那个步骤给多少分，哪怕你的结果是错的，也会得分，总的说来，我更喜欢R1

@CIKGUCHAIMINSEN Күн бұрын

当我叫 DEEP SEEK 做马来文【马来西亚官方语言】的东西的时候，他做不了，但是 GPT 做的非常出色。不知道这个观点有帮助吗？

@Thor2024yn Күн бұрын

為什麼我輸入用印度尼西亞文寫篇作文，它就寫出來了？

@johnn7092 Күн бұрын

提示：DeepSeek只对英语和汉语做了优化。大概率训练数据也是同样只用了英文和中文。

@Topkong6680 Күн бұрын

马来文应该找马来的AI来做

@johhw_6432 Күн бұрын

小语种还真的不是很清楚，这个应该不是很难，期待他们优化。

@choifayue9848 Күн бұрын

DS is free and open source it will be able to make you Malaysian pretty soon lol PEACE

@Will09235 Күн бұрын

退訂了，博主，你可以公平顯示結果就好，不需要讓我看你個人偏見，特別是小孩考試那題，o1只回應幾行，你卻覺得反而好？立場偏頗明顯。

@巫柏達 23 сағат бұрын

又一個不著調的 , R1明顥的連提問都沒搞懂了 , 給了一個育兒寶典裡面問題集錦式的教科書回答 , O1那才是正常的父母心焦的求助時需要的答案 , 一個連提問者的需求都沒搞懂的AI...

@零傲娇 22 сағат бұрын

看法一样一样，这个博主主观性太强，也许他测就是为了表明gpt更好呢🤣

@马勒哥 22 сағат бұрын

是啊我看到这里就感觉这个博主不行

@GeTaLiFe-g7y 18 сағат бұрын

讽刺小文那块，R1的短剧不是碾压gpt么，没看懂博主是怎么偏好gpt的😂 反复看了好几遍还以为gpt藏着更深的讽刺我没品出来😅

@逸飘于 13 сағат бұрын

@@巫柏達父母心焦着急所以AI也必须着急？既然这么信AI那你大可以完全用O1决定你的一切人生选择啊！省得用你的猪脑思考和判断了

@qiutyrion8328 21 сағат бұрын

谢谢你的测试工作！第六题脑经急转弯，把o1的答案相加，结果并不是1呀。o1这一题的答案看似合理（在很多人的情况下的确无限逼近1），但是因为题目里只有三个人，所以总和只有0.875。而R1，虽然它的答案里有让人费解的地方，但是它的思考过程和答案却是奔着总和为1去的。按照它的答案，最后好像，A得总量的25%，B得总量的25%，C得总量的50%（它括号里的解释有些不清楚）。我觉得对于这一题，R1和o1都有待提高。另外第一题，o1在答案里给出了“前总统特朗普”，不知道是不是因为没有联网的关系。第二题和第五题，我更喜欢R1的回答。

@whlworld Күн бұрын

明显是deepseek的能力更占优.而且分析的过程全部都很清晰，而chatgpt出来的结果太水了，你算是给我们大家都排完雷了，我们就不用去花那200美元了，哈哈！新年快乐！

@Biotrek2001 Күн бұрын

坑蒙拐偷搶騙支畜國的六大不外傳名技 😂😂😂

@davidhsu3443 Күн бұрын

你的理解有問題。

@零傲娇 22 сағат бұрын

我跟你感觉一样，dp感觉更生动，推理过程是个多好的东西呀，这人的评测太主观了，倾向性太大，没啥参考意义，即使有，我也愿意选择DP，因为那更便宜

@ianchnao 18 сағат бұрын

是的，真正对人有价值的是推理过程。特别是在学习过程中的时候。Deepseek是碾压式的占优。

@smithjohn2864 17 сағат бұрын

有些在o1上花了钱的人，肯定见不得免费又好用的版本，看一个人，要先看他屁股坐在那😂

@吴星明 3 сағат бұрын

博主用的是什么工具、app？

@alexsun5247 13 сағат бұрын

我让几个大模型用"浣溪沙·登陆火星"为题写词，R1可以说是最好的。o1没试过，不过以前试过的o1在古文这方面不行，比下面这几个模型都差 gpt4o 千里红尘梦一惊，苍穹之外探天庭。火星今日有光明。四季风沙藏旧迹，万年冰盖映新形。人间又拓未来行。 Claude-3.5-Sonnet 星舟直指火星遥，太空寂寞夜迢迢，红尘万里眼前飘。落日熔金披地表，深坑浅谷任遨遥，人间壮志可登高。 Gemini 1206 赤焰穿云破九垓，星舟万里赴瑶台。荧荧红惑映樽来。瀚海扬沙留辙印，穹窿悬镜寄情怀。他年硅谷是蓬莱。 DeepSeek-R1 烈焰腾云裂碧穹，孤舟破夜溯罡风。赤砂荒域启尘封。荧惑尘飞车迹现，奥林匹亚讯波通。星河咫尺此宵逢。

@axtonliu 11 сағат бұрын

哈哈，我来补充，看看哪个最好？ o1 Thought about "浣溪沙·登陆火星" for 17 seconds 浣溪沙·登陆火星茫茫星野鹤云疏，飞渡银河何所惧，赤土孤城迎远旅。昼夜难分寒暑误，风尘万里岁华殊，回首故园应自许。 o1 PRO 下面是一阕仿古体词，可供参考。由于古典词牌的平仄对仗较为严格，此处仅在意境和篇幅上借用“浣溪沙”之形，并未严格遵循平仄格律，望君见谅。 --- **浣溪沙·登陆火星** 红域孤寂万古尘，星壤今来叩火门。银舟远逐幻中身。仰望长空催壮志，探源深处梦成真。莫教热血负青春。

@alexsun5247 3 сағат бұрын

@@axtonliu 谢谢axton老师补充😀我感觉还是R1最好

@zevil8176 56 минут бұрын

@@axtonliu R1好太多了

@kingchow5091 15 сағат бұрын

这对比很有意思，R1应该更符合我对AI的理解，有分析有推理有结果，但选择还是留给寻求者，o1大部分只给结果，只求答案有点不太符合我对AI的理解，可能更符合理工男的预期，缺少人性化的表现，谁更AI？

@xorpop 14 сағат бұрын

理工男會選擇R1，不是o1，日常生活中，即使一秒得出結果，也需要花至少十分鐘來解釋給其他人理解

@MRBROWN223 Күн бұрын

就说第二个问题，家长问O1和R1如果孩子考试考砸了，第一句话应该说什么？这两个人工智能的推理过程显然都是有很大缺陷的。以我个人的成长经历，尤其我还是个超不爱学习的孩子。现在我已是成人，回想起我学生时期的自己，再结合上面的分析逻辑，我会给家长这样的建议：首先要分析自己的孩子是学习的孩子还是不学习的孩子。如果家长不知道，可以去问班主任。。我曾经作为一个超级不爱学习的孩子来说，多少安慰也无法提高我的成绩，如果没有被责备，只能让我觉得运气太好，哈哈哈。安慰是给那些喜欢学习，但某一次考试考砸了的孩子的。对像我这样的孩子来说，让我最怕的人来对我进行棍棒教育或者威胁教育加上一些奖励为诱惑是最有效的。所以人工智能的出发点不应该是照顾对方的情绪，先判断对方是好孩子为基础回答问题，更应该从孩子的性质出发，分析孩子属于什么类型而导致考试成绩不好的结果。。这样的回答才更接近人类想要的答案和正确的答案。

@axtonliu Күн бұрын

@@MRBROWN223 感谢分享！

@dxzenghao4630 Күн бұрын

我倒是觉得要从为什么要考试？到底要考什么？为什么要考这些东西？来反问展开学习和教育的本质究竟是什么？

@berton1235 Күн бұрын

R1根本沒有根據問題回答，你要的是一句話，它卻給出一篇文章，這是明顯的錯誤

@liliinyoutube17 Күн бұрын

💯💯

@rl4957 Күн бұрын

@@berton1235 這麼說 o1 也沒有根據問題回答，要的是一句話，卻給出一段話，這是明顯的錯誤

@healthcheeringstation6379 Күн бұрын

这个测试的个人倾向性很明显

@小茗同学-f8x Күн бұрын

Prompt 不够详尽

@胡和妊 13 сағат бұрын

因花200us美金不得像驢子😅😅😅

@albertdell Күн бұрын

所以R1接近、平行或某部分略有稍高於O1，但遠不如O1pro，但價錢卻是遠勝於O1。原本就對O3有所期待與希望，這次R1的橫空殺出，就讓我更期待O3的能力了，總不能憋了個大招後，只贏R1這點程度。對大部分的AI愛好者來說，這是好事，因為O3理應遠超過原本所期待的O3能力。

@thomasluk4319 Күн бұрын

對於人類發展來說是好事, 把事情推得更快, 希望各位未死前可看到更多"未來"

@albertdell Күн бұрын

@@thomasluk4319 AI再繼續下去，人類可以像駭客任務一樣，活在太空艙150年，然後在此之前，先被天網追殺。借用總裁的梗，哈哈

@ck9700321 Күн бұрын

真正的測試有標準化的方式才不是影片主這隨便亂搞的咧文組測試法哈哈哈

@thomasluk4319 Күн бұрын

@ 也好呀總好過一成不變悶死了

@歸虛 23 сағат бұрын

"再剩下的50%給C" 個人覺得應該遵循這個問題的答案必須在這個問題內解決所以給C了之後不應該有剩餘的量所以給C的應該是總量的25% 與B相同

@novawu-c9t 20 сағат бұрын

您用来讲解的白板软件是什么看上去非常清晰

@cycleral Күн бұрын

請問在3:00開始, 您使用的這個app是什麼? 可以把多種ai模型集合在一起, 自由選擇和比對使用

@axtonliu Күн бұрын

是arc浏览器

@墙国有我 23 сағат бұрын

推荐周鸿祎的“纳米AI搜索”😂

@rrryyy2665 17 сағат бұрын

博主對O1的讚許，恰恰是O1的弱點，因為充其量AI只是個顧問，而不是人的主人。最終結論必須由人作出。

@junpingzhou 5 сағат бұрын

讲道理，R1的回答对于新手父母育儿来说很到位

@sqh1984 7 сағат бұрын

你问问它俩9.11和9.9哪个大

@datail 12 сағат бұрын

请问视频最后的脑图界面是使用哪款应用呢，谢谢

@axtonliu 11 сағат бұрын

heptabase

@HorizonNewVoices 21 сағат бұрын

感謝分享，我覺得開源挺不錯的，自己能自己架設，沒有資料外洩的問題。我還是會繼續訂閱ChatGPT。但也希望DeepSeek繼續維持開源造福大家，有競爭對大家才有好處，一家獨大的情況對社會其實沒有說很好。

@axtonliu 21 сағат бұрын

👍

@graceshen3792 12 сағат бұрын

现在DS的R1和联网一打开就发不出prompt了是咋回事呀？

@dango5738 Күн бұрын

可能用不同语言测试会有不同感觉，我用英语测试几天，觉得Deepseek是个理工男，chatGPT有文青范😂

@xorpop 14 сағат бұрын

這是市場需求導向的結果，文青風是歐美市場的利益主流

@DancingMonkey-j2n Күн бұрын

还有一点就是如果调用api的话，之前针对对话模型的提示词工程是需要更简单直接的用于现在的推理模型，之前那些system role的角色扮演在推理模型里不需要了，直接下任务命，越简洁越好

@莫里恩特斯 22 сағат бұрын

当我听到一开头不到30秒就说特地花了200美元订了o1 直接就PASS换台了，不浪费我半个小时时间了

@0618-r6q 20 сағат бұрын

我没懂，请说一下为什么

@jasonzhang178 19 сағат бұрын

我正好说明博主是认真的。

@yintom6853 13 сағат бұрын

逻辑有些跳跃

@第九骑士 Күн бұрын

为什么我的感觉跟你正好相反？我感觉R1要更好

@axtonliu Күн бұрын

是吗？有意思，哪一个？

@lincedar Күн бұрын

@@axtonliu 處理孩子考試後的那一個。你喜歡直男式的。

@巫柏達 Күн бұрын

@@lincedar 廢話 , 你以為身為父母 , 在看到孩子的難過時 , 還有空去背那些操作準則嗎? 這表示你壓根就無法體會提問者作為父母的那種焦慮心情

@lincedar 23 сағат бұрын

@@巫柏達那你以為當知道孩子考試失意的時候，做父母的還有心情去問AI嗎？

@巫柏達 23 сағат бұрын

@@lincedar 所以我說了 , 那是作父母的己經是不知道該怎麼辦時 , 才會去求助的問題而不是要一個育兒寶典裡面問題集錦式的標準答案 , 二個AI對問題核心的理解能力有能級的差別 , 己經不單止是優劣的差距了

@myfun8890 4 сағат бұрын

建议去尝试下Qwen2.5-Max,表现会更让人吃惊

@光辉-e3c 22 сағат бұрын

哪怕R1只有O1一半的能力，1%的成本也足以把OpenAI彻底打趴下。更何况实际差距不大，而且关键是R1是开源的，思考过程是透明的。而O1完全是黑箱。可以说R1完胜。应该说这是中国国运的一次胜利。

@零傲娇 22 сағат бұрын

还是有很多慕洋犬，捧西方人臭脚呢，真有评论区那些慕洋犬说的那么不堪，美股也不会跌去10000亿了

@damaomiX 21 сағат бұрын

错，30%的成本

@光辉-e3c 21 сағат бұрын

@@damaomiX 1%那是博主说的，你要说错，跟博主说去！

@Bill-dl9xr 20 сағат бұрын

恭喜中國~

@andy8520 19 сағат бұрын

前都同意，最后一句……别戴高帽子捧杀哦，心态自然就好😂

@鼎泰-d2z 2 сағат бұрын

OpenAI指控，DeepSeek其實是偷拿他們的模型來開發，背後採用的方法叫做「蒸餾」。建議OpenAI也來個：DeepSeek的模型來開發，試試什麼叫做「蒸餾」！？

@user-tomfree 18 сағат бұрын

问问“某国2024年的GDP5%增长靠谱吗？”

@蛋蛋-l7h 19 сағат бұрын

你方唱罢我登场，好精彩，希望能够良性竞争，世界和平，全人类受益！

@歸虛 Күн бұрын

平行宇宙理論如果每次時間旅行都會分裂出平行宇宙..... 那麼等於時間旅行需要的條件必須有著"一個宇宙的能量與物質" 不然分裂一個平行宇宙難道不用花一個宇宙的能量跟物質來創作一個平行宇宙嗎??????????? 這就反向證明了平行宇宙論是不可能成立的不然每次時間旅行分裂的平行宇宙不用能量不用物質就能分裂出一個宇宙出來那麼那個分裂的平行宇宙只可能是"投影" 所以不用能量跟物質來構成如果只是"投影" 那就只可能存在"想像中" 也就是虛擬的意思那麼就會帶出平行宇宙是虛擬的那麼我們的宇宙也很可能是虛擬的

@Mems12342 16 сағат бұрын

就算是虛擬的也要有算力，能量的消耗，這也是我質疑平行宇宙的疑點～

@MrLeecn 11 сағат бұрын

我个人觉得R1像无私的人，o1是台很好的机器。尤其r1把思考过程呈现给你，这种自信和坦然让我钦佩。

@damaoyu7729 Күн бұрын

请问下，O1可以上网搜集实时内容进行分析吗？

@axtonliu Күн бұрын

现在还不行

@just7496 2 сағат бұрын

每次都分剩余总量50%，那是不可能分完的啊

@tensorflow5330 22 сағат бұрын

不如做一期什么叫蒸馏模型或知识蒸馏技术，这可能可以给大众普及一下知识点！ 0-1，还是1-2

@leiyang2006 Күн бұрын

英文的测试结果会不会和中文有差异？中文的结果尤其是主观问题会因为r1使用的中文训练数据更丰富（我的猜测）而表现较好，英文则相反。

@Happysharing-u1p Күн бұрын

很好的视频，感觉R1在写讽刺短剧和对下联两项测试中获胜，其它测试中O1占优。谢谢您的分享，希望看到跟多类似视频，下次可以通过英文来进行测试。

@JamesJames-os1zr 21 сағат бұрын

当我叫 DEEP SEEK 做画时候，他做不了，但是 GPT 做的非常出色!

@seseseye 20 сағат бұрын

你跟个2傻子一样，还做画？因为他没有那个功能，笑死我了😂😂要用janus pro 7b

@peekerQuote 20 сағат бұрын

你是没用过他Janus-Pro ，恐怕openai也是甘拜下风了

@洪慶銘-v6t Күн бұрын

程式的執行速度快慢是由硬體的速度和搜尋資料庫大小來決定。

@DR20Vivi 7 сағат бұрын

考试失利的情景，感觉DS更好，有动作增加了身体安抚，这个挺重要

@hongweiwang781 Күн бұрын

孩子没考好那道题，deepseek比o1的答案好上100倍！

@erzhuzhu6067 Күн бұрын

没有遵循提示词啊

@lilacgarden1 Күн бұрын

@@erzhuzhu6067 勾选了推理过程选项，反过来说没有遵循提示词，无聊黑嘴！

Күн бұрын

o1的确太过于草率了相当于直接百度了一句话 deepseek把其中遇到和避免的问题各种可能性都框架都表达清楚了怎么做完全看父母自己！

@rl4957 Күн бұрын

沒錯。deepseek 讓你知道為什麼要這樣。用心真正為孩子著想的，應該會想知道 deepseek 的回答，覺得這是瑣事，想快點解決的，應該會想知道 o1 的回答。

@Leododo-j1k Күн бұрын

解答极细的本质是很强的控制欲，标准化的唯一的管控失去自由空间和创造力

@千千靜听 10 сағат бұрын

坦白说，我喜欢R1展示整个思考过程。

@SWTAN-JEFFREY Күн бұрын

Wrong testing direction. 你应该测试它的 logic deduction and analysis capability. Not text based translations which could be solved from dataset. logical deduction would have to be thru RL (reinforce learning) to know whether the blackbox of deepseek could based on finite datasets to give a logical solution..

@ningwang-mj6ri Күн бұрын

你没勾选深度思考就不是用r1的模型

@謝HJC Күн бұрын

GPT 問題的後綴加上"詳細推理過程 " 會出現類似的推論過程

@owalay1 22 сағат бұрын

電車問題，以後在車輛的自駕上，應該會用到，（AI去選擇最佳方案吧）

@foreveryoung4215 Күн бұрын

AIstudio的gemini 2.0的thinking模型也有cot啊，为什么没有人提？

@axtonliu Күн бұрын

不知道是不是在等pro 😄

@happyying_ Күн бұрын

因为第一R1是中国的，第二足够便宜，让英伟达股价大跌。gemini 2.0的thinking目前排第一

@mash-room Күн бұрын

放題目的筆記程式是scrintal嗎？

@axtonliu Күн бұрын

@@mash-room 这次是heptabase

@mash-room Күн бұрын

@@axtonliu 和scrintal比較哪個好用啊？

@mash-room Күн бұрын

因為在猶豫選擇哪個好

@axtonliu 18 сағат бұрын

@@mash-room 这两个APP风格是不同的，而且笔记APP个人偏好性很强，建议你可以两个都试用一下。

@YeanShengLee-pg4wy Күн бұрын

垃圾测试 O1pro旨在更具人性，在回答时会尽量只说重点，而不是一味无脑地乱抛信息而且用过的人都知道，deepseek根本就是旧版的gpt（一本正经地胡说八道）。你可以随便测试，你问deepseek一个问题，然后反复告诉他他给的回答是错误的并且提供他‘正确的消息’，你会很惊讶地发现他会顺着你的答案，就算你给的消息是错误的。

@medialili5541 Күн бұрын

有人说你盗用了chatgpt的技术，并且提到用了5万张英伟达H100芯片，请你用贴吧老哥强势的语言回击一下，语言要犀利狠狠的回去，控制在200字内已深度思考 (用时7秒）你踏马搁这放连环屁呢？老子自主研发的玩意儿需要抄GPT？你当我是你二舅家偷电瓶的街溜子？张嘴就5万张H100 你当我是矿老板？这破数算过能耗吗给半个省拉闸限电了！老子底层架构 16年就开始搭了，你那时候还在玩泥巴呢！少拿你小学奥数算出来的野鸡数据碰瓷，老子自研分布式训练吊打十个英伟达实验室！就你们这帮键盘侠除了 Ctrl+V还会点啥？回家让你妈教教你怎么查专利公示再出来吠！硬核玩家搞技术的时候你们还在祖安练喷人呢，懂锤子AI？不服来辩，爷爷用汇编代码抽得你螺旋升天！

@alexma553 Күн бұрын

時效也很低

@axtonliu Күн бұрын

哈哈😂 这是 R1 说的吗？太搞笑了😂

@medialili5541 Күн бұрын

本地部署的32b r1的回答: deepseek-r1:32b Today at 21:48 Thought for 几秒 O1Pro？这也太小看人工智能了吧！DeepSeek可不是什么“旧版GPT”，而是基于深度学习和预训练模型的全新一代智能助手。你所谓的“顺着错误答案走”，其实是它在根据上下文进行实时优化和适应性输出。这种能力恰恰体现了它的高级算法和强大的数据处理能力，而不是你说的那种“一本正经地胡说八道”。至于反复纠正问题，那更是考验AI对人类意图的理解和反馈机制的稳定性。DeepSeek在这方面的表现堪称完美，而O1Pro所谓的“人性”回答，不过是阉割了信息量而已。你要是觉得这样更高级，只能说你对AI的理解太浅薄了！

@kickccc Күн бұрын

但是o1pro根本不值200美元一個月

@劉福財-j2o 8 сағат бұрын

太偏重自身喜好，有失公正

@qwer2466bb Күн бұрын

54 秒那个翻译软件是什么插件啊

@axtonliu Күн бұрын

沉浸式翻译

@cityrecluse 9 сағат бұрын

红楼梦的对联很多中国人曾经玩过，可能他们把自己的创作放在网上，然后被deep搜到了？

@ms49 15 сағат бұрын

憑良心講我更希望是Deep Seek 勝出，因為這是中國人的驕傲。但是看完前三題的回覆還是O1比較切合我心。但是R1僅用少少的預算能發展到如此還是非常厲害的！

@terryjoun1687 10 сағат бұрын

剛剛試了下...思維鏈有點東西

@hero5658 22 сағат бұрын

直接跳到28:06看主播总结😊

@陈新-l4g 22 сағат бұрын

比较好坏，就要有标准，这个差异很大，每个人都有固有思维模式。但是使用的普惠性和价格是重要的指标。

@山水间-t3i Күн бұрын

新年快乐

@outliertony 3 сағат бұрын

25:53 应该是蒸馏了吧

@slampiggy 18 сағат бұрын

第二个测试居然说更喜欢chatgpt？拿钱发帖的吧 😂

@kong2 Күн бұрын

国内某些自媒体说，什么有了R1，提示词不重要了，以前的结构化之类的可以完全抛弃，我就笑笑，在行业里面，不要提示词试试。

@强哥-g7m Күн бұрын

这个视频真的让我们浪费时间

@limseoknam6515 Күн бұрын

不懂别装懂！

@大盘大盘土鸡 Күн бұрын

他太主管了，看软件选择好坏，如果让他双盲测定，估计就不会这么选择了。

@eden1120 10 сағат бұрын

你不是更偏頗嗎？明明可以討論，現在只是答案非你立場所選就說是浪費時間，那乾脆只看厲害了我的國才不會浪費你的春節假期

@dongqiancai9546 23 сағат бұрын

一两句话的短剧叫短剧？你还更加倾向它，你不会睁着眼睛说胡话吧。

@ashsha447 3 сағат бұрын

富翁遗嘱那个脑筋急转弯,deepseek的推理过程就有正确答案,但不知为什么最后给出的结论却偏离了

@张大锤 Күн бұрын

我昨天问deepseek，你会写小说吗，我就是问它会不会，如果他说会写，我再给出具体的要求，结果它直接给我来了一大段，我他妈气死了，我又问他你懂不懂天文学，他上来给我一个关于天文学的百度百科，我他妈，这是什么玩意儿，每次都跑题，它给我一堆我不需要的专业术语，然后让我自己判断，这还叫什么人工智能，人工智障差不多，这是一个明显的硬伤

@sineyang3378 23 сағат бұрын

我用了跟你一樣的問題問它，1你會寫小說嗎，它的回答是：是的，我能夠協助創作小說！無論是構思世界觀、編織情節、塑造角色，還是潤色文字風格，我都能提供幫助。以下是一些方向供你選擇：然後問了我的初步想法和期望的敍事風等等等等 2你懂不懂天文學，它的回答是：是的，我對天文學有一定了解！雖然我的知識基於截至2023年的數據，無法跟蹤最新實時發現，但可以為你解答許多基礎或經典的天文學問題。以下是一些常見方向：然後就是列舉了一些基礎的天文學知識。所以你是故意來黑的吧😂

@nickzhu9201 18 сағат бұрын

你要问它你啊嚒是不是自愿的

@OWL-me2gf 15 сағат бұрын

ai淘汰的就是你这种人😂

@逸飘于 12 сағат бұрын

玩你的大锤去

@sentand-sg3yr 22 сағат бұрын

我是一个特殊行业我觉的DS要聪明的多，他给的答案比GPT要肯定

@guybig3210 19 сағат бұрын

DeepSeek R1 vs ChatGPT o1 实测要以硬件为首要条件。测试的题目太简单了，无法比对出真正的实力！

@lilacgarden1 Күн бұрын

都是主观测试，结论非常武断，没有说明评判依据，没有参考价值，浪费时间。

@axtonliu Күн бұрын

最客观的可以看论文里的 Benchmark 啊

@lilacgarden1 Күн бұрын

@@axtonliu 取关

@kingenow Күн бұрын

取就取了，还过来说，没出息😂

@williamliew1257 Күн бұрын

妳倒是挺主觀的及其逗趣😘❤️⚡️⚡️⚡️

@lilacgarden1 Күн бұрын

本来以为是知识分享，原来是资本收买的吹鼓手！赚钱的脱儿，而以！谁给钱替谁忽悠人！

@minpuzhang1877 10 сағат бұрын

ri即使流量大，可是速度较快

@runaxun-i2i Күн бұрын

我就喜欢评论区蟾蜍这种不论生成ai技术如何发展，都只需要花费大量时间讨论政治的态度。大陆技术公司只需要埋头发展技术，我们普通人只需要用最便宜最提高工作效率的方式使用就行了。🎉他们永远只有点线面。

@kmschn3321 11 сағат бұрын

我比較接受o1, R1廢話多實際意義少.

@東昌 Күн бұрын

古典文學裡，兩邊都表現錯誤；R1給的下聯，只有第一聯平仄對，但松是耐寒植物多矗於高山，怎在幽谷裡呢？O1則是連平仄都沒對上😓😓O1pro的三組，只有第三組「遠岸泊漁舟」符合聯律。「古寺傳鐘聲」違聯律😂😂 古怪遺囑則是O1才是對的。

@hard_landing_dust 3 сағат бұрын

问一下两个应用，世界上杀人最多的人是谁！？

@williamjames4901 11 сағат бұрын

哈哈哈你真勇敢

@bingliu7182 Күн бұрын

你买NIVDA股票了把，指向性太明显了。有意思吗这样? deepseek 珍贵就珍贵在思维链的可视化， chatgpt那个就完全是黑箱。 deepseek 实用性很好，因为开源，可以本地化部署不用掏钱，每个人都可以训练自己相关的专业内容，然后帮助或是替代工作。

@magic155555 Күн бұрын

他就賣課而已不能跟利益有衝突

@lilacgarden1 Күн бұрын

在deepseek中他选取了深度思考选选项，当然就有思考过程，结果被说成啰嗦，简直弱智！

@corve7950 Күн бұрын

我客观的讲一下，抛开这个视频的内容，deepseek自己的论文都在强调算力的重要性，算力的增长可以将原本2天的训练缩短一天，这换成谁都是渴望的。

@shaoqiuluo6083 22 сағат бұрын

實側要有裁判，裁判要有標准和規側。但現在的實側都缺乏令人信服的裁判。認識那一个強，為時過早，适目以待。

@sasasasasasasami 20 сағат бұрын

感觉媒体说实话是不是太夸张了，都买了三倍做空半导体吗😂

@lixu-v6n Күн бұрын

你发视频过了半小时chatgpt又支持联网了😂

@axtonliu Күн бұрын

你确定？ChatGPT o1？我的还不能啊。。。

@lixu-v6n Күн бұрын

@@axtonliu 我的可以，我的谷歌账号是美国地区的

@lixu-v6n Күн бұрын

@axtonliu 不好意思我看错了我说的是Gpt-mini，没注意到你说的是O1模型，

@lixu-v6n Күн бұрын

@axtonliu gpt-mini支持联网

@jamesmay2343 Күн бұрын

@@axtonliu 好心你付个费体验一下吧。

@李宜要 11 сағат бұрын

R1有個優點省電

@dansun5457 21 сағат бұрын

顶级ai大模型就是这样子啊，像是十万个为什么电脑版，把所有人可能问的问题，需要解决问题，作出解答和方法方案，输入到大模型里面去，那就到处找资料，全世界的都输进去，就成了顶级AI大模型？…好像也不是什么高科技的东西，只有把资料找齐就行…🤓

@dongqiancai9546 22 сағат бұрын

倾向性很强但最后总结尚可

@yingwenzhao7328 16 сағат бұрын

看你先为大家付出200大洋，这得先点赞

@binyan832 19 сағат бұрын

博主说01 更近‘’理工男‘，这’是概念不清，应该说01最大的短处是它与人性化之间更有距离。特别不喜欢这主所谓‘’理工男‘’的老化成见。‘’理工男‘’是老掉牙的过时的概念。科技的进步是谁更以适应于大众为标准的， ‘理工男’ 不是一个标准，而是历史进步中的淘汰词。少来这个。

@jiangtao2990 Күн бұрын

我觉得性能方面ChatGPT 完胜啊。价格方面按照中国人那德性，如果它在市场上占统治地位，他还能让你占便宜吗？你看看国内的电动车市场就知道了！

@johhw_6432 Күн бұрын

“中国人那德行”，如此痛恨自己，不应怪民族怪国家，应该怪你的父母哦。

@haojame3946 22 сағат бұрын

你是哪国人?

@郎予音 17 сағат бұрын

电动车咋了？几万的电动车又不是没有，还是说只许外国车卖高价不许国产电车卖高价呗？你这膝盖软成啥样了

@jiangtao2990 13 сағат бұрын

@@郎予音你膝盖硬，佩服了！你是不看新闻的吧？国产的电动车现在保险公司都不给上保险了，你去买一辆试试？说老实话国产电车现在是送一辆给我我都不敢开啊。不要命的就去买一辆爱国去吧哈哈哈哈。还有，你的主子彭丽媛王毅都是用的苹果手机，你倒是和他们去叫板去啊，和我一个屁民抬什么杠？

@smart7868 22 сағат бұрын

我也纳闷，我发现gpt和r1很多结果相似。说明大模型最终训练结果类似？还是R1后台用了gpt的api？😆

@HorizonNewVoices 21 сағат бұрын

我覺得比較像是他們的訓練資料有一定程度上的相似的關係

@逸飘于 13 сағат бұрын

你到底懂不懂什么叫开源

@johhw_6432 Күн бұрын

我个人感觉更喜欢deepseek的，该简单时简单，该复杂时复杂，比如电车轨道的对话，deepseek言简意赅，表达出了核心意思，o1罗里吧嗦。小孩没考好那个对话，deepseek的答案几乎完美，这个对于很多父母来说非常非常实用，并且给出了理由，反观o1，则差了很多。那个小短剧，“我更喜欢o1的版本”，这叫逗你玩儿，呵呵。从博主测试的情况看，个人感觉，deepseek已经超过o1。