【李自然说】DeepSeek深度解读|走私显卡蒸馏OpenAI,天才少女550万美元打落美帝万亿市值?

  Рет қаралды 18,113

李自然说

李自然说

Күн бұрын

有趣的灵魂 聊科技人文
欢迎关注「李自然说」,与你分享关于商业、创业、人文的经历与见解。
欢迎在评论区讨论交流。
推荐视频:
【李自然说】海外市场增长实战指南:从0到1的系统化运营方法论
• 【李自然说】海外市场增长实战指南:从0到1的...
【李自然说】独立开发能赚多少钱?揭秘收入上限和成功案例
• 【李自然说】独立开发能赚多少钱?揭秘收入上限...
【李自然说】如何提高商业认知?商业知识的学习方法
• 【李自然说】如何提高商业认知?商业知识的学习方法
【李自然说】人生如逆旅,我亦是行人
• 【李自然说】人生如逆旅,我亦是行人
【李自然说】每月营收千万,跨境电商实战
• 【李自然说】每月营收千万,跨境电商实战
【李自然说】价值100万的流量思维
• 【李自然说】价值100万的流量思维
【李自然说】除了风险投资,还有谁能投钱?
• 【李自然说】除了风险投资,还有谁能投钱?
【李自然说 】【奇绩创坛】投资人是怎么选创始人和创业项目的?
• 【李自然说 】【奇绩创坛】投资人是怎么选创始...
【李自然说】填个表就能拿到百万融资?Y Combinator,陆奇和奇绩创坛
• 【李自然说】填个表就能拿到百万融资?Y Co...
【李自然说】创业必备技能:如何陌生拜访/约见大佬
• 【李自然说】创业必备技能:如何陌生拜访/约见大佬
【李自然说】创业路上,你会遇到哪些问题
• 【李自然说】创业路上,你会遇到哪些问题

Пікірлер: 120
@iwancao2731
@iwancao2731 Күн бұрын
还记得李自然说,AI格局已定了,没有万亿算力训练,是不可能出结果的。中国的很多公司估值都没有万亿,你拿什么来竞争?这些话还犹在耳,今天来分析DS深度解读了。你这有点伪专家的意思啊
@迟金超
@迟金超 Күн бұрын
你得知道算力永远是不够用的这一点底层逻辑,DS只是通过局部创新比如MLA,MOE之类的算法节约了一些算力,但这算法是开源的,并且节省算力的研究和论文每个月都会有几篇新的进展被发布出来每一篇新论文都是对前人论文的改进,DS的改进只是这这条链中的一个节点,但不管怎么优化算力永远是不够用的,搞模型的大拿们总会想办法压榨完他所能动用的全部资源,掌握着更多的算力资源的公司就是有能力做别人做不了的研究
@XX-hz5xw
@XX-hz5xw Күн бұрын
只有中医永远正确,现代医学每天都可以打脸,懂吗
@VS-pu2bq
@VS-pu2bq Күн бұрын
长得更像了桑
@菲兹艾卜
@菲兹艾卜 Күн бұрын
本来就不是理工科毕业也不是学算法的你听听就好需要计算机专业知识的就不要信,但是营销部分内容可以看
@vincentl9689
@vincentl9689 Күн бұрын
DS不会改变AI格局,OpenAI还是OpenAI,该花大钱买芯片还是花大钱买芯片,ds的确有进步,但在中国民族主义的叙事里成了扭转国运的大杀器,这明显不是事实
@edithjarvisfriday
@edithjarvisfriday Күн бұрын
美国那边需要鼓吹中国威胁论,中国这边需要满足民族自尊心,对立的两方刚好在这件事上不谋而合,一起把DS推上神坛。
@taijistar9052
@taijistar9052 Күн бұрын
这位说的有道理!
@taijistar9052
@taijistar9052 Күн бұрын
但是也可以看到,有些中国人是多么不自信!即使自己有的好公司也不敢想信!这可能是长期受过度宣传伤害的结果!
@杨彦-f4t
@杨彦-f4t Күн бұрын
对啊,英伟达,因特尔,美国几家AI企业老板都在肯定DS的成果,肯定是觉得自己股价太虚高了,需要降一降。我觉得需要查一查这些大公司高管是不是做空自己家股票了。
@闲云野鹤-g5w
@闲云野鹤-g5w Күн бұрын
他们早开始出货了,降一降没有问题,但是不能用这种原因降
@dhye7477
@dhye7477 16 сағат бұрын
同理,openAI的爆火也是各方面的需要。
@pyn644
@pyn644 Күн бұрын
很感谢两位很专业的叙述,解答了人们的很多疑问,专业的知识解答得很通俗,很了不起额。订阅并关注这个频道。
@VincentTso-b7h
@VincentTso-b7h 2 күн бұрын
r1是推理模型需要thought token,O1的api不给thought token根本没法蒸馏。。。
@高高阳-x8k
@高高阳-x8k Күн бұрын
though token 是啥
@maxwang2089
@maxwang2089 Күн бұрын
o1的api输出不是也有think tag吗?而且chatgpt交互界面也会把cot写出来
@shanliu6190
@shanliu6190 Күн бұрын
@@maxwang2089啊?o1没给cot吧?
@VincentTso-b7h
@VincentTso-b7h Күн бұрын
@@maxwang2089 那个是summarized version不是本来的cot
@VincentTso-b7h
@VincentTso-b7h Күн бұрын
@@高高阳-x8k 推理模型的思维链
@fanyang7
@fanyang7 8 сағат бұрын
这次真的不错,学习很多
@user-cm4ce5fh4q
@user-cm4ce5fh4q 10 сағат бұрын
我感觉比较符合事实的猜测是,软件都是利用能利用的开源工具自己开发的。训练成本和显卡数量应该不是DEEKSEEK自称的量。😁
@ianfreud7703
@ianfreud7703 Күн бұрын
第一,我不明白为啥DS的蒸馏和teacher-student有本质的不同。无论是用模型输出token的概率,还是用模型输出本身(RFT),或是用模型输出加上它的推理过程(SFT),都是蒸馏。gpt和claude的条款里写了,如果用模型输出去训练你的模型,在商用上是有限制的,更不能拿去做竞品。第二,我不明白为什么蒸馏出来的模型就不可能打败原模型,student不如teacher是因为模型小,而不是蒸馏减弱了模型的能力,相反信息密度更高了。所以不能说R1在某些方面超过o1就证明它不是蒸馏的。第三,RL也不是啥创新,早在2024年初字节的文章里就有,openai在这之前就用了。它和SFT的区别就是SFT的训练数据需要问题、答案、和解题过程,RFT只需要问题和答案。DS用RL省掉了解题过程,用gpt又省掉了写答案,所以可以全自动不需要花钱雇phd了。最后,DS在商业上的成功可能影响开创性的研发工作,这就好比仿制药比新药便宜100倍,如果放任仿制药在市场上和新药竞争,就没有人去投资新药了。
@zhongkaizhu490
@zhongkaizhu490 Күн бұрын
通篇错误百出,一股浓浓的民科味儿,还能有人给你点赞,真行
@traxxas888
@traxxas888 Күн бұрын
根本就不可能大量调用OpenAI的API来蒸馏模型的,OpenAI的运维是可以监控API使用情况的。而且使用OpenAI的语料进行部分的训练和验证,基本上所有大模型都在这么做。而且互联网的内容很多都是AI生成的,那么不同的模型其实从互联网抓取数据之后训练,就是在互相蒸馏,最后是你中有我,我中有你。 而且DeepSeek给普通人和小企业低成本使用或者部署AI提供了便利。如有有便宜的AI,为什么一定要付20美金给ChatGPT呢? OpenAI其实现在都被说成ClosedAI,DeepSeek至少把论文和推理模型都开放出来下载,而且展示了推理的步骤,这促进AI的发展,会有更多人投入开源AI,而且也不影响大家继续投资OpenAI。所谓影响开创性的工作,仿制药影响新药投资就是胡说八道
@catchfishattexas
@catchfishattexas Күн бұрын
没有人能蒸馏出一个700b模型
@少云他爹
@少云他爹 14 сағат бұрын
@@traxxas888 “你中有我,我中有你”??? 是大家“中”都有ChatGPT吧?
@少云他爹
@少云他爹 14 сағат бұрын
@@zhongkaizhu490 你也来篇呗,专科味的!?!
@aku19871213
@aku19871213 Күн бұрын
几个月不看怎么变老嫂子了。。。。。
@staypeace3691
@staypeace3691 2 күн бұрын
质量好高
@huangjiang64
@huangjiang64 Күн бұрын
请一定要出实用性课程啊~太期待了。其他走私蒸馏少女都不关心
@yiminhuang4183
@yiminhuang4183 Күн бұрын
李总对上次结论有更新么?现在算法更新了搞大模型不需要万卡了,会有更多小公司搞大模型么?更多公司搞大模型会加速大模型应用的开发么?
@maven1983
@maven1983 Күн бұрын
能否让嘉宾多说点?否则这期节目的目的是什么?
@zhangjackson7837
@zhangjackson7837 Күн бұрын
能不能讲下李飞飞的 S1?
@tokyotureyoung
@tokyotureyoung 2 күн бұрын
请一定要出实用性课程啊~太期待了
@dang_nadang_na8300
@dang_nadang_na8300 Күн бұрын
对冲基金应该做好了布局,R1出来无论科技和金融他们都赚了
@afonsode419
@afonsode419 Күн бұрын
別的對咂沒說
@严波-c2r
@严波-c2r Күн бұрын
如何系统的学习使用这些模型,用在哪些情况下。容易错用用不好
@afonsode419
@afonsode419 Күн бұрын
奇怪 我在SiliconeFlow 用華為的體驗區 速度超慢 大概7個token 每秒 而且經常當掉 不像李大大講的那樣啊
@过时玩友
@过时玩友 Күн бұрын
脑子进水了吧,一个印度人骑摩托车载5个人骑的风生水起为什么不是创新?为什么不举国欢庆?Deepseek跟一辆两轮摩托车拉6个人的性质是一样的。后面的文字是Deepseek的提示:当前服务器资源紧张,为避免对您造成业务影响,我们已暂停 API 服务充值。存量充值金额可继续调用,敬请谅解!--能研究出世界一流AI大模型的公司不能提前意识到有“当前服务器资源紧张”的可能?会在几个星期的时间里没有办法解决“当前服务器资源紧张”?
@seasidehope1110
@seasidehope1110 2 күн бұрын
就喜欢看这样的技术大佬互动分析,视频质量有理有据有深度
@Ming-qe5xl
@Ming-qe5xl 2 күн бұрын
十分希望出一期AI使用课程
@tong1543
@tong1543 2 күн бұрын
感谢,受教了
@MyTinyfish
@MyTinyfish Күн бұрын
可以再聊几期课程
@Killer-i1x
@Killer-i1x Күн бұрын
不是应该分析一下为什么DeepSeek的our one这么先进,但他却直接开源吗?还有原因吗?
@ayao95
@ayao95 Күн бұрын
并没有完全开源😂
@yeshwhrsfzshb7464
@yeshwhrsfzshb7464 22 сағат бұрын
@@ayao95 完全开源的。你说的没有开源的部分代码是跟算法无关的。这部分也没必要开源,本地部署代码也不需要那部分。
@yanjh222
@yanjh222 21 сағат бұрын
李老师怎么知道自己不是那些个自己鄙视的人呢?;)
@backing100
@backing100 Күн бұрын
没文化听不懂技术,就是来看评论是赞同多还是质疑多,哈哈哈~
@som845
@som845 Күн бұрын
你以后和老范或JEFF 直接对话可能效果更好
@freedomseekerism
@freedomseekerism Күн бұрын
up更像老范,里面是个小粉。jeff可能是做出海生意的😅
@LovingHeart2077
@LovingHeart2077 Күн бұрын
jeff就算了, 大外宣老粉红
@MyBobbyCC
@MyBobbyCC Күн бұрын
需要更深入的课程 +1
@seasidehope1110
@seasidehope1110 Күн бұрын
对,大部分人关心的还是中美科技谁更牛逼,差距有多大,差距在哪里,先把这些搞明白,再来谈应用场景以及教学,这是一个很好的顺序,符合社会逻辑
@dili2053
@dili2053 Күн бұрын
说明推理模型有水分。数据肯定是抽取过,唯一的借口是大家都干过。
@haisenbao-01
@haisenbao-01 Күн бұрын
你换位思考,中国也一样只会更过分,希望以后客观一点, 谷歌在中国遭遇的一切没有正义与邪恶之分.
@freedomseekerism
@freedomseekerism 2 күн бұрын
半科普 半洗地😅
@langzi
@langzi Күн бұрын
🤡
@gz6x
@gz6x Күн бұрын
DS效果非常好,就是服务器经常报告太忙,准备自己撸一个本地部署了
@afonsode419
@afonsode419 Күн бұрын
大哥 有錢有能力 I envy you!
@gz6x
@gz6x Күн бұрын
@afonsode419 😄,就是跟着教程撸个残血版而已。
@william3323
@william3323 Күн бұрын
随便能蒸馏,openai岂不是太傻了要破产😂。据说用了高性价比的芯片,比如华为的,所以价格低。英伟达价格虚高,所以股价跳水了。
@少云他爹
@少云他爹 14 сағат бұрын
只能说是防不胜防,字节的豆包不就被禁了API了吗? 英伟达股价又回来了,马上又要创新高了。
@valleyhappy7718
@valleyhappy7718 Күн бұрын
没充分利用专业人士的时间!
@kurtlin4745
@kurtlin4745 5 сағат бұрын
李自然的意思就是, 我們不承認我們偷了, 你又沒證據,.而且偷很普遍, 請不要大驚小怪
@Ruiki_kintsugi
@Ruiki_kintsugi 2 күн бұрын
希望专业人士多多解答
@ReadyVal
@ReadyVal Күн бұрын
视频内容很好,观点也很支持,但是有一件事想请教:全世界都知道中国通过新加坡等各国走私H100,这不是秘密,大家都知道,为什么要在这方面辩护DeepSeek? H800也不是特别差,只是比H100弱几个百分比,承认国内AI公司走私H100后果很严重吗?
@003ggg
@003ggg Күн бұрын
指控都不用證據的嗎?有聽過莫須有嗎?😂
@yeshwhrsfzshb7464
@yeshwhrsfzshb7464 22 сағат бұрын
中国的大模型有十几个,即便有走私,并不能说DeekSeek就使用了H100。 你来自小国家吧,眼界需要扩大。
@wjhacup
@wjhacup Күн бұрын
软银是受益者。
@fengzhang8726
@fengzhang8726 Күн бұрын
这期有点偏政治立场了,嘉宾也很难保持中立形象,绝口不提Facebook,Google,X,Inst在国内被封禁的事实,在这个前提下美国封禁TK有任何问题吗?
@口哥-e7q
@口哥-e7q Күн бұрын
是这样的,老共集权,不开放,是共识,也是事实,但是号称自由民主开放自由市场竞争宣传几十年的美国也搞这一套,当然就不同了。
@kunkun-play
@kunkun-play Күн бұрын
deepseek突然爆火不也是这件事上升到爱国情怀吗,只能说在中国各行各业唯一的流量密码只有一个,哈哈哈
@content4free99
@content4free99 Күн бұрын
就算没墙,这些应用的大部分也竞争不过中国本土产品
@gz6x
@gz6x Күн бұрын
没问题,本来就是美国的内政,但这真是太蠢了,TK的投资方60%是美国,说破了是美国内部资本罔顾国家形象和信誉互相抢劫罢了
@vincentl9689
@vincentl9689 Күн бұрын
@@口哥-e7q对等原则,没有任何问题。自由贸易不是当傻子
@Canal-jk3vm
@Canal-jk3vm 17 сағат бұрын
我对科技创新的态度是全人类都该共同努力,共享成果,但是只要中国仍处于社会主义意识形态,共产党独裁,中国科技的任何进步都该被否定和扼杀在摇篮里,因为这不是为人类进步做贡献,而是对人类进步的威胁。如果你们真是搞技术的中国人,如果你们真是有脑子的人,应该意识到这点。比如当年的德国在核物理方面是绝对领先的状态,量子物理的奠基人海森堡是德国人,爱因斯坦也是德国人,但如果都去帮希特勒搞原子弹,那就是对全人类的亵渎,中国搞计算机科学的人,如果在中国搞,也等于对全人类的亵渎,所以禁运芯片是不够的,应该禁止收相关学科的留学生和任何AI相关技术的软硬件进入中国。
@content4free99
@content4free99 Күн бұрын
这期质量高。以后这类内容可以多做。
@HanyunGong
@HanyunGong Күн бұрын
没有干货;鉴定完毕
@godfox66
@godfox66 Күн бұрын
大脑计算 用多少能量?
@xuefengdu-6252
@xuefengdu-6252 Күн бұрын
很好
@the19trier
@the19trier 2 күн бұрын
讲怎么用!!
@Babu-f4i9c
@Babu-f4i9c Күн бұрын
李飞飞已经通过基于谷歌样本和阿里千问,蒸馏模式做到50美元的训练成本,效果也差不多,成本碾压deepseek。deepseek没有算法创新,只是基于工程层面创新,而且蒸馏利用了大模型的结果。好处是大大降低了人工智能成本,坏处是大模型的投资收益很低。谁还愿意去投资打这个基础?
@traxxas888
@traxxas888 Күн бұрын
OpenAI已经有更牛x的GPT 4.5或者5了,该投资还要继续投资的。另外,降低成本对打破大企业的垄断很有好处,我们最好人人都能低价用上类似GPT 4.5或者5的AI。
@irmtouch
@irmtouch Күн бұрын
你这理解是错误的,去看原始论文。
@yeshwhrsfzshb7464
@yeshwhrsfzshb7464 22 сағат бұрын
DS没有算法创新? 你会读论文吗, DS的思维链是最先进的算法, 这就是创新。
@crazyfish2222
@crazyfish2222 2 күн бұрын
666
@steveriver9260
@steveriver9260 Күн бұрын
我覺得吧,你自己偷偷用用就算了,拿出來吹就不大好看了。你拉長時間軸,所謂的改革開放這些年,所有吹過的那些遙遙領先,究竟有多少最終證明出來確實是在天朝環境中自主創新出來的?安全可靠可持續的?更不要說是引領世界的產品了。大家都懂,就別裝外賓了。這樣就沒意思了。
@user-pm9fj1si6h
@user-pm9fj1si6h Күн бұрын
代码和论文都是公开的,大哥你看一眼吧
@user-pm9fj1si6h
@user-pm9fj1si6h Күн бұрын
川普明确说了台积电偷了美国的芯片技术
@大海-s6r
@大海-s6r Күн бұрын
傻福,问国人强也疑
@charname-player
@charname-player Күн бұрын
那么拉长时间轴,那你意思是再过一亿年也出不了自主创新,还是有个某个科学证明的时间节点就突然出现了,反正就是不是现在
@steveriver9260
@steveriver9260 2 сағат бұрын
唉,都不是體面人。回牆裡吧,什麼都有。友情提示,翻牆違法。
@bahaarabia5034
@bahaarabia5034 Күн бұрын
看出是一個愛表現東拉西扯以自我為中心的人
硅谷视角深聊:DeepSeek的颠覆、冲击、争议和误解
1:20:33
The Best Band 😅 #toshleh #viralshort
00:11
Toshleh
Рет қаралды 22 МЛН
Mom Hack for Cooking Solo with a Little One! 🍳👶
00:15
5-Minute Crafts HOUSE
Рет қаралды 23 МЛН
Арыстанның айқасы, Тәуіржанның шайқасы!
25:51
QosLike / ҚосЛайк / Косылайық
Рет қаралды 700 М.
许成钢谈经论政:DeepSeek是人工智能领域里的重大突破吗?
31:52
書展2013:李莊重慶打黑真相
1:51:20
香港貿發局
Рет қаралды 6 МЛН
NVIDIA CEO Jensen Huang's Vision for the Future
1:03:03
Cleo Abram
Рет қаралды 1,3 МЛН
The Best Band 😅 #toshleh #viralshort
00:11
Toshleh
Рет қаралды 22 МЛН