AI开发者-就爱瞎鼓捣

5:34

视觉大模型大盘点！最人气的十款视觉大模型

9 сағат бұрын

5:26

AI开发动向：Hinton斩获诺奖，方便易用的豆包MarsCode编程助手，MeTA视频生成模型

14 күн бұрын

7:31

从代码到细节：拆解LoRA微调的内部秘密！

21 күн бұрын

6:53

揭秘 OpenAI 新应用 Canvas 的神奇力量！

28 күн бұрын

5:34

AI开发必看！OpenAI开发者日4大新功能全解析！DevDay

Ай бұрын

3:38

Meta重磅发布首个多模态Llama 3.2，视觉处理11B 90B参数！

Ай бұрын

1:37

颠覆认知！通过自动驾驶看AI开发者的真正价值

Ай бұрын

3:00

AI开发者动态：云栖大会主题演讲精华分享

Ай бұрын

8:59

微调技术大比拼：全量微调与LoRA、QLoRA实测对比！

Ай бұрын

5:44

AI开发者动态：o1被称舔狗，LLM刷榜技巧曝光！

Ай бұрын

5:09

微软最强大LLM训练工具，ZERO3 为什么可以训练万亿参数大模型？

Ай бұрын

3:24

OpenAI最新o1模型发布，看看它比GPT-4o强多少

Ай бұрын

9:58

AI开发者动态：Cursor带来焦虑，Reflection大翻车，RAG落地思路

Ай бұрын

9:50

终极PK！Reflection硬刚GPT-4、GPT-4o、Llama 3.1 70B和Qwen2 72B！

Ай бұрын

3:14

世界最强开源AI？Reflection 强势碾压GPT-4o！

Ай бұрын

5:48

LLM如何“自主”调用工具？揭秘Function Calling真相！

Ай бұрын

6:12

AI开发者动态：LLM毫秒级推理速度来啦

2 ай бұрын

7:06

如何快速估算模型训练资源？Llama3竟用16000块GPU！

2 ай бұрын

6:09

五分钟速读：李沐上海交大LLM趋势分享

2 ай бұрын

7:07

LLM应用最最最重要的设计模式：Code Interpreter模式

2 ай бұрын

4:56

OpenAI RAG采用了什么技术？如何实现它？

2 ай бұрын

3:15

Agents系列：OpenAI Assistants是如何工作的？

2 ай бұрын

6:30

用72B Qwen2跑一次GraphRAG要多少钱？

2 ай бұрын

5:09

GPT-4o，GPT-4o mini，DeepSeek提取GraphRAG知识图谱的比较

3 ай бұрын

4:21

GraphRAG制作的《凡人修仙传》知识图谱长什么样？

3 ай бұрын

6:25

GraphRAG与普通RAG比较，效果，速度，费用

3 ай бұрын

4:23

Gemma2和Qwen2谁才是开源一哥？

4 ай бұрын

2:07

来围观下网友分享的OpenAI API的梦幻式预算控制

4 ай бұрын

3:51

如何将ollama升级来试用Gemma2？

4 ай бұрын

Пікірлер

@JiasenLiu 9 сағат бұрын

竞争真的是很激烈啊，感觉每过一段就有其中一家反超另一家。perplexity要加油了。不过perplexity刚推出了space功能可以上传多个文件，根据文件内容提问。

@gemini_537 12 сағат бұрын

我绝大多数搜索都是基于关键词找网页，并不是问问题。总的来说，AI搜索听起来很酷，但是不实用。

@藍藍-j9c 12 сағат бұрын

現在的google真他媽又爛又難用以前找首歌沒有在找不到的現在前10頁直接滿滿的給你全是廣告不然就是要付費的要像幾十年前一樣一搜一堆可用資源簡直作夢 google這樣爛下去真的不如倒一倒吧

@tonypang1577 Күн бұрын

标题很猛。

@techdiylife 4 күн бұрын

视频中的文档：techdiylife.github.io/blog/blog.html?category1=c01&blogid=0066

@李金珂-j6j 15 күн бұрын

blackbox插件也不错啊

@qingqingxie5021 26 күн бұрын

没看懂好像懂了网址打开了发现根本不懂懂得是“哦将压力分给硬盘内存 cpu的这种技术终于出了” 要的是运行出个代码没有解释怎么用

@yuli.kamakura 28 күн бұрын

同质化的内容太多太多了

@yuli.kamakura 28 күн бұрын

一点不都不多此一举

@csroable Ай бұрын

請問如果需要同時執行多個function, openai的API回覆會說需要call 兩個funnction嗎? 可能像是請跟我說訂單當天的天氣就需要去Call 訂單的時間再去call 天氣謝謝!

@techdiylife Ай бұрын

OpenAI的模型是支持多个function的，看返回数据的格式，应该也是可以同时返回多个function调用。你可以参考这个讨论：community.openai.com/t/emulated-multi-function-calls-within-one-request/269582

@CCNA整理哥 Ай бұрын

可以接到memo裡面嗎

@techdiylife Ай бұрын

技术文档：techdiylife.github.io/blog/blog.html?category1=c01&blogid=0065

@minglv Ай бұрын

内容实用，满满干货。

@qingsir Ай бұрын

大模型是按照token来的你去让他算字母

@techdiylife Ай бұрын

还真有道理。作为用户，才不管它怎么处理的。

@jim1977 Ай бұрын

你说的13b的模型超过gpt4，说的是phi吧

@techdiylife Ай бұрын

论文里没有看过，应该不是吧

@leeuwmeanfee4726 Ай бұрын

您的笔记本电脑硬件配置，比如内存、硬盘、显卡、中央处理单元？

@fenix20075 Ай бұрын

想說剛好想反是7B才應該是主力，問題出在「何時需要使用模型」？當用戶有大量資料需要人手處理時，轉成70B以上的模型跑速不夠快又貴，開幾個70B只能排隊等著辦，相反大量的平價 7B 同等價錢可以連開幾十條隊伍，處理資料的速度大增；另外70B和7B使用起來最大差別是問題複雜程度，70B雖然可以處理複雜問題單發解決，但只要把問題拆細，容許模型在回答問題時可以簡化答案，7B 也可以跑得又快又好，所以prompting engineer貴在前置作業吧？P.S> 不用花時間測試7B以下，例如Phi 1.5B ，簡直是浪費時間，那貨連基本JSON都列不出來

@zen1tsu-sam Ай бұрын

这才哪到哪，这个才是o1，未来迭代会越来越快，现在只是刚刚开始

@zhanglink9918 Ай бұрын

和 reflection 想法类似，某种程度上算是能泛化的CoT，通过训练自己学习构建 CoT 的的能力，而不是通过输入先验，猜测这个花这么久，难点之一还是构造高质量的训练数据，不然就是Refection 那样一顿瞎说

@albertchern Ай бұрын

問它黎曼猜想......

@techdiylife Ай бұрын

小心它来毁灭人类。

@LiuMike-q3m Ай бұрын

你的这几个问题很好，看了看全网都在质疑新模型，你的评测非常直观

@User-3U4D0SsPjQy28 Ай бұрын

没看出来有多强，不带搜索功能我还在用4o o1-preview 只是告诉了你他的思考过程

@techdiylife Ай бұрын

会主动思考了，前几天被吐槽的reflection算是o1的简化版

@印小布 Ай бұрын

@@techdiylife感觉还是好很多了，思考超级重要

@jingqiwu2865 Ай бұрын

带走又一箱估计是 take another case.

@sijian1910 Ай бұрын

为什么我不在群里，如何加群？

@techdiylife Ай бұрын

通过这个链接：techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032

@leishi8514 Ай бұрын

cursor既然也是大语言模型,本质和直接用gpt4不是没有什么区别吗? 只是方便很多吧

@techdiylife Ай бұрын

一个是基本工具，一个是产品

@CyrilPilgrim_LLL_party Ай бұрын

得了吧，套了Claude的壳

@techdiylife Ай бұрын

哈哈，两个骗子忽悠人。

@陳柏均-d4q Ай бұрын

請問要怎麼入群??

@techdiylife Ай бұрын

通过这个链接：techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032

@geliangzhu9146 Ай бұрын

念了一通新闻，我以为什么自己的看法，原来是没有，就是范范的说了下最近的新闻。这些新闻我都看过了，然后了，up你有什么深入的信息可以提供吗。比如 Reflection 到底真实性如何

@techdiylife Ай бұрын

感谢反馈

@DilipAugusta Ай бұрын

没道理

@shuangg Ай бұрын

加速了就听不清了，建议用一个清脆一点的AI语音代替人声

@techdiylife Ай бұрын

多谢反馈

@johnmao5172 Ай бұрын

Your GPT-4o is not same as mine.

@wayne8863 Ай бұрын

只想知道你自己的评测为什么那么好，是 test sample 太少了吗？本来也很怀疑它，结果看了你的视频还选择相信了它。

@techdiylife Ай бұрын

就测试了几个问题，很难真的说明问题。

@JackMaxwell-y6t Ай бұрын

Clark Karen Perez Larry Miller Betty

@Design-Enjoyment-Happiness Ай бұрын

Reflection目前在reddit上被噴爆了...很多人實測還不如llama3.1 70B

@mintisan Ай бұрын

让子弹再飞一会儿。。。

@VictoryAllen-vd1hu Ай бұрын

qanything确实不错

@zsh5376 Ай бұрын

太失望了，觀察一天後發現根本就是個騙子，他說什麼效果不好是因為什麼上傳權重錯誤，有人質疑看起來更像llama3不是3.1又說可能上傳時不知怎麼的讓不同模型權重混在一起，現在又說要重新訓練，總之現在堅稱影片中的api不是真的他用的模型云云，失望透頂

@kuisun4622 Ай бұрын

还有第二个问题,我向gpt追问爱丽丝是男孩还是女孩,有时候gpt会认为是男孩,有时候又会认为是女孩.😄

@kuisun4622 Ай бұрын

我把第四个问题改成: 一个农夫带着一只羊站在河边。河上有一条船，可以容纳一个人和一只羊。农夫把自己和羊送到河对岸需要多少次？几乎所有模型都能回答正确,偶尔一次出错,清除上下文从新问一下就对了.所以我觉得模型回答不正确和文字描述理解有很大关系,还有提示词,top设置这些

@kuisun4622 Ай бұрын

怎样才能最少的船🤣 别说大模型,人都被你绕晕了

@menglilingsha Ай бұрын

中文支持不一定好。另外没做prompt engineering

@cicerochen313 Ай бұрын

個人覺得分析過程正確比較重要。

@techdiylife Ай бұрын

同意，qwen2对齐做的还不够。

@rogerroan7583 Ай бұрын

能多模態嗎

@techdiylife Ай бұрын

目前不能

@rogerroan7583 Ай бұрын

那就不能算是超越了

@李金珂-j6j Ай бұрын

只能跑gemma2:2B这种模型，这种70B的，即使进行了一些算法上的1压缩，也不可以跑

@Neo-ho6ly Ай бұрын

你好，想请教一下，你用的硬件设备是什么？用了几块什么型号的显卡？

@techdiylife Ай бұрын

70B模型差不多需要45G显存。没有80G显卡，可以使用2张24G的。

@azhengfox5669 Ай бұрын

70B 本地跑不起来，哪个平台可以部署这个模型了？

@techdiylife Ай бұрын

可以用云服务器。使用ollama的话，最好要有45G左右的显存，速度才会比较快。

@Ericyoungify Ай бұрын

@@techdiylife45g顯存，市面上沒有這種顯卡吧？除了專業計算卡

@techdiylife Ай бұрын

也可用两张24G的。

@雨行者 Ай бұрын

重要LLaMA3.1是開源的，可能已經置入Agent功能，這點我很喜歡，但GPT5快要出來，這性能可能遠超GPT4o GPT-5的發布日期雖然OpenAI尚未正式公佈GPT-5的發布日期，但公司領導層暗示，該模型有望於2024年底推出 GPT-5要來了 : GPT-5的主要功能自主AI助理 (Agent) --重點 GPT-5最具革命性的功能之一是引入了自主AI代理。這些代理能夠自動執行各種任務，如安排會議、管理電子郵件，甚至進行網上購物，此功能的應用範圍廣泛，將為個人及商業用戶帶來極大的便利和效率。多模態處理能力 GPT-5不僅限於文字處理，還將引入多模態處理能力，代表其能夠處理圖片、影片等多種輸入形式，這種多樣性將使AI回應更加全面，從而革新用戶與AI的互動方式。增強的自然語言處理（NLP） GPT-5的自然語言處理技術將更為流暢自然，能更好地理解上下文及語言中的微妙差異，並進行更有意義的對話，此功能在客服、醫療保健、教育等領域特別有用，將顯著提高AI在這些領域的應用價值。參數與推理能力的提升預計GPT-5將擁有超過1.5兆參數，這將大幅提升其推理能力和對話深度，使其能更準確地理解複雜問題並提供適當的回應，此進步將使其成為各種應用中的強大工具，尤其是在需要精確解決方案的專業狀況下。

@dong-l3x Ай бұрын

到底是不是比4o好

@techdiylife Ай бұрын

刷榜结果有几个超过了。但是刷榜和用户体验不是一会儿事儿。用户体验上，还没有能超过openai的模型。

@newsflow3888 Ай бұрын

他们都用特定数据测试，个个都说超过gpt4o，其实整体根本没有4o强

@kuisun4622 Ай бұрын

@@newsflow3888 是的,我写代码最终还是用的gpt4o mini,其它都太渣了...gpt4o 还是太贵了.

@kaokuntai Ай бұрын

不能上網,肯定輸o4

@反贼必须死 Ай бұрын

@@techdiylife 不不不。得看什么类型的体验。代码上，4o和Claude3.5不相上下。阅读理解，gemini exp最新版碾压其他所有模型，完全是碾压级别！差距太离谱了，就感觉他有读心术一样。（但是代码真的不咋地啊）

@yuli.kamakura Ай бұрын

录屏和演示画笔非常惊艳，询问下，是什么工具？

@techdiylife Ай бұрын

用的傲软录屏

Ең жақсы KZbin

Пікірлер