Пікірлер
@JiasenLiu
@JiasenLiu 9 сағат бұрын
竞争真的是很激烈啊,感觉每过一段就有其中一家反超另一家。perplexity要加油了。不过perplexity刚推出了space功能可以上传多个文件,根据文件内容提问。
@gemini_537
@gemini_537 12 сағат бұрын
我绝大多数搜索都是基于关键词找网页,并不是问问题。总的来说,AI搜索听起来很酷,但是不实用。
@藍藍-j9c
@藍藍-j9c 12 сағат бұрын
現在的google真他媽又爛又難用 以前找首歌沒有在找不到的 現在前10頁直接滿滿的給你全是廣告 不然就是要付費的 要像幾十年前一樣一搜一堆可用資源簡直作夢 google這樣爛下去真的不如倒一倒吧
@tonypang1577
@tonypang1577 Күн бұрын
标题很猛。
@techdiylife
@techdiylife 4 күн бұрын
视频中的文档:techdiylife.github.io/blog/blog.html?category1=c01&blogid=0066
@李金珂-j6j
@李金珂-j6j 15 күн бұрын
blackbox插件也不错啊
@qingqingxie5021
@qingqingxie5021 26 күн бұрын
没看懂 好像懂了 网址打开了 发现根本不懂 懂得是“哦 将压力分给硬盘 内存 cpu的这种技术终于出了” 要的是运行 出个代码 没有解释怎么用
@yuli.kamakura
@yuli.kamakura 28 күн бұрын
同质化的内容太多太多了
@yuli.kamakura
@yuli.kamakura 28 күн бұрын
一点不都不多此一举
@csroable
@csroable Ай бұрын
請問如果需要同時執行多個function, openai的API回覆會說 需要call 兩個funnction嗎? 可能像是請跟我說訂單當天的天氣 就需要去Call 訂單的時間再去call 天氣 謝謝!
@techdiylife
@techdiylife Ай бұрын
OpenAI的模型是支持多个function的,看返回数据的格式,应该也是可以同时返回多个function调用。你可以参考这个讨论:community.openai.com/t/emulated-multi-function-calls-within-one-request/269582
@CCNA整理哥
@CCNA整理哥 Ай бұрын
可以接到memo裡面嗎
@techdiylife
@techdiylife Ай бұрын
技术文档:techdiylife.github.io/blog/blog.html?category1=c01&blogid=0065
@minglv
@minglv Ай бұрын
内容实用,满满干货。
@qingsir
@qingsir Ай бұрын
大模型是按照token来的 你去让他算字母
@techdiylife
@techdiylife Ай бұрын
还真有道理。 作为用户,才不管它怎么处理的。
@jim1977
@jim1977 Ай бұрын
你说的13b的模型超过gpt4,说的是phi吧
@techdiylife
@techdiylife Ай бұрын
论文里没有看过,应该不是吧
@leeuwmeanfee4726
@leeuwmeanfee4726 Ай бұрын
您的笔记本电脑硬件配置,比如内存、硬盘、显卡、中央处理单元?
@fenix20075
@fenix20075 Ай бұрын
想說剛好想反是7B才應該是主力,問題出在「何時需要使用模型」?當用戶有大量資料需要人手處理時,轉成70B以上的模型跑速不夠快又貴,開幾個70B只能排隊等著辦,相反大量的平價 7B 同等價錢可以連開幾十條隊伍,處理資料的速度大增;另外70B和7B使用起來最大差別是問題複雜程度,70B雖然可以處理複雜問題單發解決,但只要把問題拆細,容許模型在回答問題時可以簡化答案,7B 也可以跑得又快又好,所以prompting engineer貴在前置作業吧?P.S> 不用花時間測試7B以下,例如Phi 1.5B ,簡直是浪費時間,那貨連基本JSON都列不出來
@zen1tsu-sam
@zen1tsu-sam Ай бұрын
这才哪到哪,这个才是o1,未来迭代会越来越快,现在只是刚刚开始
@zhanglink9918
@zhanglink9918 Ай бұрын
和 reflection 想法类似,某种程度上算是能泛化的CoT,通过训练自己学习构建 CoT 的的能力,而不是通过输入先验,猜测这个花这么久,难点之一还是构造高质量的训练数据,不然就是Refection 那样一顿瞎说
@albertchern
@albertchern Ай бұрын
問它黎曼猜想......
@techdiylife
@techdiylife Ай бұрын
小心它来毁灭人类。
@LiuMike-q3m
@LiuMike-q3m Ай бұрын
你的这几个问题很好,看了看全网都在质疑新模型,你的评测非常直观
@User-3U4D0SsPjQy28
@User-3U4D0SsPjQy28 Ай бұрын
没看出来有多强,不带搜索功能 我还在用4o o1-preview 只是告诉了你他的思考过程
@techdiylife
@techdiylife Ай бұрын
会主动思考了, 前几天被吐槽的reflection算是o1的简化版
@印小布
@印小布 Ай бұрын
@@techdiylife感觉还是好很多了,思考超级重要
@jingqiwu2865
@jingqiwu2865 Ай бұрын
带走又一箱 估计是 take another case.
@sijian1910
@sijian1910 Ай бұрын
为什么我不在群里,如何加群?
@techdiylife
@techdiylife Ай бұрын
通过这个链接:techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032
@leishi8514
@leishi8514 Ай бұрын
cursor既然也是大语言模型,本质和直接用gpt4不是没有什么区别吗? 只是方便很多吧
@techdiylife
@techdiylife Ай бұрын
一个是基本工具,一个是产品
@CyrilPilgrim_LLL_party
@CyrilPilgrim_LLL_party Ай бұрын
得了吧,套了Claude的壳
@techdiylife
@techdiylife Ай бұрын
哈哈,两个骗子忽悠人。
@陳柏均-d4q
@陳柏均-d4q Ай бұрын
請問要怎麼入群??
@techdiylife
@techdiylife Ай бұрын
通过这个链接:techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032
@geliangzhu9146
@geliangzhu9146 Ай бұрын
念了一通新闻,我以为什么自己的看法,原来是没有,就是范范的说了下最近的新闻。这些新闻我都看过了,然后了,up你有什么深入的信息可以提供吗。比如 Reflection 到底真实性如何
@techdiylife
@techdiylife Ай бұрын
感谢反馈
@DilipAugusta
@DilipAugusta Ай бұрын
没道理
@shuangg
@shuangg Ай бұрын
加速了就听不清了,建议用一个清脆一点的AI语音代替人声
@techdiylife
@techdiylife Ай бұрын
多谢反馈
@johnmao5172
@johnmao5172 Ай бұрын
Your GPT-4o is not same as mine.
@wayne8863
@wayne8863 Ай бұрын
只想知道你自己的评测为什么那么好,是 test sample 太少了吗?本来也很怀疑它,结果看了你的视频还选择相信了它。
@techdiylife
@techdiylife Ай бұрын
就测试了几个问题,很难真的说明问题。
@JackMaxwell-y6t
@JackMaxwell-y6t Ай бұрын
Clark Karen Perez Larry Miller Betty
@Design-Enjoyment-Happiness
@Design-Enjoyment-Happiness Ай бұрын
Reflection目前在reddit上被噴爆了...很多人實測還不如llama3.1 70B
@mintisan
@mintisan Ай бұрын
让子弹再飞一会儿。。。
@VictoryAllen-vd1hu
@VictoryAllen-vd1hu Ай бұрын
qanything确实不错
@zsh5376
@zsh5376 Ай бұрын
太失望了,觀察一天後發現根本就是個騙子,他說什麼效果不好是因為什麼上傳權重錯誤,有人質疑看起來更像llama3不是3.1又說可能上傳時不知怎麼的讓不同模型權重混在一起,現在又說要重新訓練,總之現在堅稱影片中的api不是真的他用的模型云云,失望透頂
@kuisun4622
@kuisun4622 Ай бұрын
还有第二个问题,我向gpt追问爱丽丝是男孩还是女孩,有时候gpt会认为是男孩,有时候又会认为是女孩.😄
@kuisun4622
@kuisun4622 Ай бұрын
我把第四个问题改成: 一个农夫带着一只羊站在河边。河上有一条船,可以容纳一个人和一只羊。 农夫把自己和羊送到河对岸需要多少次? 几乎所有模型都能回答正确,偶尔一次出错,清除上下文从新问一下就对了.所以我觉得模型回答不正确和文字描述理解有很大关系,还有提示词,top设置这些
@kuisun4622
@kuisun4622 Ай бұрын
怎样才能最少的船🤣 别说大模型,人都被你绕晕了
@menglilingsha
@menglilingsha Ай бұрын
中文支持不一定好。另外没做prompt engineering
@cicerochen313
@cicerochen313 Ай бұрын
個人覺得分析過程正確比較重要。
@techdiylife
@techdiylife Ай бұрын
同意,qwen2对齐做的还不够。
@rogerroan7583
@rogerroan7583 Ай бұрын
能多模態嗎
@techdiylife
@techdiylife Ай бұрын
目前不能
@rogerroan7583
@rogerroan7583 Ай бұрын
那就不能算是超越了
@李金珂-j6j
@李金珂-j6j Ай бұрын
只能跑gemma2:2B这种模型,这种70B的,即使进行了一些算法上的1压缩,也不可以跑
@Neo-ho6ly
@Neo-ho6ly Ай бұрын
你好,想请教一下,你用的硬件设备是什么?用了几块什么型号的显卡?
@techdiylife
@techdiylife Ай бұрын
70B模型差不多需要45G显存。没有80G显卡,可以使用2张24G的。
@azhengfox5669
@azhengfox5669 Ай бұрын
70B 本地跑不起来,哪个平台可以部署这个模型了?
@techdiylife
@techdiylife Ай бұрын
可以用云服务器。 使用ollama的话,最好要有45G左右的显存,速度才会比较快。
@Ericyoungify
@Ericyoungify Ай бұрын
@@techdiylife45g顯存,市面上沒有這種顯卡吧?除了專業計算卡
@techdiylife
@techdiylife Ай бұрын
也可用两张24G的。
@雨行者
@雨行者 Ай бұрын
重要LLaMA3.1是開源的,可能已經置入Agent功能,這點我很喜歡,但GPT5快要出來,這性能可能遠超GPT4o GPT-5的發布日期 雖然OpenAI尚未正式公佈GPT-5的發布日期,但公司領導層暗示,該模型有望於2024年底推出 GPT-5要來了 : GPT-5的主要功能 自主AI助理 (Agent) --重點 GPT-5最具革命性的功能之一是引入了自主AI代理。這些代理能夠自動執行各種任務,如安排會議、管理電子郵件,甚至進行網上購物,此功能的應用範圍廣泛,將為個人及商業用戶帶來極大的便利和效率。 多模態處理能力 GPT-5不僅限於文字處理,還將引入多模態處理能力,代表其能夠處理圖片、影片等多種輸入形式,這種多樣性將使AI回應更加全面,從而革新用戶與AI的互動方式。 增強的自然語言處理(NLP) GPT-5的自然語言處理技術將更為流暢自然,能更好地理解上下文及語言中的微妙差異,並進行更有意義的對話,此功能在客服、醫療保健、教育等領域特別有用,將顯著提高AI在這些領域的應用價值。 參數與推理能力的提升 預計GPT-5將擁有超過1.5兆參數,這將大幅提升其推理能力和對話深度,使其能更準確地理解複雜問題並提供適當的回應,此進步將使其成為各種應用中的強大工具,尤其是在需要精確解決方案的專業狀況下。
@dong-l3x
@dong-l3x Ай бұрын
到底是不是比4o好
@techdiylife
@techdiylife Ай бұрын
刷榜结果有几个超过了。但是刷榜和用户体验不是一会儿事儿。用户体验上,还没有能超过openai的模型。
@newsflow3888
@newsflow3888 Ай бұрын
他们都用特定数据测试,个个都说超过gpt4o,其实整体根本没有4o强
@kuisun4622
@kuisun4622 Ай бұрын
@@newsflow3888 是的,我写代码最终还是用的gpt4o mini,其它都太渣了...gpt4o 还是太贵了.
@kaokuntai
@kaokuntai Ай бұрын
不能上網,肯定輸o4
@反贼必须死
@反贼必须死 Ай бұрын
@@techdiylife 不不不。 得看什么类型的体验。 代码上,4o和Claude3.5不相上下。 阅读理解,gemini exp最新版碾压其他所有模型,完全是碾压级别!差距太离谱了,就感觉他有读心术一样。(但是代码真的不咋地啊)
@yuli.kamakura
@yuli.kamakura Ай бұрын
录屏和演示画笔非常惊艳,询问下,是什么工具?
@techdiylife
@techdiylife Ай бұрын
用的傲软录屏