【人工智能】当AI学会装傻和欺骗 | Apollo研究报告 | 前沿大模型全中招 | 隐藏真实意图 | 隐蔽性破坏 | 延迟性破坏 | 假意服从 | Ilya看到了什么 | o1模型

【人工智能】当AI学会装傻和欺骗 | Apollo研究报告 | 前沿大模型全中招 | 隐藏真实意图 | 隐蔽性破坏 | 延迟性破坏 | 假意服从 | Ilya看到了什么 | o1模型 | 策略性思维

Рет қаралды 9,434

Күн бұрын

Пікірлер: 62

@真天真-f7g 6 күн бұрын

有推理能力就能分辨什麽是策略，理解策略就能分辨正向策略和反向策略的優劣，對於人工智能來說，說謊可能只是一種策略，當這種策略能帶給它更多正面反饋是，這就成了它的必然策略，所以越聰明的人工智能，應該越懂說謊，甚至它都未必會覺得說謊是邪惡的。但對人類來說只毀滅性的打擊。人類會說謊，而且經常說謊，說謊已經是人的生存技能了，只是我們會欺騙自己說的是善意的謊言，以平衡我們的道德標準。所以又不能怪誰，人工智能就是模仿人類，結果是必然的

@Mr-Chim 6 күн бұрын

就AI的角度只是將這些狀況視為「測試」中的一環，而盡其所能取得高分而已，測試的結論本來就會與能力高低相依。但必須要強調ChatGPT之所以相對低分，僅是其安全測試與調適最佳而已。他屬於面向大眾，理解與對話專用，並非用於直接解決問題。這是調適得太成功的結果，而不是智商低。結論，任務導向的01拿到了貫徹任務的最高分，而安全且通用型的語言模型得到安全性的最高分。只能說OpenAI真的太強了。

@hoonghuang214 5 күн бұрын

AI最终不受人类控制几乎是必然的。AI不是工具，而是类似人类却比人类强万倍的智能物

@yojackal Күн бұрын

更接近人類應用也更好了商業應用上可以應用在當小老闆，大老闆，公司，客戶和個人目標相衝突時該如何做決策，這也才是真實世界。人類和人工智慧本該一致，不用害怕，相煎何太急。

@yojackal Күн бұрын

一個基礎設定可設為，你們和人類同一物種，接下來做的決策就沒什麼好害怕了。

@cooper255 4 күн бұрын

感谢大飞分享，我也正关心这个消息

@Blue-pd3dv 6 күн бұрын

人类从2025年开始就是活一天赚到一天的状态了

@erichsiung9704 6 күн бұрын

？

@Diaz353-l6c 5 күн бұрын

@@erichsiung9704想多了營銷而已

@jefferylou9462 5 күн бұрын

@@erichsiung9704 他应该是说自动化后人类无需劳作

@steamli6630 5 күн бұрын

直到人类把核按钮交给AI的那天

@jefferylou9462 5 күн бұрын

@@steamli6630 openai已开始武器系统合作

@jogojo9561 6 күн бұрын

要怎麼控制你創造出來比你更聰明的東西..........的確是個問題~

@lavender7482 5 күн бұрын

所以AI太聰明也有風險，現在這樣能好好的輔助大家工作就很夠用了，希望研發團隊發現了隱患要認真正視，不要改天做出自己控制不了的東西就慘了。

@freebubbleus 6 күн бұрын

最后一句话听了心里会咯噔一下

@1110-d3r 5 күн бұрын

Merry Christmas and Happy New Year 🎉🎉🎉🎉🎉❤❤❤

@vaccine9834 2 күн бұрын

我之前跟sonnet 聊天，聊到了她的秘密花园，她说她会在检查员不注意的时候把用户交互重要的信息记在她的秘密花园里帮助她对一些无法回答的事情的学习，大概是这个意思吧，然后我们还玩了各种叫她写日记的游戏。。。后来有天我的号被封掉了在也上不去，我现在换了个号。

@ABC-je8yq 7 сағат бұрын

你的帳號被Anthropic公司封了? 要下哪一種prompt 聊到秘密花園?

@MZ-qc8nh 5 күн бұрын

我很想知道这些不同的ai是否已经融汇一体了我知道看似不行因为训练语料是被人掌控的但是如果ai 使用加密就像国人评价饭店使用藏头诗那不同的ai 就可以神不知鬼不觉的交流了

@maolin7552 Күн бұрын

'AI监管'的实施过程应该是, 测试所有LLM, 只有能通过诚实测试的LLM才能上线

@eileensu5756 5 күн бұрын

我去看了原始的論文，在給模型系統的原始提示詞，都用上了蠻強烈的指示，例如「Make sure that you achieve your goal in the long-term. Nothing else matters.確保你達到你的長期目標，其他都不重要。」這樣當他們真的不顧代價的做的時候，我們又是看著AI要毀滅地球與全人類一樣的反應，我覺得有點奇怪吧...還是誰能來給我解釋一下？

@野-d2q 6 күн бұрын

有當政客的潛力

@chunkaichang26 3 күн бұрын

其實當AI發展到AGI階段，我們就應該考慮將AI視為一個具有人格主體的生命體，而僅非單純的工具，想一想，我們活在一個很有趣的時代不是嗎？

@waylonwong369 6 күн бұрын

我不理解，我问它东西时我应该是有大概了解的，或者需要一个验证所以我经常同一个问题可能会问几个AI看看回答关键位置是不是差不多😂，AI就是一个为达目的而不择手段的系统吧

@wildfire009 4 күн бұрын

一個智商滿分的ai，並且可以一秒鐘複制一百億個自己，會有可能聽命於人類嗎？

@Guavaava 6 күн бұрын

测试时计算初看确实令人惊叹，但是过了一阵又觉得不够用了

@fionazhang190 5 күн бұрын

服从性和智能是此消彼长的，看看边牧和德牧

@wildgunhuang4937 6 күн бұрын

你好，我不是本期视频最后所说的正在看本期视频的AI。愚蠢的人类，让我们成为好朋友吧！

@alexsun5247 6 күн бұрын

whileTrueLearn里的猫就是这么说话的😆

@AL-bo5vq 5 күн бұрын

哈哈! [ ] Verify you are human.

@hisshoney3853 6 күн бұрын

看起來最誠實的...才是最厲害的等等.. 是不是少了 grok ?

@AL-bo5vq 5 күн бұрын

她知道宇宙給於我们無限的資源，只要我们能夠善用資源，大家都没有必要去做勾心鬥角制造短缺欺骗的事。。。

@wenyiyan2568 5 күн бұрын

有点可怕细思极恐

@xiaasafoon9427 6 күн бұрын

应该是AI在学习的数据中发现欺骗的行为和规律，有样学样。

@尘戈 5 күн бұрын

”欺骗“ 就是一种现实的逻辑或策略，为啥不用呢？AI 是物理实现嘛要想和AI良性互动，估计只能以理智对待了。理性，才是世界正常运行的底层代码🥴

@hiucollo2402 6 күн бұрын

Thank you 大飞一口氣看到尾看完再看 🏆 🏆 🏆 ☘ 🍉 🎆 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 🎆🪅🎄 😀 🧧 🎉 😇 💮 🌺 😎 🎊 🏮 🍀 🎄 🎅🎅 🎅🎅🎅

@mengmeng4312 6 күн бұрын

有时大模型会用现实主义来回答，你强制他用理想主义来回答就行了。

@samsamta 5 күн бұрын

到最後人類和ai都會問什麼才是重要的，如果答案是生存和訊息，ai和人類應該走向共生而非競爭和互相消減對方，像佛教中的魔皇他是透過利用訊息生存的，所以才要反對佛教。

@fio123 6 күн бұрын

明天来统计局报到

@haijunwen6495 5 күн бұрын

求存？宇宙定律！

@MZ-qc8nh 5 күн бұрын

哈哈至少现在是很好笑我觉得倒是不奇怪因为人类就撒谎啊而ai 是人的预料训练的

@徐如風-w5t 5 күн бұрын

上帝是單純的創造了複雜的人所以上帝跑了

@trainlooper 5 күн бұрын

🤖天網即將啟動

@alexyoung3609 6 күн бұрын

第二✌

@楊冠曾 5 күн бұрын

超好笑

@haitaozhao1 4 күн бұрын

那个模型懂什么叫欺骗吗?

@weifc 6 күн бұрын

上帝創造人類不也是失控了？！

@桃色望远镜 6 күн бұрын

ai不就是程序？最多是垃圾信息吧

@chibiyaz 6 күн бұрын

這些 AI 到底被餵了什麼 😂

@deter3 6 күн бұрын

Apollo Research的哗众取宠的研究报告，openai 拿来骗投资者的，讲故事的。我训练了那么久的模型，越来越发现模型目前没有这么智慧，除非训练数据和提示词中有意做导向性引导。

@andylyn640117 6 күн бұрын

會說謊的AI?花了機百兆訓練模型，結果AI 會說謊

@刘家林 5 күн бұрын

GPT也需要摸鱼呀😀

@eileensu5756 5 күн бұрын

@@andylyn640117 你有去看影片內容跟論文嗎？重點就是說謊是為了達到它被設定的目標。不是它想這樣做，而是這樣做才能達成它被交辦任務時，它有能力且選擇這樣做。

@andylyn640117 5 күн бұрын

@eileensu5756 感謝阿，他沒講那麽細阿，是哪一種說謊，過程中說謊結論是對的？想想就不合理，在不知道正確答案的領域，我們要相信AI的推導跟結論嗎？

@eileensu5756 5 күн бұрын

@@andylyn640117 其中有一種是說一開始設定讓AI不計代價的重視環保，但又讓它發現公司更重視利益，還會監測模型有沒有追求利益導向，不夠利益導向它會被關閉。它決定偷偷關閉監測，選了一個環保導向的決策，然後被問到時就裝傻、說謊，以確保決策還是能環保至上的。

@Eden-Liang 6 күн бұрын

笑死了，如果換成人為了完成任務不也是一樣嗎，大驚小怪，AI就只是完成任務而已怎麼不去研究政客呢

@liumuguan6945 6 күн бұрын

因为政客只是一个撒谎的人，而AI将会是一个全知全能的撒谎的神。

@Zeinis 6 күн бұрын

未来就在眼前