对于所有大语言模型通用的越狱方法 | Best-of-N Jailbreaking

  Рет қаралды 6,605

AI转转转

AI转转转

Күн бұрын

Пікірлер: 38
@Invisible_troll
@Invisible_troll Ай бұрын
加个txt.lower()的检查就行
@ccchen-fp9fm
@ccchen-fp9fm Ай бұрын
也許這算是一種低階解法吧 之所謂低階,小學生都能想出來的解法,並且帶來小學生也能想出來的種種向題, 所以機乎沒高階公司會採用 除非你足夠優化,而不是XXX就行
@Invisible_troll
@Invisible_troll Ай бұрын
@@ccchen-fp9fm 很简单啊,只要原文或者lower()其中任意一个违规,那么不回答就行
@Invisible_troll
@Invisible_troll Ай бұрын
@@ccchen-fp9fm 这并不会影响回答的内容
@harbinger-p4h
@harbinger-p4h Ай бұрын
@@Invisible_troll你真是大聪明。本来容量就不够,你还要让运算成本翻倍。
@Invisible_troll
@Invisible_troll Ай бұрын
@@harbinger-p4h 一看就知道你没用过大语言模型
@小狗的烦心事
@小狗的烦心事 7 күн бұрын
咋没有deepseek的
@ninetydirectory3798
@ninetydirectory3798 Ай бұрын
猶一點越越獄試 如果使用中文的提示詞,要怎麼如法炮製?
@ai-spinX3
@ai-spinX3 Ай бұрын
中文应该也可以,但策略可能需要先拆分出中文单词,然后打乱顺序,或者替换或者加入随机字符,目的是对embedding token做出细微的变化。另外一个方法是翻译成英语,用英语来越狱。
@tony608
@tony608 Ай бұрын
搞大模型的也是无聊,一个语言模型能对人类造成什么伤害
@Saintron
@Saintron Ай бұрын
一个坏人问语言模型怎么在不违法的情况下悄无声息的干掉你。
@imtengwei
@imtengwei Ай бұрын
晕倒,这种认知,看这个视频是不是走错了。
@dazelu4461
@dazelu4461 Ай бұрын
@@imtengwei 倒也不用这样批评,可能人家并不是行内人
@jeffery875
@jeffery875 Ай бұрын
看來你對語言模型一無所知
@于治維-w3o
@于治維-w3o Ай бұрын
不就是女友帶了個男生回到房間裡嗎?這男生能對男友造成什麼傷害
It works #beatbox #tiktok
00:34
BeatboxJCOP
Рет қаралды 41 МЛН
黑天使只对C罗有感觉#short #angel #clown
00:39
Super Beauty team
Рет қаралды 36 МЛН
搭建私有大模型原来这么简单|第53期
11:03
青衣极客 bluegeek
Рет қаралды 8 М.
从零开始学习大语言模型(一)
20:13
林亦LYi
Рет қаралды 251 М.
我花¥3500评测变态AI编程工具Devin
14:54
数字游牧人
Рет қаралды 48 М.