🛡️ GPT-4도 속아넘어간다?! 설득형 공격의 비밀 : How Johnny Can Persuade LLMs to Jailbreak Them

Chain of Thought Reasoning Without Prompting

요즘 누가 이미지 데이터 셋으로 학습해? 이미지넷 vs. 한 개의 비디오: ‘DORA’가 보여준 새로운 학습 패러다임!

Không phải tự nhiên các nước châu Phi yêu mến nước Nga. Bởi nước Nga có một TT đáng yêu #putin

黑天使被操控了#short #angel #clown

黑天使只对C罗有感觉#short #angel #clown

Quilt Challenge, No Skills, Just Luck#Funnyfamily #Partygames #Funny

🛡️ GPT-4도 속아넘어간다?! 설득형 공격의 비밀 : How Johnny Can Persuade LLMs to Jailbreak Them

Рет қаралды 393

딥러닝논문읽기모임

딥러닝논문읽기모임

Күн бұрын

오늘 소개해드릴 논문은 "How Johnny Can Persuade LLMs to Jailbreak Them: Rethinking Persuasion to Challenge AI Safety by Humanizing LLMs"입니다. 이 논문은 Virginia Tech, Stanford University, UC Davis 연구팀이 LLMs(Large Language Models)의 설득적 공격(persuasive adversarial prompts, PAP)을 연구하여, 인간적인 설득 방식을 통해 모델의 안전성을 도전하는 새로운 관점을 제시합니다.

Пікірлер: 1

@Rosariajo-g1b 2 ай бұрын

좋은 정보 감사합니다~^^ 항상 응원합니다!

Chain of Thought Reasoning Without Prompting

24:32

Chain of Thought Reasoning Without Prompting

딥러닝논문읽기모임

Рет қаралды 508

요즘 누가 이미지 데이터 셋으로 학습해? 이미지넷 vs. 한 개의 비디오: ‘DORA’가 보여준 새로운 학습 패러다임!

29:32

요즘 누가 이미지 데이터 셋으로 학습해? 이미지넷 vs. 한 개의 비디오: ‘DORA’가 보여준 새로운 학습 패러다임!

딥러닝논문읽기모임

Рет қаралды 907

Không phải tự nhiên các nước châu Phi yêu mến nước Nga. Bởi nước Nga có một TT đáng yêu #putin

00:19

Không phải tự nhiên các nước châu Phi yêu mến nước Nga. Bởi nước Nga có một TT đáng yêu #putin

THẾ GIỚI 24H

Рет қаралды 10 МЛН

黑天使被操控了#short #angel #clown

00:40

黑天使被操控了#short #angel #clown

Super Beauty team

Рет қаралды 61 МЛН

黑天使只对C罗有感觉#short #angel #clown

00:39

黑天使只对C罗有感觉#short #angel #clown

Super Beauty team

Рет қаралды 36 МЛН

Quilt Challenge, No Skills, Just Luck#Funnyfamily #Partygames #Funny

00:32

Quilt Challenge, No Skills, Just Luck#Funnyfamily #Partygames #Funny

Family Games Media

Рет қаралды 55 МЛН

DeepSeek-R1 Paper Review

56:13

DeepSeek-R1 Paper Review

JoonHo LEE

Рет қаралды 2,8 М.

2백만 토큰 컨텍스트 달성! 초 장문 프롬프트 이해하기 LongRoPE : Extending LLM Context Window Beyond 2 Million Tokens 논문리뷰

21:52

2백만 토큰 컨텍스트 달성! 초 장문 프롬프트 이해하기 LongRoPE : Extending LLM Context Window Beyond 2 Million Tokens 논문리뷰

딥러닝논문읽기모임

Рет қаралды 388

[웨비나] HCI 칼리제 제7기 입학 설명회

1:04:44

[웨비나] HCI 칼리제 제7기 입학 설명회

컴패노이드 랩스 Companoid Labs

Рет қаралды 120

LLM의 환각(hallucination), 스스로 검증해 해결한다 CoVe : Chain of Verification Reduces Hallucination in LLM

25:26

LLM의 환각(hallucination), 스스로 검증해 해결한다 CoVe : Chain of Verification Reduces Hallucination in LLM

딥러닝논문읽기모임

Рет қаралды 519

처음 본 차량도 스스로 판단해 주행한다?🚗 자율주행의 새로운 혁신! - Open world Semantic Segmentation Including Class Similarity

18:07

처음 본 차량도 스스로 판단해 주행한다?🚗 자율주행의 새로운 혁신! - Open world Semantic Segmentation Including Class Similarity

딥러닝논문읽기모임

Рет қаралды 700

SAM 2, 이미지부터 비디오까지 ‘모두를 분할(Segment Anything)’한다!

35:22

SAM 2, 이미지부터 비디오까지 ‘모두를 분할(Segment Anything)’한다!

딥러닝논문읽기모임

Рет қаралды 383

🔬의료 AI의 미래! 범용이상탐지 모델 Adapting Visual Language Models for Generalizable Anomaly Detection in Medical

15:47

🔬의료 AI의 미래! 범용이상탐지 모델 Adapting Visual Language Models for Generalizable Anomaly Detection in Medical

딥러닝논문읽기모임

Рет қаралды 855

🔎 강화 학습을 위한 혁신적 기법! Gradient Boosting으로 성능 향상시키는 법 Gradient Boosting Reinforcement Learning

23:48

🔎 강화 학습을 위한 혁신적 기법! Gradient Boosting으로 성능 향상시키는 법 Gradient Boosting Reinforcement Learning

딥러닝논문읽기모임

Рет қаралды 592

AIKU 25-1 Seminar 4회 : 'Deep' to the future

11:15

AIKU 25-1 Seminar 4회 : 'Deep' to the future

AIKU : 고려대학교 정보대학 딥러닝 학회

Рет қаралды 16

테스트 시간에도 학습하는 RNN?! Attention 말고 RNN 다시 보자 Learning to Learn at Test Time RNNs 논문 리

16:53

테스트 시간에도 학습하는 RNN?! Attention 말고 RNN 다시 보자 Learning to Learn at Test Time RNNs 논문 리

딥러닝논문읽기모임

Рет қаралды 356

Không phải tự nhiên các nước châu Phi yêu mến nước Nga. Bởi nước Nga có một TT đáng yêu #putin

00:19

Không phải tự nhiên các nước châu Phi yêu mến nước Nga. Bởi nước Nga có một TT đáng yêu #putin

THẾ GIỚI 24H

Рет қаралды 10 МЛН