Рет қаралды 698
발표자: 박사과정 김재희
1. 논문 제목: Training Large Language Models to Reason in a Continuous Latent Space
2. 논문 링크: arxiv.org/abs/...
3. Overview:
latent mode를 활용한 reasoning 유도 학습/추론 프레임워크 제안
continuous reasoning 시 모델의 추론 방식에 대한 다양한 분석 진행
기존 CoT 방식 대비 성능 소폭 개선 및 추론 토큰 수 감소