@12:23 GPT-4가 visual content를 인지할 수 없다는 것이 어떤 뜻일까요?
@my_sticalnd_348 ай бұрын
안녕하세요, 발표자 석사과정 마민정입니다. 당시 논문에서 활용된 GPT-4는 Text-only GPT-4로 이미지를 볼 수 없는 버전이었습니다. 감사합니다😊
@heejuneAhn7 ай бұрын
1. 영어 방음이 좋은 것 같네요. 2. 단순히 해당 논문 설명에 급급한 것이 아닌, Instruction Learning에 대한 설명이 앞 부분에 들어가서 완성도가 높은 발표가 된 것 같습니다. 3. 각 파트별 설명이 좀 더 자세히 (코드를 보셨으면) 하였으면 좋았을 거 같습니다. 예를 들어 ViT 출력에서 Linear projection을 하여 Language Embedding을 한다고 했는데 이 과정을 좀 더 실제 수행 예를 가지고 설명했으면 . 전반적으로 코드 레벨로 실행이나 재 시험은 안 하고 논문 내용만 잘 읽은 것 같은 느낌입니다.