[Paper Review] LLaVA: Large Language and Vision Assistant (Visual Instruction Tuning)

[Paper Review] Back to the Feature: Classical 3D Features are All You Need for 3D Anomaly Detection

[Paper Review] BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language

Une nouvelle voiture pour Noël 🥹

⚡Токаев ШОКИРОВАЛ Кремль! РАЗМАЗАЛ заявлением Путина #shorts

How Strong Is Tape?

伪装成一棵树整蛊妹妹，结果妹妹当场怀疑人生竟要揍我？【两只马儿-恶搞姐妹】

[Paper Review] LLaVA: Large Language and Vision Assistant (Visual Instruction Tuning)

Рет қаралды 2,919

서울대학교 산업공학과 DSBA 연구실

서울대학교 산업공학과 DSBA 연구실

Күн бұрын

Пікірлер

@노란콩-u1d 7 ай бұрын

발표가 귀에 쏙쏙 들어오네요~

@leejaeyoung3448

@leejaeyoung3448 8 ай бұрын

@12:23 GPT-4가 visual content를 인지할 수 없다는 것이 어떤 뜻일까요?

@my_sticalnd_34

@my_sticalnd_34 8 ай бұрын

안녕하세요, 발표자 석사과정 마민정입니다. 당시 논문에서 활용된 GPT-4는 Text-only GPT-4로 이미지를 볼 수 없는 버전이었습니다. 감사합니다😊

@heejuneAhn 7 ай бұрын

1. 영어 방음이 좋은 것 같네요. 2. 단순히 해당 논문 설명에 급급한 것이 아닌, Instruction Learning에 대한 설명이 앞 부분에 들어가서 완성도가 높은 발표가 된 것 같습니다. 3. 각 파트별 설명이 좀 더 자세히 (코드를 보셨으면) 하였으면 좋았을 거 같습니다. 예를 들어 ViT 출력에서 Linear projection을 하여 Language Embedding을 한다고 했는데 이 과정을 좀 더 실제 수행 예를 가지고 설명했으면 . 전반적으로 코드 레벨로 실행이나 재 시험은 안 하고 논문 내용만 잘 읽은 것 같은 느낌입니다.

@my_sticalnd_34

@my_sticalnd_34 4 ай бұрын

조언 감사합니다:)

[Paper Review] Back to the Feature: Classical 3D Features are All You Need for 3D Anomaly Detection

47:56

[Paper Review] Back to the Feature: Classical 3D Features are All You Need for 3D Anomaly Detection

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 660

[Paper Review] BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language

37:12

[Paper Review] BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 2,3 М.

Une nouvelle voiture pour Noël 🥹

00:28

Une nouvelle voiture pour Noël 🥹

Nicocapone

Рет қаралды 9 МЛН

⚡Токаев ШОКИРОВАЛ Кремль! РАЗМАЗАЛ заявлением Путина #shorts

00:33

⚡Токаев ШОКИРОВАЛ Кремль! РАЗМАЗАЛ заявлением Путина #shorts

24 Канал

Рет қаралды 941 М.

How Strong Is Tape?

00:24

How Strong Is Tape?

Stokes Twins

Рет қаралды 96 МЛН

伪装成一棵树整蛊妹妹，结果妹妹当场怀疑人生竟要揍我？【两只马儿-恶搞姐妹】

00:57

伪装成一棵树整蛊妹妹，结果妹妹当场怀疑人生竟要揍我？【两只马儿-恶搞姐妹】

两只马儿—恶搞姐妹

Рет қаралды 44 МЛН

[Paper Review] AI agent가 연구도 할 수 있을까?: The AI Scientist

34:37

[Paper Review] AI agent가 연구도 할 수 있을까?: The AI Scientist

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 3,7 М.

[Paper Review] Byte Latent Transformer: Patches Scale Better Than Tokens

36:10

[Paper Review] Byte Latent Transformer: Patches Scale Better Than Tokens

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 889

무료 자료요약 최고 구글의 노트북LM | 유료 챗GPT 보다 낫다! | Google Notebook LM

19:22

무료 자료요약 최고 구글의 노트북LM | 유료 챗GPT 보다 낫다! | Google Notebook LM

감자선배

Рет қаралды 5 М.

[Paper Review] BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and LLMs

26:11

[Paper Review] BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and LLMs

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 1,3 М.

[Paper Review] Instruction Tuning with GPT-4

18:54

[Paper Review] Instruction Tuning with GPT-4

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 2,4 М.

[Paper Review] An Inverse Scaling Law for CLIP Training

21:09

[Paper Review] An Inverse Scaling Law for CLIP Training

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 204

[Paper Review] AgentInstruct:Toward Generative Teaching with Agentic Flows

32:56

[Paper Review] AgentInstruct:Toward Generative Teaching with Agentic Flows

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 392

[Paper Review] Unsupervised Information Refinement Training of LLMs for RAG

25:10

[Paper Review] Unsupervised Information Refinement Training of LLMs for RAG

서울대학교 산업공학과 DSBA 연구실

Рет қаралды 199

이미지까지 이해하는 Multimodal LLM의 학습 방법 밝혀내기 / if(kakaoAI)2024

37:59

이미지까지 이해하는 Multimodal LLM의 학습 방법 밝혀내기 / if(kakaoAI)2024

kakao tech

Рет қаралды 909

LlamaIndex Webinar: LLaVa Deep Dive

49:23

LlamaIndex Webinar: LLaVa Deep Dive

LlamaIndex

Рет қаралды 6 М.

Une nouvelle voiture pour Noël 🥹

00:28

Une nouvelle voiture pour Noël 🥹

Nicocapone

Рет қаралды 9 МЛН