Рет қаралды 1,578
최근 ChatGPT를 비롯한 많은 대형 언어 모델이 발표되고 있다. 대형 언어 모델을 기반으로 특정 문제를 위한 학습 없이 해당 문제를 해결하고 있다.
여기서 다음과 같은 의문이 발생한다. '여러 computer vision을 한번에 수행할 수 있는 모델은 없을까?' 이번 세미나에서 이러한 물음에 답을 얻기 위해 개발된 Segment Anything 이라는 방법론을 소개하고자 한다. 어떻게 데이터 수집을 진행하고, 모델을 학습하며, 여러 computer vision 문제를 해결하는 지 위주로 해당 방법론을 탐구해 볼 예정이다.
참고 자료:
[1] Kirillov, A., Mintun, E., Ravi, N., Mao, H., Rolland, C., Gustafson, L., ... & Girshick, R. (2023). Segment anything. arXiv preprint arXiv:2304.02643.
[2] Chen, T., Zhu, L., Ding, C., Cao, R., Zhang, S., Wang, Y., ... & Zang, Y. (2023). SAM Fails to Segment Anything?--SAM-Adapter: Adapting SAM in Underperformed Scenes: Camouflage, Shadow, and More. arXiv preprint arXiv:2304.09148.
[3] dmqm.korea.ac.k...