No video

[Open DMQA Seminar] Controllable Diffusion Model

  Рет қаралды 774

‍김성범[ 교수 / 산업경영공학부 ]

‍김성범[ 교수 / 산업경영공학부 ]

Күн бұрын

Diffusion model 기반의 text-to-image 모델이 고품질의 이미지 생성 능력을 보여주며 많은 관심을 받고 있다. 그러나 기존 모델들은 텍스트 입력에 크게 의존하여 이미지를 생성하기 때문에, 때로는 사용자가 의도한 지시를 정확하게 반영하는 데 어려움이 있다. 이에 따라 본 세미나에서는 텍스트 뿐 아니라 다양한 입력 조건에 대해서도 유연하게 제어 가능한(controllable) diffusion 방법론을 소개하고자 한다.
참고자료 :
[1] Nichol, A. Q., Dhariwal, P., Ramesh, A., Shyam, P., Mishkin, P., Mcgrew, B., ... & Chen, M. (2022, June). GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models. In International Conference on Machine Learning (pp. 16784-16804). PMLR.
[2] Saharia, C., Chan, W., Saxena, S., Li, L., Whang, J., Denton, E. L., ... & Norouzi, M. (2022). Photorealistic text-to-image diffusion models with deep language understanding. Advances in Neural Information Processing Systems, 35, 36479-36494.
[3] Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-resolution image synthesis with latent diffusion models. In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (pp. 10684-10695).
[4] Zhang, L., Rao, A., & Agrawala, M. (2023). Adding conditional control to text-to-image diffusion models. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 3836-3847).
[5] Huang, L., Chen, D., Liu, Y., Shen, Y., Zhao, D., & Zhou, J. (2023). Composer: Creative and controllable image synthesis with composable conditions. arXiv preprint arXiv:2302.09778.
[6] Zhao, S., Chen, D., Chen, Y. C., Bao, J., Hao, S., Yuan, L., & Wong, K. Y. K. (2023). Uni-ControlNet: All-in-One Control to Text-to-Image Diffusion Models. arXiv preprint arXiv:2305.16322.

Пікірлер
[Open DMQA Seminar] Conditional Diffusion Models
38:00
‍김성범[ 교수 / 산업경영공학부 ]
Рет қаралды 9 М.
[Open DMQA Seminar] Image Denoising
31:18
‍김성범[ 교수 / 산업경영공학부 ]
Рет қаралды 793
Incredible Dog Rescues Kittens from Bus - Inspiring Story #shorts
00:18
Fabiosa Best Lifehacks
Рет қаралды 29 МЛН
I Took a LUNCHBAR OFF A Poster 🤯 #shorts
00:17
Wian
Рет қаралды 10 МЛН
Whoa
01:00
Justin Flom
Рет қаралды 50 МЛН
[Open DMQA Seminar] Hybrid Methods for Semi-Supervised Learning Under Class Distribution Mismatch
56:09
‍김성범[ 교수 / 산업경영공학부 ]
Рет қаралды 641
[Open DMQA Seminar] Multimodal Representation Learning
39:24
‍김성범[ 교수 / 산업경영공학부 ]
Рет қаралды 382
[Paper Review] Denoising Diffusion Probabilistic Models
51:46
고려대학교 산업경영공학부 DSBA 연구실
Рет қаралды 20 М.
[Open DMQA Seminar] Enhancing Prompt Understanding in Text-to-Image Diffusion Model
28:44
‍김성범[ 교수 / 산업경영공학부 ]
Рет қаралды 775
[Open DMQA Seminar] AI in Semiconductor Manufacturing
46:54
‍김성범[ 교수 / 산업경영공학부 ]
Рет қаралды 1 М.
Incredible Dog Rescues Kittens from Bus - Inspiring Story #shorts
00:18
Fabiosa Best Lifehacks
Рет қаралды 29 МЛН