09/01 세미나

저번주 월요일에는 이현종 연구원이 디퓨젼 모델이 어떻게 창의적인 그림을 그려내는지를 다루는 ICML 2025 Oral 논문을 소개했습니다. 이 논문에서는 CNN 기반의 디퓨젼 모델이 가지는 CNN의 두가지 특성(locality, equivariance)들이 디퓨젼 모델의 창의성에 큰 기여를 한다고 밝히고 있습니다. 원래 디퓨젼 모델의 목적은 트레이닝한 이미지 데이터 샘플들을 최대한 완벽하게 복원하는 것이 목적이지만 실제 디퓨젼 모델을 써보면 트레이닝한 이미지와는 비슷하지만 약간 다르면서도 새로운 특성을 가지는 이미지들이 생성되는 것을 확인할 수 있습니다. 이 논문에서 말하기로는 이는 CNN의 두가지 중요 특성으로 인해 훈련 이미지의 일부 부분들의 특성들을 필터들이 얻을 수 있고 이 일부 부분들의 특성의 위치를 바꿔가면서 이미지를 새로 재조합하기 때문에 디퓨젼 모델이 창의성을 발휘하고 훈련 이미지와 다른 새로운 이미지를 만들어낼 수 있다는 것을 밝혀냈습니다. 이 논문을 통해 디퓨젼 기술에 대한 이해를 더 넓힐 수 있었고 이 모델을 어떻게 우리 연구에 활용할 수 있을지도 생각해볼 수 있었습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다