Daily Papers — 2025-09-16

1. Locality in Image Diffusion Models Emerges from Data Statistics

Introduction

  • 본 연구의 목표는 이미지 확산 모델에서 관찰되는 지역성(locality) 현상이 신경망의 귀납적 편향이 아니라 데이터 통계로부터 발생함을 규명하는 것이다.
  • 기존 연구들은 지역성 및 이동 equivariance가 모델 성능 차이를 야기하는 신경망 아키텍처의 귀납적 편향 때문이라고 가정하였으나, 본 연구는 이러한 가정을 데이터 자체의 통계적 특성으로 대체하고자 하였다.
  • 본 논문은 데이터의 주성분 신호대잡음비(SNR) 분석을 통해 최적 선형 디노이저가 심층 신경망 디노이저와 유사한 지역성 특성을 보이며, 이를 기반으로 기존 모델보다 더 우수한 해석적 확산 모델을 제안하였다.

Method

  • 확산 모델의 최적 해석적 디노이저를 데이터의 공분산 행렬 고유분해를 통한 Wiener 필터 형태로 해석하였다.
  • 다양한 아키텍처(예: U-Net, Transformer) 학습 결과의 민감도 필드가 데이터의 고SNR 주성분 투영 연산자와 유사함을 실험적으로 확인하였다.
  • 데이터 통계 조작을 통해 디노이저 민감도 필드의 모양을 인위적으로 변경할 수 있음을 보였으며, 이를 바탕으로 픽셀별 비등방성 지역성을 반영한 새로운 해석적 모델을 제안하였다.

Results

  • 제안된 해석적 모델은 CIFAR10, CelebA-HQ, AFHQv2, MNIST, FashionMNIST 등 5개 데이터셋에서 기존의 최적 디노이저 기반 모델들보다 학습된 확산 모델 출력을 더 정확히 근사하였다.

Limitations

  • 본 연구는 주로 단순 아키텍처와 2차 통계량에 기반한 분석에 한정되며, 심층 확산 네트워크가 포착하는 고차 통계나 비선형 효과는 포함하지 못하였다.

Conclusion

  • 이미지 확산 모델의 지역성은 신경망 구조적 귀납적 편향이 아닌 데이터 픽셀 간 상관관계에 기인하며, 이를 반영한 해석적 모델이 심층 확산 모델의 동작을 더 정확히 설명할 수 있음을 증명하였다.

2. LongEmotion: Measuring Emotional Intelligence of Large Language Models in Long-Context Interaction

Introduction

  • Goal: 본 논문은 장문 맥락에서 대형 언어 모델(LLM)의 감성 지능(Emotional Intelligence, EI)을 평가하기 위한 LONGEMOTION 벤치마크를 제안하는 것이다.
  • Motivation: 기존의 EI 평가 벤치마크는 현실적인 장문 대화 상황에서의 감성 지능 평가에 필요한 문맥적 깊이와 시간적 연속성을 충분히 반영하지 못하였다.
  • Contribution: LONGEMOTION은 감정 분류, 감정 탐지, 감정 질의응답, 감정 대화, 감정 요약, 감정 표현의 6가지 과제로 구성되며, RAG 및 CoEM 프레임워크를 통해 장문 맥락에서 EI 성능 향상을 도모하였다.

Method

LONGEMOTION은 대화 내 감정 이해 및 표현을 위한 6개 과제를 포함하고, 대화 문맥을 동적 벡터 저장소로 활용하는 Retrieval-Augmented Generation(RAG)과 다중 에이전트 협업을 통한 Collaborative Emotional Modeling(CoEM) 방식을 제안하였다. CoEM은 입력 컨텍스트를 여러 청크로 분할하고, 관련성에 따라 선별, 보강 후 재평가하여 감성 응집력 있는 출력을 생성하도록 설계되었다. 두 방법 모두 장문에서 정보의 효율적 활용과 감성적 일관성 유지에 초점을 맞추었다.

Results

실험 결과, GPT-4o와 DeepSeek-V3 등 여러 모델이 RAG 및 CoEM 프레임워크 적용 시 대부분의 장문 EI 과제에서 성능이 꾸준히 향상되었으며, GPT-5가 감정 분류 및 탐지에서 최고 성능을 보였다.

Limitations

장문 맥락에서 외부 지식 주입 시 문맥과 불일치하거나 잡음이 유입되어 일부 과제에서는 성능 저하가 발생하였다.

Conclusion

LONGEMOTION과 제안된 RAG 및 CoEM 기법은 장문 맥락에서 LLM의 감성 지능 평가 및 향상을 위한 효과적인 연구 기반을 마련하였다.




Enjoy Reading This Article?

Here are some more articles you might like to read next:

  • Daily Papers — 2025-09-15
  • Daily Papers — 2025-09-13"
  • Daily Papers — 2025-09-12"
  • Daily Papers — 2025-09-11"
  • Daily Papers — 2025-09-10"