![로고 [사진: 디노티시아]](https://cdn.digitaltoday.co.kr/news/photo/202508/588286_547449_5846.jpg)
[디지털투데이 석대건 기자] 디노티시아가 한국 문화유산을 반영한 멀티모달 데이터셋 연구로 'ACM International Conference on Multimedia 2025' Dataset Track 논문으로 채택됐다고 29일 밝혔다.
이 연구는 한국 방송 영상 7822편에서 추출한 4만1000장 이미지와 41만개 한·영 내러티브 캡션을 기반으로 구축됐다. 기존 영어 중심 데이터셋의 언어적 불균형과 문화적 편향 문제를 해결했다.
ACM 멀티미디어(ACM Multimedia)는 1993년 창립 이후 33번째로 열리는 멀티미디어 분야 학회다. 올해 학회는 10월 27일부터 31일까지 아일랜드 더블린에서 개최된다.
채택된 디노티시아 논문 'HAN(Korean Heritage Augmented Narrative Visual-Language Description Dataset)'은 한국의 문화유산과 언어적 맥락을 반영한 멀티모달 데이터셋 구축을 다뤘다.
아울러 데이터셋 'HAN'은 기존 멀티모달 모델의 성능 한계를 보완했다. '내러티스 스타일 캡션(Narrative-style caption)' 방식을 적용해 문화유산의 맥락적 의미를 담아냈다. 연구진은 데이터셋의 실효성을 검증하기 위해 내러티브 캡션의 다양성을 활용한 후속 연구를 진행했다. 그 결과 기존 모델 대비 성능 향상이 나타났다.
이릍 통해 대규모 이미지-텍스트 기반 학습에서 발생하는 편향 문제를 완화하고, 다문화 환경에서도 일반화 가능한 시각-언어 모델 개발에 기여할 것으로 기대된다고 회사 측은 설명했다.
정무경 디노티시아 대표는 "K-팝과 K-드라마를 통해 한국문화가 세계인의 일상에 스며든 것처럼, 이제는 AI 모델에도 한국의 문화가 반영될 때"라며 "데이터셋 HAN은 단순한 연구 성과를 넘어, 한국문화가 글로벌 AI 모델들에 스며들 수 있는 첫걸음이며, 더 나아가 AI 생태계에서 데이터 다양성을 보장하고 편향을 줄이는 것에 기여할 것"이라고 말했다.

