‘하나 배우면 둘 아는’ AI 멀티모달 학습기술 개발
2025-05-08 이다예
멀티모달 학습은 서로 다른 데이터 모달리티를 결합해 통합적으로 이해하고 처리하는 학습법인데, 명확히 짝지어진 데이터가 부족하면 성능이 저하된다.
연구팀이 제안한 학습법은 짝지어지지 않은 데이터로도 멀티모달 학습이 가능하다. 음성과 인간 표정을 함께 분석해 감정을 이해하는 AI 비서, CT 영상과 진료 기록을 의사처럼 결합해 진단하는 의료AI 구축에 들어가는 비용과 시간을 절감할 수 있다.
연구팀은 텍스트 모델이 이미지 모델 학습을 돕거나, 오디오 모델이 언어 모델 성능을 높이는 등의 실험을 진행했고, 기존보다 높은 정확도를 기록하며 모달리티 간 학습 촉진 효과를 확인했다. 오디오와 이미지처럼 직접적인 연관성이 적은 조합에서도 AI의 성능 향상이 나타났다.
윤성환 교수는 “정렬된 데이터셋 확보가 어려운 의료, 자율주행, 스마트 AI 비서 등 다양한 분야에서 활용 가능성이 높다”고 말했다.
이다예기자 ties@ksilbo.co.kr