이미지 데이터, 언어로 변환·분석 방법론 제시
상태바
이미지 데이터, 언어로 변환·분석 방법론 제시
  • 이다예 기자
  • 승인 2025.12.29 00:01
  • 댓글 0
이 기사를 공유합니다

▲ UNIST 인공지능대학원 김태환(사진) 교수
UNIST는 인공지능대학원 김태환(사진) 교수팀이 AI 학습 데이터를 인간이 이해할 수 있는 ‘자연어’로 변환함으로써 AI 블랙박스를 설명하는 학습 방법론을 제안했다고 28일 밝혔다.

연구팀은 AI 학습의 원천인 ‘데이터’에 주목, 데이터의 특징을 설명문으로 구체화하고 이를 분석함으로써 모델의 의사결정 과정을 규명하고자 했다.

연구팀은 먼저 챗GPT와 같은 LLM 모델로 사진 속 사물의 특징을 여러 문장으로 설명하게 했다.

환각 현상 없는 고품질 설명문을 만들기 위해서는 인터넷 백과사전과 같은 외부 지식도 참고하도록 했다. LLM이 생성한 수십 개의 설명 문장이 모두 모델 학습에 유효한 것은 아니다.

연구팀은 생성된 설명 중 AI 모델이 정답을 맞추는 데 실제로 참고한 설명문을 식별하기 위해 텍스트 영향력 점수(IFT)라는 정량적 분석 지표를 고안했다.

예를 들어 조류 분류 모델에서 배경 색상에 대한 설명보다 ‘부리의 형태’나 ‘깃털의 무늬’를 묘사한 설명문이 높은 IFT 점수를 기록했다면, 해당 모델은 부리와 깃털의 특징을 학습하여 대상을 식별했다고 해석할 수 있다.

연구팀은 이렇게 영향력이 큰 설명문들이 실제 모델이 정답을 맞추는 성능에도 도움이 되는지를 확인하기 위해 별도의 벤치마크 실험을 설계했다.

그 결과, 영향력이 높은 설명문을 사용했을 때 기존 방식보다 안정적으로 높은 성능을 보였다.

이는 모델이 학습 과정에서 실제로 활용했던 설명이 성능에도 의미 있는 기여를 한다는 사실을 보여주는 검증 결과다.

연구 결과는 자연어처리(NLP) 분야 대표 국제학회인 ‘EMNLP’의 정식 논문으로 채택됐다.

이다예기자 ties@ksilbo.co.kr

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
이슈포토
  • 경상도 남자와 전라도 여자 ‘청춘 연프’ 온다
  • “서생면에 원전 더 지어주오”
  • 울산 전고체배터리 소재공장, 국민성장펀드 1호 후보 포함
  • 주민 편익 vs 교통안전 확보 ‘딜레마’
  • 2026 경상일보 신춘문예 980명 2980편 접수
  • 조선소서 풀리는 돈, 지역에서 안돌고 증발