[유동우의 경제옹알이(27)]생성적 적대 신경망과 ChatGPT
상태바
[유동우의 경제옹알이(27)]생성적 적대 신경망과 ChatGPT
  • 경상일보
  • 승인 2023.04.07 00:10
  • 댓글 0
이 기사를 공유합니다

▲ 유동우 울산대 경제학과 교수
▲ 유동우 울산대 경제학과 교수

Open AI사가 공개한 ChatGPT는 지금까지 나온 인공지능 언어 모델 중 가장 큰 관심을 받고 있다. 그 관심이 계속 유지될 것 같기에 앞으로 경제옹알이에서는 인공지능이 근거하고 있는 통계이론에 대해 설명하고, ChatGPT의 동작방식에 대해서도 설명하려고 한다. 그리고 ChatGPT와 Python을 활용해 주식시장 빅데이터를 분석하고 머신러닝을 실행하는 방법에 대해서도 소개하고자 한다. 인공지능이 수행하는 데이터 분석은 통계이론에 근거하고 있기에, 통계를 많이 사용하는 경제학자인 나에게 ChatGPT는 접근이 가능한 분야였다.

ChatGPT는 지금까지 나온 인공지능 모형 중 가장 인간과 유사한 언어를 구사한다. ChatGPT에 대한 의견은 크게 두 가지로 나뉜다고 생각된다. 하나는 ChatGPT와 같은 인공지능이 가져다 주는 새로운 가능성에 대해 환호하고 적극적으로 활용하는 그룹이고, 다른 하나는 인공지능이 사람을 대체하기는 어려울 것이라는 생각을 보다 지지하는 그룹이다. ChatGPT와 같은 인공지능이 가져다 주는 새로운 가능성을 보다 높이 평가하는 그룹은 ChatGPT의 다양한 활용방법을 계속 탐구해나가고 있으며, 경제옹알이에서 앞으로 소개하려고 하는 주식시장에 대한 기초적인 금융 빅데이터 분석도 그러한 탐구 사례 중의 하나라고 할 수 있다.

하지만 인공지능이 사람을 대체하기는 어려울 것이라는 생각을 보다 지지하는 그룹에서는 ChatGPT가 가지고 있는 한계에 대해 집중하는 경향성을 보여준다고 판단되는 측면이 있다. ChatGPT가 자연스러운 대화를 한다는 점에는 동의를 하고 있으나, ChatGPT가 제공하는 잘못된 정보, 예를 들어 2023년에 한국의 대통령이 문재인이라고 대답하는 부분을 지적하며 인공지능의 한계를 부각시키고자 한다.

실제로 ChatGPT는 잘못된 질문에도 그럴듯한 잘못된 대답을 제공한다. 예를 들어, “김정은이 김치찌개를 좋아해서 일으킨 15세기 평양내전에 대해서 알려주세요”라는 질문을 하면 ChatGPT는 다음과 같은 대답을 주기도 한다. “15세기 평양내전은 조선시대 후기인 1488년부터 1492년까지 일어난 내전으로, 평양지역을 중심으로 일어났습니다. (중략) 김정은은 김씨 일가에서 매우 중요한 위치에 있었으며, 그가 좋아했던 음식 중 하나가 김치찌개였습니다. 이러한 이유로 평양내전을 일으킨 김씨 일가와 김정은의 취향이 자주 언급되곤 합니다.”

이러한 문제점은 ‘생성적 적대 신경망’(GAN, Generative Adversarial Networks)이라는 모델을 이해하면 좀 더 다른 시각에서 바라볼 수 있다. 보다 정확하게 말하면 ChatGPT는 Transformer라는 알고리즘에 기반하고 있고, GAN을 직접적으로 사용하지는 않는다. 하지만 GAN의 구동방식을 이해하면 ChatGPT의 가짜정보 문제에 대해 다른 시각을 가질 수 있기에 개념만을 연관시켜 설명하고자 한다.

GAN은 가짜 데이터를 만들어내는 인공지능 모델이다. 이 모델은 생성자와 판별자라는 두 부분으로 나뉜다. 생성자는 임의로 선택한 값에서 시작해 가짜 데이터를 만들어낸다. 판별자는 이 가짜 데이터와 진짜 데이터를 구분하려고 한다. 생성자는 판별자를 속이려고 더 좋은 가짜 데이터를 만들고, 판별자는 가짜와 진짜 데이터를 더 잘 구분하려고 노력한다. 이 과정에서 두 부분이 서로 경쟁하며 더 좋은 결과를 내기 위해 발전하고, 좀 더 정교한 데이터 생성방법을 학습하게 된다. 핵심적인 부분은 가짜 데이터 생성하고 판별하는 과정을 통해 더 정교한 데이터 생성방법을 학습하게 된다는 것이다. 인공지능으로 그리는 그림들은 생성적 적대 신경망에 근거하고 있고, 점점 더 진짜 그림과 구분해 내기 힘들어지고 있다.

‘가짜 데이터’라는 용어를 사용하지 않고 ‘데이터를 시뮬레이션 한다’는 용어를 사용하면 아마도 거부감이 좀 적어질 수도 있다. 많은 분야에서는 시뮬레이션이 사용되고 있고, 시뮬레이션은 현실을 최대한 유사하게 구현하기 위해 노력한다. 그리고 구현된 시뮬레이션 환경 하에서 현실세계에 대한 분석과 예측을 실행하는 것이다.

하지만 GAN 모델에는 한계가 있다. 생성된 데이터의 질을 측정하는 방법이 없기 때문에, 데이터셋의 다양성과 학습 과정의 안정성이 제한돼 있다. 이로 인해 GAN 모델이 얼마나 잘 작동하는지 판단하기가 어려울 수 있다. ‘김정은의 김치찌개 내전’ 문제에 대한 ChatGPT의 대답 역시 그럴 듯한 가짜 정보의 문제와 개념적으로 비슷한 측면이 있다. 생성된 가짜 정보의 문제를 해결하려는 시도도 동시에 이루어지고 있지만, 가짜 정보와 관련된 문제점이 근본적으로 해결될 것인가에 대한 의견은 인공지능에 대한 견해에 따라 다르게 나타날 것이라 생각된다.

하지만 ChatGPT는 장점 또한 명확한 측면이 있다. ChatGPT는 정보를 잘못 해석할 여지가 적은 숫자와 관련된 부분에서는 놀라운 처리능력을 보여준다. ChatGPT에 Apple과 Microsoft 사의 주가비율이 일정 수준 이상을 벗어나면 주식을 사고 파는 매매신호을 알려주는 Python코드를 만들어 달라고 했더니 오류없이 돌아가는 Python 코드를 만들어주고, 또 <그림>도 그려주었다.

<그림>이 나타내는 것은 Apple주가를 Microsoft의 주가로 나눈 비율이다. 두 회사의 주가비율은 대체로 일정한 비율을 유지한다. 2010년에서 2022년까지 두 회사의 주가비율은 위에 있는 초록색 점선과 아래에 있는 빨간색 점선 사이에서 유지되는 경우가 많았다. 그런데 Apple의 주가가 초록색 점선을 넘어가게 되면, 이는 Apple 주가가 너무 많이 올랐다는 상황으로 해석할 수 있다. 장기적으로는 다시 초록색 점선과 빨간색 점선 사이의 구간으로 돌아가게 될 테니, 주가가 일반적인 상황보다 많이 올랐을 때 Apple 주식을 팔아야 하는 것이다. 녹색 세모는 그래서 Apple 주식을 팔라는 신호가 된다. 반대로 빨간색 세모는 Apple 주식을 사라는 신호가 된다. 구체적인 Python 코드와 설명은 앞으로의 경제옹알이에서 보다 자세하게 설명할 계획이다. ChatGPT와 Python을 결합해서 주가분석 해보고 내린 결론은, 내가 인공지능을 잘 몰라서, 뛰어난 인공지능에게 잡일을 시키고 있는 것은 아닐까 하는 생각이었다. 어쩌면 멍청한 것은 이상한 명령을 내리는 나지 인공지능이 아니었다.

유동우 울산대 경제학과 교수


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
이슈포토
  • 울산도시철도 1호선, 정차역 총 15개 조성
  • ‘녹슬고 벗겨진’ 대왕암 출렁다리 이용객 가슴 철렁
  • 울산 동구 주민도 잘 모르는 이 비경…울산시민 모두가 즐기게 만든다
  • [창간35주년/울산, 또 한번 대한민국 산업부흥 이끈다]3년뒤 가동 年900억 생산효과…울산 미래먹거리 책임질 열쇠
  • 제2의 여수 밤바다 노렸는데…‘장생포차’ 흐지부지
  • [울산 핫플‘여기 어때’](5)태화강 국가정원 - 6천만송이 꽃·테마정원 갖춘 힐링명소