[목요칼럼]정책 분석에서의 상관관계와 인과관계

2024-11-07     경상일보

우리는 종종 “상관관계가 인과관계를 의미하지 않는다”는 말을 듣는다. 그럼에도 불구하고 많은 사람들이 이 두 개념을 쉽게 혼동한다. 상관관계와 인과관계의 차이는 우리가 세상을 이해하고 정책을 결정하는 방식에 큰 영향을 미친다.

먼저 두 개념을 정의해 보자. 상관관계란 두 변수 간의 통계적 관계로, 한 변수가 변할 때 다른 변수도 함께 변하는 현상을 의미한다. 예를 들어, 여름철에 아이스크림 판매량과 익사율이 동시에 증가한다면, 이 두 변수 사이에는 상관관계가 있다고 볼 수 있다. 그러나 상관관계는 두 변수가 함께 변화한다는 사실을 보여줄 뿐, 하나가 다른 것을 일으킨다는 뜻은 아니다.

반면, 인과관계는 직접적인 원인과 결과의 관계를 의미한다. 즉, A가 B를 일으킬 때, A의 변화가 B의 변화를 직접적으로 초래하는 것이다. 상관관계와 달리, 인과관계는 단순한 연관성을 넘어 한 사건이 다른 사건의 발생 원인인지 고찰한다. 우리는 두 현상 간에 상관관계가 있다는 이유로 하나가 다른 것의 원인이라고 쉽게 착각할 수 있다. 예를 들어, 아이스크림을 먹는 것이 익사 위험을 증가시킨다고 잘못 결론 내릴 수도 있다.

하지만 실제로는 아이스크림 판매량과 익사율이 모두 여름철 기온 상승에 의해 증가한 것으로, 이는 허위 상관관계의 전형적인 사례다.

최근에는 인과추론 연구자들이 노벨경제학상을 수상하면서 인과관계의 중요성이 더욱 강조되고 있는데, 이들은 복잡한 사회경제적 현상에서 인과관계를 밝히기 위한 방법론을 개발하고 발전시켜 왔다. 인과추론은 머신러닝 발전에서도 중요한 역할을 하고 있다.

머신러닝은 데이터에서 패턴과 상관관계를 찾는 데 뛰어나지만, 이제는 단순한 상관관계를 넘어 이러한 패턴을 이끄는 인과관계를 파악하는 것이 중요해지고 있다.

인과관계는 단순한 학문적 논의에 그치지 않고 정책 분석과 결정에 핵심적인 역할을 한다. 정부와 조직이 정책을 설계할 때는 빈곤 감소, 교육 향상, 기후 변화 완화 등 구체적인 목표를 갖고 있다. 이를 효과적으로 달성하기 위해서는 정책의 성공 여부를 좌우하는 인과적 관계를 이해해야 한다. 인과관계를 제대로 이해하지 못하면 자원을 비효율적으로 사용하거나 예기치 않은 부작용을 초래할 위험이 크다.

그러나 실제 정책 분석에서 인과관계를 명확히 파악하는 것은 실험실 환경처럼 간단하지 않다. 실험실에서는 변수를 통제해 명확한 원인과 결과의 관계를 도출할 수 있지만, 정책 분석에서는 수많은 변수가 얽힌 복잡한 사회 데이터를 다루어야 하고, 윤리적·재정적·실무적 제약 때문에 무작위 통제 실험을 시행하기 어렵다.

그럼에도 경제학자와 사회과학자들은 실험실 밖에서도 인과관계를 추론할 수 있는 다양한 방법을 개발해 왔다. 자연 실험, 이중차분법, 조작변수, 회귀 불연속 설계, 매칭법, 도구변수, 통제집단합성법 등 다양한 방법론이 등장하면서 무작위 실험이 불가능한 상황에서도 인과추론을 가능하게 한다.

정책 설계에서 인과관계를 정확히 파악할 수 있다면, 다양한 정책의 효과를 예측하는 데 큰 도움이 된다. 이 과정에서 반사실적(counterfactual) 분석이 중요한 역할을 한다. 반사실적 분석은 특정 정책이 시행되지 않았다면 어떤 결과가 나타났을지를 질문한다. 예를 들어, 새로운 세금 정책이 도입됐을 때, 그 세금이 도입되지 않았더라면 경제가 어떻게 변화했을지 반사실적 분석을 통해 추정할 수 있다. 이러한 분석은 정책의 실질적 효과를 이해하고, 미래의 정책 설계를 개선하는 데 필수적이다.

정확한 인과 추론은 과거 정책의 효과를 설명할 뿐만 아니라, 향후 정책의 영향을 예측하는 데도 중요한 역할을 한다. 인과관계를 이해함으로써 정부는 자원을 더 효율적으로 배분하고, 시민들에게 더 나은 결과를 제공할 수 있다.

이사야 UNIST 경영과학부 교수