인과관계 시리즈의 두 번째로 인과관계의 식별을 방해하는 요소들에 대해서 세 가지로 나누어 살펴보자.
그림에서 우리의 목표는 X가 Y에게 주는 인과관계, 즉 1번을 밝혀내는 것이다. X와 Y가 함께 움직인다는 사실 만으로 1번의 인과관계를 확정할 수 없다.
우연의 일치
1,2,3이 전부 없어도 X, Y는 함께 움직일 수 있다. 상관 관계가 있다고 해서 인관 관계가 있는 것은 아니다. 더구나 그 연관이 기이하다면 더욱 의심을 해봐야 할 것이다. 물론 복잡계의 동학(베이징 나비의 날갯짓!)을 상상할 수도 있지만, 연관을 인과의 ‘충분조건’이 아니라 ‘필요조건’ 정도로 참고하는 편이 낫다. 물론 인터넷 뉴스의 해외 토픽 거리 정도로 소비하는 것 정도는 너그럽게 용서하도록 하자. 재미 삼아서 1인당 치즈 소비량과 이불보에 목이 걸려 죽는 사람의 숫자 사이에는 놀라운 상관 관계가 존재한다. 이런 가짜 상관성을 더 보고 싶으신 분들은 여기를 참고하시라.
제3의 요인
위의 그림에서 3에 해당한다. 영어로는 잠복 변수(hidden variables)라고 한다. 즉, 어떤 두 대상이 연관되었다는 것은 둘이 일정한 방향성을 지니며 함께 움직인다는 뜻이다. 이렇게 함께 움직인다는 사실만으로 하나가 다른 하나를 낳았다고 볼 수 있을까? 만일 둘 모두에게 작용하는 제3의 요인(들)이 있다면 어떨까? 그림에서 보듯이, 체력이 좋은 학생들이 공부를 잘한다”라는 사실에서, ‘그렇지, 체력이 실력이지, ‘라고 인과적인 결론 내릴 수 있을까? 만일 부모의 교육열이라는 제3의 공통 요인이 있어서 이 둘 모두에게 영향을 주고 있다면, 둘 사이에는 인관관계는 없고 상관관계만 존재할 뿐이다. 둘을 뒤에서 움직이는 것은 이 제3의 손이다.
역 인과관계
사실 역 인과관계, 즉 인과성이 반대로 설정된 경우(그림의 2번), 가 가장 절묘하다. 서울의 경찰관 수와 범죄 발생 건수를 살펴보니 양의 상관관계가 존재했다. 보통 경찰관의 수가 늘어나면 범죄가 줄 것을 예상한다. 그런데, 경찰관의 숫자가 늘어나니 범죄가 늘어나더라! 이런 놀랍고도 과학적인 발견이 있나! 이런 결론을 내린 어떤 과학자는 범죄를 줄이기 위한 대책으로 경찰관의 축소를 제안할지도 모르겠다. 무엇이 잘못되었을까? 우리는 경찰관의 수가 범죄 발생을 줄일 것을 예상한다. 이것은 관습적인 “인과관계”에 대한 인식이다. 이러한 인식이 과학적 분석을 방해할 수 있다. 만일 경찰관의 규모가 범죄 발생에 달린 문제라면? 그렇다면 범죄가 많이 발생할수록 더 많은 경찰관이 투입될 것이다. 앞서 미친 과학자처럼 처방했다가는 오히려 “범죄 도시”를 부추길 수도 있다.
RCT 복습
당연하지만, 이런 요인들을 인식하는 것과 이를 극복하는 것은 별개의 문제다. 앞서 1편에서 보았듯이 제대로 된 실험을 하기 위해서는 “반사실 counter-factual”이 필요하다. 통계학적으로 같은 대상에 대해서 이렇게 해보고 저렇게도 해 본 후에 처치 효과를 측정할 수 있는 것이다. 그게 안된다면 적어도 평균적으로 동일하다고 확신할 수 있는 두 집단(통제 집단, 처치 집단)을 고르고 이 집단에 대해 차별적인 조치를 취한 후 분포 상의 차이를 볼 수 있어야 한다. 이렇게 통제 집단과 처치 집단을 구별해서 통제된 실험을 하는 것을 무작위 통제 실험(randomized controlled trial)라고 한다.
의학에서 RCT를 “이중맹검 실험”이라고 부르기도 한다. 이중 맹검(double-blinded test)이란 통제 집단과 처치 집단을 나눔에 있어서 실험자나 실험대상자 양쪽 모두 자신이 어느 쪽에 있는지 알 수 없게 만드는 절차이다. 실험 과정 및 결과 분석 등에서 개입될 수 있는 편향을 방지하기 위한 방법이다. 단일 맹검(single-blinded test)란 실험 대상, 즉 실험 참가자에게 어느 집단에 속해 있는지 무엇을 실험하는지 따위를 알려주지 않는 것을 말한다.
RCT가 그냥 이론적으로만 혹은 의학 등의 일부 분야에만 존재하는 것이 아니다. 사회적 의제에 대해서도 RCT는 의외로 많이 활용된다. RCT를 가능하게 하는 조건에서 가장 중요한 것은 실험의 윤리과 비용일 것이다.
비교적 타협 가능한 형태로 RCT가 가장 많이 시행되는 분야가 “발전 경제학”이다. 저개발국의 가난한 농민들에게 직접 돈을 주는 게 맞을까, 아니면 씨앗과 비료를 공급하는 것이 맞을까? 논쟁할 필요 없이 RCT를 잘 설계해서 실험을 해보면 된다. 특히 저개발국을 돕는 원조를 제공해야 하는 측의 입장에서 보면 이러한 효과성을 파악할 수 있는 연구가 꽤 중요하다. MIT의 경제학자 에스더 뒤플로가 이 분야의 선구자이며 많은 성과를 내고 있다. 오바마 행정부에서는 증거 기반(evidence-based) 정책의 중요성을 강조하고 정책을 시행하기 전에 RCT를 통해 효과를 검증할 수 있다는 다양한 방법을 모색했다.
시리즈의 다음 포스트에는 RCT를 시행할 수 없는 상황에서 인과성을 찾아내기 위한 사회과학자들의 눈물 겨운 시도를 하나 씩 살펴볼 예정이다.
참고한 책
- 이토 고이치로, “데이터 분석의 힘”, 2018.
- 나카무로 마키코, 쓰가와 유스케, “원인과 결과의 경제학”, 2018.
- Joshua Angrist, J-S Pischke, “고수들의 계량경제학”, 2017
- 아바지트 배너지, 에스테르 뒤플로, “가난한 사람이 더 합리적이다”, 2012