정치권-언론-조사업계가 만든 합작품

본 보고서는 <신동아> 2013년 2월호 [정밀진단 | 위기의 여론조사] “태생적 한계, 정치적 의도가 혼란 가중: 다르고 틀리고 헛갈리고”를 수정 보완한 보고서이다.

1. 2010년 지방선거와 여론조사 신뢰도 위기

2012년 대선에서는 대권을 건 후보들의 경선과 함께 또 다른 영역에서 그에 못지 않은 뜨거운 각축전이 펼쳐졌다. 여론조사 보도에서 우위를 점하려는 언론사들의 경주마식 보도경쟁이 바로 그것이다. 적지 않은 여론조사 비용 문제로 인해 과거에는 방송 3사나 규모 있는 언론사에서만 비정기적으로 보도하는 수준이었지만, 최근 금기시 되었던 저가의 자동응답조사(ARS 조사 혹은 IVR조사로 불림) 방법을 선거여론조사에 활용하기 시작하면서 이젠 재정이 넉넉지 않은 전통 언론매체나 인터넷 매체 등에서도 독자적인 여론조사 보도를 하는 것이 가능해졌다.

조사 빈도에서도 많은 변화가 있었다. 과거에는 한달 주기 정기조사나 ‘D-100’, ‘D-30’, ‘D-7’ 식으로 특정 시점에 의미를 부여하거나 ‘추석 직후 대선 민심’, ‘후보등록 직후 조사’ 처럼 정치사회적 이벤트에 맞춰 비정기적으로 조사하는 것이 일반적이었다. 그러나 2012년 대선에서는 한국갤럽, 리얼미터, 리서치앤리서치 등에서 300-500명 씩 샘플을 매일 모집하여 2-3일간의 조사결과를 평균하여 발표하는 소위 ‘일일조사’ 결과까지 발표되면서 거의 매일 복수의 기관들에 의한 다양한 여론조사 결과들을 거의 매일 접할 수 있게 되었다.

이러한 여론조사 보도행태에서의 변화 뿐 아니라 2010년 지방선거를 계기로 조사방법에서도 큰 변화들이 발생했다(표1 참조). 조사실비 상승 및 조사기간 연장 등 때문에 미루어져온 조사방법의 개선노력이 2012년 대선을 앞두고 급격하게 확산된 것은 무엇보다 2010년 지방선거를 계기로 ‘여론조사 신뢰도 위기’로부터 비롯된 정치사회적 압력이 컸기 때문이다. 즉 2010년 지방선거에서 대부분의 선거 일주일 전 조사에서 전국적으로 당시 한나라당 후보가 우세한 결과들이 나왔지만, 민주당 열세로 예상된 지역에서는 박빙의 결과(예: 서울, 경기에서 한명숙, 유시민 후보의 선전)가, 박빙이 예상된 지역에서는 민주당 후보의 여유 있는 승리(예: 경남 김두관, 충남 안희정, 강원 이광재 후보의 승리 등)로 귀결되면서 소위 기존의 여론조사로 잡지 못하는 ‘야당의 숨은 표’가 존재한다는 주장이 대부분의 언론을 통해 대대적으로 보도되었고 기정사실화되었다.

이러한 주장은 크게 세 가지 논리로 뒷받침된다. 첫째, 휴대전화로 추출된 응답자는 가구전화로 추출된 응답자들보다 진보성향, 야당성향을 가지고 있다는 것이다. 둘째, 같은 가구전화 응답자라도 KT등재리스트에 뽑은 응답자보다 임의번호뽑기로 뽑은 응답자들이 더 진보성향, 야당성향을 띤다. 셋째, ARS는 기계음으로 물어보기 때문에 자신의 생각을 솔직하게 응답하여 면접원에 의한 전화조사보다 진보, 야성향의 숨은 표를 잡는데 더 우월하다는 것이다.

이러한 논리를 기초로 2010년 지방선거의 충격이후 한국 선거여론조사 방법은 크게 변화하였다. 표본추출방법에서는 2010년 지방선거 이전까지만 해도 조사대상을 단일하게 KT 가구전화명부에 등재된 일반 집전화 번호, 이중에서도 전화번호 등재 시 개인정보의 외부공개를 허용한 가구전화 리스트를 통해 조사대상 번호를 추출했다. 이제는 가구전화와 별도로 휴대전화를 통해서 표본을 추출하는 이중 표본추출틀(dual frame)로 전환했다. 표본추출방식에서도 2010년 지방선거까지는 KT 가구전화명부에 올라있는 전화번호들 중에서 무작위적으로 추출하는 방식에서 2012년 총선, 대선에서는 리스트와 무관하게 아예 번호 자체를 임의로 형성함으로써 기존 전화부에서 포괄하지 않는 번호를 포괄하는 임의번호추출(RDD: Random Digit Dialing)방식으로 바뀌었다.

기존의 KT 가구전화부에 등재된 가구전화가 전체 가구의 절반에 못 미치는 상황에서 KT 가구전화에서 표본을 추출하는 것은 이론적으로 등재되지 않은 가구나 유권자층이 배제되는 ‘대표성의 문제’가 제기될 수밖에 없다. 임의번호추출방식은 기존 리스트에서 조사표본을 추출하는 것이 아니라 국번호-개별번호 자체를 무작위로 생성하기 때문에 기존의 리스트에 올라있지 않은 가구나 아예 리스트가 공개되지 않는 휴대전화 소유자들까지 표본에 포함시킬 수 있게 되었다. 다만 휴대전화 포함에 따른 통신비용 상승, 실제 존재하지 않는 번호까지 생성되기 때문에 조사시간과 경비의 상승의 불가피하다.

[표1] 2010년 지방선거 이후 여론조사 방법 및 보도행태의 변화

2. 명예회복에 실패한 2012 대선 여론조사

이러한 변화 노력에도 불구하고 2012년 대선에서 선거여론조사의 명예회복은 실패한 것으로 보인다.

첫째, 동일시점의 조사결과들임에도 불구하고 우세 후보가 다른 결과들이 동시에 발표됨으로써 여론조사가 정치권은 물론 유권자들의 해당시점의 판세에 대해 오히려 혼선을 조장하는 측면이 컸기 때문이다. 특히 대부분의 언론이 동시에 여론조사 보도 경쟁을 펼쳤던 추석 전후, 야권의 후보단일화 전후, 여론조사 공표금지기한 전후 조사의 경우 조사 결과로 인한 혼란이 극에 달했다. 특히 같은 기관이 비슷한 시기에 실시한 조사임에도 불구하고 조사결과에서 순위가 바뀌거나 오차범위가 벗어나는 편차가 확인되었다. 가령 10월 초 대부분의 언론에서 추석 전후로 여론이 크게 변화했다고 진단했는데 야권후보가 박근혜 후보에 역전하여 격차를 벌렸다는 보도와 반대로 박근혜 후보의 우위가 유지되고 있다는 보도가 동시에 나왔다. 또한 1:1 가상대결 기준으로 보면 야권후보가 우세하다는 조사만 보더라도 안철수, 문재인 후보 공히 박근혜 후보를 추월했다는 기사와 안철수 후보는 추월했지만, 문재인 후보는 아직 박근혜 후보 지지에 미치지 못하고 있다는 보도가 언론에 공표됨으로써 혼란이 가중되었다.

둘째, 야권 단일화 과정에서 나타난 문재인, 안철수 후보 진영의 조사문구와 방법을 둘러싼 논란은 여론조사 방법에 대한 의문과 혼선을 가중시켰다. 문재인 후보진영은 안철수, 문재인 양자를 놓고 ‘적합도’를 묻는 문항을 선호했다. 안철수 후보 진영은 양자간 ‘선호도’ 혹은 ‘당선가능성’을 묻는 문항을 주장하다 최종적으로는 박근혜 후보와의 각각의 1:1 가상대결조사를 진행하여 그 결과를 가지고 최종적인 단일 후보를 결정하자는 입장이었다. 지지자간의 때 아닌 ‘여론조사 방법론’ 논쟁까지 불러 일으키며 관심을 모았지만, 양 후보진영은 단일화 합의에 실패했을 뿐 아니라, 이 과정에서 여론조사 방법에 대한 논란이 심각한 의혹과 음모론으로 증폭되었던 것이 사실이다. 한 여론조사 기관이 선호도 조사 만을 진행하다 적합도 조사를 병행하자 안철수 캠프 진영에서 문재인 후보를 사실상 지원하는 편파적 행위라고 공격한 바 있다. 조사문항에 따라 조사결과가 달라지는 소위 ‘워딩효과’나 다차원적인 개념을 하나의 조사 문항으로 측정하는 데 근본적인 한계로부터 나타나는 문제인데, 정치적 의도의 문제로 환원될 여지가 드러난 상징적인 사건이었다.

셋째, 일반국민들 차원보다는 주로 정치권과 언론계에서 여론조사에 대한 신뢰성에 의문이 강하게 제기되고 있는 것은 여론조사 공표금지기간 중 은밀하게 접했던 이 기간 실시한 여론조사결과와 실제 결과 사이에 격차가 크다는 점도 고려해야 할 듯 하다. 선거 초기 야권단일화의 실패와 문재인 후보 캠프의 선거전략상 오류, 즉 안철수 후보 사회 이후 과거지향적인 ‘유신후보 심판론’이나 ‘이명박근혜’ 프레임이 전혀 여론을 반응을 이끌지 못하다 안철수 후보의 적극적인 선거유세와 TV토론을 거치면서 투표일 직전 조사들에서는 문재인 후보가 박근혜 후보를 추월했다는 결과들이 관련 업계와 정치권에서 회자되었던 것이 사실이다. 그러나 선거결과는 박근혜 후보가 예상보다 큰 격차로 승리하자 선거 후 평가담론을 주도하는 정치권과 언론에서 여론조사 신뢰도에 대한 의문을 제기하는 목소리가 커지는 것은 십분 이해할 만하다.

넷째, 직접적으로 여론조사 방법 자체의 문제들은 아니지만 기존 정치권이나 조사업계에서 통용되던 선거여론과 관련한 통설들이 여지없이 깨진 것도 선거여론 및 여론조사 전반에 대한 불신을 강화시키는 계기로 작용하였다. “수도권 유권자들은 진보적이다”라든 지, “투표율이 높으면 야당이 유리하고, 낮으면 여당이 유리하다”라는 주장은 일종의 선거법칙처럼 이해되어 왔고, “국민들은 여론조사 우세 후보에 편승한다”, “SNS 여론이 전체 여론에 미치는 영향력이 커지고 있다”, “이번 대선은 부동층이 적고 고정표가 많은 선거다”라는 주장 등도 마치 정설처럼 인식되어온 것이 사실이다. 이러한 주장들은 여론조사 방법 자체의 문제들은 아니지만, 대체로 여론조사 전문가들의 입을 통해 정당화되어 왔다는 점에서 실제 선거과정과 결과와는 전혀다른 결과들이 나오면서 전체적으로 여론조사에 대한 신뢰도를 잠식하는 효과도 가져온 것으로 보인다.

3. 문제 진단과 처방

결론부터 말하자면, 여론조사 신뢰성 위기는 선거캠프의 여론조사에 대한 정략적 이용과 언론 및 조사업계의 선정주의가 빚어낸 합작품이다. 그 밑바탕에는 ‘여론조사’에 대한 오해 내지 의도적인 왜곡을 깔고 있다.

“여론조사 결과 = 민의” 아니다

무엇보다 여론조사는 민의를 제대로 파악하기 위한 하나의 수단일 뿐 여론조사의 결과는 민의 전체와 동일시 할 수 없다는 점을 자주 간과한다. 첫째, 민주주의체제에서 민의는 ‘대표(representativeness)’와 ‘참여(participation)’라는 정치적 행위를 통해 이루어진다. 여론조사는 대의민주주의 과정이 실제 유권자들의 의사를 제대로 대표하고 있는지 점검하고 모니터링하기 위해 수행하는 하나의 방법론일 뿐 여론조사가 유권자들이 자신의 대표를 선정하고 이들로 하여금 유권자들의 의사를 추진해나가는 민주주의 과정을 대체할 수 없다. 마찬가지로 여론조사에 응답하는 것이 정치적 참여를 의미하는 것일 수 없다. 조사기관에서 임의로 선정한 응답자가 유권자를 대표하고 수동적으로 물어보는 질문에 답을 한 것을 어떻게 자발적 정치참여와 동일시 할 수 있겠는가?

민의는 다의적이고 다면적인 데 반해 여론조사에서 하나의 질문을 통해 얻은 결과는 단일차원에 대한 태도를 수량화한 결과이다. 단일화 과정에서 적합도니 선호도니 논쟁이 불가피한 것은 단일화를 지지하는 유권자들의 태도 자체가 다의적이고 다면적일 수 있기 때문이다. 실제로 초기 여론에서는 안철수 후보가 적합도, 선호도, 당선가능성 등 모든 차원에서 우위를 점했지만, 후보 등록이후 안철수 후보에 대한 불안감이 커지고, 상대적으로 문재인 후보의 인물호감도와 안정감이 부상하면서 유권자들의 태도가 다층적으로 변화했다. 즉 후보 적합도에서는 문재인 후보를 높게 평가하면서도 박근혜 후보와의 경쟁력에서는 안철수 후보를 높게 평가하는 여론을 여론조사를 통해서 파악할 수 있었다.

[그림1] 단일후보 당선가능성과 국정역량 평가 : 전체 유권자 및 민주당, 무당파 층의 평가(%)

데이터: EAI․한국리서치 정기여론바로미터조사(2012.9)

단일후보에 대한 “지지”라는 다층적이고 다면적인 여론을 한 두 개의 질문을 통해 파악하여 더구나 그것을 가지고 후보를 결정하겠다는 발상 자체가 민심을 얼마나 단순하게 이해하고 있는지, 여론조사 방법을 얼마나 편의적으로 활용하고 있는지 단적으로 보여준다. 여론조사가 다양한 질문을 통해 유권자 구성원들간의 선호의 차이를 풍부하게 이해하는 데 도움을 줄 수는 있지만, 어느 선호가 그 사회와 유권자들에게 더 바람직한 것인지, 어떤 측면을 더 우선할 것인지에 답을 줄 수 없으며 그 해답을 찾는 것이야말로 유권자들의 위임을 받은 정치인, 정당의 정치활동이다. 후보단일화 과정이나 주요 정책결정을 여론조사에 맡기는 것은 정치인, 정당이 정치적 리더십과 유권자들의 참여를 통해 해결할 능력이 없음을 고백하는 것에 다름 아니다. 단일화 룰 합의의 실패는 여론조사의 실패가 아닌 단일화 주체들 간의 정치력의 공백을 의미할 뿐이다.

“오차 부정은 여론조사 왜곡”

여론조사는 기본적으로 ‘오차’를 항상적으로 포함하고 있는 ‘확률적 지식’이다. 4천만 유권자들의 선호와 태도를 불과 1천명 내외의 표본을 뽑아 조사하여 전체 4천만의 선호와 태도로 추론한다는 점에서 뽑힌 1천명의 조사결과와 전체 4천만 전체 유권자들의 실제 여론분포와는 차이가 있을 수 밖에 없다. 이를 표본오차라고 부른다. 그렇기 때문에 조사결과를 발표할 때 95%신뢰수준에 오차범위가 플러스마이너스 얼마라는 표본오차의 범위를 밝힌다. 뿐만 아니라 이러한 오차는 조사면접원의 숙련도, 코딩정확성, 조사기관 마다의 하드웨어적인 인프라 차원, 노하우 나 앞서 말한 ‘워딩효과’ 등 비표본오차도 불가피하다. 이는 언론을 통해 보도되는 허용표본오차의 범위보다 실제로는 훨씬 더 큰 오차를 가질 수밖에 없다. 따라서 통계적으로 조사결과를 해석할 때 전체 모집단의 여론을 특정수치가 아닌 ‘범위’로 해석할 수 밖에 없으며, 오차범위 내의 차이라는 실제로는 누가 우세라고 장담할 수 없는 박빙이라는 의미라는 것이다. 앞에서 언급한 추석전후 여론의 경우 대부분의 조사결과들이 1등의 주인공은 다를 지언정 1등과 2등의 차이가 오차범위 내에 있었다. 특히 이번 선거의 경우 후보간 경합도가 매우 높았던 시기가 많았기 때문에 조사결과들이 오차범위 내라면 조사기관들마다 순위가 바뀌거나 같은 조사기관의 동일 시점의 조사결과라도 순위가 뒤바뀌는 것은 혼란스러워할 필요가 없다.

그러나 현실적으로 이러한 결과에 혼란스러울 수밖에 없는 것은 정치권과 언론이 책임이 가장 크다. 우선 각 정당과 선거캠프는 여론조사 결과에서 갖는 오차범위의 의미를 거두절미한다. 이기고 있을 때는 오차범위내의 우세를 대세론으로 포장하고, 자신이 뒤질 때에만 오차범위를 해석하는 이중잣대를 너무 쉽게 발견할 수 있다. 정치권이야 사활이 걸린 승부 때문이라고 치자. 이러한 해석을 바로잡고, 견제해야 할 언론이 사실 이러한 정보를 유포하는 일등공신이다. 이번 선거에서 박근혜 후보는 새누리당 후보 선정 전후 일주일 사이에 발표된 여론조사 결과들을 보면 수치상 2~3% 가량 상승한 것으로 나타났다. 오차범위를 고려하면 정체내지 답보라는 해석이 타당한 결과였다. 그러나 대부분의 언론이 “컨벤션 효과”로 해석한 바 있다. 여론조사 신뢰도 위기의 상당부분은 오차해석으로부터 비롯된 위기이다. 그러나 극히 일부이기는 하지만 일관된 편향성을 가지고 조사결과를 해석하거나 확대 과장하여 보도하는 행태 역시 여론조사 신뢰회복을 위해 반드시 해결해야 할 과제다.

휴대전화 혼용 RDD는 대안인가?

그러나 정치권과 언론의 문제 이전에 조사를 담당하고 데이터를 제공하는 조사업계 자체의 자정노력을 강조하지 않을 수 없다. 여론조사방법에 대한 정치권의 오용, 조사결과에 대한 언론의 오용의 문제가 여론조사 신뢰도 위기의 동반요인임은 부정할 수 없지만, 이러한 문제들을 유발하고 키운 책임은 역시 조사업계 자신에게서 찾아야 할 것이다.

첫째, 조사업계의 조사방법론 개선 작업이 이론적 기반과 경험적 데이터의 지속적인 분석과정 없이 즉흥적으로 이루어졌다는 점을 지적하지 않을 수 없다. 상식처럼 이해되어왔던 ‘숨은 표’ 문제를 해결하는 방식으로서 RDD 방식이 도입되었고 휴대전화 조사가 도입되었지만, 이번 선거에서도 다시 한번 5060세대 숨은 표 논란이 재연되고 있다. RDD방식이 역으로 보수성향 유권자 층의 숨은 표를 가져왔다고 봐야 할 까? 필자가 보기에는 그렇지 않을 것이다. 기존에 등재리스트에 없던 응답자들을 조사에 포함시킨다는 점에서는 긍정적인 변화지만 숨은 표라는 것은 사회적 분위기 때문에 자신의 의견을 숨기는 현상이라면 RDD방식의 도입은 조사대상범위를 확장하는 것일 뿐 응답을 왜곡시키는 사회적 분위기에 대한 처방이 아니라는 점에서 원인과 처방 자체가 맞지 않는다.

뿐 만 아니라 여론조사 관련 왜곡된 통설의 상당부분이 조사업계와 학계로부터 출발하고 있다는 점도 간과하기 어렵다. “숨은 표 이론”이나 앞서의 “컨벤션 효과”, “RDD 및 휴대전화 조사의 진보적 편향성 가설” 등을 이론적으로 정교한 가설화 및 풍부한 경험적 검증 과정 없이 한 두차례의 일반화하기 어려운 사례를 바탕으로 언론플레이를 앞세우면서 정설로 자리잡았다는 점을 고려해야 할 것이다. 2012 대선여론조사 결과 평가에서는 개별회사의 상업주의 및 단기적 차별화 전략보다는 조사업계 전체적인 공동연구 및 협력대응방안을 모색해야 할 필요가 있다.

혼선을 부추기는 제도 : 여론조사 공표금지 폐지

마지막으로 선거 6일 이내 실시한 여론조사 결과의 공표를 제한하는 규제가 오히려 여론조사에 대한 혼선과 분란을 강화시키고 있다. 선거 2-3일 전부터 당일까지 여러 경로를 통해 돌아다닌 여론조사 공표금지기간 중 실시한 조사결과가 암암리에 회자된 바 있다. 이러한 정보들이 필자가 여론조사 업계에 몸 담고 있기 때문에 접할 수 있었던 고급정보가 아니라 SNS 공간에서 쉽게 확인되고 있던 결과들이라는 것이다. 각각에는 실제 결과인 것도 있고, 반대로 사실이 아닌 결과들도 다수 포함된 것으로 알려져 있다.

근거 없는 정보 유통으로 인한 혼선 및 투표 선택에 미치는 왜곡현상, 이러한 정보를 취득할 수 없는 응답층에서는 정치적 소외와 배제에 따른 불만과 냉소를 키울 것으로 보인다. 여론조사 공급처가 다양해지고, 조사업체간 경쟁이 심해지면서 여론조사 시장에서 특정 조사결과의 독점적인 영향력을 기대할 수 없는 상황에서 오히려 이에 대한 규제가 오히려 문제를 심화시키고 있다고 볼 수 있다. 유권자들이 여론조사 결과를 일방적으로 수용하거나 조사결과에 편승하지 않지 않을뿐더러 보다 근원적으로는 여론조사 공표금지 자체가 언론과 표현의 자유에 대한 규제로 이해하고 있다는 점을 고려해야 한다.

여론조사 신뢰도 위기에 대한 동반책임과 협력적인 개선 노력 없는 즉흥적, 일회적, 미봉책과 책임전가가 이루어질 경우 2017년 차기 대선 시기나 그 이전 중간평가 시간에도 오늘 진단한 문제들이 개선되지 않을 것이다. 신뢰회복은 불신의 원인과 책임을 정확히 진단하는 것에서부터 출발해야 한다는 점은 두 번 강조할 필요가 없을 것이다. ■