이재명-윤석열 여론조사, 왜 가상번호만 초박빙인가

엄경영 시대정신연구소장 입력 2021. 12. 4. 10:02 수정 2021. 12. 5. 10:49
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

통계 안정성 떨어지고 특정 후보에 유리한 방식

(시사저널=엄경영 시대정신연구소장)

대선 100일 전후로 발표된 각종 여론조사에서 독특한 흐름이 나타나고 있다. 가상번호를 활용한 다자 대결 여론조사에선 이재명 더불어민주당 후보와 윤석열 국민의힘 후보가 오차범위 내에서 치열한 접전을 펼치는 것으로 나타났다. 반면 무작위 전화 걸기(Random Digit Dialing·RDD)에선 윤 후보가 이 후보를 최대 10%포인트 이상 앞서는 것으로 조사됐다(여론조사 관련 자세한 내용은 중앙선거여론조사심의위원회 홈페이지 참조).

11월5일 국민의힘 대선후보 선출 이후 약 한 달간 전국 단위 대선후보 지지도 여론조사는 대략 60개 남짓. 윤 후보는 일부 조사에서 오차범위 내 접전을 허용했지만 단 한 차례도 1위를 놓친 적이 없었다. 그러나 윤 후보는 11월26~28일 실시된 한국리서치 여론조사에서 이 후보에게 동률(35.5%)을 허용했다. 이 조사는 가상번호로 이뤄졌다. 비슷한 시기에 실시된 가상번호 전화면접조사, ARS(자동응답)에서도 대부분 두 후보 격차가 2~3%포인트에 불과했다. 반면 11월26~27일 여론조사공정, 리얼미터에선 윤 후보가 이 후보를 8.6~10%포인트 격차로 따돌렸다. 

가상번호는 휴대폰 보유가 늘어나고 집전화가 줄어들면서 여론조사 정확도 개선을 위해 도입됐다. 가상번호는 중앙여심위 승인으로 통신 3사가 제공한다. 가상번호는 중앙여심위에 등록된 82개 선거여론조사업체만 신청할 수 있고, 이를 활용한 여론조사는 반드시 공개해야 한다(정당 제외). 번호 비용은 1개당 하루 16.94원(부가세 포함)이며, 암호가 걸려 있기 때문에 통신비용도 두 배 이상 들어간다. 까다롭고 높은 비용에도 가상번호에 대한 신뢰도가 상승하면서 활용도가 높아지고 있다.

(왼쪽)11월27일 이재명 더불어민주당 대선후보가 순천 연향상가 패션거리에서 유세를 하고 있다. (오른쪽)윤석열 국민의힘 대선후보가 10월23일 울산시 남구 신정시장을 방문해 지지자들에게 화답하고 있다.ⓒ이재명 캠프 제공·연합뉴스

비슷한 시기의 여론조사, 결과가 다른 이유

최근 발표된 가상번호 여론조사는 비슷한 시기에 조사가 이루어졌는데도 응답률, 지지도 등에서 차이가 커 통계 안정성에 의문이 제기된다. 11월22~24일 전국지표조사 응답률은 29.6%에 달했지만 27~28일 글로벌리서치 응답률은 16.8%였다. 대선 100일 전후 실시된 가상번호 여론조사에서 두 후보가 오차범위 내 접전이었지만 글로벌리서치에선 윤 후보가 오차범위 밖으로 앞섰다. 이에 비해 RDD 방식에선 응답률 편차가 4.5%(여론조사공정)·6.5%(리얼미터) 등으로 그리 크지 않았고 두 후보 지지율 추이도 상대적으로 안정된 흐름을 보였다(ARS).

가상번호 여론조사가 상대적으로 이 후보에게 유리하다는 관측도 있다. 11월22~23일 한국갤럽 여론조사에서 이 후보는 37.1%로 윤 후보(38.4%)와 초박빙이었다. 그러나 11월16~18일 한국갤럽(자체) 조사에서는 윤 후보가 42%로 이 후보(31%)에 11%포인트 차이로 앞섰다. 앞의 조사는 가상번호를 활용했고, 뒤의 조사는 RDD 방식으로 표본추출에서 차이가 있다. 올해 1월부터 최근까지 이루어진 305개 여론조사 전수조사에서 윤 후보는 42%로 이 후보(36.3%)에 5.7%포인트 정도 앞선 것으로 나타났다.

여론조사에서 표본은 가장 핵심적인 요소다. 표본이 정확히 추출돼야 표본조사가 의미를 갖고, 결국 여론조사 신뢰도도 높아진다. 기본적인 표본 추출 방법으로는 임의, 할당, 무작위 세 가지가 주로 사용된다. 이 중에서도 무작위가 중요하다. 무작위는 모집단 구성원들이 표본으로 균등한 기회를 갖게 되는 의미가 담겨 있다. 즉 모집단 일부가 표본 추출 대상에서 배제된다면 표본 추출이 제대로 됐는지 논란이 일 수 있다.

가상번호에는 알뜰 번호 가입자 제외돼 

가상번호는 통신 3사가 갖고 있는 휴대폰 번호를 모집단으로 한다. 여기엔 알뜰번호 가입자가 제외된다. 과학기술정보통신부는 11월24일 국내 알뜰폰 가입자가 1000만 명을 돌파했다고 밝혔다. 11월21일 기준 가입자 회선 수는 1007만 명을 기록했다. 이 중 휴대폰 가입자가 598만 명(선불 163만 명+후불 435만 명), 사물지능통신(M2M) 가입자가 435만 명이다. 선불 가입자 중에는 외국인, 유학생 등이 다수 포함되어 있다고 하더라도 598만 명 중 상당수가 가상번호 표본 추출에서 제외되는 것이다.

요금이 저렴한 알뜰폰은 60대 이상 중고령층, 20·30대 이하 연령층 사용자가 많다고 알려져 있다. 60대 이상에선 윤 후보 지지율이 압도적으로 높다. 30대 이하에서도 윤 후보가 앞서고 있다. 알뜰폰 가입자 표본 제외는 윤 후보 지지율에 부정적으로 작용할 수도 있고, 이 후보가 반사효과를 누릴 가능성도 있다. 또 RDD 방식에 비해 표본 모집단이 줄어드는 단점이 있다.

응답률은 성·연령·지역에 따라 천차만별로 달라진다. 가상번호는 조사완료 표본의 30배까지 제공된다. 즉 1000명이라면 최대 3만 개를 받을 수 있다. 조사업체는 성·연령·지역별로 차등을 둘 수 있다. 응답률이 매우 낮은 20·30대 여성에선 30배 이상, 응답률이 높은 60대 이상에선 30배 이하 등으로 설계할 수 있다. 즉 조사업체는 성·연령·지역에 대한 대략적인 개인정보를 활용하게 되는 셈이다. RDD 방식에선 아예 시도할 수 없는 것들이다. 

이렇게 해서 응답률이 높아진다면 의도하지 않더라도 통계가 튈 수 있다. 결과적으로 임의, 할당, 무작위라는 표본 추출 방식과 부합하지 않을 수도 있다. 지금까지는 조사 방식, 즉 전화면접조사 또는 ARS에 따른 영향이 컸다. 그러나 최근엔 알뜰폰 가입자 급증, 젊은 층 보수화 등 정치사회 변화도 빨라지고 있다. 따라서 가상번호 표본 추출, 여론조사가 원칙대로 실시되고 있는지 진지하게 되돌아볼 필요가 있다.

Copyright ⓒ 시사저널(http://www.sisajournal.com). 무단전재 및 재배포 금지

Copyright © 시사저널. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?