국제

'입'은 속였고 '손'은 정직했다.. 온라인 표심 읽는 빅데이터

입력 2016.11.12. 03:36
번역beta

Translated by kakao i

번역할 언어 선택
글자 크기 조절 레이어
선거민심조사의 미래는

[서울신문]지난 4월 20대 국회의원 선거와 6월 영국의 유럽연합(EU) 탈퇴, 그리고 최근 미국의 대통령 선거는 여론조사의 무덤이었다. 낮은 응답률과 속내를 제대로 밝히지 않는 응답자 행태 등의 제약으로 인해 여론조사는 무엇 하나 올바로 예측하는 데 실패했다. 부정확한 여론조사 결과에 대한 회의론이야 진작부터 있었지만 이젠 아예 여론조사의 종말을 얘기하는 상황에 다다랐다. 그리고 여론조사의 빈자리를 인터넷과 소셜네트워크서비스(SNS)의 빅데이터 분석이 대체할 것이라는 예측이 갈수록 설득력을 얻고 있다. 미래의 선거민심조사는 어떤 형태를 띠게 될지 전문가들에게 물었다.

빅데이터를 이용해 미국 대선 결과를 예측한 우종필 세종대 경영학과 교수는 11일 “미국 여론조사는 도화지에 찍힌 점 하나를 보는 수준으로 오류가 상당하다”고 지적했다. 여론조사는 통상 모집단에서 표본을 추출한 뒤 진행한다. 우 교수는 “미국 전체 유권자가 2억 1000만명인데, 이 중 60%가 투표한다고 생각하면 1억 2000만명의 표를 예측해야 한다”며 “하지만 현재 여론조사는 1000여명에게 묻는데, 이는 유권자의 0.00001%에 불과하다”고 설명했다. 표본이 적은 데다 제대로 된 표본 선발 과정도 없었고, 여론조사에서 자신의 의사를 제대로 밝히지 않는 ‘샤이 트럼프’ 현상까지 겹치며 표심을 제대로 읽지 못했다는 것이다.

그는 빅데이터를 대안으로 제시했다. 우 교수는 “유권자의 절대다수가 컴퓨터나 스마트폰으로 접속하는 온라인에서는 굳이 표심을 숨기지 않는다”며 “이번 미국 대선을 두고 SNS를 분석한 결과 힐러리 클린턴이 도널드 트럼프를 이긴 적은 단 한 번도 없었다”고 말했다.

한규섭 서울대 언론정보학과 교수는 여론조사 3000개의 빅데이터를 분석해 여론조사의 허점을 보완한 뒤 두 후보의 지지율을 도출했다. 한 교수는 “올해 1월부터 선거 직전까지 전국구 여론조사 3000개를 분석하니 지지율에서 클린턴이 2.2% 포인트 앞서는 것으로 나왔다”고 말했다. 한 교수는 여기에 그치지 않았다. ‘숨은 표’를 감안한 분석을 별도로 실시했다. 그 결과 숨은 표가 없다고 가정했을 때 트럼프의 당선 확률은 5%에 불과했지만 1.0% 포인트의 가중치를 두면 30%로 올랐고 1.7% 포인트일 때는 50%, 2.0% 포인트일 때는 65%로 뛰어올랐다. 실제로 대선 결과 클린턴은 득표율(47.7%)에서 트럼프(47.5%)를 0.2% 포인트 앞섰지만 주(州) 선거인을 해당 주 승자가 독식하는 미 대선의 독특한 방식에 따라 선거인단 290명을 얻은 트럼프가 232명을 얻은 클린턴을 이겼다.

이번 미 대선은 족집게로 유명한 대선 예측 전문가 네이트 실버의 예측이 틀리면서 화제를 모으기도 했다. 그가 운영하는 선거 예측 사이트 파이브서티에이트는 애초 클린턴의 승률을 72%, 트럼프의 승률을 28%로 예측했다. 그러다 지난 8일 개표 결과가 나오면서 밤늦게 트럼프의 승률을 61%로 수정했다. 김준석 동국대 정치외교학과 교수는 “샤이 트럼프 현상은 언론과 여론조사기관의 책임 회피”라며 “여론조사의 한계가 극명히 드러났다”고 지적했다.

샤이 트럼프 현상은 독일 커뮤니케이션 학자 노엘레 노이만의 ‘침묵의 나선 이론’을 배경으로 한다. 다수의 의견과 자신의 의견이 다를 경우 침묵하게 된다는 것이다. 영국에는 숨어 있는 보수표를 의미하는 ‘샤이 토리’가 있다. 우리나라도 비슷한 전개를 보이고 있다. 극도의 보수주의자를 ‘수구 꼴통’으로 여기는 인식이 확산되면서 보수표가 숨는 현상이 두드러졌다는 것이다. 한 교수는 “한국은 세대 간 이념과 정치 성향이 극명하게 차이 나고, 보수·진보 갈등도 어느 나라보다 심하다”며 “여론조사나 출구조사에서 새누리당 지지자들이 실제보다 과소평가되는 경우가 나타나고 있다”고 말했다.

그렇다고 해서 지금의 여론조사가 무용지물이라는 판단은 이르다는 지적도 적지 않다. 김춘석 한국리서치 이사는 “내년 대선에서 휴대전화를 이용해 여론조사를 하게 되면 여론조사 신뢰도는 올라갈 것”이라고 밝혔다. 다른 여론조사기관 관계자는 “내년 대선에서 1% 포인트 미만의 표차만 나지 않는다면 여론조사로 결과를 예측할 수 있을 것”이라며 “빅데이터는 세대별, 지역별 지지율을 알아내기 어려운 만큼 전통적인 여론조사와 빅데이터가 공존하는 체제로 가야 한다”고 말했다. 우 교수도 “빅데이터도 다른 이슈로 인한 데이터 오류 등 부작용이 생길 수 있는 만큼 여론조사와 병행할 필요가 있다”고 밝혔다.

이민영 기자 min@seoul.co.kr

홍인기 기자 ikik@seoul.co.kr

이 시각 추천뉴스