뒤지던 배현진, 총 언급량서 최재성 앞서 [총선 빅데이터-서울 송파을]

국민일보

뒤지던 배현진, 총 언급량서 최재성 앞서 [총선 빅데이터-서울 송파을]

입력 2020-04-13 04:03 수정 2020-04-13 10:15
사진=연합뉴스

더불어민주당 최재성 후보와 미래통합당 배현진 후보가 다시 맞붙는 서울 송파을에선 두 후보에 대한 빅데이터 민심이 초박빙으로 12일 나타났다. 현역인 최 후보와 관련된 언급량은 정치 신인 배 후보 전체 언급량과 크게 차이나지 않았다. 각종 여론조사에서 순위를 뒤바꿔 온 것처럼 디지털 민심도 혼전 양상을 보였다.

최 후보는 전체 부정 감성 비율(40.5%)이 배 후보(37.2%) 보다 3.3% 포인트 많았다. 긍정 감성 비율도 최 후보가 35.4%로 배 후보(33.7%) 보다 높았다. 대개의 경우 현역 의원은 인지도가 높아 총 언급량에서 우위를 차지하지만 이번 빅데이터 조사에서는 최 후보 언급량이 2563건으로 배 후보(2748건)에 비해 낮았다. 전체 빅데이터 수치 상으로도 대등한 경기가 펼쳐지고 있다는 의미다.

부정 평가가 높아지는 양상도 비슷했다. 최 후보와 배 후보 모두 지난 1일부터 부정 민심이 긍정 민심보다 더 높게 나타났다. 최 후보는 “머리가 큰 후보가 좋은 후보”라며 자신을 소개한 영상이 최근 회자되면서 부정 평가를 키웠다. 지난달 31일 15.3%였던 부정 평가 비율은 다음 날 47.1%로 급등했다.

배 후보는 잠실종합운동장 워킹스루 선별진료소 설치에 지난 2일 “이런 전시행정을 벌이나, 제정신인가”라며 비판 목소리를 냈다. 배 후보는 이후 매일같이 공격적 발언을 내놓으며 지역 민심을 얻으려 했지만 SNS상에서는 오히려 역효과가 났다. 배 후보 부정 평가는 지난 1일 20.0%에서 다음 날 46.6%로 크게 뛰었다. 다만 빅데이터 분석업체 언노운데이터 측은 “배 후보 관련 논란은 지역민들에게는 긍정적으로 평가될 수 있다”고 말했다.

두 후보의 연관어 역시 워킹스루 선별진료소 설치에 집중됐다. 언급량이 많은 상위 50개 단어 중 중복 단어를 제외하면 배 후보의 경우 ‘제정신’ ‘전시행정’이 눈에 띄었다. 최 후보의 상위 연관어에는 ‘방법’ ‘청와대’가 자리했다. 최 후보는 선별진료소 설치에 대해 지난 2일 “취지에는 동의하나 방법이 틀렸다”고 말했다.

기존 여론조사에서도 두 후보는 접전 양상을 보였다. KBS가 한국리서치에 의뢰해 지난 2~4일 송파을 선거구에 거주하는 만18세 이상 남녀 500명을 조사한 결과 최 후보(43.0%)가 배 후보(41.0%)를 2.0%포인트로 오차범위(±4.4%포인트) 내에서 앞질렀다.

그 밖의 사항은 사항은 중앙선거여론조사심의위원회 홈페이지 참조

어떻게 분석했나

국민일보는 경기대 빅데이터센터(센터장 장석진) 김택환 교수팀과 공동으로 지난달 20일부터 지난 9일까지 SNS상에 올라온 주요 격전지 6곳 후보자에 대한 유권자 평가글 52만여 건을 텍스트 마이닝(text mining) 기법으로 추출해 분석했다. 트위터, 블로그, 인스타그램 등을 대상으로 ‘감성 연관어 분석’ 방식을 적용했다. 글에 나타난 긍·부정 감정 평가 알고리즘을 만들어 점수화한 것으로 2012년 미국 대선에서는 오바마 캠프가 여론 파악을 위해 활용했었다. 유권자가 설문에 답하는 여론조사와는 달리 SNS 상에 드러난 유권자 감정을 직접 분석, 디지털 민심을 유추하는 기법이다. 조사는 웹데이터 수집 전문회사 리스틀리와 빅데이터 분석 업체 언노운데이터에 의뢰했다.

텍스트 마이닝 기법으로 추출한 감성 빅데이터 분석에서는 부정 감성 연관어 비중이 당락 예측의 가장 중요한 기준이 된다. ‘싫다’ ‘나쁘다’ 같은 부정 표현이 ‘좋아요’ 같은 긍정 표현보다 감정 표출 면에서 적극적이기 때문이다.

데이터 분석업체는 긍정 부정의 감성어 비중이 하루 이틀 요동치고 원래자리로 돌아오는 현상은 당락에 큰 의미가 없다고 보고 있다. 후보자에 대한 감정이 굳어지는 추세가 중요하기 때문이다. 그래서 이슈가 터진 뒤 곧 사라지는 키워드들은 표준편차값을 통해 제거했다.

지난 20대 총선 데이터를 기반으로 모델링을 했을 때도 일시적 요동은 당락에 큰 영향을 미치지 못한 것으로 분석됐다. 다만 유권자 감정에 영향을 미치는 이슈 발생 이후 추세가 움직이면 분석가치가 높다. 선거일에 임박해 긍정 비율이 급증할 경우 실제 당선에도 긍정적인 영향을 미치는 것으로 예측된다. 한 후보에 대한 부정적 감성이 늘어나는 추세라고 해도, 상대편 후보가 비슷하게 늘어가고 있으면 상쇄된다.

민주, 부정 평가 늘어나고… 통합, 막말에 흔들리고 [총선 빅데이터]
황교안, 당내 공천·막말논란에 부정평가↑ [총선 빅데이터-서울 종로]
‘여론 주목’ 태구민 인지도, 4선 의원 압도 [총선 빅데이터-서울 강남갑]
주호영에 쏠렸던 디지털 민심, 후반엔 혼전 [총선 빅데이터-대구 수성갑]
이수진 부정 평가 증가… 나경원과 초박빙 [총선 빅데이터-서울 동작을]
우세하던 고민정, 빅데이터는 낙관 못해 [총선 빅데이터-서울 광진을]

박세원 기자 one@kmib.co.kr

많이 본 기사

포토

아직 살만한 세상