이수진 부정 평가 증가… 나경원과 초박빙 [총선 빅데이터-서울 동작을]

국민일보

이수진 부정 평가 증가… 나경원과 초박빙 [총선 빅데이터-서울 동작을]

입력 2020-04-13 04:02 수정 2020-04-13 10:16
사진=연합뉴스

정치 신인 이수진 더불어민주당 후보와 현역 중진 나경원 미래통합당 후보는 빅데이터 분석에서 접전 양상으로 관측됐다. 선거운동이 진행되는 과정에서 점차 네거티브 전략이 부각돼 두 후보 모두 긍정 감성 비율은 낮아지고 부정 감성 비율이 높아지는 추세가 나타났다. 지난 8일까지 발표된 각종 여론조사에서는 이 후보가 근소하게 앞서는 것으로 나타났지만 빅데이터 분석에서는 이 후보의 부정 평가가 최근 늘어나면서 초박빙 접전 판세로 조사됐다.

이 후보는 전체 7963건의 데이터 가운데 긍정 감성 언급 비율이 32.0%, 부정 감성 언급 비율이 36.6%로 조사됐다. 나 후보는 전체 7029건 가운데 긍정 감성 언급 비율이 23.9%, 부정 감성 언급 비율이 51.2%로 나타났다. 전체 언급량을 보면 나 후보의 부정 감성 언급 비율이 14.6% 포인트 더 높다.

변수는 최근 흐름이다. 이 후보의 경우 초반에는 상대적으로 긍정 감성 평가가 더 많았지만 시간이 흐를수록 부정 감성 평가가 크게 늘었다. 지난 1일 30%대였던 부정 감성 평가 비율은 지난 8일 63.9%까지 치솟았다. ‘새 얼굴’인 이 후보의 경우 선거일이 다가올수록 정치인으로 인식되면서 부정적인 평가가 급격히 늘어나는 경향을 보였다.

지난 5일 임종석 전 청와대 비서실장이 이 후보 지원 유세에 나선 게 두 후보의 부정 감성 언급을 키운 변곡점으로 꼽혔다. 당시 임 전 비서실장은 나 후보를 향해 “20대 국회를 동물국회로 만든 장본인”이라며 “싸움꾼을 국회에서 몰아내자”고 비판했다. 나 후보는 “적반하장도 유분수”라며 “친문 비리 게이트 수사로 궁지에 몰리고 있는 임 전 실장이 국민을 기만하는 궤변을 쏟아내고 있다”고 맞섰다.

이후 두 후보에 대한 부정 감성 비율은 추세 상승 양상이 분명해졌다. 부정 감성 평가는 이 후보와 나 후보 모두 증가세지만 정치 신인인 이 후보에게 더 불리하게 작용할 수 있다는 게 전문가 분석이다.

빅데이터 분석 업체 언노운데이터 분석팀은 “막말 수준으로 서로 치고 받는 네거티브 선거로 흐르면서 이 후보에 대한 참신성이 상대적으로 떨어졌다. 빅데이터 상으로는 대등한 상황”이라고 분석했다.

후보 관련 문건에서 언급량이 많은 상위 50개 단어 가운데 중복 단어를 제외하면 나 후보의 경우에는 ‘대한민국’ ‘정권’, 이 후보의 경우에는 ‘사법’ ‘청와대’ ‘여당’ 등이 눈에 띈다. 나 후보의 경우 정권심판론과 보수 세력 결집을 호소한 것이 영향을 미친 것으로 풀이된다. 반면 이 후보 지지층은 사법개혁 이슈와 청와대·여당을 강조한 것으로 해석된다.

그 밖의 사항은 사항은 중앙선거여론조사심의위원회 홈페이지 참조

어떻게 분석했나

국민일보는 경기대 빅데이터센터(센터장 장석진) 김택환 교수팀과 공동으로 지난달 20일부터 지난 9일까지 SNS상에 올라온 주요 격전지 6곳 후보자에 대한 유권자 평가글 52만여 건을 텍스트 마이닝(text mining) 기법으로 추출해 분석했다. 트위터, 블로그, 인스타그램 등을 대상으로 ‘감성 연관어 분석’ 방식을 적용했다. 글에 나타난 긍·부정 감정 평가 알고리즘을 만들어 점수화한 것으로 2012년 미국 대선에서는 오바마 캠프가 여론 파악을 위해 활용했었다. 유권자가 설문에 답하는 여론조사와는 달리 SNS 상에 드러난 유권자 감정을 직접 분석, 디지털 민심을 유추하는 기법이다. 조사는 웹데이터 수집 전문회사 리스틀리와 빅데이터 분석 업체 언노운데이터에 의뢰했다.

텍스트 마이닝 기법으로 추출한 감성 빅데이터 분석에서는 부정 감성 연관어 비중이 당락 예측의 가장 중요한 기준이 된다. ‘싫다’ ‘나쁘다’ 같은 부정 표현이 ‘좋아요’ 같은 긍정 표현보다 감정 표출 면에서 적극적이기 때문이다.

데이터 분석업체는 긍정 부정의 감성어 비중이 하루 이틀 요동치고 원래자리로 돌아오는 현상은 당락에 큰 의미가 없다고 보고 있다. 후보자에 대한 감정이 굳어지는 추세가 중요하기 때문이다. 그래서 이슈가 터진 뒤 곧 사라지는 키워드들은 표준편차값을 통해 제거했다.

지난 20대 총선 데이터를 기반으로 모델링을 했을 때도 일시적 요동은 당락에 큰 영향을 미치지 못한 것으로 분석됐다. 다만 유권자 감정에 영향을 미치는 이슈 발생 이후 추세가 움직이면 분석가치가 높다. 선거일에 임박해 긍정 비율이 급증할 경우 실제 당선에도 긍정적인 영향을 미치는 것으로 예측된다. 한 후보에 대한 부정적 감성이 늘어나는 추세라고 해도, 상대편 후보가 비슷하게 늘어가고 있으면 상쇄된다.

민주, 부정 평가 늘어나고… 통합, 막말에 흔들리고 [총선 빅데이터]
황교안, 당내 공천·막말논란에 부정평가↑ [총선 빅데이터-서울 종로]
‘여론 주목’ 태구민 인지도, 4선 의원 압도 [총선 빅데이터-서울 강남갑]
주호영에 쏠렸던 디지털 민심, 후반엔 혼전 [총선 빅데이터-대구 수성갑]
우세하던 고민정, 빅데이터는 낙관 못해 [총선 빅데이터-서울 광진을]
뒤지던 배현진, 총 언급량서 최재성 앞서 [총선 빅데이터-서울 송파을]

김판 기자 pan@kmib.co.kr

많이 본 기사

포토

아직 살만한 세상