‘여론 주목’ 태구민 인지도, 4선 의원 압도 [총선 빅데이터-서울 강남갑]

국민일보

‘여론 주목’ 태구민 인지도, 4선 의원 압도 [총선 빅데이터-서울 강남갑]

입력 2020-04-13 04:02 수정 2020-04-13 10:10
사진=연합뉴스

호남 4선 출신의 김성곤 더불어민주당 후보와 북한 고위 외교관 출신 태구민(태영호) 미래통합당 후보가 맞붙는 서울 강남갑은 디지털 민심 빅데이터 분석에서 태 후보의 우위가 예상됐다. 언급량 자체에서 김 후보를 압도했다. 그동안 실시된 각종 여론조사에서도 태 후보는 김 후보를 오차범위 내에서 앞선 것으로 조사됐다.

태 후보와 관련된 전체 언급량은 2212건으로 김 후보 전체 언급량 1133건의 2배에 달했다. 북한 출신의 첫 지역구 국회의원 후보라는 점에서 태 후보가 여론의 주목을 받은 결과로 보인다. 그만큼 인지도에서 앞섰다는 평가다.

김 후보는 긍정 감성 언급 비율과 부정 감성 언급 비율 모두 태 후보보다 높게 측정됐다. 김 후보의 전체 언급량 가운데 긍정 비율은 40.8%, 부정 비율은 32.3%다. 태 후보의 긍정 감성 언급 비율 23.9%보다 16.9% 포인트나 높다. 부정 감성 언급 비율은 김 후보가 32.3%, 태 후보가 30.2%를 기록했다. 빅데이터 분석 업체 언노운데이터 분석팀은 “김 후보의 경우 SNS 상의 열성 지지층 메시지가 반영됐지만 전체적인 감성 언급량 자체가 적었다. 인지도 열세가 드러난 것으로 보인다”면서 “부정 감성 언급 비율까지 종합적으로 고려하면 빅데이터 상에서는 태 후보의 평판이 조금 더 나은 것으로 보인다”고 분석했다.

태 후보와 관련한 부정 감성어로는 ‘범죄’ ‘의혹’이 상위권에 집계됐다. 일부 시민단체들이 태 후보의 과거 발언을 근거로 “범죄혐의자 탈북민도 무조건 수용해야 하느냐”고 공세를 펼친 결과로 보인다. 김 후보 측도 이 문제를 집중적으로 부각시키며 태 후보의 통일관·대북관을 비판했다. 또 북한의 대외선전매체가 태 후보에 대해 “국가자금 횡령죄, 미성년 강간죄와 같은 온갖 더러운 범죄를 다 저질렀다”고 주장한 내용이 알려지면서 각종 의혹에 대한 고발장까지 접수된 상태다.

김 후보와 함께 언급된 부정 감성어로는 ‘빨갱이’가 집계됐다. 태 후보가 북한 외교관 출신이라는 점, 보수 성향이 강한 지역구라는 점에서 양쪽 지지층이 서로 색깔론을 제기한 결과로 해석된다. 특히 선거 운동 기간에는 김 후보 측에서 태 후보의 안보관을 문제 삼으며 ‘역색깔론’을 펼쳤다는 평가까지 나왔다.

‘평화’ ‘합리적’ ‘해결’과 같은 긍정 감성어는 양측에서 모두 빈번하게 사용된 것으로 조사됐다. 두 후보 모두 서로의 대북관을 비판하며 북한 문제를 풀어갈 적임자임을 주장했고, 부동산 규제 등 지역구 표심을 의식한 듯 정책의 합리성을 강조한 결과로 해석된다.

그 밖의 사항은 사항은 중앙선거여론조사심의위원회 홈페이지 참조

어떻게 분석했나

국민일보는 경기대 빅데이터센터(센터장 장석진) 김택환 교수팀과 공동으로 지난달 20일부터 지난 9일까지 SNS상에 올라온 주요 격전지 6곳 후보자에 대한 유권자 평가글 52만여 건을 텍스트 마이닝(text mining) 기법으로 추출해 분석했다. 트위터, 블로그, 인스타그램 등을 대상으로 ‘감성 연관어 분석’ 방식을 적용했다. 글에 나타난 긍·부정 감정 평가 알고리즘을 만들어 점수화한 것으로 2012년 미국 대선에서는 오바마 캠프가 여론 파악을 위해 활용했었다. 유권자가 설문에 답하는 여론조사와는 달리 SNS 상에 드러난 유권자 감정을 직접 분석, 디지털 민심을 유추하는 기법이다. 조사는 웹데이터 수집 전문회사 리스틀리와 빅데이터 분석 업체 언노운데이터에 의뢰했다.

텍스트 마이닝 기법으로 추출한 감성 빅데이터 분석에서는 부정 감성 연관어 비중이 당락 예측의 가장 중요한 기준이 된다. ‘싫다’ ‘나쁘다’ 같은 부정 표현이 ‘좋아요’ 같은 긍정 표현보다 감정 표출 면에서 적극적이기 때문이다.

데이터 분석업체는 긍정 부정의 감성어 비중이 하루 이틀 요동치고 원래자리로 돌아오는 현상은 당락에 큰 의미가 없다고 보고 있다. 후보자에 대한 감정이 굳어지는 추세가 중요하기 때문이다. 그래서 이슈가 터진 뒤 곧 사라지는 키워드들은 표준편차값을 통해 제거했다.

지난 20대 총선 데이터를 기반으로 모델링을 했을 때도 일시적 요동은 당락에 큰 영향을 미치지 못한 것으로 분석됐다. 다만 유권자 감정에 영향을 미치는 이슈 발생 이후 추세가 움직이면 분석가치가 높다. 선거일에 임박해 긍정 비율이 급증할 경우 실제 당선에도 긍정적인 영향을 미치는 것으로 예측된다. 한 후보에 대한 부정적 감성이 늘어나는 추세라고 해도, 상대편 후보가 비슷하게 늘어가고 있으면 상쇄된다.

민주, 부정 평가 늘어나고… 통합, 막말에 흔들리고 [총선 빅데이터]
황교안, 당내 공천·막말논란에 부정평가↑ [총선 빅데이터-서울 종로]
주호영에 쏠렸던 디지털 민심, 후반엔 혼전 [총선 빅데이터-대구 수성갑]
이수진 부정 평가 증가… 나경원과 초박빙 [총선 빅데이터-서울 동작을]
우세하던 고민정, 빅데이터는 낙관 못해 [총선 빅데이터-서울 광진을]
뒤지던 배현진, 총 언급량서 최재성 앞서 [총선 빅데이터-서울 송파을]

김판 기자 pan@kmib.co.kr

많이 본 기사

포토

아직 살만한 세상