빅데이터를 통해 본 분단적대성

빅데이터를 통해 본 분단적대성

분단적대성 지표

‘분단적대성 지표’(Inter-Korean Antagonism Index : IKAI)

  • ‘분단적대성 지표’(Inter-Korean Antagonism Index : IKAI)는 포털 사이트 뉴스 게시판 ‘북한’ 관련 기사에 달린 댓글을 대상으로 감정어를 추출하고 해당시기 분단적대성의 강도를 수치화하여 가시화하려는 목적에서 개발되었다.

    IKAI는 분단적대성을 구성하는 감정유형들을 10개 유형(공포, 분노, 혐오, 불안, 싫증, 슬픔, 연민, 기쁨, 호감, 안심)으로 분류하고 그 비율을 제시하면서 분단적대성의 감정동학을 파악하기 위한 도구로 활용하고자 개발된 것이다.

     

    IKAI는 크게 두 가지 과정을 거쳐 개발되었다.

    첫 번째는 ‘분단감정어 사전’(Inter-korean Emotion Lexicon) 구축이다.

    IKAI는 빅데이터 분석기법에 바탕을 두고 있기에 수집된 텍스트로부터 분단적대성을 표현하는 어휘들을 선별하여 추출할 도구가 필요하다.

    ‘분단감정어 사전’이 바로 그 도구이다.

    ‘분단감정어 사전’은 아래 그림에서 보는 바와 같이 ‘분단 관련 어휘군 수집→전문가 집단을 통한 감정어휘 목록화→집단지성을 활용한 감정 유형 분류 및 강도 평정’ 과정을 거쳐 이루어졌다.

    이 과정을 거쳐 최종적으로 완성된 분단감정어 사전은 총949개의 어휘를 수록하고 있으며, 각각의 어휘는 고유한 감정강도값을 지니고 있다.

    더 나아가 통일인문학연구단은 분단적대성이 강화되거나 약화되는 요인을 객관적으로 파악하기 위하여 빅데이터 분석기법을 활용한 ‘분단적대성 지표’(Inter-Korean Antagonism Index : IKAI)를 개발하고 지난 2007년 이후부터 지수변화를 관찰하고 그 변화요인을 분석해오고 있다.

     

     

     

    IKAI 개발의 두 번째 단계는 분단적대성의 감정강도를 지수화하는 모형을 제시하는 것이다. 지수 산출 과정의 설계는 다음과 같다.

     

    우선 ①‘북한’을 검색어로 포털 사이트 뉴스에서 1차 댓글을 수집한다.

    이때 수집된 자료는 기사에 대한 직접적인 반응인 1차 댓글로 한정한다.

    왜냐하면 2차 이상의 댓글은 분단의 대상(북한이나 좌파 등)에 대한 것이 아니라 그 이전의 댓글을 단 사람이나 생각에 대한 반응일 수 있기 때문이다.

     

    ②수집된 댓글을 대상으로 ‘분단감정어 사전’을 활용하여 형태소 분석을 실시하고 분단적대성의 감정어휘를 추출한다.

    이때 추출된 감정어휘는 그것이 사용된 빈도수 및 고유의 강도값과 함께 감정유형별로 분류되어 목록화된다.

    그리고 아래의 예시와 같이 ③각 어휘의 빈도수와 강도값을 통해 감정어휘들이 표현하는 감정의 크기를 구한다.

     

    마지막으로 ④감정어휘별 감정의 크기를 감정유형별로 총합한 후 이를 다시 감정구분(긍정/부정) 대비 백분율로 나타낸다.

     

    이때 최종적으로 산출되는 부정감정의 비율이 곧 ‘분단적대성 지수’이다.

     

     

    아래 그래프는 2007년부터 2018년까지 IKAI를 활용해 측정한 분단적대성 지수 그래프이다.

    해당 기간 분단적대성 지수의 전체 평균은 88.0p였다.

    가장 낮은 지수를 보이는 해는 2007년으로 78.5p였으며 2018년까지 그 이하로는 하락하지는 않았으며 최고치는 2010년으로 97.4p를 기록하고 있다.

    최대값과 최소값 간의 차이는 18.9p이다.

     

     

    2007년에는 78.5p였던 분단적대성 지수는 이명박 정권이 시작된 2008년에 82.3p로 소폭 상승하였고 2009년에는 급증하여 93.5p를 기록하였다.

    그리고 2010년에는 지난 12년간 최고치인 97.4p까지 상승하였다.

    다음 해인 2011년에는 소폭 하락하여 94.4p로 떨어졌지만 2012년에는 다시 상승하여 95.3p를 기록하였다.

    박근혜 정부가 들어선 2013년에는 9p 떨어져 86.1p를 기록하였다.

    그리고 임기가 끝난 2016년까지 꾸준히 86p 언저리에 머물고 있다.

     

    문재인 정권으로 교체되면서 지수는 85p 아래로 떨어졌다.

    2017년에는 전년도 대비 1.4p 하락하여 84.9p를, 다음 해인 2018년에는 약 0.5p 상승하여 85.4p를 기록하였다.

     

    연간 분단적대성 지수의 변화에서 가장 눈에 띄는 것은 단연 이명박 정권 시기이다.

    정권이 교체된 처음 1년은 4p가량 증가하였지만 다음 해에 폭발적으로 증가하여 나머지 임기 4년 내내 평균지수 88p를 훨씬 상회한 93.5-97.4p를 기록하였다.

    이는 무엇보다 이명박 정권 시기 북핵 문제를 둘러싸고 갈등이 매우 첨예화되었고 그 이전과 다르게 강경한 대북정책으로 전환하면서 남북관계가 악화된 탓으로 보인다.

    또한 이 시기에는 금강산 관광객 피격사건(2008), 천안함 사건(2010)과 연평도 포격 사건(2010)이 발생하는 등 한반도에 긴장이 최고조에 이르렀고 그것이 사람들의 불안심리를 자극하였기 때문으로 추측된다.

     

    그렇지만 박근혜 정부로 교체되는 2013년도 들어 적대성 지수는 전년도 대비 약 10p 하락한다.

    그리고 85p 선에서 4년여 동안 큰 변화를 보이지 않는다.

    무엇보다 이는 박근혜 정부 들어 북핵문제를 둘러싸고 갈등을 지속하고 개성공단을 폐쇄하는 등 원활한 남북관계가 형성되지는 못하였지만, 신뢰프로세스로 대변되는 대북정책과 드레스덴 선언을 통해 남북 간의 경제·사회문화 공동체 건설이라는 기조를 나름 유지하면서 그 이전 이명박 정부에 비해 상대적으로 긴장도가 낮아졌기 때문으로 보인다.

    아울러 여기에서 유심히 살펴봐야 할 시기는 2017년 이후이다.

    알다시피 문재인 정부 들어 남북관계는 상당히 호전되었다.

    2017년 말까지만 하더라도 최악으로 치달았던 남북관계는 2018년 평창동계올림픽을 계기로 남북교류는 각종 분야에서 확대되었으며, 같은 해 4, 5, 9월에는 3차례 남북정상회담을 개최하기도 하였다.

    또한 6월에는 사상 최초로 북미정상회담이 열리기도 하였다. 그럼에도 분단적대성 지수는 박근혜 정부시기 보다 약1.5p 하락한 수준에 머물고 있다.

     

    분단적대성 지수는 남북관계와 한반도를 둘러싼 세계적 정세 그리고 북한 내의 정치적 지형 변동, 국내의 정치·사회적 갈등 이슈 등에 영향을 받아 변화되는 것으로 분석된다.

    하지만 이런 분석은 지수변화와 분석된 요인 간의 상관성을 명확하게 밝힌 것이라고 할 수 없다.

    좀 더 명확한 분석이 되기 위해서는 분단적대성을 구성하는 감정들의 변화와의 비교가 필요하다.

    아래에서는 감정범주별 연간변화가 지닌 주요특징을 살펴보면서 좀 더 구체적으로 적대성 지수에 변화를 야기한 요인을 밝히고 아울러 그 의미를 도출하고자 한다.

     

     

    위의 그래프는 2007년부터 2018년까지 매해 감정범주별 연간 변화이다.

    크게 두 가지의 특징이 눈에 띈다.

    우선 2007년과 2008년 그리고 2014년 이후는 ‘혐오’와 ‘공포’가 비율상으로 1, 2위를 차지하지만 2009년에서 2013년 사이에는 ‘불안’과 ‘싫증’이 그 순위를 대신한다는 점이다.

    또 한 가지 눈에 띄는 것은 2007년과 2014년 이후 1, 2순위를 차지하는 감정범주는 동일하게 ‘혐오’와 ‘공포’이지만 3, 4순위가 뒤바꿔 있다는 점이다.

    보다시피 2007년은 ‘분노-불안’ 순이지만 2014년 이후는 ‘불안-분노’ 순으로 나타나고 있다.

    이는 무엇보다 분단적대성의 상승 또는 하락을 야기하는 구체적인 감정들이 시기별로 다르다는 것을 말한다.