빅데이터를 통해 본 분단적대성 연구자료

빅데이터를 통해 본 분단적대성 연구자료

연구자료

분단감정어 사전과 분단적대성 지표 개발 연구

조회수 1144 link 복사

한상효,  분단감정어 사전개발 연구, 통일인문학75, 2018.

이 글은 빅데이터를 이용한 분단적대성 지표 개발을 위한 우선적인 작업으로 분단감정어 사전 개발과정을 설계하고 그에 따른 결과를 도출하는 데 목적이 있다. ‘분단적대성은 북한 혹은 좌파·빨갱이·종북 등으로 분류되는 자들을 향한 혐오, 불안, 공포, 분노 등의 복합적인 집단감정이다. 이러한 집단검정을 분석하기 위해 빅데이터 기법 중 감정사전을 기반으로 한 감정분석을 이용한다. 그런데 이러한 감정분석을 위해서는 우선적으로 요구되는 것이 감정사전이다. 이 글에서는 분단적대성의 분석하기 위한 감정사전을 분단감정어 사전으로 명명하며, 이를 구축하기 위해 분단감정어휘를 수집하고 이에 대한 감정범주 및 강도를 측정한다. 우선 온라인 포털의 댓글 텍스트를 형태소 단위로 나누어 분석하고 수집된 어휘들의 감정표현 여부를판단하여 분단에 관한 감정어휘인 분단감정어를 선정하였다. 그 다음으로는 집단지성(200)을 이용하여 감정어휘를 감정범주별로 분류하고 각 어휘의 감정강도(10점 척도)를 평가하였다. 최종적으로 연구진들의 검토를 거쳐 감정범주와 감정강도 정보가 담긴 분단감정어 사전을 개발하였다. 이러한 과정을 통해 분단감정어 추출 방법을 체계화하였으며 분단으로 촉발되는 자극에 대한 사람들의 반응이라고 할 수 있는 언어적 표현을 평가하는 기준을 마련하였다.

 

박재인, 빅데이터 분석기법을 통해 본 분단적대성의 언어적 재현과 의미통일인문학 81, 2020.

이 연구는 분단체제 속 사회적 집단감정으로 분단적대성을 빅데이터 방법으로 분석하는 논의로 분단적대성 감정어의 산출과정과 함께, ‘분단에 처해있는 한국사회의 현주소를 재현하는 특별한 언어들의 특징과 의미를 살펴보았다. 이 연구의 대상인 분단감정어 사전북한관련 기사의 댓글 수집, 높은 빈도수로 출현하는 감정어 선별, 감정어 적합성에 대한 전문가 검토, 집단지성을 통한 분단감정어의 유형과 강도 평정, 분단적대성 측정 검색어로 확정과정으로 제작되었으며, 여기에서 산출된 어휘들과 각각의 지수들은 분단적대성을 측정하는 검색 도구가 되는 것이다. 이 분단감정어사전으로 산출된 다양한 범주의 감정어들은 한국사회 분단적대성의 속성을 드러낸 언어들이다. 여기에서는 혐오와 분노, 공포와 불안 및 긍정적인 감정들을 중심으로, 남북관계에 있어 가장 첨예한 반응이 있었던 20179(6차 핵실험)20184(4.27 남북정상회담) 시기의 인터넷 댓글 자료들을 분석하였다. 혐오의 어휘들을 통해서는 남북관계에만 한정되어 있지 않고, 정치갈등과 지역갈등, 세대갈등에까지 침범해 있다는 사실을 확인할 수 있었고, 분노 범주에서는 전쟁과 관련하여 적개심이 분노의 언어로 표현되고 있음을 알 수 있었다. 또한, 확실한 실체에 대한 두려움인 공포의 범주에서는 전쟁과 핵에 대한 공포를 담고 있었으며, 예측되지 않은 상황에 대한 걱정을 나타내는 불안의 범주에서는 남북관계의 막막함에 대한 심리가 담겨있었다. 마지막으로 긍정의 감정어들을 살펴보았는데, 상대를 굴복시키는 쾌감이나 상대를 낮추어 보는 시선, 혹은 못마땅한 마음이 섞인 연민 등 결코 긍정의 감정만을 담고 있지는 않은 복합적인 형태로 쓰이고 있었다. 이렇게 분단적대성을 나타내는 감정어들은 우리 사회의 갈등과 분열을 그대로 반영하고 있으면서, 분단체제를 살아가는 사람들의 원초적 심리를 나타내고 있다고 할 수 있다.

 

김종곤, 분단적대성 지표’(IKAI)의 개발과 타당성통일인문학81, 2020.

이 글의 목적은 분단적대성 지표’(IKAI)의 개발 과정을 설명하고 그 타당성을 논의하는 데에 있다. 우선, 이 글은 지표 개발 과정을 분단감정어 사전 구축단계와 분단적대성의 지수 산출 모형화 단계로 나누어 설명한다. 이때 분단감정어 사전은 수집된 텍스트에서 분단적대성의 감정어휘를 추출하고 이를 감정유형별로 분류하는 기능을 한다. 또 각 어휘에 고유의 강도값을 평정하여 지수 산출과정에서 분단적대성의 강도를 계산하기 위한 도구로 활용된다. 반면 지수 산출 모형화는 해당시기 수집된 어휘들의 빈도수와 분단감정어 사전을 통해 평정된 각 어휘의 강도값을 감정비율로 계산하여 부정감정의 비율을 산출하는 과정이다. 둘째, 이 글은 IKAI의 타당성을 밝히기 위해 개발된 지표를 활용하여 지난 12년간의 연간·월간 분단적대성 지수 및 감정유형별 지수를 산출하고 해당 시기에 발생한 이슈와 대조한다. 그 결과 IKAI는 남북관계 및 국내의 정치적 상황에 따른 긴장도와 분위기에 민감하게 반응하는 것으로 분석되었다.