동네: 동아미디어그룹 공식 블로그

대한민국 70년 동아일보 기사속 연관어 빅데이터 분석

 

‘민주화’ 빈도 1987년 정점… 1989년부터 ‘진보’  〉‘반공’ 역전

 

 

 

  1980년 ‘서울의 봄’은 짧았지만, ‘민주화’는 7년 뒤 마침내 봉우리를 이뤘다.

 

 

 대한민국 정부 수립 70주년을 맞아 본보와 고려대 민족문화연구원 디지털인문학센터가 공동으로 ‘동아일보 코퍼스(연구를 위한 말뭉치)’를 분석한 시스템은 연도별로 특정 단어가 본보 기사에 등장한 ‘빈도’를 그래프로 보여준다.

 

 

 대한민국의 정치적 변화상을 상징하는 단어 ‘민주화’가 쓰인 빈도 그래프는 군부독재 시절 숨죽이던 민주화의 열망이 폭발하는 과정을 그대로 드러낸다. 4·19혁명이 일어난 1960년 ‘민주화’ 키워드의 빈도는 살짝 늘었다가 이내 수그러든다. 빈도가 그래프에서 작은 봉우리를 이룬 건 1980년 ‘서울의 봄’. 유신체제가 막을 내린 뒤 전국에서 민주화 요구 시위가 벌어졌다. 당시 동아일보는 신년호 특집 기사에서 “경제성장을 다소 늦추고 생활수준 향상을 지연시키더라도 자유선거에 의한 국민의 정치 참여와 인권을 신장시키는 민주화가 바람직하다는 얘기다”(1980년 1월 1일)라고 보도했다.

 

 

 신군부가 비상계엄으로 짓밟은 ‘민주화’가 다시 급증하는 건 1985년부터다. 오제연 성균관대 사학과 교수는 “1985년 2월 총선에서 선명 야당의 기치를 내건 신한민주당이 직선제 개헌을 어젠다로 제시하고 돌풍을 일으킨 영향”이라며 “그래프는 1987년 6월 항쟁으로 직선제 개헌을 쟁취하며 ‘민주화’가 정점을 찍는 과정을 보여준다”고 말했다.

 

 

○ ‘민족’보다 ‘시민’의 꾸준한 성장 

 

민주주의의 성숙은 ‘시민’이란 단어의 사용 빈도 증가에서도 확인된다. ‘시민’은 1950∼2000년대 꾸준히 빈도가 늘었다. 처음에는 같은 문장에 ‘서울’ ‘회관’ 등이 함께 주로 등장하다가 1990년대 이후 ‘단체’와 ‘운동’ ‘연대’라는 단어와 함께 많이 쓰였다. 시민단체가 2000년 총선을 앞두고 벌인 낙천·낙선 운동의 위법 논란이 ‘뉴 밀레니엄’의 벽두부터 주요 뉴스로 등장하기도 했다. 오 교수는 “단순히 시(市)에 사는 사람이라는 뜻이었던 시민이 자율성과 자발성을 지닌 민주주의의 주체로 등장하는 것으로 해석된다”고 말했다.

 1980년대 시민과 함께 ‘광주’가 같은 문장에 가장 많이 쓰인 건 1980년 5·18민주화운동에서 희생된 ‘광주 시민의 한(恨)’에 대한 기사가 많았기 때문이다.

 시민의 성장은 ‘민족’의 퇴조와 대조된다. 1940, 50년대 민족은 시민보다 압도적으로 많이 쓰였고, 1980년대까지도 시민과 비슷한 추세로 사용됐으나 이후 계속 하락세다. 이는 글로벌화를 거치며 민족주의의 힘이 약화된 것을 보여준다. 감성적 민족주의에 바탕을 둔 주장의 호소력이 떨어진 것과도 같은 맥락이다.

 

 

 

○ 성 평등의 부각, ‘반공 대(對) 진보’

  ‘자유’는 1960, 70년대까지 ‘세계’와 같은 문장에서 함께 쓰인 경우가 많았다. 냉전 상황에서 자유민주주의 진영을 지칭한 ‘자유세계’라는 단어가 많이 사용됐던 것. 그러나 1980년대 이후 ‘무역’의 비중이 높아졌다. ‘평등’과 함께 한 문장에 쓰인 연관어로는 ‘자유’ ‘사회’ ‘원칙’ ‘법’ 등이 많았다. 특히 1980년대 이후 ‘교육’이, 1990년대 이후 ‘양성’과 ‘남녀’가 함께 많이 등장한 건 평등한 권리의 내용이 확장되고 있음을 보여준다.

 

 단어 ‘진보’의 출현 빈도가 늘면서 1989년부터 ‘반공’과 역전되는 것도 흥미로운 대목이다. 박태균 서울대 국제대학원 교수는 “민주화 이전에는 반공주의 내에서 여야가 갈라졌지만 민주화 이후 보수 대 진보로 정치 구도가 바뀌는 것과 관련이 있다”며 “이 구도는 1990년 3당 합당으로 민자당이 생겨난 뒤 정착했다”고 말했다. 진보당을 창당한 조봉암(1899∼1959)이 간첩으로 내몰려 사형당한 뒤 1960년대에는 ‘혁신 정당’이라는 표현이 오히려 많이 사용됐으며, ‘진보 정당’이라는 말은 민주화 뒤 ‘민중당’ 등이 등장하면서 다시 쓰였다는 설명이다.

 

 

 

○ ‘3김’의 정치 역정, 그래프에 그대로

 김영삼 김대중 전 대통령과 김종필 전 총리의 이름이 기사에 언급된 빈도 그래프에는 그들의 정치 역정이 고스란히 드러난다.

 

 ‘영원한 2인자’ 김종필이 본보 기사에 나타난 빈도는 1963년 권력의 2인자로 국회에 진입해 6·3한일회담반대운동으로 2차 외유를 떠나는 이듬해까지가 정점이었다.

 

 김영삼과 김대중은 1980년대까지 모두 ‘민주화’와 그래프 모양이 대체로 비슷해 ‘라이벌이자 동지’였음을 실감케 한다. 1987년 이들의 빈도는 정점을 찍었지만 후보 단일화에 실패해 노태우 대통령이 당선된 뒤 하락했다가 당선(김영삼 1992년, 김대중 1997년) 시기 다시 번갈아 상승한다.

 

 두 사람은 1980년 ‘서울의 봄’ 전후를 제외하면 유신 말기, 신군부 집권 초기인 1970년대 후반∼1980년대 초반 수감과 가택연금 등으로 신문에서 이름이 언급되는 횟수가 극도로 떨어진다. 당시 본보는 ‘재야인사’라고 에둘러 지칭하면서 두 사람의 소식을 전하기도 했다.

 

조종엽 기자 jjj@donga.com

 

 

[분석 틀 ‘동아일보 코퍼스’는] 

신문은 사회 변화를 보여주는 근현대의 가장 기본적인 사료다. 일제에 의해 강제 폐간됐다가 1945년 12월 복간 이후 지속 발행하고 있는 정론지 동아일보는 사료로서 가치가 특히 높다.  

 그러나 방대한 자료도 분석 도구가 없으면 존재하지 않는 것이나 다름없다. ‘동아일보 코퍼스’는 이도길 고려대 민족문화연구원 교수, 김일환 성신여대 국문학과 교수(민족문화연구원 공동연구원) 등이 2009년부터 연구해 탄생했다. 1946∼2014년 발간된 동아일보 약 260만 기사(약 4억1000만 어절) 전체를 분석할 수 있는 시스템이다. 

 연구팀은 같은 기간 ‘물결21’이라는 사업을 통해 동아일보 조선일보 중앙일보 한겨레신문의 2000∼2013년 신문 기사 5억9200만 어절을 분석할 수 있는 시스템을 만들고 이미 공개하기도 했다. 
 신문 기사를 분석하기 위해서는 기사 문장을 형태소로 분리하고, 품사 정보를 ‘태깅’(부착)하는 게 필요하다. 이 교수는 먼저 ‘KMAT’라는 기계학습 기반의 자동 형태소 분석, 품사 태깅 도구를 개발해 ‘21세기 세종계획’으로 확보된 한국어 언어 자료를 학습했다. 이를 통해 새로운 형태소 분석 모델을 만들어냈다. 

 이 교수는 “일제강점기 동아일보 기사는 맞춤법이 오늘날과 많이 달라 별도 작업이 필요하다”며 “추후 완성되면 100년가량의 시간대에서 언어적, 사회·문화적 변화를 추적할 수 있는 데이터가 확보되는 것”이라고 말했다. 김 교수는 “공기어(共起語·문맥상 함께 등장하는 단어) 분석이 가능한 품사 범주를 확대하고 인명·지명·단체명·사건 명칭을 구별할 수 있도록 시스템을 정교하게 보완하면 가까운 미래의 추세 예측도 기대할 수 있을 것”이라고 전망했다.조종엽 기자 jjj@donga.com

 

 

 

 

 

 

댓글 없음 »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

LOGIN