동네: 동아미디어그룹 공식 블로그

동아일보 속의 선거 1: 선거 키워드

Posted by 신이 On 6월 - 1 - 2012

  2012년은 총선과 대선이 있는 선거의 해다. 동아일보는 고려대 민족문화연구원 ‘물결 21’ 사업팀과 함께 동아일보 기사에 비친 선거의 변화상을 데이터 마이닝 기법(data mining)으로 분석했다.  1948년 제헌국회 선거부터 올해 4·11총선까지 디지털화한 동아일보 기사가 대상이다.

 

 ••  선거 키워드란?

선거별 키워드는 장기간의 동아일보 기사(1947년 7월 21일부터 2012년 3월 26일까지) 가운데 선거와 관련된 기간을 설정하고 그 기간 동안 나타난 기사의 언어 사용 양상을 통해 해당 선거의 키워드를 추출하고자 시도했다. 선거와 관련된 기간의 키워드일 뿐 선거와 직접 관련되지 않은 단어가 포함됐다.

키워드 추출 과정은 다음과 같다.
먼저 선거와 관련한 구간별로 기사를 통합한다. 이번 분석에서는 1990년 이전에는 총선의 경우 총선일 이전 6개월, 대선의 경우 대선일 이전 1년을 기간으로 선정했다.
이 텍스트를 대상으로 자동 형태소 분석을 수행한 뒤 형태소 분석된 결과를 토대로 키워드를 선거별로 추출했다.
키워드의 추출은 해당 선거와 인접한 두 선거 기간을 비교했다. 예컨대 5대 총선의 키워드는 인접한 선거인 4대와 6대의 단어들과 비교하여 특별히 높게 출현한 단어를 키워드로 선정하게 된다. 이 과정에 키워드가 되기 위한 단어들을 t-점수를 이용하여 계량화하여 이 점수가 높은 순으로 키워드를 결정하게 된다. 
 

* 역대 대선 키워드

 대선 인물과 선거 키워드 네트워크

 

* 역대 총선 키워드

 2000~2009년 총선 키워드 네트워크

 

 

12대~19대 총선 키워드 네트워크

 

 

첨부파일

2000-2009선거관련네트워크
Title : 2000-2009선거관련네트워크
Caption :
File name : 2000-2009선거관련네트워크.pdf
Size : 95 KB
역대 대선 키워드
Title : 역대 대선 키워드
Caption :
File name : president_election_keyword.hwp
Size : 21 KB
역대 총선 키워드
Title : 역대 총선 키워드
Caption :
File name : general_election_keyword.hwp
Size : 27 KB

댓글 없음 »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

LOGIN