인터넷언어교육실 특강 포스터

 

Introduction:

 

   Coh-Metrix는 미국 멤피스대학교(University of Memphis) 지능형시스템연구소(Institute for Intelligent Systems)에서 개발한 웹기반 언어분석 시스템으로 다양한 유형의 텍스트 및 교재를 광범위한 언어학적 측정치들에 의해 분석하는 자동화된 컴퓨터 도구이다(전문기와 임인재, 2009, 2010; Graesser, Jeon, Cai, & McNamara, 2008; Graesser, Jeon, Yan, & Cai, 2007; Jeon, 2008). Coh-Metrix 시스템은 현재 전산언어학 분야에서 광범위하게 사용되는 어휘집(lexicons), 코퍼스(corpora), 품사분석기(Brill, 1995), 통사구문분석기(Charniak, 2000), LSA(Latent Semantic Analysis, Landauer, 2007) 등으로 구성된다. Coh-Metrix는 표준 읽기 난이도 공식(standard readability formulas, Klare, 1974-1975)에 의해 산출되는 Flesch Reading Ease(FRE) 점수 및 Flesch-Kincaid Grade(FKG) 수준 점수를 포함, 어휘의 다양성(lexical diversity), 통사적 복잡성(syntactic complexity), 참조적 정합성(co-referential cohesion), 의미적 정합성(semantic cohesion), 단어빈도수(word frequency) 등의 광범위한 언어학적 측정치를 제공한다. Coh-Metrix는 현재 인터넷을 통해 누구나 무료로 이용할 수 있고(http://cohmetrix.memphis.edu/), 이 경우 60개의 대표적인 언어학적 측정치를 제공한다. 그러나 현재 멤피스대학교 지능형시스템연구소 연구원들에게만 연구용으로 제공되는 데스크톱(desktop) 컴퓨터용 프로그램을 이용할 경우, 약 800여 개의 언어학적 측정치들을 제공한다. 이러한 점에서 Coh-Metrix는 전산언어학 분야에서 측정 가능한 거의 모든 언어학적 측정치를 제공하는 유일한 컴퓨터 시스템이라 할 수 있다. 본 발표는 Coh-Metrix에 대한 소개 및 시연, 그리고 Coh-Metrix에 의한 자료 분석 결과의 제시로 구성된다.