• 제목/요약/키워드: 단어 유사도 분석

검색결과 231건 처리시간 0.028초

트윗 텍스트의 유사 키워드 추출을 통한 이벤트 지역 탐지 기법 (A Method for Detecting Event-Location based on Similar Keyword Extraction in Tweet Text)

  • 임준엽;하현수;황병연
    • Spatial Information Research
    • /
    • 제23권5호
    • /
    • pp.1-7
    • /
    • 2015
  • 트위터는 다른 SNS와 대비되는 정보의 빠른 전파력과 확산성을 갖고 있다. 따라서 트위터를 이용하여 현실에서 발생한 이벤트를 탐지하는 여러 연구가 진행되고 있다. 트위터 사용자 개개인을 하나의 센서로 가정하고 그들이 작성한 트윗 텍스트를 분석하여 이벤트 탐지에 이용하는 것이다. 이와 관련된 연구들은 이미 많은 성과를 보이며 진행되어 왔으나 여러 가지 문제점들로 인해 새로운 한계에 직면했다. 특히 선행 연구의 대다수가 이벤트의 발생 위치를 추적하기 위해 GPS좌표를 이용한다. 그러나 이는 최근 트위터 사용자들이 위치정보 공개에 회의적인 점을 감안하면 명확한 한계점으로 제시될 수 있다. 이에 본 논문에서는 트위터에서 제공하는 위치정보를 이용하지 않고 트윗 텍스트에서 위치정보를 추적하는 방법을 제시하였다. 트윗 텍스트에서 키워드를 추출하여 키워드간의 관계를 고려해 연관단어를 군집화 하였다. 본 논문에서 제안한 알고리즘을 적용한 실험을 통해 이벤트가 발생한 지역과 실제로 발생한 이벤트의 탐지여부를 확인하였다. 또한 본 논문에서 제안한 기법이 기존 매체들보다 빠른 탐지를 보임으로써 제안된 기법의 우수성을 입증하였다.

셀슈머(Sell-sumer)로 진화한 인플루언서의 새로운 유형과 소셜미디어에서의 세일즈 전략 (Sell-sumer: The New Typology of Influencers and Sales Strategy in Social Media)

  • 신하진;김수림;홍만의;황봄님;양희동
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.217-235
    • /
    • 2021
  • 전 세계 인구의 49%가 소셜미디어 플랫폼을 사용하면서 소셜미디어 내에서의 소통과 콘텐츠 공유가 그 어느때보다 활발해지고 있다. 이러한 환경 속에서 1인미디어 시장이 빠른 속도로 성장하고 여론을 형성하면서 셀슈머(Sell-summer)라는 새로운 트렌드가 등장했다. 본 연구는 인플루언서의 상업적/비상업적 키워드의 주제 집중도와 상업적 포스팅의 비율이 매출에 미치는 영향 분석하여 제품 카테고리별 인플루언서의 새로운 유형을 정의하였다. 이는 소셜미디어 내에서 활동하는 인플루언서가 셀슈머로 변모하며 구사하는 새로운 세일즈 전략에 도움이 될 것으로 희망한다. 본 연구의 방법은 파이썬 환경에서 인플루언서의 상업적/비상업적 포스팅으로 분류하고, 이를 KoNLPy를 이용하여 텍스트 마이닝 한 후 FastText 기반 단어 간의 유사도를 계산하였다. 그 결과, 인플루언서의 상업적 포스팅의 키워드 주제 집중도가 높을수록(narrow) 매출이 높아진다는 것을 확인하였다. 또한, 군집분석을 통해 제품 카테고리별 인플루언서 유형을 4가지로 분류하고 매출에 따른 집단 간의 차이가 유의함을 확인하였다. 즉, 본 연구의 시사점은 소셜미디어에서 활동하는 인플루언서들과 이를 마케팅 도구로 활용하고자 하는 마케터들에게 소셜미디어 세일즈 전략의 실증적인 해법을 제시할 수 있을 것이다.

신문사설 분석을 통한 산불에 대한 사회적 인식연구 (Study on Korea Social Perceptions on the Forest Fires of Newspaper Analysis)

  • 김보미;박주원
    • 한국산림과학회지
    • /
    • 제108권1호
    • /
    • pp.88-96
    • /
    • 2019
  • 본 연구는 신문 사설의 분석을 통해 산불에 대한 사회적 인식을 형성하는 조건, 산불에 대한 사회적 인식의 내용, 인식과 산불관리 정책의 연관성을 알아보는 것을 목적으로 하였다. 연구대상은 1988년 1월 1일부터 2017년 5월 15일까지 5개 중앙지에 보도된 총 44건의 산불 관련 사설을 대상으로 하였다. 산불에 대한 사회적 인식을 형성하는 조건은 산불 관련 사설 수와 산불현상의 특징의 증감을 비교하여 분석하였다. 산불에 대한 사회적 인식은 산불 관련 사설의 범주와 주요 주제어, '산불관리주체'와 '산불방지대책'에 관한 사회적 인식의 내용 및 산불관리정책과의 연관성으로 나누어 Nvivo11을 통해 데이터 범주화, 단어별 사용빈도 분석을 실시하고 사용빈도가 높은 단어를 중심으로 사설주제에 대한 맥락분석을 실시하였다. 연구결과 산불이 사회적 인식을 형성하는 조건은 산불피해면적과 가장 밀접한 관련이 있는 것으로 나타났다. 산불 관련 신문사설에서 출현 빈도가 높은 주요 주제어를 기간 및 범주별로 분석한 결과 제1분석기에는 산불관리를 총체적 산림관리의 일환으로 여기며, 산불관리 주체로서 국민에게 산불에 대한 책임과 의무를 강조하는 인식이 높은 강도로 나타났다. 제2분석기에는 산불 예방과 진화를 위한 관리 뿐 아니라 환경 생태적 시각에서 관리하려는 인식이 등장했다. 제3분석기에는 산불이 사회재난의 일종으로 관리되면서 국가가 국민을 산불로부터 보호하고, 철저하게 사회재난관리를 해야 한다고 요구하는 사회적 인식이 점차 강화되었다. 이 같은 변화는 3차 산림기본계획에서 국민 계도를 통한 산불 예방을 목표로 한 산불관리 계획이 수립되고 4차 산림기본계획에서는 산림자원의 보호와 자연생태계 보전을 목표로 한 산불관리 계획이 추진되었으며, 5차 산림기본계획에는 인명피해 예방에 관한 산불관리계획이 수립된 것과 유사한 흐름을 보였다. 산불관련 신문사설 분석을 통하여 산불에 대해 형성된 사회적 인식을 분석하고 산불정책과 비교해 본 결과 산불에 대한 사회적 인식과 산불관리 정책은 상호 연관성을 갖고 변화해왔다는 것을 알 수 있었다.

다국어 소셜미디어에 대한 감성분석 방법 개발: 한국어-중국어를 중심으로 (A Method of Analyzing Sentiment Polarity of Multilingual Social Media: A Case of Korean-Chinese Languages)

  • 최미나;진윤선;권오병
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.91-111
    • /
    • 2016
  • 소비자들이 소셜미디어 상에 기록한 글을 통해 기업은 제품 또는 기업 이미지에 대한 감성분석을 수행하는데 이는 소셜미디어 기반 마케팅에서 중요한 활동 중에 하나다. 특히 글로벌 소셜미디어의 경우 국적을 불문하고 다양한 고객이 늘어남에 따라 여러 언어권의 소비자들이 각자의 언어로 다양한 의견을 표명하고 있다. 이처럼 다양한 언어로 작성된 텍스트를 감성분석하기 위해서는 기존 방법과 달리 동일한 언어로 통일시켜야 하는 번역 작업이 필요하다. 하지만 번역을 하게 될 경우, 언어와 관련된 배경이나 문화, 용어사용의 차이 등으로 본래 문서에 있는 모든 단어나 문법을 정확히 표현할 수 없는 문제점이 있다. 따라서 본 연구에서는 다중 언어로 수집되는 텍스트를 번역하지 않고 해당 언어별로 텍스트를 분리한 다음 감성분석을 진행하여 각각의 극성치를 종합하는 방법을 제안하고자 한다. 본 연구에서 제안한 다국어 감성분석 알고리즘을 검증하기 위해 다중언어 문장을 한국어, 중국어로 번역한 감성분석의 극성치 편차인 RMSE 값을 비교하였다. 그 결과, 번역을 통한 다중언어의 감성분석보다 언어별로 분리한 감성값이 실제 감성값에 가장 근접하는 것으로 나타나 본 연구에서 제안한 방법론의 우수성을 입증하였다. 본 연구는 다수의 유사한 연구에서 사용했던 알고리즘을 사용하지 않고 원문 그대로 다중언어 감성분석을 시도했다는 점에서 의의가 있다.

KISTI 과학기술정보서비스의 콘텐츠 활용 분석 (A Study on the Content Utilization of KISTI Science and Technology Information Service)

  • 강남규;황미녕
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.87-95
    • /
    • 2020
  • 한국과학기술정보연구원(KISTI)가 제공하는 과학기술정보서비스는 일반적인 정보서비스와 유사하게 구축된 콘텐츠를 이용자가 쉽고 편리하게 검색하고 조회할 수 있도록 만들어진 서비스이다. NDSL은 KISTI의 핵심 과학기술정보서비스로서 약 1억 38백만건의 콘텐츠를 제공하고 있으며 2019년 1년간 약 93백만회의 페이지 뷰를 보이고 있다. 본 논문에서는 NDSL이 제공하고 있는 학술논문, 보고서, 특허 등의 과학기술정보가 웹 서비스(https://www.ndsl.kr)를 통해서 어떻게 검색되고 활용되는지와 입력된 검색 질의어 등을 분석을 통해 다양한 인사이트를 도출하였다. 콘텐츠 구축 현황, 콘텐츠 유형별 활용 현황과 활용 방식 등의 일반적인 통계 이외에도 월별/요일별/시간대별 콘텐츠의 이용 행태, 조회수 구간별 활용 콘텐츠의 유형, 콘텐츠 유형별 1회 검색 대비 조회 비율, 학술논문의 발행년도별 이용 현황 비교, 국내 학술논문의 활용과 KCI 영향력 지수와의 관계, 학술논문과 특허 활용에 대한 특징 등 콘텐츠 유형별 활용성에 대한 분석을 진행하였다. 또한 콘텐츠 유형별 검색 질의어의 구성 방식, 질의어의 단어수 분석, 검색 질의어와 시기성의 관계 등의 검색 질의어에 대하여 분석하였으며 NDSL에서는 한글 성명 검색이 많다는 특징도 발견할 수 있었다. 이러한 분석 결과를 토대로 정보시스템 구축 관점에서의 NDSL 서비스 개선 방안을 제안하고자 한다. 본 논문에서는 콘텐츠 활용에 대한 행태 분석 결과를 이용자의 검색 결과에 동적으로 반영, 비로그인 이용자에 대한 식별을 통해 타겟팅 서비스가 가능하도록 시스템을 구축, 질의어 확장하는 등의 것을 NDSL 개선 사항으로 제안하고자 한다.

한국인의 공감 측정 도구에 관한 연구 (RELIABILITY AND VALIDITY OF A KOREAN EMPATHY CONSTRUCT HATING SCALE)

  • KIM, MOON SIL
    • 대한간호학회지
    • /
    • 제18권1호
    • /
    • pp.26-33
    • /
    • 1988
  • 내담자와 상담자간의 관계형성 추진에 관한 연구가 C. Rogers에 의해 시작된 이래, 돕는자 또는 상담자가 가져야 할 주요 조건으로서 공감, 존중, 온정, 확고부동함, 진지성, 자기노출, 직면반응 등을 들고 있으며 이중 둘 또는 세 요소 등을 선택하여 그 효과를 보고 있으나 역시 가장 주요한 요소로써는 공감을 들고 있다. 공감에 관한 연구는 그 본질의 정서적 측면, 인지적 측면 또는 복합적인 측면을 강조하면서 시도되고 있으나 간호원은 돕는자로써 환자의 문제해결을 위한 전수자적 역할을 해야한다는 점을 고려할때 간호현상에서의 공감에 관한 연구는 복합적인 측면을 강조하는 공감이 어 야 한다고 생각한다. 간호학자들도 간호원의 돕는 행위중 주요 요소로써 공감을 들고 있으며 특히 Lamonica는 공감측정을 위한 도구를 개발하였으며 공감이란 환자가 간호원이 환자의 입장을 이해하고 도와준다는 사실을 인지하고 그 고마움을 표현하는 것을 의미한다고 하였다. 본 연구자는 간호원-환자간의 촉진적 관계형성을 위한 교육내용 개발에 대한 기본 연구로써 한국인의 공감 정도를 측정할 수 있는 도구개발의 중요성을 느껴 Lamonica 의 공감측정 도구를 번역하게 되었다. 본 연구의 구체적인 목적은 미국문화권에서 사용되는 공감측정 도구가 한국인에게 적합하고 의미있게 번역되었는지를 확인하고 또한 한국인이 인지한 공감에 대한 탐색을 하는데 있다. 위 목적달성을 위하여 횡문화적 연구과정을 통한 개념분석, 도구 개발에 대한 통계분석을 시도하였다. 한국인의 공감 개념 분석을 위하여 미국 텍사스 오스틴에 있는 한국인에게 공감의 뜻, 동의어, 어떤 경우에 공감을 느꼈는지, 어떤 경우에 비공감적임을 느꼈는지를 물은 결과 한국인이 갖는 공감의 의미는 미국인의 것과 유사하지만 그 표현방법의 차이가 있음을 알게 되었다. 따라서 두 국가에서 사용되는 공감의 의미가 유사하고 또한 간호학자인 Lamonica가 개발한 공감측정 도구를 한국인에게 사용하는데 무리가 없을 것으로 판단되었다. 도구의 번역은 텍사스 주립대학 박사과정 지원생인 임상 심리 학자에게 의뢰하고 그 정확성을 판단하기 위해 인간을 대상으로 하는 학문을 연구하는 한국인(간호학, 사회학, 신문방송, 광고학, 심리학 전공)에게 그 정확성 유무를 물어 최고 27점, 최하 9점중 22점 미만인 문항에 대해서는 미국 간호학자와 의논하여 수정ㆍ보완하였다. 그 후 일반인으로 간주되는 한국인에게 그 도구의 이해 여부를 확인한 후 통계분석을 시도하였다. 대상자는 미국 텍사스 오스틴에 거주하면서 한국을 떠난지 3년 미만인 성인 45명을 대상으로 하였다. 2차에 걸친 자료수집 과정상 5명의 자료는 분석 불가능하다고 판단되어 총 40명의 자료를 spss- X를 이용하여 cronbach's alpha, test-retest stability, intercorrelation matrix 분석을 통한 결과는 다음과 같다. 1) cronbach's alpha는 1차 .9353 2차 .9666으로써 문항의 동질성을 보였고, 3, 4주 간격으로 행한 test-retest stability는 .7619(p=000)이였다. 2) 반면에 intercorrelation matrix에서는 역관계 또는 무관계를 보였으며 84문항중 26문항의 item-to-total correlation값이 .35미만이었고 이 중 16문항은 .30 미만이었다. 이들을 제외한 68문항과 58문항의 각각의 item-to-total correlation간은 .96이었고 test retest stability 역시 .76으로써 84문항 전체에 관한 값과 유사하였다. 3) 역상관 또는 무상관의 값을 보인 문항을 미국 간호학자와 재검토한 결과 본래 문항에서의 단어 의미가 복합적이거나 불분명한 것이었고 또는 미국 문화권에서 사용되는 특이한 용어임을 알 수 있었다. 따라서 한국인 공감 측정 도구의 타당성을 높이기 위해 역통역을 시도하였다. 그후 공감에 관한 연구를 하고 있는 미국 학자에게 그 정확성을 판단하여 최종적으로 58문항이 한국인 공감측정 도구로서 적합하다는 판단을 하였다. 위 결과를 통한 결론 및 제언은 다음과 같다. 인간의 행위는 조건화된 문화권에 따라 다를 수 있으며, 이것은 같은 현상을 인지하는데도 영향을 미치게 되며 본 연구와 같이 어떤 현상에 대한 횡문화적 연구는 그 행위를 이해하는데 도움을 준다. 그러나 한국에서 간호에 대한 연구가 한국적 토착화 과정에 있으므로 그 연구 방법이나 도구사용이 서구의 것을 도입해야 하는 입장을 고려할 때 도구번역 과정은 원래의 의미나 함축성을 내포한 번역이어야 하며 소홀히 해서는 안될 과정임을 재확인되었다. 또한 추후 연구로써 다양한 계층의 다수를 대상으로 한 한국인 공감 측정 도구의 타당성을 재확인해야 하며 요인분석을 시도할 필요성이 있다고 사려된다.

  • PDF

미세먼지 저감을 위한 그린인프라 계획요소 도출 - 텍스트 마이닝을 활용하여 - (Derivation of Green Infrastructure Planning Factors for Reducing Particulate Matter - Using Text Mining -)

  • 석영선;송기환;한효주;이정아
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.79-96
    • /
    • 2021
  • 그린인프라 계획은 미세먼지 저감을 위한 대표적인 조경 계획 방안 중 하나이다. 이에, 본 연구에서는 미세먼지 저감을 위한 그린인프라 계획 시 활용될 수 있는 요소를 텍스트 마이닝 기법을 활용하여 도출하고자 하였다. 미세먼지 저감계획, 그린인프라 계획 요소 등의 키워드를 중심으로 관련 선행연구, 정책보고서 및 법률 등을 수집하여 텍스트 마이닝을 통해 단어 빈도-역 문서 빈도(Term Frequency-Inverse Document Frequency, 이하 TF-IDF) 분석, 중심성 분석, 연관어 분석, 토픽 모델링 분석을 실시하였다. 연구결과, 첫째, TF-IDF 분석을 통해 미세먼지 및 그린인프라와 관련된 주요 주제어는 크게 환경문제(미세먼지, 환경, 탄소, 대기 등), 대상 공간(도시, 공원, 지역, 녹지 등), 그리고 적용 방법(분석, 계획, 평가, 개발, 생태적 측면, 정책적 관리, 기술, 리질리언스 등)으로 구분할 수 있었다. 둘째, 중심성 분석 결과, TF-IDF와 유사한 결과가 도출되었으며, 주요 키워드들을 연결하는 중심단어는 '그린뉴딜', '유휴부지'임을 확인할 수 있었다. 셋째, 연관어 분석 결과, 미세먼지 저감을 위한 그린인프라 계획 시, 숲과 바람길의 계획이 필요하며, 미기후 조절의 측면에서 수분에 대한 고려가 반드시 필요한 것으로 확인되었다. 또한, 유휴공간의 활용 및 혼효림의 조성, 미세먼지 저감 기술의 도입과 시스템의 이해가 그린인프라 계획 시 중요한 요소가 될 수 있음을 확인할 수 있었다. 넷째, 토픽 모델링 분석을 통해 그린인프라의 계획요소를 생태적·기술적·사회적 기능을 중심으로 분류하였다. 생태적 기능의 계획요소는 그린인프라의 형태적 부분(도시림, 녹지, 벽면녹화 등)과 기능적 부분(기후 조절, 탄소저장 및 흡수, 야생동물의 서식처와 생물 다양성 제공 등), 기술적 기능의 계획요소는 그린인프라의 방재 기능, 완충 효과, 우수관리 및 수질정화, 에너지 저감 등, 사회적 기능의 계획요소는 지역사회 커뮤니티 기능, 이용객의 건강성 회복, 경관 향상 등의 기능으로 분류되었다. 이와 같은 결과는 미세먼지 저감을 위한 그린인프라 계획 시 리질리언스 및 지속가능성과 같은 개념적 키워드 중심의 접근이 필요하며, 특히, 미세먼지 노출 저감의 측면에서 그린인프라 계획요소의 적용이 필요함을 시사한다고 볼 수 있다.

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 (A Study on Differences of Contents and Tones of Arguments among Newspapers Using Text Mining Analysis)

  • 감미아;송민
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.53-77
    • /
    • 2012
  • 본 연구는 경향신문, 한겨레, 동아일보 세 개의 신문기사가 가지고 있는 내용 및 논조에 어떠한 차이가 있는지를 객관적인 데이터를 통해 제시하고자 시행되었다. 본 연구는 텍스트 마이닝 기법을 활용하여 신문기사의 키워드 단순빈도 분석과 Clustering, Classification 결과를 분석하여 제시하였으며, 경제, 문화 국제, 사회, 정치 및 사설 분야에서의 신문사 간 차이점을 분석하고자 하였다. 신문기사의 문단을 분석단위로 하여 각 신문사의 특성을 파악하였고, 키워드 네트워크로 키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised Learning 기법을 활용하여 각각의 논조에 대해 분류하였으며, 마지막으로는 분류 성능 평가를 위해 정확률과 재현률, F-value를 측정하여 제시하였다. 본 연구를 통해 문화 전반, 경제 전반, 정치분야의 통합진보당 이슈에 대한 신문기사들에 전반적인 내용과 논조에 차이를 보이고 있음을 알 수 있었고, 사회분야의 4대강 사업에 대한 긍정-부정 논조에 차이가 있음을 발견할 수 있었다. 본 연구는 지금까지 연구되어왔던 한글 신문기사의 코딩 및 담화분석 방법에서 벗어나, 텍스트 마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있다. 향후 지속적인 연구를 통해 분류 성능을 보다 높인다면, 사람들이 뉴스를 접할 때 그 뉴스의 특정 논조 성향에 대해 우선적으로 파악하여 객관성을 유지한 채 정보에 접근할 수 있도록 도와주는 신뢰성 있는 툴을 만들 수 있을 것이라 기대한다.

실험 타이포그래피 관점에서의 부적의 조형성 (A Study on the Form of Charms with the Attributes of Experimental Typography)

  • 정성환;김민호
    • 디자인학연구
    • /
    • 제14권4호
    • /
    • pp.99-108
    • /
    • 2001
  • 부적에는 고대의 다양한 기호나 그림, 원형문자가 사용되어 왔으며 현재도 쓰여지고 있다. 이는 체계화된 문자와 조합되어 다양한 표현으로 메시지를 전달하고 있으며, 현재도 전통적인 방법이 고수되는 반면 지속적인 변화를 통해 인간의 감정과 욕망을 표현하고 있다. 부적은 일반적 견해로 생각하는 실험 타이포그래피 만큼이나 논리적이며 실험적인 성격이 강하다. 또한 문자가 가지고 있는 의미로 다른 기호나, 상형문자, 그림 및 유사단어로 표현하고 있다. 각각의 요소들은 상징적 심볼 및 연상성, 글의 해체성 등 다양성을 갖추고 있었다. 이러한 타이포그래피의 실험적 성격을 더욱 실험적으로 표현가능성을 보여 주고 있는 부적에서 배워야할 해체와 구성작업을 회화적 타이포그래피 관점으로도 눈여겨볼 점이 많았음이 관찰되었다. 본 연구는 부적이 가지고 있는 조형적 특징을 실험 타이포그래피와 비교, 분류, 분석하여 부적이 가지고 있는 조형적 특징이 시각적 언어와 타이포그래피 표현으로 응용될 수 있는 가능성을 살펴보고자 한다. 또한, 한국적 조형 문화로서 부적이 형태적 물성이 가지는 시각 이미지에 대한 재인식과 그 가능성에 대한 모색은 타이포그래피의 서구적인 고정된 틀을 벗어나 우리의 문화와 정서에 맞는 타이포그래피의 표현 영역을 화장하는 것이 앞으로의 과제라 할 수 있다.

  • PDF

문법성과 어휘 응집성 기반의 영어 작문 평가 시스템 (An English Essay Scoring System Based on Grammaticality and Lexical Cohesion)

  • 김동성;김상철;채희락
    • 인지과학
    • /
    • 제19권3호
    • /
    • pp.223-255
    • /
    • 2008
  • 본 논문에서 우리는 문장의 문법성과 텍스트의 어휘 응집성 측정을 위주로 하는 영어 작문 자동평가시스템을 소개하려고 한다. 문법 검사를 위해서는 링크 파서를 사용하고 어휘 연쇄를 측정하기 위해서는 로제 시소러스를 사용한다. 자동 평가 시스템의 채점 신뢰도를 측정하기 위해서 자동 채점과 수동 채점의 결과를 통계적으로 비교한다. 카파 통계와 다국면 Rasch 모형에 따른 분석 결과 자동 채점은 수동 채점과 유사성이 크며 수동 채점과 비교해서 신뢰성에 특별한 문제가 없다는 결론을 내리게 된다. 본 연구의 가장 큰 의의는 다양한 종류의 기술과 도구를 바탕으로 신뢰할 만한 수준의 영작문 자동 평가 시스템을 개발했다는 것이다. 평가 대상이 문장 단위를 넘어 선 텍스트 단위이며, 단어나 문법 등의 형식적 측면만 검사하는 것이 아니라 내용적 측면도 평가한다.

  • PDF