• 제목/요약/키워드: Corpus Analysis Tools

검색결과 13건 처리시간 0.024초

Citation Practices in Academic Corpora: Implications for EAP Writing

  • Min, Su-Jung
    • 영어어문교육
    • /
    • 제10권3호
    • /
    • pp.113-126
    • /
    • 2004
  • Explicit reference to the work of other authors is an essential feature of most academic research writings. Corpus analysis of academic text can reveal much about what writers actually do and why they do so. Application of corpus tools in language education has been well documented by many scholars (Pedersen, 1995, Swales, 1990, Thompson, 2000). They demonstrate how computer technology can assist in the effective analysis of corpus based data. For teaching purposes, tills recent research provides insights in the areas of English for Academe Purposes (EAP). The need for such support is evident when students have to use appropriate citations in their writings. Using Swales' (1990) division of citation forms into integral and non-integral and Thompson and Tnbble's (2001) classification scheme, this paper codifies academic texts in a corpus. The texts are academic research articles from different disciplines. The results lead into a comparison of the citation practices m different disciplines. Finally, it is argued that the information obtained in this study is useful for EAP writing courses in EFL countries.

  • PDF

한국어 교육 관련 국내 코퍼스 연구 동향 (A review of corpus research trends in Korean education)

  • 심은지
    • 아시아태평양코퍼스연구
    • /
    • 제2권2호
    • /
    • pp.43-48
    • /
    • 2021
  • The aim of this study is to analyze the trends of corpus driven research in Korean education. For this purpose, a total of 14 papers was searched online with the keywords including Korean corpus and Korean education. The data was categorized into three: vocabulary education, grammar education and corpus data construction methods. The analysis results suggest that the number of corpus studies in the field of Korean education is not large enough but continues to increase, especially in the research on data construction tools. This suggests there is a significant demand in corpus driven studies in Korean education field.

A Corpus-Based Study on Korean EFL Learners' Use of English Logical Connectors

  • Ha, Myung-Jeong
    • International Journal of Contents
    • /
    • 제10권4호
    • /
    • pp.48-52
    • /
    • 2014
  • The purpose of this study was to examine 30 logical connectors in the essay writing of Korean university students for comparison with the use in similar types of native English writing. The main questions addressed were as follows: Do Korean EFL students tend to over- or underuse logical connectors? What types of connectors differentiate Korean learners from native use? To answer these questions, EFL learner data were compared with data from native speakers using computerized corpora and linguistic software tools to speed up the initial stage of the linguistic analysis. The analysis revealed that Korean EFL learners tend to overuse logical connectors in the initial position of the sentence, and that they tend to overuse additive connectors such as 'moreover', 'besides', and 'furthermore', whereas they underuse contrastive connectors such as 'yet' and 'instead'. On the basis of the results of this study, some pedagogical implications are made concerning the need for teaching of the semantic, stylistic, and syntactic behavior of logical connectors.

PPEditor: 한국어 의존구조 부착을 위한 반자동 말뭉치 구축 도구 (PPEditor: Semi-Automatic Annotation Tool for Korean Dependency Structure)

  • 김재훈;박은진
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.63-70
    • /
    • 2006
  • 말뭉치(corpus)는 많은 언어 정보를 포함하고 있으며, 언어처리 및 계산언어학 분야에서 다양한 용도로 사용되고 있다. 그러나 말뭉치에 언어 정보를 부착하는 데는 많은 시간과 인력이 소요된다. 이 문제를 완화시키기 위해서 말뭉치 구축 도구가 반드시 요구된다. 본 논문에서는 한국어 의존구조 부착을 위한 말뭉치 구축 도구의 설계 및 구현에 관해서 기술한다. 가장 이상적인 방법은 주석자가 전혀 개입하지 않고, 말뭉치를 구축하는 것이나 이것은 사실상 불가능하다. 따라서 대부분의 말뭉치 구축 도구는 반자동으로 구성되어 있으며, 본 논문에서 제안된 도구도 반자동이다. 제안된 도구는 언어 분석기의 분석 결과에 내포된 오류를 효과적으로 수정할 수 있고, 또한 가능한 한 반복적인 작업을 피할 수 있으며 쉽게 사용할 수 있도록 인터페이스를 설계하였다. 제안된 시스템을 이용해서 20어절 이상의 1만 문장에 의존구조를 부착해 보았다. 잘 훈련된 8명의 주석자들이 매일 4시간씩 2개월 동안 구축하였으며, 그 결과는 정확하고 일관성 있는 말뭉치를 구축할 수 있었으며, 작업 시간과 인력도 크게 줄일 수 있었다.

북한 제1중학교 영어교과서 분석 (Analysis of the English Textbooks in North Korean First Middle School)

  • 황서연;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.242-251
    • /
    • 2017
  • 본 연구는 북한의 수재양성 기관인 제1중학교의 영어교과서를 코퍼스로 구축한 후, 이를 분석하여 언어적 특징을 파악한 연구이다. 그동안 북한의 일반중학교의 영어교과서의 특징들을 파악한 연구는 많았지만, 북한의 수재교육기관인 제1중학교 영어교과서에 대한 연구는 부족했다. 이를 위하여 북한자료센터에서 입수한 제1중학교 1학년, 2학년, 4학년, 6학년 영어 교과서 구성 체계를 살펴보고, 코퍼스를 구축한 후, 워드스미스 툴스 7.0을 활용하여 제1중학교 영어 교과서의 언어적인 특징과 고빈도 내용어를 분석하였다. 기본적인 통계 정보를 살펴본 결과, 학년의 위계에 따라 어휘 수가 증가하지는 않았으나 어휘다양성은 고학년으로 갈수록 순차적으로 높아지는 경향성이 발견되었다. 한편 학년별 고빈도 내용어의 분포를 살펴본 결과, 각 학년별 교과서에 수록된 지문의 주제에 따라 학년별로 큰 차이를 보였다.

Wallerian Degeneration of Insufficiently Affected White Matters in Old Infarction: Tract of Interest Analysis of Diffusion Tensor Imaging

  • Choi, Chi-Hoon;Lee, Jong-Min;Koo, Bang-Bon;Park, Jun-Sung;Kwon, Jun-Soo;Kim, Sun-I.
    • 대한의용생체공학회:의공학회지
    • /
    • 제28권3호
    • /
    • pp.317-324
    • /
    • 2007
  • The application of diffusion tensor imaging (DTI) and fiber tractography to Wallerian degeneration (WD) is important because this technique is a very potent tools for quantitatively evaluating fiber tracts in vivo brain. We analyzed a case and control using tracts of interest (TOI) analysis to quantify WD. We scanned a case of old infarction and an age-matched healthy volunteer. T1 magnetization prepared rapid acquisition gradient echo (MPRAGE), fluid attenuated inversion recovery (FLAIR) and 12-direction diffusion tensor imaging (DTI) were obtained and analyzed using TOI analysis. The value of mean diffusity ($D_{av}$) and fracional anisotrophy (FA) were analyzed statistically by MWU test. A p-value of less than 0.05 was considered to indicate statistical significance. A comparison of the global fiber diffusion characteristics shows WD of both the corpus callosum and the ipsilateral superior longitudinal fasciculus. The corpus callosum in particular showed trans-hemispherical degeneration. Local fiber characteristics along the geodesic paths show WD in the corpus callosum, ipsilateral superior longitudinal fasciculus, ipsilateral corticospinal tract, and ipsilateral corticothalamic tract. We have demonstrated changes in $D_{av}$ and FA values and a clear correspondence with the WD in various tracts. TOI analysis successfully revealed radial WD in white matter tracts from a region of encephalomalacia and primary gliosis, although they were only slightly affected.

빅데이터 분석 방법론을 활용한 지방자치단체 단위과제 운영 지원도구 개발 연구 (Research on Development of Support Tools for Local Government Business Transaction Operation Using Big Data Analysis Methodology)

  • 김다빈;이은정;류한조
    • 기록학연구
    • /
    • 제70호
    • /
    • pp.85-117
    • /
    • 2021
  • 이 연구의 목적은 지방자치단체에서 사용하고 있는 단위과제 현황, 단위과제 운영 및 기록관리 관점의 문제점을 조사 및 분석하여 그 과정에서 도출된 시사점들을 기반으로 텍스트 기반 빅데이터 기술을 활용하여 문제점에 대한 개선방안을 제시하는 것이다. 지방자치단체는 단위과제의 오분류로 인한 보존기간 책정 오류, 과공통사무와 기관공통사무의 유형식별 불가, 단위과제의 과대·과소·중복생성의 오류, 단위과제 명칭의 오류, 참고 가능한 표준의 부재, 통제 가능한 시스템 또는 도구의 부재 등으로 인해 기록관리 운영상 심각한 상태에 놓여 있다. 그러나 단위과제의 수가 약 72만개로 지나치게 많은 수량 때문에 효과적으로 통제할 수 없는 실정이며, 따라서 엄밀하고 통제할 수 있는 도구 및 표준이 필요하다. 본 연구에서는 이와 같은 문제점을 해결하기 위하여 빅데이터 분석 기술 중 텍스트기반 분석 도구인 코퍼스와 토큰화 기술을 적용한 시스템을 개발하고, 이를 기록관리기준표를 구성하고 있는 명칭 및 구성용어에 적용하였다. 이러한 단위과제 운영 지원도구는 통일성 있는 보존 기간 책정, 위임사무 기록물 식별, 중복·유사단위과제 생성 통제, 공통 과제의 표준적인 운영 등을 지원할 수 있는 도구가 될 수 있어 기록관리 업무에 상당한 기여를 할 수 있을 것으로 예상된다. 따라서 향후 빅데이터 분석 방법론을 활용한 지원도구가 BRM 및 RMS 등과 연계할 수 있다면 기록관리기준표 관리 업무의 품질이 높아질 수 있을 것으로 보인다.

북한 영어 교과서 어휘의 통시적 분석 (A Diachronic Lexical Analysis of the North Korean English Textbooks)

  • 김지영;이제영;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제17권4호
    • /
    • pp.331-341
    • /
    • 2017
  • 본 연구는 북한의 영어 교과서에 나타난 어휘의 시대적인 변화를 파악하기 위해 통시적인 관점에서 코퍼스 기반 어휘 분석을 실시하였다. 이를 위해 통일부의 북한자료센터에 소장되어 있는 북한의 중등학교 영어 교과서 중 1996년 교육과정이 적용된 시기를 기준으로 김정일 시대 이전과 이후의 교과서를 구분지어 코퍼스를 구축한 후, 워드스미스 툴스 7.0을 통해 해당 코퍼스를 분석하여 각 교과서들의 어휘 변화 양상을 살펴보았다. 연구 결과 해당 교과서들의 어휘 규모는 개편 후의 교과서가 개편 전에 비해 증가했지만, 어휘 유형과 어휘 다양성은 감소하였다. 교육과정 개편 이전에 비해 개편 이후의 교과서에서 더 자주 등장하는 핵심어(keyword)를 분석한 결과 김정일 체제를 확고히 하기 위한 관련 이념 어휘와 북한의 경제 및 생활상을 반영하는 어휘들이 나타남을 확인할 수 있었다. 또한 다빈도 어휘 100개 목록과 핵심어를 비교한 결과 북한의 영어 교과서의 어휘가 문법과 문어체 위주의 텍스트에서 조금씩 실질적인 의사소통과 관련된 구어체 내용이 증가하고 있었다.

CosmoScriBe 2.0: 한국어 전사 도구의 개발 (CosmoScriBe 2.0 : The development of Korean transcription tools)

  • 곽선동;장문수
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.323-329
    • /
    • 2014
  • 구어 연구에서는 음성 데이터를 문자로 옮기는 전사(Transcription)라는 과정이 필요하다. 전사 작업을 보조하는 프로그램을 전사도구라고 하는데, 발화 내용을 비롯하여, 발화 시간, 화자 정보 등의 많은 정보를 기록하는 다양한 기능을 제공한다. 이로 인하여 컴퓨터 사용에 익숙하지 않은 사용자는 숙지하는데 어려움이 있다. 또한 전사 도구는 국내에서 개발된 것이 거의 없어서 한국어 환경에 적합하지 않는 경우가 많다. 본 논문에서는 효율적인 한국어 전사를 지원하면서 비숙련자도 도구를 쉽고 빠르게 적응할 수 있는 전사 도구를 제안한다. 이를 위해 비숙련자를 위한 사용자 친화적인 인터페이스 환경을 제공한다. 또한 전사 과정에서 발생할 수 있는 실수를 최소화하기 위해 전사 지원 기능을 제공한다. 마지막으로 데이터 신뢰성을 위한 시스템 구조를 제공한다. 제안하는 도구에 대해 전사 경험의 유무에 따라 사용성 평가를 하였으며, 평가결과는 전체적으로 전사 속도 향상 및 전사 지원 기능이 편리한 것으로 나타났다.

초등영어교육 연구 논문의 변천: 코퍼스 기반 분석 (A Corpus-based Analysis on Primary English Education Research for the Past 20 Years)

  • 최원경
    • 한국콘텐츠학회논문지
    • /
    • 제19권2호
    • /
    • pp.11-21
    • /
    • 2019
  • 우리나라의 공립 초등학교의 정규교육과정에서 '영어' 과목을 가르치기 시작한 것은 1997년으로 이제 20년 정도의 시간이 지났다. 본 연구는 과거 20년 동안에 초등 영어 관련 연구들을 되짚어봄으로써, 향후 초등영어 교육이 나아갈 방향을 탐색하려 한다. 이를 위하여, 국내에 발표된 석 박사 학위논문과 학술지게재 논문을 검색하여(총 6,467편), 이들 연구의 '제목'을 코퍼스 분석 프로그램인 Utagger와 WordSmith Tools를 통해 빈도 분석하였다. 분석 결과, 지난 20년 동안 '초등 영어' 논문편수는 꾸준히 성장하는 추세를 보였지만, 최근에는 다소 침체된 것으로 보인다. 연구 주제로는 교수 학습 관련 영역을 포함하여 교육과정, 평가, 의사소통 기능 등과 같이 20년간 꾸준히 수행된 분야가 있는가 하면, 당시 교육정책의 기조에 따라 몰입, 원어민 등과 같이 특정 기간에 집중적으로 연구된 분야도 있었다. 최근에는 정보통신기술의 발달에 따라 스마트 교육, ICT 관련 연구가 많이 진행되는 것으로 보인다. 결론적으로, 지난 20년 동안 초등 영어 교육 분야는 양적 측면에서 괄목할 만한 성장을 했고 연구의 스펙트럼도 다양해졌다는 성과를 보였다. 본 연구의 결과가 향후 초등 영어 교육의 방향을 설정하는데 도움이 되길 기대한다.