• 제목/요약/키워드: 21st century sejong project

검색결과 4건 처리시간 0.018초

21세기 세종 계획 특수자료 구축 분과의 성과 (1998~2007) (The $21^{st}$ Century Sejong Project Special Corpus Construction (1998~2007))

  • 서상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.317-322
    • /
    • 2007
  • 이 발표는, <21세기 세종 계획>(문화관광부/국립국어원의 지원, 1998~2007)의 일환으로 이루어진, 특수자료 구축 분과의 지난 10년간의 성과를 소개하고자 하는 데에 목적이 있다. 특수자료 구축 분과에서는 구어, 병렬, 역사 자료, 북한 및 해외 말뭉치와 같은 특수 말뭉치의 구축을 담당하고 있다. 여기서는 특수자료 구축 소분과의 개요와 과제의 구성, 각 세부 과제별 말뭉치 구축 성과 및 각 말뭉치의 가치와 특성을 밝히고자 한다.

  • PDF

말뭉치 구축·활용의 흐름과 현재의 동향 - 일본의 사례를 중심으로 - (A Study of the Research Direction and Trend in the Use of Corpus - Focusing on the Case of Japan -)

  • 윤영민
    • 언어사실과 관점
    • /
    • 제45권
    • /
    • pp.35-59
    • /
    • 2018
  • In this paper, as a proposal to an effective corpus construction and utilization scheme, there is a purpose to explore the present situation of Japanese corpus construction, concrete content and current trend. In Japan, dependence on google is remarkable, there has been a steady effort to develop high-quality corpus and development tool. On the other hand, the Japanese corpus should clearly grasp the location and information from those created by individual researchers to their own purpose to those created mainly by universities, research institutes, national policy institutions, etc. It is difficult. In this survey, it was possible to distinguish by "media corpus", "literary·magazine·web and balanced corpus", "spoken language corpus", "learner corpus", "historical material corpus" etc. by field and type. In addition, there were not many tools developed for corpus efficient use and secondary processing such as "example search", "morphological analysis", "machine translation", etc. for tool corpus only. The current trend in Japanese corpus construction spurred preparations for Seed data which can be utilized in linguistic research and various fields of the fourth industry, including national policy and research institutes such as NINJAL, JPO, NICT, ALAGIN and companies such as RAKUTEN ing.

바이오데이터베이스와 도구를 활용한 바이오인포매틱스의 동향 (Current Status of Bioinformatics on Bio-databases and it Tools)

  • 임달혁;전수경;박완규;이영주
    • Journal of Pharmaceutical Investigation
    • /
    • 제34권1호
    • /
    • pp.73-79
    • /
    • 2004
  • The union of information-technology and biology presents great possibilities to both applications of bio-information and development of science and technology. Also, meaningful analysis of bio-information brings about a new innovation in the field of bio-market with the advent and growth of bioinformatics. Hence, bioinformatics is the most import aspect for establishing a science-technology-oriented society in the $21^{st}$ century. This article provides trends in current state of bioinformatics. Technological development of bioinformatics for the rapid growth of bio-industry means that using bioinformatics, a biologist can process and store enormous amount of data such as current Human Genome Project and future data in the field of biology. We have manly looked at the tends of bio-information, databases and mining tools that are generally used, and strategies and directions for the future.

신문 기사의 언어 사용 양상: 코퍼스언어학적 접근 (Aspects of Language Use in Newspaper Articles: A Corpus Linguistic Perspective)

  • 송경화;강범모
    • 인지과학
    • /
    • 제17권4호
    • /
    • pp.255-269
    • /
    • 2006
  • 본 연구는 신문 기사에 대한 실증적 언어 분석을 목적으로 한다. <21세기 세종계획>에 의해 구축된 대용량의 신문 기사 말뭉치를 형태, 어절, 절, 문장 등의 단위로 계량화하여 분석하였다. 신문 기사를 표제, 전문, 본문의 세 구성 성분으로 나누고 표제의 표시성과 압축성의 실현 양상, 전문과 표제의 연관성, 본문의 문장 구조와 일반명사 구성 비율 등을 살펴보았다. 이 연구를 통하여 기존의 비계량적 연구 방법들과 차별화 된 실증적 연구로서 신문 이론을 검증하고, 신문 기사의 새로운 언어 현상을 발견할 수 있었다. 신문 기사와 같은 텍스트는 인간의 인지적 언어 처리의 결과이며 동시에 인지적 언어 형성에 영향을 미칠 것이다.

  • PDF