• 제목/요약/키워드: 세종계획

검색결과 179건 처리시간 0.026초

Universal POS 태그셋의 한국어 적용 (Universal POS Tagset for Korean)

  • 박혜진;오태환;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.417-421
    • /
    • 2018
  • The Universal Dependencies 프로젝트는 현재 71개 언어, 122개 Treebank로 이루어져 있으며, 병렬 언어 처리를 위해 여러 언어에 적용할 수 있는 형태적, 구문론적 특성을 찾는 것을 목표로 한다. 본고는 UD의 형태 태그셋인 Universal POS를 살펴보고, 한국어의 기존 형태 태그셋을 UPOS로 자동 변환하여 적용하는 방안을 제안한다. 영어와 같은 굴절어를 중심으로 구축된 UPOS 체계를 교착어에 속하는 한국어에 적용하기 위해서는 UPOS의 개별 표지와 21세기 세종계획 형태 주석 표지 결합체 간의 일대다 사상을 시도해야 한다.

  • PDF

한민족언어정보화 사업의 성과 (The result of hanminjokeoneojeongbohwa project)

  • 이태영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.332-339
    • /
    • 2007
  • 이 논문은 21세기 세종계획 중 1998년부터 2007년까지 한민족언어정보화 분과 사업의 성과와 그 활용을 제시한 것이다. 이 사업에서는 국어 어문규정 검색 프로그램, 남북한 언어 비교사전, 한국 방언 검색 프로그램, 국어의 어휘 역사 검색 프로그램, 문학작품에 나타난 방언 검색 프로그램, 한국 전통문화 어휘 검색 프로그램, 남북한 정서법 변환 프로그램 등을 만들어 활용하였다. 국어 어휘와 관련된 정보화 작업을 시행하여, 국어를 다양하게 정보화하는 인력을 양성하고, 국어 어휘의 종합적 연구와 국어 발전에 크게 기여하였고, 국민들이 어문규정을 손쉽게 검색하여 국어생활에 큰 도움이 되도록 하였다. 특히 남북한 어휘 연구를 통하여 언어 통일 문제를 다루었고, 국어의 역사적 연구, 각 지역 방언 및 문학작품에 나타난 방언의 연구 및 이해에 큰 도움이 되도록 하였다.

  • PDF

구문 분석 말뭉치 구축을 위한 분석의 원칙, 방법, 문제 (Principles, methods, and some problems in compiling a Korean treebank)

  • 김의수;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-162
    • /
    • 2002
  • 본고는 21세기 세종계획의 일환으로 현재 구축 중인 구문 분석 말뭉치의 분석 방안에 대한 연구이다 논의하고자 하는 내용은 첫째, 구문 분석에서의 기본 원칙과 표지의 종류 및 세부 원칙에 대한 것이다. 둘째, 이러한 구문 분석 방안을 마련하는 데 있어 심각하게 고려된 몇 가지 유형의 문제들에 관한 논의이다. 특히 이 문제들은 자연언어처리에서뿐만 아니라 이론적인 국어학의 연구에서도 매우 중요하다. 화자의 직관에 의해서라기보다는 실제 말뭉치 구축 작업을 통해서 그 실체가 확연하게 드러나는 문제들이라는 점에서 이들은 우리의 관심을 끌기에 충분하다. 본고에서는 이러한 문제들이 실제 구문 분석에서 어떻게 발생하고 어떻게 해결될 수 있는지를 보일 것이다.

  • PDF

신문 기사의 코퍼스 언어학적 분석 (Corpus-Linguistical Analysis of Newspaper Articles)

  • 송경화;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-14
    • /
    • 2006
  • 본 연구에서는 신문 기사에 대한 실증적 언어 분석을 목적으로 하여, <21세기 세종계획>에 의해 구축된 대용량의 신문 기사 말뭉치를 다양한 각도로 계량화하여 분석한다. 신문 기사를 표제, 전문, 본문의 구성으로 나누고 각 구성의 특징에 따라 형태 분석 말뭉치, 형태의미 분석 말뭉치, 구문 분석 말뭉치를 이용하여 분석한다. 본 연구는 대량의 신문 기사 말뭉치를 이용한 계량적 방법이라는데 의의가 있다 이러한 연구 방법을 통하여 기존의 직관을 이용한 연구 방법들과 차별화 된 실증적 연구로서 신문 이론을 검증하고, 신문 기사의 새로운 언어 현상을 발견할 수 있을 것이다.

  • PDF

한국어 PropBank 프레임 파일 확장 도구 설계 (A Design of Frame File Extension Tool for Korean PropBank)

  • 이정국;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.126-129
    • /
    • 2011
  • 본 논문에서는 한국어 PropBank의 구축을 위한 동사의 프레임 파일 확장 및 구축에 대한 연구를 논한다. 문장 단위의 의미 분석에 있어서 가장 중요하다고 볼 수 있는 의미 역 결정을 위해서 필요한 언어자원중, PropBank는 동사의 술어-논항 구조를 태그해 놓은 말뭉치로써 가장 널리 쓰이는 언어자원 중 하나이다. PropBank는 크게 술어-논항 구조를 태그한 말뭉치와 개별 동사들의 논항 구조를 기술한 프레임 파일로 이루어져 있다. 한국어 PropBank 구축을 위해서는 구문 표지 부착 말뭉치에 술어-논항 구조의 표지 부착 작업 및 한국어 동사의 프레임 파일의 구축 및 확장이 이루어져야 하는데, 본 논문에서는 세종 계획에서 발표한 용언 격틀 파일을 사용하여 기존의 한국어 PropBank 프레임 파일을 확장하는 도구를 설계하였다.

  • PDF

품사별 자질을 이용한 한국어 품사부착의 성능 향상 (Improving Korean Part-of-speech tagging by Part-of-Speech specific features)

  • 최원종;이도길;임해창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.16-18
    • /
    • 2006
  • 한국어 형태소분석 및 품사부착에서 일부 품사는 높은 중의성으로 인하여 오류가 많으며, 일부 품사가 전체 오류의 대부분을 차지한다. 본 연구에서는 높은 중의성으로 인하여 오류가 많은 품사를 대상으로, 각 품사에 적합한 자질을 이용하여 학습한, 정확률이 높은 분류기를 통계적 방식의 태거와 순차 결합하여 형태소분석/품사부착 성능을 향상하였다. 2003년 세종계획 품사 부착 말뭉치 200만 어절에서 학습하여 평가를 한 결과 기존 통계적 품사 부착기에 비해 정확도는 0.62% 향상되었으며, 오류는 13.12% 감소하였다.

  • PDF

형용사만을 사용한 의견어 사전의 한계점 분석 (Analysis of limitations using only adjectives sentiment word dictionary)

  • 유원희;지혜성;양영욱;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.373-375
    • /
    • 2011
  • 최근 많은 연구가 되고 있는 오피니언 마이닝은 의견어 사전의 구축이 가장 기본적으로 선행되어야 하는 연구이다. 오피니언 마이닝의 의견어 사전 구축 연구는 영어를 중심으로 많은 연구가 진행 되었다. 하지만 형용사 위주의 의견어 사전 구축으로 많은 부분의 문제들이 해결되는 영어에 비해서 한국어는 여러 가지 품사와 문장구조를 고려하여 의견어 사전을 구축해야한다. 이것을 실험으로 밝히기 위하여 형용사로만 구성되어진 의견어 사전을 구축하고 영화평에 적용하여 분석해 봄으로써 형용사로만 구성되어진 의견어 사전의 한계점을 확인한다. 실험은 세종계획 말뭉치에서 나타나는 형용사로 구성된 의견어 사전을 구축하고 네이버 랩에서 제공하는 영화평을 형용사로 구성된 의견어 사전으로 의견 분석하여 시행하였다. 분석 결과 재현율 약 50%, 정확률 약 60%정도의 성능을 보였다.

Activity of Young Astronomers Meeting in 2020 Season

  • 이가인;백인수;강지수;김이곤;이용희;임효빈;정미지;최보은;최우락
    • 천문학회보
    • /
    • 제45권1호
    • /
    • pp.56.2-57
    • /
    • 2020
  • 2019년 10월, 젊은 천문학자 모임(Young Astronomers Meeting, 이하 YAM)은 가을 정기총회를 가졌으며, 2020년 임원진으로 회장 서울대학교 이가인, 부회장 서울대학교 백인수 회원이 선출되었다. 운영위원으로는 서울대학교 강지수, 경북대학교 김이곤, 경희대학교 이용희, UST 임효빈, 충남대학교 정미지, 세종대학교 최보은, 연세대학교 최우락 회원이 임명되었다. 매년 진행되어 오던 YAM 워크샵이 지난 2월 27일에 1박 2일동안 한국천문연구원에서 개최될 예정이었으나, 코로나19 사태로 인해 무기한 연기되었고 이밖의 많은 활동들에도 제약이 따랐다. 현재 YAM은 본 모임의 온라인 소식지인 <하늘사랑> 제 9호 발간 및 온라인 모임을 준비함으로써 직접 만나기 어려운 회원들의 소식을 공유하고자 한다. 본 포스터에서는 2020년 상반기 활동을 보고하고 하반기 활동 계획에 대해 논의하고자 한다.

  • PDF

기계학습 기법을 이용한 문장경계인식 (Sentence Boundary Detection Using Machine Learning Techniques)

  • 박수혁;임해창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.69-72
    • /
    • 2008
  • 본 논문은 언어의 통계적 특징을 이용하여 범용의 문장경계 인식기를 제안한다. 제안하는 방법은 대량의 코퍼스 내에서 사용되고 있는 문장 경계를 기준으로 음절 및 어절 등의 자질을 이용하여 통계적 특징을 추출하고 다양한 기계학습 기법을 사용하여 문장경계를 인식하고자 하였다. 또한 특정 언어나 도메인에 제한적이지 않고 범용적인 자질만을 사용하려고 노력하였다. 언어의 특성상 문장의 구분이 애매한 경우 또는 잘못 사용 된 구두점 등의 경우에도 적용 가능하도록 다양한 자질을 사용하여 실험하였으며, 한국어와 영문 코퍼스에 대해서 동일한 자질을 적용하여 실험하여 본 논문에서 제시한 자질들이 한국어 및 다른 언어권의 언어에도 적용될 수 있는 범용적인 자질임을 확인할 수 있었다. 한국어 문장경계 인식을 위한 기계학습 및 실험을 위해서 세종계획 코퍼스를 사용하였으며, 성능척도로는 정확률과 재현율을 사용하였으며, 실험결과 제안한 방법으로 99%의 정확률과 99.2%의 재현율을 보였다. 영문의 경우는 Wall Street Journal 코퍼스를 사용하였으며, 동일한 자질을 적용하여 실험한 결과 98.9%의 정확률과 94.6%의 재현율을 보였다.

초등학교 배치특성을 고려한 사이공간 계획방향에 관한 연구 -세종시 신설초등학교를 중심으로- (A Study on the Planning of In-Between Space Considering the Site Planning Characteristics of Elementary Schools -Focused on Newly-Built Elementary Schools in Sejong City-)

  • 송병하
    • 한국산학기술학회논문지
    • /
    • 제19권2호
    • /
    • pp.105-116
    • /
    • 2018
  • 본 연구는 세종시 신설초등학교의 배치계획에 따른 사이공간 현황과 계획방향에 관한 사례연구로 24개 학교의 사이공간 유형을 분류하고 5개 학교를 대상으로 구성현황과 이용빈도를 비교분석하였다. 주요 결과로 첫째, 사이공간 내부의 구성이 학습기능보다 놀이, 휴식의 기능에 이용빈도가 높은 것으로 분석되어 다양한 놀이기구 및 휴게공간의 계획이 우선되어야 하는 것으로 판단된다. 둘째, 사이공간에 계획된 필로티 공간은 높은 이용빈도를 보이는 반면 그에 접해 있는 사이공간의 이용빈도가 낮아 필로티 공간에서의 활동을 사이공간으로 확대할 수 있는 계획적 접근이 필요한 것으로 나타났다. 셋째, 사이공간을 통과동선으로 이용하는 경우(E2, E3)는 놀이, 휴게공간과 영역을 구분하여 사이공간의 기능적 독립성을 확보해야 하는 것으로 나타냈으며 넷째, 사이공간의 과도한 조경면적이 이용빈도를 낮추는 요인으로 작용하고 있어 활동영역을 충분히 확보한 후에 조경영역을 계획하는 접근이 필요하다. 다섯째 사이공간으로의 다양한 진입동선을 확보해야하는 것으로 주진입로에서 단절된 배치의 경우 사이공간을 둘러싼 교사동 각 부분에서 부출입구를 계획해 접근성을 최대한 확보해야 이용빈도를 높일 수 있는 것으로 분석되었다.