• 제목/요약/키워드: 선어말어미 처리

검색결과 9건 처리시간 0.019초

형태소 분석 및 합성을 위한 선어말어미 처리 모형 연구 (The Study on a Processing Model of Prefinal Endings for Analysis and Composition of Morphemes)

  • 안성민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.53-58
    • /
    • 2015
  • 본 연구는 한국어 정보처리를 위한 형태소 연구 중 선어말어미 분석과 합성을 위한 처리 모형을 제안한다. 이를 위해 (1) 어미를 정의하고 선정한 뒤 (2) 낱말 패러다임 형태 이론에 기반하여 동사 어간을 그 특징에 따라 적절하게 분류한다. (3) 또한 형태소 결합을 위해 필요한 조작들을 기술하고 (4) 마지막으로 어미의 결합 순서와 결합 제약을 만족시킬 규칙을 만들어 제시함으로써 각 조작과 규칙을 이용하여 기계 분석을 하기 위한 프로그램 모형을 내놓는다.

  • PDF

한국어-프랑스어 자동번역을 위한 과거시제 선어말어미 '-었'의 처리방안 (Past Tense Generation in Korean to French Machine Translation)

  • 임승희;노란;홍문표
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.173-174
    • /
    • 2014
  • 본 연구는 현재 개발 진행 중인 다국어 자동통번역시스템에서 발생하는 한국어 과거시제 선어말어미 '-었'의 생성문제를 다루었다. 한국어 과거시제 선어말 어미는 영어와 독일어의 경우에는 대부분 단순과거형으로 생성될 수 있으나, 프랑스어의 경우에는 복합과거의 형식과 반과거의 형식 중 하나를 선택해야 하는 문제가 발생한다. 본 연구에서는 이러한 문제의 해결을 위해 한-프랑스어 코퍼스 분석을 통해 복합과거와 반과거의 올바른 생성을 위한 네 가지의 자질을 선정하였고, 이에 SVM 알고리즘을 적용한 분류기를 구현하였다. 현재까지의 실험결과는 84.45%의 정확률이며 현재 성능개선을 위한 연구가 계속 진행 중이다.

  • PDF

한영 기계번역 시스템을 위한 효율적인 한국어 용언 처리 (Efficient Korean Predicates Processing for Korean-English Machine Translation System)

  • 박홍원;정경진;네기시 켄이치로;임유정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.288-293
    • /
    • 2001
  • 한영 기계번역 시스템을 구현하기 위해서는 다양하게 활용하는 한국어 용언을 보다 효율적으로 처리해야 할 필요가 있다. 한국어 용언은 그 활용이 매우 다양하여 활용에 따라 문장 내에서 다양하게 기능하게 된다. 한영 기계번역 시스템에서는 용언의 활용이 가지는 여러 정보를 효율적으로 분석하여 해당정보를 보다 효과적으로 역문에 반영시키는 연구가 필요하다. 본 논문에서는 용언의 활용에 따른 여러 정보-시제에 관한 정보(선어말어미 관련), 문종에 관한 정보(어말어미 관련), 양상에 관한 정보(보조용언, 어말어미 관련) 등-를 통일된 코드를 이용하여 일괄적으로 처리하는 방법론과 그 과정을 제시한다.

  • PDF

한국어 기능범주의 정보처리 (The Structure and Processing of the Korean functional category)

  • 황유미;문영선;박혜성;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.273-278
    • /
    • 2000
  • 본 연구는 한국어 기능 범주(functional category)의 처리를 살펴보기 위하여 실문법증 환자를 대상으로 실시되었다. 일반적으로 수형도에서 기능 범주는 보문소구(Complementizer Phrase), 시제구(Tenxe Phrase), 일치소구(Agreement Phrase)의 순으로 구성되어 있다. 본 실험은 Grodzinsky(1997)의 수형도 가지치기 가설과 실문법증의 엄밀성 척도를 바탕으로 한국어 기능 범주의 처리에 있어서도 두 가지 가설의 적용이 타당한지 여부를 검증하기 위해 실시되었다. 실험 1은 일치소(Agr)의 처리를 살펴보기 위하여 실시되었는데, 국어의 존칭 선어말 어미를 중심으로 살펴보았다. 국어의 존칭선어말 어미는 크게 '-시-'삽입에 의한 존칭과 다른 어휘로 대체하는 보충법에 의한 존칭으로 구분된다. '-시-'삽입에 의한 존칭은 AgrP의 범주로 보충법에 의한 존칭은 동사구(Verb Phrase)의 범주로 설정하여 문법에 어려움을 보이는 실문법증의 경우 어휘부에 혹하는 보충법에 의한 존칭을 문법범주에 속하는 '-시-'삽입의 존칭보다 더 잘 할 것으로 가정하였다. 실험 2는 AgrP의 범주인 '-시-'선택의 장애가 TPqja주인 시제 선택에 역시 영향을 미칠 것이라는 가정아래 설계되었다. 수형도 상에서 '-시-'는 일치소(Agr)로서 시제(TP)의 아래에 위치하므로 실험 3은 '-시-'삽입 존칭과 시제에서 어려움이 보문소(CP)의 선택에 역시 영향을 미칠 것이라는 가정하에서 실시되었다. 실험 1의 결과 '-시-'삽입에 의한 존칭을 처리하는데 보충법에 의한 존칭보다 어려움을 보였다. 실험 2의 결과 '-시-'삽입 존칭에 어려움을 보인 환자는 시제 선어말 어미를 선택하는데도 어려움을 보임이 확인되었다. 실험 3 역시 실험 1과 실험2에서와 동일하게 처리의 어려움을 보였다. 이러한 실험 결과들은 국어의 존칭과 시제 선어말 어미가 통사부에서 구(XP)와 결합하여 새로운 구를 형성하는 통사적 접사로 해석할 수 있으며 Grodzinsky의 가설을 지지하는 결과를 보여 줌으로서 국어에서도 AgrP, TP, CP 사이의 통사적 위계가 있음을 뒷받침하는 증거가 된다.

  • PDF

한국어 용언의 형태소 정보처리 특성 (III): 피동 정보처리 (A model of Korean morphological passive processing)

  • 황유미;권유안;임희석;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.137-141
    • /
    • 2002
  • 한국어 용언의 형태소 정보처리의 특성을 규명하기 위해 피동의 처리 양상을 살펴보았다. 한국어의 피동문은 용언에 파생접사가 붙어 이루어지는 경우와 '-어 지다'와 같이 구문 변형에 의해 이루어지는 경우로 나눌 수 있다. 본 연구에서는 이 중 피동 파생접사 '-이, -히, -리, -기'가 붙은 피동사만을 선정하여 고려대학교에 재학중인 일반인 학생을 대상으로 점화어휘판단 관제를 실시하였다. 실험조건은 표면적 형태와 기능으로 구분하여 4조건으로 설계하였고 SOA는 150msec과 750msec로 나누었다. 실험 결과 피동('어근+파생접사')의 정보처리는 선행연구의 '어간+(시제)선어말어미'의 결과와 유사한 형태를 보였으며, '어간+(연결)어말어미'와는 다른 결과를 보였다. 이런 결과로 미루어보아 어근과 접사는 각각 따로 저장되어 있다기보다는 '어근+접사'의 형태로 심성어휘집에 저장되어 있는 것으로 보인다. 기존의 형태소 분석에서 거론되고 있는 Fullist, Decomposition, Hybrid의 세 가지 모형으로는 한국어 용언의 다양한 표상 및 처리 과정을 설명하기 어려우므로 새로운 모형을 제시하고자 한다.

  • PDF

SNS에서의 문장 분석을 통한 친밀도 분별 (Closeness Discrimination through Sentence Analysis in SNS)

  • 고용석;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.219-223
    • /
    • 2012
  • 인간관계 유지와 새로운 관계 형성을 지원하는 다양한 소셜 네트워크가 각광을 받으면서 사용자간 친밀도 분석에 대한 연구가 활발히 진행되고 있다. SNS에서 구성되는 사용자 개인 정보와 컨텐츠 공유 및 기타 활동에 대한 정보는 사용자의 특징을 파악할 수 있는 유용한 정보가 된다. 이러한 정보는 추천과 같은 여러 가지 서비스에서 사용될 수 있으며, 특히 사용자간 친밀도 분석을 통한 친구 추천에서 유용하게 사용된다. 기존 친밀도 분석 연구에서는 사용자간 프로필 유사도와 메시지 교환수 같은 양적 정보를 사용해 왔다. 본 논문에서는 사용자간 대화 내용을 분석한 내용적 정보를 친밀도 분석에 반영하기 위한 방법을 제안한다. 학습 데이터를 활용하여 구축된 친밀도 분별 시스템에서는 감탄사, 종결어미, 선어말어미, 이모티콘, 문장 길이의 내용적 자질 정보의 사용으로 기존 양적 정보 사용과 유사한 수준의 친밀도 분별 성능을 얻을 수 있었으며, 양적 정보와 내용적 정보를 동시 사용한 경우 소폭의 성능 향상을 얻었다.

  • PDF

21세기 세종계획 관용표현 전자사전 구축에 대하여 (On the development of a computational lexical database of idiomatic expressions in the frmework of 21st Sejong Project)

  • 박만규;이선웅;나윤희;이광호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.334-340
    • /
    • 2001
  • 본고는 올해 처음 시도하는 세종계획 관용표현 전자사전 구축에 관한 글이다. 본 전자사전이 완성되면 관용표현의 총체적 정보(형태, 통사, 의미, 화용 정보)를 수록하는 최초의 업적이 될 뿐만 아니라 실제 언어 자료에서 흔히 볼 수 있는 관습적 표현까지 모두 포괄하는 4만 표제어의 대규모 사전이 될 것이다. 본 사전에서는 관용표현의 형태 통사적 구성과 그 분포적 속성뿐 아니라, 관용표현이 가지는 논항의 존재 유무, 구조, 조사 통합 양상, 그리고 고정명사에 대한 수식어 제약, 어휘적 통사적 변형 양상, 선어말어미 제약, 어말어미 제약, 문장 유형 제약 등이 수록된다. 또한 각 논항의 의미역과 선택제약에 관한 정보, 그 외 다양한 의미 화용 정보 어원 표기 정보 등도 담기게 된다. 본고에서는 그러한 정보의 표기 양식을 하나하나 명시적으로 설명할 것이다.

  • PDF

한국어 불규칙 용언의 형태 정보 : 실어증 환자를 중심으로 (The Processing of Irregular Verbals in Korean : Shown in Aphasics)

  • 김윤정;김수정;김희정;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.303-308
    • /
    • 2000
  • 용언은 그 어간이 여러 문법소와 결합하면서 자동적 음운 변동을 제외한 형태 변동이 있는가, 없는가에 의해 규칙 용언/불규칙 용언으로 구분할 수 있다. 이러한 불규칙 용언은 심성 어휘집에 어떤 형태로 저장되어 있으며, 규칙 용언과는 어떠한 관계가 있는지, 나아가 실어증 환자의 경우에는 정상인에 비해 어떤 행동장애를 보이며, 장애가 있다면 어느 경로의 손상으로 인한 장애인지를 알아보는 것이 본 연구의 목적이다. 이를 위해 이해성 실어증 환자 한 명과 음어적 실행증 현상을 동반한 경미한 정도의 실어증 환자를 피험자로 하였다. 실험 과제는 단어 채워 넣기 과제(word completion task)를 사용하였다. 즉 주어진 기본형 용언을 검사 문장의 문맥에 맞게 활용하여 채워 넣는 것이다. 실험 결과에 의하면 환자들은 규칙용언의 활용(예. 먹다/먹는)과 불규칙 용언 중 형태를 유지한 채로 활용하는 경우(예. 줍다/줍고)에는 거의 오류가 없었으나, 불규칙 용언이 형태 변화를 겪어야 할 경우(예. 줍다/주워)에는 대부분 오류를 보였다. 또 이때는 기본형(basic form)을 그대로 유지하는 오류 방향성을 관찰할 수 있었다. 이는 그간 문법으로 구분되어 오던 규칙 용언/불규칙 용언의 정보 처리보다는 형태 유지/형태 변화 정보 처리의 영향이 크다는 것을 알 수 있다. 특히 이해성 실어증 환자는 전체적인 오류율이 매우 높았는데, 규칙 용언의 경우에도 오류를 보였다. 이때, 용언의 어간에 해당하는 부분에는 오류가 없고, 뒤에 따르는 내용과의 관계를 파악해야 하는 문법 기능소, 즉 연결 어미에서 오류를 보여 정보의 유지, 통합에 문제가 있다는 기존의 연구와도 일치하는 결과를 나타냈다.환자는 시제 선어말 어미를 선택하는데도 어려움을 보임이 확인되었다. 실험 3 역시 실험 1과 실험2에서와 동일하게 처리의 어려움을 보였다. 이러한 실험 결과들은 국어의 존칭과 시제 선어말 어미가 통사부에서 구(XP)와 결합하여 새로운 구를 형성하는 통사적 접사로 해석할 수 있으며 Grodzinsky의 가설을 지지하는 결과를 보여 줌으로서 국어에서도 AgrP, TP, CP 사이의 통사적 위계가 있음을 뒷받침하는 증거가 된다.전처리한 Group 3에서는 IL-2와 IL-4의 수준이 유의성있게 억제되어 발현되었다 (p < 0.05). 이러한 결과를 통하여 T. denticola에서 추출된 면역억제 단백질이 Th1과 Th2의 cytokine 분비 기능을 억제하는 것으로 확인 되었으며 이 기전이 감염 근관에서 발견되는 T. denticola의 치수 및 치근단 질환에 대한 병인기전과 관련이 있는 것으로 사료된다.을 보였다. 본 실험 결과, $Depulpin^{\circledR}은{\;}Tempcanal^{\circledR}와{\;}Vitapex^{\circledR}$에 비해 높은 세포 독성을 보여주공 있으나, 좀 더 많은 임상적 검증이 필요할 것으로 사료된다.중요한 역할을 하는 것으로 추론할 수 있다.근관벽을 처리하는 것이 필요하다고 사료된다.크기에 의존하며, 또한 이러한 영향은 $(Ti_{1-x}AI_{x})N$ 피막에 존재하는 AI의 함량이 높고, 초기에 증착된 막의 업자 크기가 작을 수록 클 것으로 여겨진다. 그리고 환경의 의미의 차이에 따라 경관의 미학적 평가가 달라진 것으로 나타났다.corner$적 의도에 의한 경관구성의 일면을 확인

  • PDF

음절에 기반한 한국어 형태소 분석기 (Syllable-Based Korean Morphological Analyzer)

  • 장동수;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.331-339
    • /
    • 1993
  • 본 논문에서는 한국어의 음절 특성을 이용한 한국어 형태소 분석기를 제시하였다. 이 형태소 분석기는 품사별 음절 정보, 불규칙 음절 정보, 활용어절 음절 정보, 선어말 어미 음절 정보 등을 이용하여 음절 단위로 형태소 분석을 한다. 음절 단위의 형태소 분석 방법은 음소 단위의 방법보다 형태소 분석시에 생성될 수 있는 잘못된 중간 분석 결과를 크게 감소시켜, 사전 탐색 부담을 최소화한다. 시스템의 사전은 품사별 결합 특성과 사전 표제어의 길이별 분포 특성을 이용하여 구성하였으며, 그 규모는 약 16만 어휘이다. 이러한 사전 구성은 효율적인 사전검색을 제공하며, 특히 철자 검색기와 자동 인덱싱 등의 다양한 응용 시스템 요구를 곧바로 수용할 수 있는 유연성과 효율성을 갖고 있다.

  • PDF