• 제목/요약/키워드: 과분석

검색결과 15건 처리시간 0.02초

전문(全文) 분석을 통한 파생명사 및 합성명사의 분석 (Analysis of Derived Nouns and Compound Nouns by Examining Full Text)

  • 박봉래;황영숙;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.122-128
    • /
    • 1997
  • 대부분의 한국어 형태소 분석기는 파생명사나 합성명사가 포함된 어절을 오분석 또는 과분석하는 경향이 있다. 이는 하나의 어절에서 오분석이나 과분석을 방지하기 위하여 획득할 수 있는 정보가 제한적이기 때문이다. 이에 본 논문은 파생명사나 합성명사 후보가 포함된 어절뿐만 아니라 주변 및 전문에서 분석에 필요한 정보를 수집하여 이용하는 방법을 제시한다. 제안한 방법은 오분석된 파생명사나 합성명사에만 나타나는 저빈도 단어를 제거하고, 파생명사나 합성명사 후보의 주변 어휘들을 실마리로 이용하며, 문서 전역에서 동일한 파생명사나 합성명사 후보가 포함된 둘 이상의 어절을 비교분석하여 파생명사 및 합성명사 후보가 포함된 어절을 처리한다. 실험 결과 제안한 방법은 99.8%의 정확도와 95.3%의 재현율로 파생명사나 합성명사 후보가 포함된 어절을 올바르게 분석할 수 있었다.

  • PDF

한국어 형태소 분석을 위한 효율적 기분석 사전의 구성 방법 (Construction of an Efficient Pre-analyzed Dictionary for Korean Morphological Analysis)

  • 곽수정;김보겸;이재성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.881-888
    • /
    • 2013
  • 기분석 사전은 형태소 분석기의 속도와 정확도를 향상시키고, 과분석을 줄이기 위해 사용된다. 하지만 기분석 사전에 저장된 어절 중에 저장된 형태소 분석 결과가 부족한 어절, 즉 불충분 분석 어절이 존재할 경우 오히려 형태소 분석기의 정확도를 떨어뜨리는 원인으로 작용할 수 있다. 본 논문에서는 세종 형태 분석 말뭉치(문어체, 2011)를 이용해 말뭉치의 크기와 어절 빈도의 변화에 따라 사전의 정답 제시율이 변화하는 양상을 측정하였다. 그리고 통계기반의 형태소 분석기인 SMA와 기분석 사전을 결합한 통합 시스템을 구성하여 기분석 사전의 충분 분석률이 99.82% 이상일 때 시스템 전체 성능이 향상되는 것을 확인하였다. 또한 160만 어절의 말뭉치를 이용할 때는 32회 이상 출현한 어절로, 630만 어절로 구성된 말뭉치를 이용할 때는 64회 이상 출현한 어절로 사전을 구성하는 것이 통합 시스템의 성능을 가장 높게 할 수 있었다.

상호정보량을 이용한 동형이의어 분별용 의미정보의 정제 (Refinement of Semantic-Information for WSD Using Mutual Information)

  • 김준수;이왕우;김창환;옥철영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.460-463
    • /
    • 2002
  • 사전 뜻풀이에서 추출된 기존의 의미정보는 동형이의어가 포함된 뜻풀이에서 명사, 용언을 모두 추출하는 방법을 이용하여 단어 중의성 해소에 부적절만 정보를 상당수 포함하게 되었다. 이러만 부적절한 정보 때문에 오분석이나 과분석이 발생하게 된다. 그러므로 기존의 의미정보에서 동형이의어 분별에 유용한 정보만을 선택하는 기준이 필요하게 되었다. 본 논문에서는 사전 뜻풀이에서 동형이의어와 의미정보 사이의 상호정보량을 계산하고 임계치를 선정하여 의미정보를 선택제약하는 방법을 이용하였다. 임계치에 의해 제한된 의미정보의 효율성을 실험하기 위한 다양만 동형이의어 분별 실험들을 수행하였다.

  • PDF

어휘 및 형태 정보를 이용한 한국어 Two-level 어휘사전 자동 구축 (Automatic Construction of Korean Two-level Lexicon using Lexical and Morphological Information)

  • 김보겸;이재성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.865-872
    • /
    • 2013
  • Two-level 형태소 분석 방법은 규칙 기반 방법 중 하나로 형태소의 변화 현상을 규칙으로 처리하고, 기본 어휘 사전을 기반으로 형태소 결합관계를 분석한다. 이는 언어에 독립적인 방법으로 한국어에 대해서도 일부 구축되어 적용됨이 증명되었다. 그러나 기존 한국어에 대한 Two-level 형태소 분석기는 사전을 수동으로 구축하여 규모가 매우 작고 실제 사용에 제한적이었으며, 과분석이 많아 효율성이 매우 떨어졌다. 본 논문은 세종 품사부착 말뭉치에서 대규모의 Two-level 어휘 사전을 자동으로 구축하여 형태소 분석기의 적용 범위를 넓히고, 형태소간의 결합관계를 어휘 정보와 어휘 형태에 따른 하위품사 정보를 이용하여 분석함으로써 형태소 분석기의 성능을 향상시킬 수 있는 방법을 제시한다. 실험 결과, 기존의 방법보다 형태소 분석기의 과분석을 68% 이상 줄여 f-measure를 25.5% point 이상 향상시킬 수 있었다.

효율적인 한국어 분석을 위한 확장된 최장일치법 (The extended longest match strategy for efficient Korean analysis)

  • 이기오;이근용;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-261
    • /
    • 1996
  • 한국어 형태소 분석 방법중 최장일치법은 영어의 분석처럼 one-pass로 한국어를 분석할 수 있도록 하는 기법에 가장 적절하다. 그러나 최장일치법은 매우 많은 분석 후보를 생성하여 탐색 회수가 많아 시스템의 성능을 떨어뜨린다. 또한 대부분의 한국어 형태소 분석 시스템들은 형태소 자체에만 중점을 두어 한국어 분석 시스템 전체의 성능은 고려하지 않아 형태소 분석 시스템의 결과가 파서의 입력에 적절치 못한 결과를 생성한다. 본 논문에서는 형태소 분석의 원형복원 규칙과 사전 탐색을 통합하여 과분석 후보에 대한 탐색 회수를 줄이고 전체 시스템의 성능을 향상시키기 위해 파서에 적합한 입력을 제공하는 확장된 최장일치법을 제안한다.

  • PDF

확장 정의된 유사어절의 분석에 근거한 실시간 미등록어 인식 (Real Time Recognition of Unknown Words based on the Analysis of Similar Words with an Extended Definition)

  • 박봉래;황영숙;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.222-228
    • /
    • 1996
  • 기존의 미등록어 추정 방법은 대부분 단일 어절 접근 방법으로 단일 어절에서 추출할 수 있는 추정 정보가 부족하여 과분석과 오분석의 가능성이 높았다. 그래서 동일 미등록어를 가진 어절들을 동시에 분석하는 유사 어절 접근 방법이 제시되었다. 그러나 이 방법도 유사 어절의 범위를 조사나 어미만 다른 어절로 정의함으로써 수집될 수 있는 유사 어절의 수가 제한되어 대략의 텍스트에서만 적용이 가능하였다. 이에 본 논문은 유사어절을 동일 음절열을 공유하는 어절들로 확장 정의하여 작은 크기 N의 텍스트 윈도우에서 유사 어절의 발견 가능성을 높임으로써 실시간으로 미등록어를 추정할 수 있게 하는 방법을 제시한다. N을 100으로 한 실험결과는 미등록어 추정 정확도가 99.3%였고 재현율은 약 32%였다.

  • PDF

$K^{+}$ channel openers의 약리학적 특성에 관한 연구

  • 홍기환;이원석;이주희;유성옥
    • 한국응용약물학회:학술대회논문집
    • /
    • 한국응용약물학회 1992년도 제1회 신약개발 연구발표회 초록집
    • /
    • pp.37-37
    • /
    • 1992
  • 세포의 흥분성과 막전위의 조절에 있어서 $K^{+}$ channel의 역할이 크다는 사실이 인정 됨으로서 (Rudy, 1988) $K^{+}$ channel 개방 약물의 약리학적 연구와 임상적 응용에 대한 관심은 높아졌다. Cromakalim, nicorandil 및 pinacidil등이 혈관 평활근을 특히 예민하게 이완시킨다. 작용기전으로서는 세포의 원형질 막을 통한 $K^{+}$ 전도의 항진과 $K^{+}$ outward current의 증가가 막 과분극을 일으킨다. 이러한 결과는 막흥분에 의한 voltage-dependent $Ca^{++}$ channel을 닫게하고 세포내 free $Ca^{++}$의 농도를 감소시켜 혈관의 흥분성과 수축력의 감소를 야기하여 근이완을 야기한다. 한편, 평활근 세포막의 $Na^{+}$-$K^{+}$ ATPase도 활성화하면 electrogenic pump를 가동하여 막 과분극을 일으키고 막 흥분성을 저하시킨다. $Na^{+}$-$K^{+}$ pump는 세포 바깥의 $K^{+}$과 세포안의 $Na^{+}$농도에 의하여 활성화한다.

  • PDF

다중 물체의 효과적 검출과 분할을 위한 문맥자유 마커 제어 분수계 변환 (Context-free marker controlled watershed transform for efficient multi-object detection and segmentation)

  • 서경석;박창준
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.1-1
    • /
    • 2001
  • 본 논문에서는 복잡 배경으로부터 임의의 다중물체를 효과적으로 검출함과 동시에 고속 분할할 수 있는 문맥자유 마커제어 분수계 변환 (context-free marker controlled watershed transform)을 제안하였다. 먼저 잡음에 강건한 주목 연산자 (attention operator)를 써서 복잡 배경 속의 여러 물체 별로 그 위치를 검출하여 문맥자유 마커를 추출하고, 이를 마커로 한정된 레이블링 (marker constrained labeling)을 하여 최소값 부과과정이 필요 없는 문맥자유 마커제어 분수계 변환을 제안함으로써 과분할없이 신속하게 분할할 수 있도록 하였다. 다중 물체가 포함된 복잡 영상에 적용 실험하여, 대상 물체에 대한 사전정보 없이도 과분할과 처리시간을 대폭 줄여 효과적으로 다중 물체를 검출함과 동시에 고속 분할이 가능함을 확인 할 수 있었다.

어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기 (A Korean Grammar Checker using Lexical Disambiguation Rule and Partial Parsing)

  • 소길자;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권3호
    • /
    • pp.305-315
    • /
    • 2001
  • 본 논문에서는 우리말 문서에 있는 오류를 어절 단위로 검증하는 철자 오류와 여러 어절을 분석해야 처리할 수 있는 문법 오류로 분류하였다. 문법 오류를 처리할 때 전체 문장 분석은 시간이 많이 소요되고 구현하기 어려우므로 대부분 부분 문장 분석 방법을 이용한다. 기존 연구에서 사용한 부분 문장 분석은 분석 어절에 어휘 중의성이 있을 때 문장 분석 종결 또는 과분석 등의 오류가 발생한다. 본 논문에서는 문법 검사기에서 어휘 중의성 때문에 발생하는 문제점을 해결하는 방법으로 어휘 중의성 제거 규칙을 사용한다. 본 논문에서 구현한 어휘 중의성 제거 모듈은 코퍼스 데이타에서 얻은 경험적 규칙을 기반으로 한다. 이 경험적 규칙은 언어적 지식을 기반으로 한다.

  • PDF

다중 물체의 효과적 검출과 분할을 위한 문맥자유 마커제어 분수계 변환 (Context-free Marker Controlled Watershed Transform for Efficient Multi-object Detection and Segmentation)

  • 서경석;조상현;최흥문;박창준
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.237-246
    • /
    • 2001
  • 본 논문에서는 복잡 배경으로부터 임의의 다중물체를 효과적으로 검출함과 동시에 고속 분할할 수 있는 문맥자유 마커제어 분수계 변환 (context-free marker controlled watershed transform)을 제안하였다. 먼저 잡음에 강건한 주목 연산자 (attention operator)를 써서 복잡 배경 속의 여러 물체 별로 그 위치를 검출하여 문맥자유 마커를 추출하고, 이를 마커로 한정된 레이블링 (marker constrained labeling)을 하여 최소값 부과과정이 필요 없는 문맥자유 마커제어 분수계 변환을 제안함으로써 과분할없이 신속하게 분할할 수 있도록 하였다. 다중 물체가 포함된 복잡 영상에 적용 실험하여, 대상 물체에 대한 사전정보 없이도 과분할과 처리시간을 대폭 줄여 효과적으로 다중 물체를 검출함과 동시에 고속 분할이 가능함을 확인 할 수 있었다.

  • PDF