• 제목/요약/키워드: 문맥 크기

검색결과 42건 처리시간 0.024초

가변 크기 문맥과 거리가중치를 이용한 동형이의어 중의성 해소 (Word sense disambiguation using dynamic sized context and distance weighting)

  • 이현아
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제38권4호
    • /
    • pp.444-450
    • /
    • 2014
  • 의미 중의성 해소를 위한 대부분의 기존 연구에서는 문장의 특성에 상관없이 고정적인 크기의 문맥을 사용해 왔다. 본 논문에서는 중의성 해소에서 문장에 따라 가변적인 크기의 문맥을 사용하는 가변길이 윈도우와 단어간 거리를 사용한 의미분석 방법을 제안한다. 세종코퍼스의 형태의미분석 말뭉치로 학습하여 12단어 32,735문장에 대해 실험한 결과에서 제안된 방법이 용언에 대하여 92.2%의 평균 정확도를 보여 고정 크기의 문맥을 사용한 경우에 비해 향상된 결과를 보였다.

단어 중의성 해소를 위한 SVM 분류기 최적화에 관한 연구 (A Study on Optimization of Support Vector Machine Classifier for Word Sense Disambiguation)

  • 이용구
    • 정보관리연구
    • /
    • 제42권2호
    • /
    • pp.193-210
    • /
    • 2011
  • 이 연구는 단어 중의성 해소를 위해 SVM 분류기가 최적의 성능을 가져오는 문맥창의 크기와 다양한 가중치 방법을 파악하고자 하였다. 실험집단으로 한글 신문기사를 적용하였다. 문맥창의 크기로 지역 문맥은 좌우 3단어, 한 문장, 그리고 좌우 50바이트 크기를 사용하였으며, 전역문맥으로 신문기사 전체를 대상으로 하였다. 가중치 부여 기법으로는 단순빈도인 이진 단어빈도와 단순 단어빈도를, 정규화 빈도로 단순 또는 로그를 취한 단어빈도 ${\times}$ 역문헌빈도를 사용하였다. 실험 결과 문맥창의 크기는 좌우 50 바이트가 가장 좋은 성능을 보였으며, 가중치 부여 방법은 이진 단어빈도가 가장 좋은 성능을 보였다.

단어 중의성 해소를 위한 지도학습 방법의 통계적 자질선정에 관한 연구 (A Study on Statistical Feature Selection with Supervised Learning for Word Sense Disambiguation)

  • 이용구
    • 한국비블리아학회지
    • /
    • 제22권2호
    • /
    • pp.5-25
    • /
    • 2011
  • 이 연구는 지도학습 방법을 이용한 단어 중의성 해소가 최적의 성능을 가져오는 통계적 자질선정 방법과 다양한 문맥의 크기를 파악하고자 하였다. 실험집단인 한글 신문기사에 자질선정 기준으로 정보획득량, 카이제곱 통계량, 문헌빈도, 적합성 함수 등을 적용하였다. 실험 결과, 텍스트 범주화 기법과 같이 단어 중의성 해소에서도 자질선정 방법이 매우 유용한 수단이 됨을 알 수 있었다. 실험에 적용한 자질선중 기준 중에 정보획득량이 가장 좋은 성능을 보였다. SVM 분류기는 자질집합 크기와 문맥 크기가 클수록 더 좋은 성능을 보여 자질선정에 영향을 받지 않았다. 나이브 베이즈 분류기는 10% 정도의 자질집합 크기에서 가장 좋은 성능을 보였다. kNN의 경우 10% 이하의 자질에서 가장 좋은 성능을 보였다. 단어 중의성 해소를 위한 자질선정을 적용할 때 작은 자질집합 크기와 큰 문맥 크기를 조합하거나, 반대로 큰 자질집합 크기와 작은 문맥 크기를 조합하면 성능을 극대화 할 수 있다.

IoT-Cloud 융합 가상 기계에서 효율적인 오프로딩 실행을 위한 문맥 동기화기의 설계 및 구현 (Design and Implementation of Context Synchronizer for Efficient Offloading Execution in IoT-Cloud Fusion Virtual Machine)

  • 김상수;손윤식;이양선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.1199-1202
    • /
    • 2017
  • IoT-Cloud 융합 가상 기계 시스템은 저성능의 사물인터넷 장비에서 고성능 클라우드 서버의 연산력을 제공받는 오프로딩 기법을 사용한다. 오프로딩 기법을 사용하는 경우 실행 대상 프로그램은 사물인터넷 장비와 클라우드 서버 사이에 일관성이 유지되어야하기 때문에 문맥 동기화가 필요하다. 기존 IoT-Cloud 융합 가상 기계의 문맥 동기화 방식은 전체 문맥 동기화를 시도하기 때문에 네트워크 오버헤드가 증가하여 비효율적이다. 네트워크 오버헤드는 오프로딩 실행 성능을 기존보다 감소시킬 수 있기 때문에 효율적인 오프로딩을 위해서는 오프로딩 실행에 필요한 문맥 정보만을 동기화하여 네트워크 오버헤드를 줄여야 한다. 본 논문에서는 효율적인 오프로딩 실행을 위해 정적 프로파일링을 통해 추출된 문맥 정보를 기반으로 오프로딩 실행에 필요한 문맥 정보만을 동기화하는 문맥 동기화기를 설계 및 구현하였다. 오프로딩 실행에 필요한 문맥 정보만 동기화가 이뤄지면 문맥 동기화 시 발생하는 네트워크 오버헤드의 크기가 줄어들기 때문에 효율적인 오프로딩 실행이 가능하다.

문맥 윈도우의 크기와 위치 변화를 이용한 한국어 기반 명사구 인식 (Korean BaseNP Identification using the variation of context length and position)

  • 전수영;강인호;김길창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.454-456
    • /
    • 2002
  • 한국어의 비재귀 명사구 즉 기반 명사구(basehp)를 인식하는 알고리즘을 제시한다. 본 논문에서는 한개의 주어진 학습 알고리즘에 대해 문맥 윈도우의 크기와 문맥 윈도우의 위치를 달리해 가면서 학습시킨다 이러한 방법을 통해 서로 다른 정보를 바탕으로 한 기반 명사구 인식을 수행할 수 있으며, 그 결과서로 다른 여러 개의 결과들을 생성할 수 있다. 본 논문에에서는 이렇게 얻어진 여러 개의 인식 결과들을 적절한 방법으로 결합하여 한국어에서 91% 이상의 높은 기반명사구 인식 정확도를 얻어낼 수 있다. 15만 단어 규모의 국어정보베이스의 말뭉치를 사용했으며 , 학습 알고리즘으로는 메모리 기반 학습 알고리즘 (memory-based learning)을 이용하여 실험하였다.

  • PDF

한국재래산양에서 간장의 초음파검사법 (Ultrasonography of the Liver in Korean Native Goat)

  • 김명철;김상근;조성환;신광순;류시윤;박종오;박관호;박경수
    • 한국임상수의학회지
    • /
    • 제11권2호
    • /
    • pp.593-598
    • /
    • 1994
  • 본 연구의 목적은 초음파검사에 의하여 한국재래산양의 간장 및 담낭의 정상적인 구조와 크기를 알아보는데 있다. 30두의 한국재래산양에서 간장, 문맥, 후대정맥 및 담낭의 크기, 위치 및 구조를 측정하였다. 30마리의 산양을 체중에 따라서 5-15Kg, 15-25Kg 및 25-35Kg군으로 분류하였다. 우측복벽의 제9늑간극으로부터 12늑간극까지에서 측정을 실시하였다. 각 늑간극에서의 간장의 크기, 후대정맥 및 문맥의 위치 및 직경을 관찰하였다. 본 연구에 있어서의 간장 크기 및 위치의 초음파 측정자료는 한국재래산양의 간장의 변화에 대한 진단에 있어서 기초자료로서 사용될 수 있다는 결론을 얻었다.

  • PDF

지지벡터기계를 이용한 단어 의미 분류 (Word Sense Classification Using Support Vector Machines)

  • 박준혁;이성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.563-568
    • /
    • 2016
  • 단어 의미 분별 문제는 문장에서 어떤 단어가 사전에 가지고 있는 여러 가지 의미 중 정확한 의미를 파악하는 문제이다. 우리는 이 문제를 다중 클래스 분류 문제로 간주하고 지지벡터기계를 이용하여 분류한다. 세종 의미 부착 말뭉치에서 추출한 의미 중의성 단어의 문맥 단어를 두 가지 벡터 공간에 표현한다. 첫 번째는 문맥 단어들로 이뤄진 벡터 공간이고 이진 가중치를 사용한다. 두 번째는 문맥 단어의 윈도우 크기에 따라 문맥 단어를 단어 임베딩 모델로 사상한 벡터 공간이다. 실험결과, 문맥 단어 벡터를 사용하였을 때 약 87.0%, 단어 임베딩을 사용하였을 때 약 86.0%의 정확도를 얻었다.

가변길이 윈도우를 이용한 통계 기반 동형이의어의 중의성 해소 (Statistical Word Sense Disambiguation based on using Variant Window Size)

  • 박기태;이태훈;황소현;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-44
    • /
    • 2012
  • 어휘가 갖는 의미적 중의성은 자연어의 특성 중 하나로 자연어 처리의 정확도를 떨어트리는 요인으로, 이러한 중의성을 해소하기 위해 언어적 규칙과 다양한 기계 학습 모델을 이용한 연구가 지속되고 있다. 의미적 중의성을 가지고 있는 동형이의어의 의미분별을 위해서는 주변 문맥이 가장 중요한 자질이 되며, 자질 정보를 추출하기 위해 사용하는 문맥 창의 크기는 중의성 해소의 성능과 밀접한 연관이 있어 신중히 결정되어야 한다. 본 논문에서는 의미분별과정에 필요한 문맥을 가변적인 크기로 사용하는 가변길이 윈도우 방식을 제안한다. 세종코퍼스의 형태의미분석 말뭉치로 학습하여 12단어 32,735문장에 대해 실험한 결과 용언의 경우 평균 정확도 92.2%로 윈도우를 고정적으로 사용한 경우에 비해 향상된 결과를 보였다.

  • PDF

질의 응답 시스템에서 개체 피드백을 이용한 정답 추출 (Answer Extraction Using Named Entity Feedback in Question Answering System)

  • 나승훈;강인수;이상율;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.676-678
    • /
    • 2002
  • 질의 응답 시스템(Question Answering: QA)에서 정답 유형 부류(Answer Type Taxonomy: ATT)란 사용자 질문 분석을 위한 미 부류 체계를 의미하는 것으로, ATT의 크기가 클수록 시스템의 성능은 높아진다. ATT를 확장하기 위해서는, 개체(Named Entity)에 의미 범주를 결정하는 개체 분류기(Named Entity Tagger의 분류 체계가 세분되어야 하는데, 기존의 개체 분류기는 한문서 내에서 그 개체의 분류를 시도하기 때문에, 분류를 위한 문맥 정보의 양이 부족하여, 정확하고 상세한 분류를 기대하기 힘들다. 본 논문에서는 동일 개체에 대한 문맥 정보를 수집하기 위해, 그 개체가 나타나는 다른 문서들을 검색하는 개체 피드백 Named Enti쇼 Feedback)이라는 기법을 사용한다. 개체가 상세히 분류됨에 따라 ATT도 확장될 수 있었으며, 이렇게 확장된 ATT상에서의 정답 추출은 baseline보다 약 7%정도의 성능 향상을 보여, 개체 피드백의 효과를 확인할 수 있었다.

  • PDF

시나리오 기반 자기적응형 소프트웨어의 효율적인 분석 방안 (An Efficiency Analysis Method of Self-adaptive software based Scenario)

  • 백수진;송영재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.492-495
    • /
    • 2008
  • 기존 컴퓨팅 패러다임에서는 고정된 환경을 가정하여 소프트웨어를 설계하였으므로 급속한 시장 환경의 변화와 소비자의 불확실한 요구조건에 대응하여 개발하기에 어려움이 있다. 따라서 외부 환경의 변화를 직면하였을 때 동작을 멈추는 것이 아니라 그 변화를 감지하고 대안을 선택하여 지속적으로 서비스를 제공할 수 있는 자기 적응형 소프트웨어가 필요하다. 그러나 기존의 자기적응형 소프트웨어에 대한 연구는 적응형 소프트웨어에 영향을 주는 문맥정보를 모델링하는 기법이나 적응을 위해 대체할 수 있는 기능들을 찾아내는 방법에 대한 연구가 부족한 실정이다. 이 문제를 해결하기 위해 본 논문은 시나리오를 이용한 목표 기반으로 분석을 하고, 분석된 요구사항의 가변 수와 크기에 따라 프로그램의 문법뿐 아니라 사용자의 관점에서도 의미 있도록 프로그램 동적 슬라이싱 기법을 적용하도록 한다. 또한, 제안된 방법이 전 과정에 문맥에 대한 분석, 설계 정보가 반영되어 동적으로 재구성하는 방법을 제시하도록 한다.