• 제목/요약/키워드: 실제어

검색결과 458건 처리시간 0.032초

형태 분석 말뭉치 구축을 위한 합성어의 처리 방법 - 띄어쓰기를 고려하여 - (Dealing with Compouds in the Construction of a POS Tagged Korean Corpus)

  • 조진현;김일환;이현희;이영제;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.9-15
    • /
    • 2002
  • 이 연구는 형태 분석 정보가 부착된 말뭉치를 구축할 때 합성어를 처리하기 위한 방법론을 제시하고, 그 타당성을 검증해 보는 데 있다. 그동안 합성어 처리를 위해서 합성어 선정 기준을 이용하거나 목록을 이용하는 방법이 이용되었는데, 본고에서는 ${\ulcorner}$표준국어대사전${\lrcorner}$의 합성어 목록을 참조하는 것이 적절한 방법이 될 수 있음을 보이고자 한다. 또한 이 방법을 실제 말뭉치 구축에 활용할 경우, 원문의 띄어쓰기 정보가 합성어 처리에서 중요한 요인이 될 수 있다는 점을 지적하고, 이러한 처리가 가지는 한계와 의의에 대해서도 논의하고자 한다.

  • PDF

관형적인 양식에서 배양된 생물의 생화학적 변화

  • 권오남;박흠기;이종하
    • 한국어업기술학회:학술대회논문집
    • /
    • 한국어업기술학회 2003년도 춘계 수산관련학회 공동학술대회발표요지집
    • /
    • pp.191-192
    • /
    • 2003
  • 수산양식에 있어서 초기 치자어의 영양은 치자어의 생존 및 성장에 많은 영향을 미친다. 이와 같은 영양에는 주로 DHA와 EPA 등으로 많은 연구자들은 그 초점을 두고 있다. 그러나, 실제 어류에 있어서 부화 직후의 영양소 섭식 능력은 많은 종에 있어서 미지수로 종묘생산시 초기 감모기를 겪고 있으며 이 시기를 부화 후 first feeding 단계의 5∼10일로 잡고 있다. 그러나 이 초기 감모기를 지난 자치어는 rotifer와 Artemia 같은 살아있는 먹이생물을 이용하기에 충분하기 때문에 생존율에는 큰 영향이 없는 것으로 보고되어지고 있다. (중략)

  • PDF

병렬말뭉치를 이용한 대체어 자동 추출 방법 (Automatic Extraction of Alternative Words using Parallel Corpus)

  • 백종범;이수원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권12호
    • /
    • pp.1254-1258
    • /
    • 2010
  • 정보 검색에 있어서 통일 객체를 다양한 표기로 기술하는 문제는 시스템의 성능을 저하시키는 요인이 된다. 본 연구에서는 이러한 문제를 해결하기 위하여 특허 정보의 국/영문 제목을 병렬말뭉치로 이용하여 대역어 뭉치를 추출하고, 이를 각 단어의 특징(Feature)으로 이용하여 대체어 목록을 자동 추출하는 방법을 제안한다. 또한 대체어 목록 내에 대체어가 아닌 다수의 연관단어들이 포함되는 문제점을 해결하기 위하여 국문 제목에서 추출한 연관단어 뭉치를 이용하여 대체어 목록 내 연관단어들을 필터링하는 방법을 제안한다. 평가결과에 따르면 본 연구에서 제안한 방법이 기존의 대체어 추출 방법들보다 더 우수한 것으로 나타났다.

그래픽 객체 질의어에서 집합 속성과 메소드를 포함한 경로식의 시각화 (Visualization of Path Expressions with Set Attributes and Methods in Graphical Object Query Languages)

  • 조완섭
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.109-124
    • /
    • 2003
  • 대부분의 상용 관계 DBMS(Database Management System)에서는 사용자 편의성을 위하여 SQL과 함께 그래픽 질의어를 제공하고 있으나, 객체 DBMS의 경우에는 그래픽 질의어에 관한 연구와 개발이 미흡한 실정이다. 그래픽 질의어에서는 복잡한 질의 조건을 간결하고도 직관적인 방법으로 표현하는 것이 중요한 이슈이다. 특히, 객체 DBMS는 관계 DBMS 보다 복잡한 데이타 모델과 객체 질의어를 제공하므로 그래픽 객체 질의어를 설계하고 구현할 때 간결성과 직관성을 유지하는 것이 더욱 중요하다. 본 논문에서는 인터넷 환경에서 원격지 객체 데이타베이스에 접근하여 자료를 검색하고 관리하는 그래픽 객체 질의어인 GOQL(Graphical Object Query Language)을 제안한다. GOQL은 그래픽 관계 질의어에서 다루지 않은 집합값 속성과 한정어 및 메소드를 포함한 길이가 2 이상인 경로를 간단한 그래픽 요소들로 시각화함으로써 간결성과 직관성을 높인다. 그리고 대표적인 객체 질의어인 XSQL(1,2)에서 사용하는 경로는 GOQL에서 제공하는 간단한 시각적 도구로 표현할 수 있음을 보인다. 또한, 논문에서는 GOQL의 그래픽 질의어를 텍스트 객체 질의어로 변환하는 알고리즘을 제안하고, 실제로 인터넷 환경에서 동작하도록 구현한 결과를 소개한다.

비디오 재설정 및 3D 압축처리를 위한 어텐션 메커니즘 (Attentional mechanisms for video retargeting and 3D compressive processing)

  • 황재정
    • 한국정보통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.943-950
    • /
    • 2011
  • 이 논문에서는 2D 및 3D 영상의 어텐션량을 측정하여 정지 및 동영상의 재설정 및 압축처리 기법을 제시하였다. 2D 어텐션은 세 개의 주요 구성, 즉, 영상의 세기, 컬러 및 방향성을 고려하였으며, 3D 영상에서 깊이 정보를 고려하였다. 시각적 어텐션은 관심있고 흥미있는 영역이나 객체를 검출하기 위해 희소성을 정량화하는 기법에 의해 구하였다. 왜곡된 스테레오 영상에서 변화된 깊이 정보를 어텐션 확률에 정합시켜서 최종적으로 저위 HVS 반응을 실제 어텐션 확률과 종합하여 스테레오 왜곡 예측기를 설계하였다. 결과로 기존 모델에 비해 효과적인 어텐션 기법을 개발하였으며 이를 비디오 재설정에 적용하여 성능을 입증하였다.

적절한 동사 대역어 선택을 위한 한영 변환 사전 구성 (The Composition of Korean-English Transfer Dictionary for Proper Selection of Verb Translation)

  • 송정근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.294-301
    • /
    • 2001
  • 기계번역이 인간의 언어 능력을 기계로 구현한다는 점에서 전산학적 성격이 강하다면, 변환 사전은 인간의 어휘부(lexicon) 정보를 그대로 기계에 표상한다는 점에서 언어학적 성격이 강하다. 여기서는 다양한 어휘부 정보 중에서 한영 기계번역에서 필요한 언어학적 정보를 추출하고 이러한 정보를 바탕으로 적절한 동사 대역어 선택을 위한 변환 사전의 모형을 만들어 보고자 하였다. 한영 기계번역에서 적절한 동사 대역어 선택의 어려움은 한국어 동형어 처리 문제와 한국어에서는 포착되지 않지만 영어로 번역하는 과정에서 발생하는 영어 표현의 특수성 때문에 기인한 것으로 볼 수 있다. 이 논문에서는 이러한 문제를 논항과 문법 형태소, 선택제약, 개별 어휘 등의 기초적인 언어학적 개념을 이용한 변환사전을 통해 해결한다. 또한 동사 대역어 선택에 영향을 미치는 이러한 개별적인 요인들은 실제 변환사전의 기술에 있어서는 복합적으로 적용됨을 동사 '먹다'의 기술을 통해 확인할 수 있다.

  • PDF

강건한 음성 대화 시스템을 위한 담화분석 기술 (Discourse Analysis for Robust Spoken Dialogue System)

  • 이충희;오효정;장명길;서영훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1005-1009
    • /
    • 2010
  • 지시대명사와 같은 조응어(anaphora)의 본래 단어나 구를 선행사라고 지칭하며, 음성 대화 중에는 선행사에 대한 생략과 대용어 사용이 빈번히 발생한다. 또한 언어 현상들은 문맥을 보지 않으면 이해될 수 없는 것들이 많다는 것이 담화분석의 기본 가정이므로, 생략 및 대용어 복원은 담화분석에서 매우 중요한 역할을 한다. 본 논문에서는 대용어와 생략어 복원에 기반해서 대화 레벨에서의 강건성을 향상시킨 음성 기반 대화 시스템을 제안한다. 제안된 항법의 적절성과 효과는 TV 도메인에서 평가되었다.

한국어 내포 머리어 관계절의 통사적 특성과 습득 연구 (A Study of Syntactic Properties and Acquisition of Head-Internal Relative Clauses in Korean)

  • 조수근
    • 인지과학
    • /
    • 제14권2호
    • /
    • pp.49-56
    • /
    • 2003
  • 이 논문은 한국어 내포 머리어 관계절의 통사적인 특징을 살펴보고 이 구문이 한국어를 모국어로 사용하는 아동들에 의해 어떻게 습득되는가를 조사하는데 그 목적이 있다. 먼저, 한국어 내포 머리어 관계절 구문의 통사적인 특징을 살펴보기 위하여 내포 머리어 관계절을 생성문법에 비추어 분석을 하였다. 이 분석을 통해, 한국어의 내포 머리어 관계절은 일반적인 외포 머리어 관계절에 비해 통사적으로 사용이 더 제한되어 있다는 것을 알 수 있었다. 다시 말해, 내포 머리어 관계절은 여러 개의 절을 넘어 관계화가 일어날 수 있는 외포 머리어 관계절과 달리 하나 이상의 절을 넘어 관계화가 일어날 수 없다. 또한 내포 머리어 관계절은 주어, 직접목적어, 간접목적어, 전치사의 목적어 등이 관계화될 수 있는 외포 머리어 관계절과 달리 단지 주어와 직접목적어만이 관계화가 가능하다. 그리고, 내포 머리어 관계절의 습득 연구를 위해 관찰 방법을 이용한 내포 머리어 관계절의 자료뿐만 아니라 이해도 측정 실험과 산출 실험을 이용한 자료도 같이 분석하였다. 이들 자료의 분석을 통해, 내포 머리어 관계절은 외포 머리어 관계절에 비하여 아동들이 이해하고 말하기가 더 쉽고 따라서 외포 머리어 관계절에 비해 아동들에 의해 더 일찍 습득됨을 알 수 있었다. 보통 내포 머리어 관계절은 성인들에게는 잘 사용되지 않는다고 알려져 있는데 아동들에게 특히 언어 발달 과정의 이른 시기에 있는 아동들에게 외포 머리어 관계절의 습득에 앞서 많이 사용되어진다는 습득 연구에서의 결과는 언어발달의 이른 시기에 있는 아동들이 내포 머리어 관계절을 어떻게 이용하는지를 말해준다. 다시 말해, 아동들은 언어 발달의 이른 시기에는 이해하고 말하기 어려운외포 머리어 관계절 대신 쉬운 내포 머리어 관계절을 임시적으로 사용하는 것으로 볼 수 있겠다. 실제, 외포 머리어 관계절은 언어 발달 과정에서 늦게 습득이 되는 것으로 보고되고 있다.

  • PDF

검색의도 파악을 위한 질의어 관계유형에 관한 사례연구 (A Case Study on the Types of Queries' Relations for Recognizing User intention)

  • 권순진;김원일;유성준
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.414-422
    • /
    • 2011
  • 본 연구는 정보 검색(Information Retrieval)과정에 있어 검색 기술의 적합성을 향상하기 위하여, 질의어 사이의 유용한 관계를 드러내도록 사례를 분석하고, 질의자의 의도를 파악할 수 있게끔 구체화하도록 연구한 것이다. 이를 위하여 먼저, 질의어가 가지는 어휘 의미적 연구 분야와 존재론적 연구 분야의 관련 연구들을 분석하였으며, 국내.외의 어휘 의미론적 네트워크 사례와 정보 검색 기술이 적용된 사이트의 실제 데이터를 분석하여 관계 유형을 추출하고 분석하였다. 다음으로는 일반적으로 검색자가 직면하는 검색 상황에서 자주 발생하는 문제를 중심으로 문제점을 정의하여 해결 방안을 모색하였다. 현행 검색 기술에서 색인어와 질의어를 단순 비교하여 결과를 쏟아주는 검색은 사용자를 혼란하게 하기 때문에 개선이 필요하고, 질의자의 의도에 맞는 질의 결과를 줄 수 있도록 지능적 검색으로 개선할 필요가 있다. 문제점 해결 방안에 있어서는, 두 질의어 사이의 관계를 드러냄으로써, 검색자의 의도를 인식하고 식별 및 처리할 수 있는 방안이 필요하였다. 질의어들에 관한 실제 사례를 분석하고 관계 유형을 9가지로 분류함으로써, 관계 유형을 디자인하는 방법을 적시하였으며, 관계 유형의 명칭 부여와 관계 역할의 명칭을 부여할 수 있는 방법과 제한점도 예시하였다.

의견 어구의 구문 관계를 고려한 트위터 의견 검색 (Opinion Retrieval in Twitter Considering Syntactic Relations of Sentiment Phrase)

  • 김윤성;양민철;이승욱;임해창
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권9호
    • /
    • pp.492-497
    • /
    • 2014
  • 본 연구에서는 대중적인 소셜 네트워크 서비스 중 하나이며 많은 사람들이 다양한 의견을 공유하는 트위터를 대상으로 질의어(또는 주제어)에 적합한 의견을 지닌 트윗을 검색하는 방법론을 제안한다. 기존의 의견 검색 시스템은 의견을 지닌 구절이 주어진 질의어나 화자와 관련이 없음에도 불구하고 그런 구절의 유무를 중요한 요소로 여겼다. 이와 같은 문제를 해결하기 위하여 본 연구에서는 1) 의견 어구-질의어 관계, 2) 의견 어구-화자 관계, 그리고 3) 의견 어구의 의존 구문 역할 등의 구문 요소를 반영하는 방법을 고안하였다. 또한, 의견을 가진 트윗을 검색하기 위하여 질의어와의 적절성, 텍스트 정보, 사용자 정보, 트위터 특화 자질에 기반한 랭킹 학습 방법을 이용하였다. 실제 데이터를 이용한 실험 결과, 본 시스템은 기존 연구들보다 더 좋은 성능을 보이고 있다.