• Title/Summary/Keyword: 기술어

Search Result 1,640, Processing Time 0.03 seconds

Improvement of Science and Technology Information Retrieval Service using Semantic Language Resource (의미적 언어자원을 활용한 과학기술정보 검색 서비스 개선)

  • Cho, Min-Hee;Choi, Sung-Pil;Choi, Ho-Seop;Yoon, Hwa-Mook
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.570-574
    • /
    • 2006
  • KISTI portal service is currently presenting the documents with many terminologies, so users can't find the results having their intention by using an umbrella query. In this paper, we suggest user oriented retrieval service that reflects query auto-complete, related-word suggestion and query expansion that uses nouns and relationships of U-WIN which is known as a semantic language resource. We intend to advance the retrieval satisfaction of current science & technology information service by using U-WIN's semantic information and improve the service environment that user can retrieve what they want quickly and exactly.

  • PDF

Restoring Encyclopedia Title Words Using a Zero Anaphora Resolution Technique (무형대용어 해결 기술을 이용한 백과사전 표제어 복원)

  • Hwang, Min-Kook;Kim, Young-Tae;Ra, Dongyul;Lim, Soojong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.65-69
    • /
    • 2014
  • 한국어 문장의 경우 문맥상 추론이 가능하다면 용언의 격이 생략되는 현상 즉 무형대용어 (zero anaphora) 현상이 흔히 발생한다. 무형대용어를 채울 수 있는 선행어 (명사구)를 찾는 문제는 대용어 해결 (anaphora resolution) 문제와 같은 성격의 문제이다. 이러한 생략현상은 백과사전이나 위키피디아 등 백과사전류 문서에서도 자주 발생한다. 특히 선행어로 표제어가 가능한 경우 무형대용어 현상이 빈번히 발생한다. 백과사전류 문서는 질의응답 (QA) 시스템의 정답 추출 정보원으로 많이 이용되는데 생략된 표제어의 복원이 없다면 유용한 정보를 제공하기 어렵다. 본 논문에서는 생략된 표제어 복원을 위해 무형대용어의 해결을 기반으로 하는 시스템을 제안한다.

  • PDF

Gabor descriptors extraction in the SURF feature point for improvement accuracy in face recognition (얼굴인식에서 정확도 향상을 위한 SURF 특징점에서의 Gabor 기술어 추출)

  • Kim, Ji Eun;Cho, Hye Jeong;Chung, Kwang-Sue;Oh, Seoung-Jun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.11a
    • /
    • pp.19-22
    • /
    • 2011
  • 본 논문에서는 대표적인 특징점 추출 알고리즘인 SURF (Speeded Up Robust Features)와 얼굴인식에서 널리 쓰이는 Gabor 기술어를 이용한 얼굴 인식 방법을 소개한다. SURF 기반 영상인식 방법은 특징점을 찾고 해당 특징점에서 기술어를 추출한 후, 정합을 수행한다. 본 논문에서는 SURF 를 통해 추출한 특징점에서 Gabor 웨이블릿 변환을 사용해 기술어를 추출하는 얼굴인식 방법을 제안한다. 잘 알려진 ORL 데이터베이스에서의 실험에서 제안한 방법이 기존 SURF 기반의 얼굴 인식 방법에 비해 더 높은 얼굴 인식 성능을 보여줄 뿐 아니라 정합시간을 포함한 처리 속도면에서도 더 우수한 성능을 보였다. 이러한 실험 결과를 통하여 제안하는 방법이 SURF 보다 얼굴 인식에 적합함을 확인할 수 있었다.

  • PDF

Discipline-based Descriptors for Image Retrieval: Representing Presidential Images of Korea (이미지 검색을 위한 영역별 기술어에 관한 연구 - 한국의 대통령 사진기록물을 중심으로 -)

  • Kim, Yang-Woo
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.42 no.1
    • /
    • pp.253-272
    • /
    • 2008
  • While relevant studies emphasize the significance of user-oriented indexing associated with fulfilling both topical and non-topical needs of individual users, a great number of operational retrieval systems supports only those searches related to subject attributes of the users' needs. Retrieval systems for presidential image collections are not an exception for such a restriction. Upon this reality. this study seeks diversification of access points for presidential images based on descriptors directly presented by potential user groups. Improvements of subject-based descriptors are suggested based on those descriptors identified.

Word Sense Disambiguation using Hypernym Sequence Clustering (상위어 시퀀스의 클러스터링을 이용한 단어의 의미 애매성 해소)

  • Jeong, Chang-Hoo;Choi, Yun-Soo;Choi, Sung-Pil;Yoon, Hwa-Mook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.935-936
    • /
    • 2009
  • 본 논문에서는 과학기술문서에 존재하는 기술용어와 이들 간의 연관관계를 설명하는 디스크립터를 찾아서 [subject predicate object] 형태의 트리플을 생성하는 애플리케이션을 개발할 때 발생하는 단어 의미 애매성 해소 문제를 다룬다. 기술용어가 가지고 있는 연관관계를 결정하기 위해서 워드넷의 신셋 정보를 사용하는데 이 방법은 동사를 워드넷에 매핑할 때와 상위어 관계로 전이할 때 여러 개의 의미에 매핑되는 문제점이 발생한다. 이것을 해결하기 위해서 상위어 시퀀스 클러스터링을 이용한 단어의 의미 애매성 해결 방안을 제시한다. 이 방법을 사용함으로써 워드넷 매핑과 상위어 전이 시에 발생하는 다중 매핑 문제를 동시에 해결할 수 있다.

Noun and Verb Polysemy Word Sense Disambiguation Using UWordMap (어휘지도(UWordMap)를 활용한 명사와 용언의 다의어 중의성 해소)

  • Shin, Joon-Choul;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.216-219
    • /
    • 2015
  • 컴퓨터를 이용하여 명사와 용언의 의미를 자동으로 분별하는 것은 기계번역이나 검색 등의 기술에서 아주 중요한 기반 기술이다. 최근에 동형이의어 분별에 대한 연구 결과로 약 96%의 정확률을 보이는 시스템이 개발되었으나, 다의어 분별에 대한 연구는 아직 초기 단계로 일부 어휘만을 한정하여 연구되고 있다. 본 논문에서는 어휘지도를 이용하여 다의어를 분별하는 방법을 연구하였고, 어휘지도에 등록된 모든 일반 명사와 용언을 대상으로 실험하였다. 제안된 알고리즘은 문장에서 나타나는 명사와 용언의 관계를 어휘지도에서 찾고, 그 정보를 기반으로 다의어를 분별하였다. 아직은 그 정확률이 실용적인 수준이라고 볼 수는 없지만, 전체 다의어를 대상으로 실험하였고, 그 실험 결과를 분석함으로써 앞으로의 다의어 분별 연구 방향에 도움될 것으로 판단된다.

  • PDF

ETRI신기술-한.일 자동번역 기술

  • Electronics and Telecommunications Research Institute
    • Electronics and Telecommunications Trends
    • /
    • v.14 no.4 s.58
    • /
    • pp.131-132
    • /
    • 1999
  • 일본어로 구성된 일본어 웹 정보를 한국어로 자동 번역하여 주는 한.일 자동 번역 시스템으로서 다중 사용자를 지원하는 서버 형태로 구현되었으며, 일본어 어휘 분석, 일-한 변환, 한국어 생성을 수행하는 번역 엔진부와 일-한 자동 번역에 필요한 한.일 자동 번역용 사전(20만 단어), 번역 규칙 등으로 구성되어 있다.

  • PDF

이런과학자,저런기술자 - '20세기의 다윈' 에른스트 마이어

  • Hyeon, Won-Bok
    • The Science & Technology
    • /
    • v.30 no.12 s.343
    • /
    • pp.67-69
    • /
    • 1997
  • 6백61번째의 논문, 21번째의 저서를 내면서 노익장을 과시하고 있는 올해 92세의 에른스트 마이어는 '20세기의 다윈'으로 불리는 생물학자이자 역사가이며 철학자이다. 독일 태생으로 현재 미국에서 활동하고 있는 마이어는 20세기의 가장 중요한 6대 과학업적중의 하나로 평가되는 '진화론적 종합'의 선도역할을 해왔다.

  • PDF

음성인식기술의 현황과 전망

  • Lee, Jong-Rak
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.689-707
    • /
    • 1992
  • 인간의 가장 익숙한 정보교환 수단인 음성을 기계가 인식하게 함으로써 모든 기계를 말로써 작동시키고자 하는 것은 인간의 오랜 꿈이었다. 최근 컴퓨터 기술과 음성처리 기술의 급속한 발달에 힘입어 그 꿈은 현실로 다가오고 있다. 현재 고립어 인식은 충분히 실용화될 수 있는 단계에 들어 섰으며 이제 연속어 인식 내지 연속어 이해에 연구가 집중되고 있다. 인간과 기계를 인터페이스하는 언어의 전위레벨로서 날로 그 중요성이 부각되고 있는 음성인식 기술의 현황을 살펴보고 그것의 미래를 전망해 본다.

  • PDF

Relation Extraction Using Self-attention with Multi Grained Information (다중 정보와 Self-Attention을 이용한 관계 추출)

  • Kim, Jeong-Moo;Lee, Seung-Woo;Char, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.175-180
    • /
    • 2019
  • 관계 추출은 문서에서 존재하는 트리플(주어, 관계어, 목적어)형식에 해당하는 단어를 추출하는 작업을 뜻한다. 본 논문에서는 멀티헤드 셀프 어텐션을 이용하여 트리플 중 주어나 목적어를 찾는 구조를 제안한다. 한국어 위키피디아와 DBpedia의 관계어를 단어 임베딩을 통해 벡터를 생성하고 입력한다. 초록과 관계어의 어텐션 이후 멀티 헤드 셀프 어텐선 구조를 통해 초록 중 관계어와 관련 있는 단어들의 가중치가 높아 진다. 멀티헤드 셀프 어텐션 과정을 반복하여 주요 단어들의 가중치가 계속해서 높아진다. 이를 입력으로 하여 정답이 될 단어의 시작과 끝을 선택한다. 제안 방법으로 직접 구축한 한국어 관계 추출 데이터셋을 대상으로 F1 0.7981의 성능을 보였다. 제안 방법은 관계어와 같이 단순한 정보만을 이용하고도 초록에서 적절한 정답 단어를 추출할 수 있음을 확인하였다. 관계어의 범위를 확장함으로서 나아가 육하원칙(5W1H)과 같은 이벤트의 추출에도 활용할 수 있을 것이다.

  • PDF