• Title/Summary/Keyword: 표제어

Search Result 102, Processing Time 0.023 seconds

Indexability and Information Quantity Analysis in Title and Abstract (표제(標題)와 초록(抄錄)의 색인성(索引性)과 정보량(情報量) 분석(分析))

  • Kim, Jae-Soo;Nam, Young-Joon
    • Journal of Information Management
    • /
    • v.23 no.2
    • /
    • pp.1-13
    • /
    • 1992
  • This study intends to measure the indexibility and the information quantity in title and abstract. The result of analysis was that when the source was title or abstract, result was not good. But when it was the title and abstract, the result was better.

  • PDF

Study on Improvement of Research Information Search in Portal Site (포털 사이트의 학술정보 검색 개선 방안 연구 - 사전 서비스와의 연계를 중심으로 -)

  • Yang, Chang-Jin
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2010.08a
    • /
    • pp.33-40
    • /
    • 2010
  • 인터넷 포털 사이트는 단순한 검색엔진을 넘어 네티즌들이 항해하는 사이버스페이스 그 자체를 의미할 정도로 영역과 개념이 확대되었다. 일반인들뿐만 아니라 전문 연구자도 필요로 하는 학술정보를 포털 사이트에서 서비스하기 때문에 포털 사이트를 많이 이용한다. 그 동안 포털의 검색은 얼마나 많은 정보를 검색 결과로 제시해 줄 것인가 하는 양적인 면에 관심을 두었다. 그러나 최근에는 검색의 질적인 측면에 보다 많은 관심이 주어지고 있다. 이 논문은 포털에서 제공하는 전문 학술정보 검색의 문제점을 제시하고, 주제어 사전 서비스와 연계하여 보다 신뢰성 높은 학술정보를 검색할 수 있게 하기 위한 시범적인 시도이다. 즉, 검증되고 압축적으로 정리된 사전의 표제어와, 해당 표제어를 키워드로 하는 권위있는 연구 성과를 같이 연계시킴으로써, 사전을 검색할 때 연구 성과까지 검색할 수 있게 하여, 검색의 효율성과 정보의 신뢰성을 높일 수 있는 방안을 제시하고자 하였다.

  • PDF

말뭉치에 근거한 한국어 사전 표제어 구성

  • Park, Yeong-Hwan;Yun, Jun-Tae;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.58-65
    • /
    • 1991
  • 사전은 자연어를 처리하는 핵심 부분을 이루고 있다. 그러나 기존의 한국어 사전은 기계적인 처리에 직접 이용하기에는 크게 미흡하다. 특히, 사전의 기본을 이루는 표제어 수록에 관한 연구는 더욱 취약한 형편이다. 본 연구는 새로운 한국어 사전의 표제어률 구성하기 위하여 대형 말뭉치를 수집하였다. 이 말뭉치를 이용하여 기존 사전에서 빠져있는 미등록어들을 찾아내어 수록하고, 말뭉치에 나타난 각 단어의 출현 빈도를 조사하였다. 이 연구를 수행하기 위하여 형태소 분석기, 용례 분석기 등의 필수적인 텍스트 처리 도구들을 개발하였다. 또한, 말뭉치에 나타난 어절 단위의 오류 분포를 조사하여 밝히었다.

  • PDF

DaHae: Japanese Morphological Analyzer for Japanese to Korean Machine Translation (DaHae: 일한 기계번역을 위한 일본어 형태소 분석기)

  • Yuh, Sang-Hwa;Jung, Han-Min;Chang, Won;Kim, Tae-Wan;Hwang, Do-Sam;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.195-207
    • /
    • 1995
  • 일본어는 한자, 히라가나, 가다가나 등 다양한 종류의 문자를 사용하며 이들의 혼용 비율이 매우 높아 띄어쓰기를 하지 않아도 문서의 가독성을 유지한다. ICOT 사전, EDR 사전, ATLAS I/JK사전 등 기존의 전자 사전에서 복합 자종의 표제어가 차지하는 비율(한자+히라가나의 표제어 제외)은 평균 8.8%로 그 수가 매우 작다. 따라서, 문장 내에서 자종의 변화는 단어를 구분하는 하나의 delimiter로 이용될 수 있다. 본 시스템에서는 형태소 분석의 전단계로 전처리기를 두어 자종정보(character type information)에 의한 fragment 분리 및 예외 단어, 정형표현 처리를 수행하며 각 fragment 의 형태소 분석 방법을 제시한다. 형태소 분석기는 전처리기의 처리 결과를 입력받아 각각의 fragment를 전처리기가 제시한 분석 방법에 따라 분석하여 입력 문장의 가능한 모든 분석을 추출한다. 이 방법은 불필요한 사전 탐색과 접속 체크 회수를 줄여 분석 성능을 향상시킨다.

  • PDF

Processing of Inflectional forms for the French-Korean Collocational Database (불-한 연어 데이터베이스 구축을 위한 굴절 정보의 처리)

  • Yoon, Ae-Sun;Jeong, Hwi-Woong;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.267-272
    • /
    • 2001
  • 구(phrase) 단위 또는 문장(sentence) 단위의 연어(collocation) 정보는 자연언어 처리를 위한 단일어 또는 이중어 데이터베이스를 구축할 수 있는 중요한 기초 자료가 될 뿐 아니라, 외국어 학습에서도 어휘 단계를 넘어선 학습 자료를 제공할 수 있다. 불어는 굴절 언어(inflectional language)로서 기본형 대 굴절형의 비율이 약 1:9 정도로 비교적 굴절 비율이 높은 언어다. 또한 불어 표제어 중 95% 이상을 차지하는 불어의 동사, 명사, 형용사 중 상당한 비율이 암기해야 할 목록(list)이라는 특성을 갖기 때문에 검색과 학습에 있어 오류가 지속적으로 일어나는 부분이다. 표제어의 검색의 경우 불어 굴절 현상을 지원하는 전자 사전이 개발되어 있지만 아직까지 연어 정보에서 굴절형을 지원할 수 사전 또는 데이터베이스는 개발되어 있지 않다. 본 연구의 목적은 전자 사전과 형태소 분석기를 이용하여 굴절형 처리를 지원할 수 있는 불-한 연어 데이터베이스를 구축하는데 있다. 이를 위해 부산대학교 언어정보 연구실에서 개발한 불어 형태소 분석기 Infection와 불-한 전자 사전 Franco를 사용하였으며, 지금까지 구축된 불-한 연어 정보는 94,965 개이다. 본 고에서는 두 정보를 이용하여 불어 굴절형 정보를 분석 및 생성하는 방식 및 불-한 연어 데이터베이스 구조를 살펴 본다.

  • PDF

A Study on Service Integration of Research Information and Dictionary in Portal Site (포털사이트의 사전과 학술정보 연계 검색 방안 연구)

  • Yang, Chang-Jin
    • Journal of the Korean Society for information Management
    • /
    • v.28 no.1
    • /
    • pp.7-22
    • /
    • 2011
  • Internet portals have been revolutionized not only as simple search engines but also as a new space for the Internet users. They have developed to give satisfying search results for academic information users. academic fields. However, their attention was given to the quantity rather than the quality of the results. This tendency is now changing. This study addresses the problems in the search process using the current portal sites and presents an integrated scholarly information service where users can access more organized and trustworthy information linked with online technical keyword dictionary. When a user enter a keyword on a portal site, he/she can access to high quality scholarly information resources linked with keyword. This could assure the user to get an expanded knowledge with confirmation.

The Korean Analysis System by The Using of The Korean/Japanese Maching Translation's Dictionary (한일기계번역시스템의 사전을 사용한 한국어 형태소분석시스템)

  • Kang, Yong-Hee;Tanaka, Kouichi;Matsuda, Junichi
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.106-116
    • /
    • 1999
  • 한일기계번역시스템의 형태소 해석 프로그램의 중간버퍼를 표준안에 맞추어 명사추출 및 품사태킹을 시도해 보았다. 기존의 모델을 유지하면서 사전의 표제어를 보충하여 출력의 형태를 바꾸는 방법으로 표준안의 출력에 가깝게 출력을 함으로써 기존의 프로그램의 장점과 단점을 보완하는 것과, 표준안에 관한 문제제기가 본 연구의 목적이다. 특히 품사개념이 다른 사전에서 태킹 및 명사추출을 실시할 경우 표제어의 등록여부와 정확률의 인과관계는 높다고 판단된다. 그러므로 표준안의 품사기준은 그에 따른 시스템의 성패를 좌우한다.

  • PDF

A terminology extraction system (전문용어 추출시스템)

  • 박정오;황도삼
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.381-383
    • /
    • 2000
  • 현재, 과학기술, 정치, 사회, 문화의 급격한 변화와 발전에 따라, 전문분야마다 새로운 전문용어가 빈번히 생성되거나 소멸되고 있다. 이러한 전문용어를 포함한 문서를 정확히 해석하기 위해서는 전문용어 전자사전이 필요하다. 전문용어 전자사전을 개발하는데는 수시로 생성되는 전문용어 표제어를 정확히 추출하는 것이 무엇보다 중요하다. 본 논문에서는 이러한 전문용어 표제어를 컴퓨터를 이용하여 추출하는 시스템을 개발하였다. 기본적으로 기존의 전문용어가 사용된 특정어구를 이용하여 전문용어를 추출한다. 또한, 전문용어의 어절 패턴을 이용하여 후보 전문 용어를 추출한 후, 전문용어를 구성할 수 있는 단어의 위치정보를 이용하여 전문용어를 추출하는 방법을 제안한다. 기존 전문용어 사전에 없는 단어에 대해서는 시소러스를 이용하여 유사 단어의 위치정보를 이용하는 방법을 이용하였다.

  • PDF

Knowledge Representation of Concept Word Using Cognitive Information in Dictionary (사전에 나타난 인지정보를 이용한 단어 개념의 지식표현)

  • Yun, Duck-Han;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.118-125
    • /
    • 2004
  • 인간의 언어지식은 다양한 개념 관계를 가지며 서로 망(network)의 모습으로 연결되어 있다. 인간의 언어지식의 산물 중에서 가장 체계적이며 구조적으로 언어의 모습을 드러내고 있는 결과물이 사전이라고 할 수 있다. 본 논문에서는 이러한 사전 뜻풀이 말에서 개념 어휘와 자동적인 지식획득을 통하여 의미 정보를 구조적으로 추출한다. 이러한 의미 정보가 추출되면서 동시에 자동적으로 개념 어휘의 의미 참조 모형이 구축된다. 이러한 것은 사전이 표제어 리스트와 표제어를 기술하는 뜻풀이말로 이루어진 구조의 특성상 가능하다. 먼저 172,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미 정보를 추출하는데, 의미분별이 처리 된 결과물을 대상으로 하기 때문에 의미 중의성은 고려하지 않아도 된다. 추출된 의미 정보를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(Ml)을 이용하여 개념 어휘와 의미 정보간에 연관도를 측정한 후, 개념 어휘간의 유사도(SMC)를 구하여 지식표현의 하나로 연관망을 구축한다.

  • PDF

Implementation of the Game Terminology Electronics Dictionary (게임전문용어전자사전 구현에 관한 연구)

  • Im, Choong-Jae;Yun, Tae-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.355-358
    • /
    • 2002
  • 세계는 지식정보의 창출 및 활용정도가 국가경쟁력을 좌우하는 지식기반사회로 급격히 전환하고 있다. 이러한 상황에서 주요 지식정보의 집중적인 디지털화를 통해서 국가 지식정보 공유체계를 구축하는 것이 무엇보다 시급한 상황이다. 특히 급격하게 성장하고 있는 디지털 콘텐츠 분야의 체계적인 정보화 사업은 관련 분야의 선진국과 경쟁하기 위해서 절실하게 요구된다. 본 논문은 게임산업에 대한 체계적인 정보화를 추진하기 위해서 의미를 기반으로 한 게임전문용어전자사전 구축을 위한 연구 결과를 소개한다. 의미를 기반으로 한 게임전문용어전자사전 구축하기 위해서 다양한 형태의 게임 관련 자료를 통해서 망뭉치를 추출하였다. 추출한 망뭉치로부터 빈도수 등을 이용해서 중요한 의미를 갖는 표제어를 추출하였으며, 추출한 표제어를 이용해서 게임전문용어 시소러스를 구축하였다. 또한 웹 기반으로 게임전문용어전자사전을 구축하기 위해서 SDML 을 이용하여 전문용어를 표기했으며 다양한 검색 기능을 추가해서 게임전문용어전자사전의 프로토타입 시스템을 구축하였다.

  • PDF