• 제목/요약/키워드: hangeul search

검색결과 8건 처리시간 0.018초

Character based Hangeul search using Location-specific Character Frequency

  • Lee, Jung-Hwa;Lee, Jong-Min;Kim, Seong-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.345-350
    • /
    • 2009
  • Hangul search functionality, including dictionary search is used in many Hangeul applications. Existing research of hangeul search method is the study of using hangeul syllable as a basic unit. However when you consider the characteristics of Hangul, the research of using hangeul character as a basic unit is needed. In this paper we propose the character based hangeul search method using the location-specific frequency information and verify the effectiveness of the proposed method through the experiments.

한글 글자 단위 인덱스를 위한 검색 유형 정의 및 한글 부호계와의 연관성에 관한 연구 (A Study of the framework of search patterns for Hangul characters and its relationship with Hangout code for Hangeul Character based Index)

  • 이중화;이종민;김성우
    • 한국정보통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.1083-1088
    • /
    • 2007
  • 본 논문에서는 한글 인덱스를 구현할 때 글자 단위를 기본으로 하는 경우 적용될 수 있는 검색 유형 (search pattern) 들은 어떠한 것들이 존재할 수 있는지에 대해 살펴보고, 검색 알고리즘에 적용시켜 본다. 이때 부호계와의 연관성과 효율성을 따져보기 위해서 KS X 1001의 두 바이트 조합형과 두 바이트 완성형, 그리고 유니코드 3.0의 조합형 부호계와 완성형 부호계 등 여러가지 부호계를 사용할 때에 대해 기본 검색 알고리즘을 적용해 본다.

데이터베이스에서 한글 글자 단위 검색 기능 설계 및 구현 (The design and implementation of the search function of hangeul characters in database.)

  • 이호진;이중화
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.570-573
    • /
    • 2007
  • 본 논문에서는 한글의 글자 단위 검색 기능 구현에 있어서 한글의 빈도수 정보를 이용하여 보다 효율적으로 검색할 수 있는 방안을 제시한다. 또한 본 논문에서 제시하는 알고리즘을 적용하여 데이터베이스에서 한글 글자 단위 검색이 가능하도록 검색 기능을 구현하였다.

  • PDF

Dynamic Hashing Algorithm for Retrieval Using Hangeul Name on Navigation System

  • Lee, Jung-Hwa
    • Journal of information and communication convergence engineering
    • /
    • 제9권3호
    • /
    • pp.282-286
    • /
    • 2011
  • Recently, a name retrieval function is widely used on navigation systems. In this paper, we propose the new dynamic hashing algorithm for a name retrieval function on it. The proposed dynamic hashing algorithm by constructing an index using the variance information of character is the better than existing methods in terms of storage capacity and retrieval speed. The algorithm proposed in this paper can be useful on systems that have limited resources as well as navigation systems.

상태공간탐색을 이용한 한글패턴 인식방법 (A Recognition Method of HANGEUL Pattern Using a State Space Search)

  • 김상진;이병래;박규태
    • 한국통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.267-277
    • /
    • 1990
  • 이 논문에서는 인공지능의 기본적인 문제풀이 기법인 상태공간 탐색을 이용하여 한글을 구성하는 기본자소를 분리하여 인식하는 방법을 제안하였다. 자소분리와 인식과정을 보다 밀접하게 결합하기 위하여 문제를 상태공간에 표현하고, 이 공간을 탐색하여 풀이하였다. 그리고 탐색효율을 향상시키기 위하여 한글의 조합규칙에 입각한 구조정보와 매트릭스 평면에서 각 자소가 갖는 위치정보를 이용하였으며, 컴퓨터실험을 통하여 그 유용성을 확인하였다.

  • PDF

주요 개발도상국의 국가도서관에 있어 한국관련 목록레코드 비교 분석 - 유럽 및 남미지역 12개국을 중심으로 - (Comparative Analysis of Cataloging Record Related to Korea in the National Libraries of the Main Developing Countries - Focused on 12 Europe and South America Countries -)

  • 김정현
    • 한국도서관정보학회지
    • /
    • 제47권2호
    • /
    • pp.1-25
    • /
    • 2016
  • 이 연구는 유럽 및 남미지역 주요 12개 개발도상국가의 국가도서관 목록레코드에 나타나고 있는 한국관련 레코드의 주제영역별 현황과 특성, 주제명표목 등을 중심으로 비교 분석한 것이다. 연구결과를 요약하면 아래와 같다. 첫째, 대부분의 국가도서관에 소장되어 있는 한국관련 자료가 절대적으로 부족하며, 해당 국가도서관 자료의 0.01%도 되지 않는다. 둘째, 대부분의 국가도서관이 한국어 자료를 로마자로 번자하여 표기하고 있으며, 아르메니아 국가도서관을 제외하고 한국어 자료에 대해 원어를 표기하지 않으며, 한국어 검색이 불가능 하다. 셋째, 한국관련 레코드는 대개 사회과학과 역사 지리 분야가 50~70%의 비중을 차지하고 있으며, 세부항목별 주제 분포에서는 '역사', '정치', '경제'가 상대적으로 높은 비중을 차지하고 있다. 넷째, 한국관련 주제명 가운데 태권도는 대부분이 가라데와 구분하고 있지만 아르헨티나의 경우 태권도를 가라데로 인식하고 있다. 독도는 8개 국가도서관이 한국이라는 지리 한정어와 함께 표기하고 있으며, 동해는 7개 국가도서관이 일본해로 표기하고 있다. 압록강, 두만강, 백두산 관련 레코드는 거의 검색되지 않았다.

주요 개발도상국의 국가도서관에 있어 한국관련 목록레코드 비교 분석 - 아시아 및 아프리카지역 10개국을 중심으로 - (A Comparative Analysis of Cataloging Records Related to Korea in the National Libraries of the Major Developing Countries: Focused on 10 Asian and African Countries)

  • 김정현
    • 한국문헌정보학회지
    • /
    • 제52권1호
    • /
    • pp.65-86
    • /
    • 2018
  • 이 연구는 아시아 및 아프리카지역 주요 10개 개발도상국가의 국가도서관 목록레코드에 나타나고 있는 한국관련 레코드의 주제영역별 현황과 특성, 주제명표목 등을 중심으로 비교 분석한 것이다. 연구결과를 요약하면 아래와 같다. 첫째, 대부분의 국가도서관에 소장되어 있는 한국관련 자료가 절대적으로 부족하며, 해당 국가도서관 자료의 0.1%도 되지 않는다. 베트남 국가도서관을 제외하고 모두 3,000권 미만으로 나타났으며, 일본관련 자료는 한국관련 자료에 비해 대체로 2배 이상 높게 나타났다. 둘째, 이란과 베트남 국가도서관을 제외하고 대부분의 국가도서관이 한국어 자료를 로마자로 번자 표기하고 있으며, 한국어 자료에 대해 원어 표기를 하지 않아 한국어 검색이 불가능하다. 셋째, 한국관련 레코드는 대체로 사회과학과 역사 지리 분야가 55~75%의 비중을 차지하고 있으며, 세부항목별 주제 분포에서는 '역사'와 '경제'가 상대적으로 높은 비중을 차지하고 있다. 넷째, 한국관련 주제명 가운데 태권도는 대부분이 가라데와 구분하고 있지만 4개 국가도서관에서는 태권도를 가라데로 인식하고 있다. 독도는 7개 국가도서관이 한국이라는 지리 한정어와 함께 표기하고 있으며, 동해는 7개 국가도서관이 일본해로 표기하고 있다. 압록강, 두만강, 백두산 관련 레코드는 거의 검색되지 않았다.

아태지역 주요 대학도서관의 한국관련 목록레코드 비교 분석 (A Comparative Analysis of Cataloging Records Related to Korea in the Major Asia-Pacific University Libraries)

  • 김정현
    • 한국도서관정보학회지
    • /
    • 제46권3호
    • /
    • pp.301-323
    • /
    • 2015
  • 이 연구는 아태지역 주요 10개 대학도서관의 목록레코드에 나타나고 있는 한국관련 레코드의 특성을 분석하기 위해 한국관련 레코드의 주제영역별 현황과 특성, 주제명표목 등을 중심으로 그 특성을 비교 분석한 것이다. 연구결과를 요약하면 다음과 같다. 첫째, 대부분의 대학도서관에 저장되어 있는 한국관련 레코드가 절대적으로 부족하다. 하버드대학도서관을 비롯하여 5개관이 5,000건을 상회하고 있는 반면, 국립 칠레대학도서관은 1,000건 미만으로 나타났다. 또한 일본관련 레코드와 비교하면 대부분의 대학도서관이 한국관련 자료에 비해 2배가량 높게 나타나고 있으며, 특히 상파울루와 베이징대학도서관은 6배 이상 높게 나타났다. 둘째, 대개 UNIMARC 보다는 MARC 21 형식으로 레코드를 구조화하고 있으며, 해당 국가도서관의 주제명표목표를 적용하거나 LCSH를 함께 병행하고 있다. 셋째, 한국어 자료는 대체로 로마자로 번자 표기하고 있으나, 한국어 원어를 함께 표기하고 한글 검색이 가능한 도서관은 5개관이었다. 넷째. 한국관련 레코드는 대체로 사회과학과 역사 지리 분야가 70% 내외의 비중을 차지하고 있으며, 세부항목별 주제 분포에서는 '역사', '경제', '정치'가 대체로 높은 비중을 차지하고 있다. 다섯째, 한국관련 주제명 가운데 태권도, 김치, 동해, 황해, 독도, 두만강, 압록강, 백두산 등을 분석한 결과, 도서관마다 미묘한 차이점이 드러나고 있지만 우리의 주변 국가인 베이징과 도쿄대학도서관을 제외하고는 대부분 미국의회도서관의 주제명표기와 거의 일치하고 있다. 반면 상파울루, 칠레, 멕시코, 델리대학도서관 등에서는 이와 관련된 레코드가 거의 검색되지 않았다.