• 제목/요약/키워드: character based search

검색결과 80건 처리시간 0.04초

Character based Hangeul search using Location-specific Character Frequency

  • Lee, Jung-Hwa;Lee, Jong-Min;Kim, Seong-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.345-350
    • /
    • 2009
  • Hangul search functionality, including dictionary search is used in many Hangeul applications. Existing research of hangeul search method is the study of using hangeul syllable as a basic unit. However when you consider the characteristics of Hangul, the research of using hangeul character as a basic unit is needed. In this paper we propose the character based hangeul search method using the location-specific frequency information and verify the effectiveness of the proposed method through the experiments.

온톨로지 매핑 기반 엔지니어링 정보 검색 (Engineering Information Search based on Ontology Mapping)

  • 정민;서효원
    • 한국정밀공학회지
    • /
    • 제23권5호
    • /
    • pp.30-36
    • /
    • 2006
  • The participants in collaborative environment want to get the right information or documents which are intended to find. In general search systems, documents which contain only the keywords are retrieved. For searching different word-expressions for the same meaning, we perform mapping before searching. Our mapping-based search approach has two parts, ontology-based mapping logic and ontology libraries. The ontology-based mapping consists of three steps such as character matching (CM), definition comparing (DC) and similarity checking (SC). First, the character matching is the mapping of two terminologies that have identical character strings. Second, the definition comparing is the method that compares two terminologies' ontological definitions. Third, the similarity checking pairs two terminologies which were not mapped by two prior steps through evaluating the similarity of the ontological definitions. For the ontology libraries, document ontology library (DOL), keyword ontology library (KOL), and mapping result library (MRL) are defined. With these three libraries and three mapping steps, an ontology-based search engine (OntSE) is built, and a use case scenario is discussed to show the applicability.

한글 글자 단위 인덱스를 위한 검색 유형 정의 및 한글 부호계와의 연관성에 관한 연구 (A Study of the framework of search patterns for Hangul characters and its relationship with Hangout code for Hangeul Character based Index)

  • 이중화;이종민;김성우
    • 한국정보통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.1083-1088
    • /
    • 2007
  • 본 논문에서는 한글 인덱스를 구현할 때 글자 단위를 기본으로 하는 경우 적용될 수 있는 검색 유형 (search pattern) 들은 어떠한 것들이 존재할 수 있는지에 대해 살펴보고, 검색 알고리즘에 적용시켜 본다. 이때 부호계와의 연관성과 효율성을 따져보기 위해서 KS X 1001의 두 바이트 조합형과 두 바이트 완성형, 그리고 유니코드 3.0의 조합형 부호계와 완성형 부호계 등 여러가지 부호계를 사용할 때에 대해 기본 검색 알고리즘을 적용해 본다.

정보 시스템의 유니코드 기반 한자 검색 지원 (Support on Ideograph Characters Search of Unicode Based Information System)

  • 윤소영
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.375-391
    • /
    • 2007
  • 현재 유니코드 CJK 한자코드는 부수 기준 배열방식을 따르고 있어 한자의 한글음가를 기준으로 하는 우리의 문자생활 방식과 차이가 있으며, 우리나라 고유한자나 동형이음어, 이두문자, 그리고 이체자 관계 등을 모두 수록하고 있지 않아 정보시스템에 그대로 적용하기에는 무리가 있다. 따라서 유니코드 기반 정보시스템의 정확한 한자표현 및 한자검색을 위해서는 한자를 포함하는 자료에 대한 정확한 이해를 바탕으로 여러 가지 지원방안을 마련해야 한다. 이러한 측면에서 역사분야 정보검색시스템에서는 한글음가 및 한국에서만 사용되는 동형이음어 처리를 위한 한자-한글음가 사전, 본래 한자의 음가와 다르게 읽히는 한자를 위한 특수용어사전, 이형자와이체자를 위한 이체자사전, 그리고 유니코드 CJK 통합한자에 등록되어 있지 않은 한자를 위한 신출 한자목록을 지원하고 있다.

미디어 작품 캐릭터 가치 측정 연구: 네트워크 중심성 척도와 검색 데이터를 활용하여 (A Study on the Estimation of Character Value in Media Works: Based on Network Centralities and Web-Search Data)

  • 조성현;이민형;최한별;이희석
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.1-26
    • /
    • 2021
  • 무형자산의 가치에 대한 중요성이 대두되면서 이를 측정하는 것에 관한 다양한 연구가 진행되었다. 그러나 미디어 산업의 빠른 성장에도 불구하고 해당 산업 내 캐릭터 가치를 정량적으로 평가하는 데 많은 어려움이 존재한다. 최근에는 소셜 네트워크 분석 (Social Network Analysis) 방법론이 미디어 사용자의 행태를 분석하는 데 유용하게 활용되고 있다. 본 연구는 SNS 데이터를 통하여 미디어 작품의 캐릭터 네트워크 특징과 인간의 검색 행위 사이의 상관 관계를 분석하였다. 분석 결과 미디어 작품의 캐릭터 네트워크 중심성 척도와 검색 데이터 간 유의미한 상관 관계 및 인과성이 확인되었다. 본 연구 결과는 캐릭터 네트워크가 캐릭터 자산의 가치평가를 위한 단서로서 활용될 수 있음을 시사한다.

온톨로지 매핑 기반 엔지니어링 정보 검색 (Engineering Information Search based on Ontology Mapping)

  • 정민;서효원
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2006년도 춘계학술대회 논문집
    • /
    • pp.617-618
    • /
    • 2006
  • The participants in collaborative environment want to get the right documents which are intended to find. In general search system, it searches documents which contain only the keywords. For searching different word-expressions for the same meaning, we perform mapping before searching. Our mapping logic consists of three steps. First, the character matching is the mapping of two terminologies that have identical character strings. Second, the definition comparing is the method that compares two terminologies' definitions. Third, the similarity checking pairs terminologies which were not mapped by two prior steps. In this paper, we propose Engineering Information Search System based on ontology mapping.

  • PDF

미디어 편집을 위한 인물 식별 및 검색 기법 (Character Recognition and Search for Media Editing)

  • 박용석;김현식
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.519-526
    • /
    • 2022
  • 동영상 콘텐츠 편집 시 등장인물을 구분하고 식별하는 작업은 많은 시간과 노력이 요구되는 작업이다. 노동 집약적 특성이 있는 미디어 편집 작업 시 인공지능 기술을 활용하면 미디어 제작 시간을 획기적으로 줄일 수 있어 창작과정의 효율성 향상에 도움을 줄 수 있다. 본 논문에서는 동영상 편집을 위한 인물 식별 및 검색 작업을 자동화하기 위해 다수의 인공지능 기술을 혼합하여 활용하는 기법을 제안한다. 객체 검출, 얼굴 검출, 자세 예측 기법을 사용하여 인물 객체에 대한 특징 정보를 수집하고, 수집된 정보를 바탕으로 얼굴 인식, 색 공간 분석 기법 등을 활용하여 인물 객체 식별 정보를 생성한다. 인물 특징 및 식별 정보는 편집 대상 영상의 각 프레임에 대해서 수집되며 영상 편집을 위한 프레임 단위 검색을 위한 메타데이터로 사용된다.

한글 인쇄체 문자의 형식 분류 및 비선형적 자소 분리에 관한 연구 (A Study on Korean Printed Character Type Classification And Nonlinear Grapheme Segmentation)

  • 박용민;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.784-787
    • /
    • 2006
  • 본 논문에서는 한글 인쇄체 문자의 자소를 비선형적으로 분리하는 방법을 제안한다. 자소 분리 대상 문자는 자소의 조합 방식에 따라 6개의 형식으로 분류한다. 인쇄체 한글의 6형식 분류를 위해 그레이 레벨의 문자 이미지로부터 망 특성과 수직 수평 투영 기법을 이용해 특징을 추출하고, 오류 역전파 기법을 이용하여 분류를 시도한다. 분류된 문자 형식을 기반으로 분리 후보 영역을 지정하고, 이 영역을 기반으로 다단식 그래프 탐색 알고리즘을 이용하여 최적의 비선형적 자소 분리 경로를 찾아낸다. 실험 결과, 제안한 방법은 한글의 6형식 분류에 적합하였으며, 자소가 서로 붙어 선형적으로 분리가 어려운 문자의 자소 분리에 좋은 성능을 나타내었다.

  • PDF

자연영상에서 적응적 문자-에지 맵을 이용한 텍스트 영역 검출 (Text Region Detection using Adaptive Character-Edge Map From Natural Image)

  • 박종천;황동국;전병민
    • 한국산학기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.1135-1140
    • /
    • 2007
  • 본 논문은 자연영상에서 문자의 크기와 방향에 무관한 적응적 문자-에지 맵을 이용한 에지-기반 텍스트 영역검출 알고리즘을 제안한다. 첫 번째로, 에지 이미지로부터 에지 레이블을 얻고, 레이블 이미지로부터 문자를 찾기 위해 배열문법을 이용하여 적응적 문자-에지 맵을 적용한다. 선택된 레이블은 이웃 레이블과의 거리를 기준으로 클러스터 된다. 그 결과 텍스트 후보 영역이 얻어진다. 최종적으로, 텍스트 후보 영역은 경험적 규칙과 텍스트 영역에 대한 수평/수직 프로파일을 분석함으로서 검증된다. 실험결과 제안한 알고리즘은 다양한 문자의 크기 변화, 문자열의 방향, 그리고 복잡한 배경에서도 강인한 텍스트 영역 검출 결과를 보였다.

  • PDF

컨볼루셔널 뉴럴 네트워크를 이용한 주인공 식별 기반의 영상장면 탐색 기법 (A scene search method based on principal character identification using convolutional neural network)

  • 권명규;양형식
    • 융합정보논문지
    • /
    • 제7권2호
    • /
    • pp.31-36
    • /
    • 2017
  • 본 논문은 대량의 영상에서 특정 출연자가 나오는 영상부분을 탐색하여 재생하고자 한다. TV영상 프로그램에서 주인공이나 특정 장면을 탐색 하려면 영상을 플레이하거나 코너를 설정하여 시청한다. 기존 방식은 장면 탐색이나 코너별 시청시 수동으로 offset값을 설정 하여야만 한다. 그러나 본 논문에서 제안하는 방식은 주인공 얼굴을 학습 시킨후 영상인식으로 주인공을 찾고 주인공이 등장하는 장면으로 이동하여 영상을 재생 하게 된다. 특정 출연자에 대한 데이터는 크롤링 기법을 활용하여 추출 및 수집한다. 수집된 데이터를 기반으로 컨볼루셔널 뉴럴 네트워크 알고리즘을 사용하여 학습하고 이를 이용하여 성능 평가를 진행한다. 성능 평가는 드라마를 재생하면서 추출된 키 프레임에서 학습 된 특정 출연자를 추출, 판단하는 방법으로 정확도를 측정한다. 학습된 장면을 얼마나 빨리 그리고 정확하게 탐색 하는지 성능 확인결과 약 93%의 정확도를 확보하였다. 도출된 성능을 기반으로 특정 장면만을 시청하는 코너별 시청, 인물 탐색 및 상세정보 retrieval 등 영상서비스에 응용 하고자 한다.