• Title/Summary/Keyword: 부분매칭

Search Result 239, Processing Time 0.074 seconds

A Transliteration Model based on the Seq2seq Learning and Methods for Phonetically-Aware Partial Match for Transliterated Terms in Korean (문장대문장 학습을 이용한 음차변환 모델과 한글 음차변환어의 발음 유사도 기반 부분매칭 방법론)

  • Park, Joohee;Park, Wonjun;Seo, Heecheol
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.443-448
    • /
    • 2018
  • 웹검색 결과의 품질 향상을 위해서는 질의의 정확한 매칭 뿐만이 아니라, 서로 같은 대상을 지칭하는 한글 문자열과 영문 문자열(예: 네이버-naver)의 매칭과 같은 유연한 매칭 또한 중요하다. 본 논문에서는 문장대문장 학습을 통해 영문 문자열을 한글 문자열로 음차변환하는 방법론을 제시한다. 또한 음차변환 결과로 얻어진 한글 문자열을 동일 영문 문자열의 다양한 음차변환 결과와 매칭시킬 수 있는 발음 유사성 기반 부분 매칭 방법론을 제시하고, 위키피디아의 리다이렉트 키워드를 활용하여 이들의 성능을 정량적으로 평가하였다. 이를 통해 본 논문은 문장대문장 학습 기반의 음차 변환 결과가 복잡한 문맥을 고려할 수 있으며, Damerau-Levenshtein 거리의 계산에 자모 유사도를 활용하여 기존에 비해 효과적으로 한글 키워드들 간의 부분매칭이 가능함을 보였다.

  • PDF

The Optimization for Partial Denoising Boundary Image Matching (부분 노이즈 제거 윤곽선 이미지 매칭의 성능 최적화)

  • Kim, Bum-Soo;Lee, Sanghun;Moon, Yang-Sae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.729-732
    • /
    • 2014
  • 본 논문에서는 부분 노이즈 제거를 지원하는 윤곽선 이미지 매칭의 성능 최적화 문제를 다룬다. 윤곽선 이미지 매칭에서 이미지의 노이즈를 제거하는 것은 직관적이고 정확한 매칭을 위해 매우 중요한 요소이다. 그러나, 윤곽선 이미지 매칭에서 부분 노이즈 제거를 지원하기 위해서는 매우 많은 계산이 빈번하게 발생한다. 본 논문에서는 기존 부분 노이즈 제거 윤곽선 이미지 매칭 연구를 좀 더 구체화하여 성능 향상을 위해 유사 거리의 하한을 제안한다. 실험 결과, 부분 노이즈 제거 윤곽선 이미지 매칭 성능을 수 배에서 수십 배까지 향상시킨 것으로 나타났다.

A Map Matching Method Based on Subgraph Matching of the Driving Road Semantic Information (주행로 의미정보간 부분그래프 매칭에 기반한 맵매칭 방법)

  • Yim, Whee-Jae;Park, Jin-Bae;Yoon, Tae-Sung
    • Proceedings of the KIEE Conference
    • /
    • 2015.07a
    • /
    • pp.1387-1388
    • /
    • 2015
  • 본 논문은 주어진 두 주행로 의미정보간 부분그래프 매칭(subgraph matching)을 이용한 맵매칭 방법을 제안한다. 지도 주행로의 의미정보를 선택하여 그래프로 재구성하는 방법을 제시하고 재구성된 지도 그래프에서 부분그래프 매칭을 통한 두 지도간 맵매칭 방법을 제안한다. 실제 지도를 이용한 모의실험을 통해 제안한 방법을 검증한다.

  • PDF

Partial Denoising Boundary Image Matching Based on Time-Series Data (시계열 데이터 기반의 부분 노이즈 제거 윤곽선 이미지 매칭)

  • Kim, Bum-Soo;Lee, Sanghoon;Moon, Yang-Sae
    • Journal of KIISE
    • /
    • v.41 no.11
    • /
    • pp.943-957
    • /
    • 2014
  • Removing noise, called denoising, is an essential factor for the more intuitive and more accurate results in boundary image matching. This paper deals with a partial denoising problem that tries to allow a limited amount of partial noise embedded in boundary images. To solve this problem, we first define partial denoising time-series which can be generated from an original image time-series by removing a variety of partial noises and propose an efficient mechanism that quickly obtains those partial denoising time-series in the time-series domain rather than the image domain. We next present the partial denoising distance, which is the minimum distance from a query time-series to all possible partial denoising time-series generated from a data time-series, and we use this partial denoising distance as a similarity measure in boundary image matching. Using the partial denoising distance, however, incurs a severe computational overhead since there are a large number of partial denoising time-series to be considered. To solve this problem, we derive a tight lower bound for the partial denoising distance and formally prove its correctness. We also propose range and k-NN search algorithms exploiting the partial denoising distance in boundary image matching. Through extensive experiments, we finally show that our lower bound-based approach improves search performance by up to an order of magnitude in partial denoising-based boundary image matching.

The partial matching method for effective recognizing HLA entities (효과적인 HLA개체인식을 위한 부분매칭기법)

  • Chae, Jeong-Min;Jung, Young-Hee;Lee, Tae-Min;Chae, Ji-Eun;Oh, Heung-Bum;Jung, Soon-Young
    • The Journal of Korean Association of Computer Education
    • /
    • v.14 no.2
    • /
    • pp.83-94
    • /
    • 2011
  • In the biomedical domain, the longest matching method is frequently used for recognizing named entity written in the literature. This method uses a dictionary as a resource for named entity recognition. If there exist appropriated dictionary about target domain, the longest matching method has the advantage of being able to recognize the entities of target domain quickly and exactly. However, the longest matching method is difficult to recognize the enumerated named entities, because these entities are frequently expressed as being omitted some words. In order to resolve this problem, we propose the partial matching method using a dictionary. The proposed method makes several candidate entities on the assumption that the ellipses may be included. After that, the method selects the most valid one among candidate entities through the optimization algorithm. We tested the longest and partial matching method about HLA entities: HLA gene, antigen, and allele entities, which are frequently enumerated among biomedical entities. As preparing for named entity recognition, we built two new resource, extended dictionary and tag-based dictionary about HLA entities. And later, we performed the longest and partial matching method using each dictionary. According to our experiment result, the longest matching method was effective in recognizing HLA antigen entities, in which the ellipses are rare, and the partial matching method was effective in recognizing HLA gene and allele entities, in which the ellipses are frequent. Especially, the partial matching method had a high F-score 95.59% about HLA alleles.

  • PDF

Test for robustness of matching engine designed for query-by-singing/humming (쿼리-바이-싱잉/허밍 시스템의 매칭 엔진의 강인성 테스트)

  • Jang, Dalwon;Jang, Sei-Jin;Lee, Seok-Pil
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.257-259
    • /
    • 2012
  • 이 논문에서는 실험을 통해서, 기존에 제안하였던 쿼리-바이-싱잉/허밍 (Query-by-singing/humming, QbSH) 시스템의 매칭 엔진의 강인성을 검증하고 그 결과를 제시한다. QbSH 시스템은 디지털 음악의 사용이 보편화되면서 음악 검색의 방법으로 많은 연구가 진행되어 오고 있다. QbSH 시스템은 입력으로부터 멜로디의 특징을 추출하는 부분과 추출된 특징을 매칭하는 부분으로 나눌 수 있는데, 매칭 단계에서 특징이 추출된 두 개의 멜로디 사이의 유사도 또는 거리를 계산하여 가장 유사한 멜로디를 데이터베이스에서 찾게 된다. 이 논문에서는 이 중, 기존에 제안하였던 매칭 엔진 부분의 강인성을 알아보기 위해서 입력으로부터 멜로디의 피치 시퀀스를 추출하는 과정을 간략히 하여 그 결과를 살펴보았다. 즉, 기존에 제안한 매칭 엔진이 특정한 피치 시퀀스 추출 과정에서만 좋은 성능을 보이는 게 아님을 실험을 통해서 살펴보았다. 실험 결과, 피치 시퀀스를 추출하는 과정이 극도로 간략해지더라도, 매칭 엔진을 좋은 성능을 보여주었다.

  • PDF

Potential Similarity Measuring For Partial Image Matching (부분 영상 매칭을 위한 잠재적 유사성 측정 기법)

  • 유채곤;이성환;최영수;김진용;황치정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.491-493
    • /
    • 1999
  • 본 논문에서는 부분 영상 매칭을 위한 잠재적 유사성 측정 기법을 제안한다. 영상 매칭은 영상 DB 검색이나 컴퓨터 비전 분야에서 매우 중요한 기법이지만 아직까지는 적용되는 영상의 분야가 한정되어 있는 것이 현실이다. 영상 DB 검색의 경우 찾고자 하는 영상내의 물체를 정확하게 알고 있을 경우도 있지만, 영상의 일부분이나 원하는 영상과 원하지 않는 영상이 섞여 있는 것을 기준으로 영상을 검색할 경우도 발생한다. 본 논문에서는 두 개의 영상을 매칭할 경우, 각 영상에서 유사한 부분이 존재하는지 여부를 판별할 수 있는 잠재적 유사성, 측정 알고리즘을 제안한다. 제안된 방법은 영상이 부분 정보를 사용하며, 회전, 배경에 불변적이고, 영상 분할을 필요로 하지 않고, 잡음에 강하다. 제안된 방법에서는 매칭 속도를 높이기 위하여, 유사성을 계산하기 전에 영상 농도치 변이 계수를 사용하여 사전 필터링을 시도한다.

  • PDF

Index-based Boundary Matching Supporting Partial Denoising for Large Image Databases

  • Kim, Bum-Soo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.24 no.10
    • /
    • pp.91-99
    • /
    • 2019
  • In this paper, we propose partial denoising boundary matching based on an index for faster matching in very large image databases. Attempts have recently been made to convert boundary images to time-series with the objective of solving the partial denoising problem in boundary matching. In this paper, we deal with the disk I/O overhead problem of boundary matching to support partial denoising in a large image database. Although the solution to the problem superficially appears trivial as it only applies indexing techniques to boundary matching, it is not trivial since multiple indexes are required for every possible denoising parameters. Our solution is an efficient index-based approach to partial denoising using $R^*-tree$ in boundary matching. The results of experiments conducted show that our index-based matching methods improve search performance by orders of magnitude.

Design and Implemantation of Information Retrieval System based on Semantic Information (의미정보기반 검색시스템의 설계 및 구현)

  • Park, Chang-Keun;Yang, Gi-Chul
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2004.11a
    • /
    • pp.265-268
    • /
    • 2004
  • Keyword matching technique which is used in most information retrieval systems is unfit for efficient processing of geometrically increasing information. The problem can be solved by using semantic information and an efficient method of semantic processing is introduced in this paper. The technique uses conceptual graph to represent the semantic information and apply it for information retrieval. The implemented system can perform exact matching and partial matching. Partial matching has two different types. One is syntactic partial matching and the other is semantic partial matching. The semantic semilaries are measured by the subclass relations in the ontology. The introduced technique can be used not only information retrieval but also in various applications such as an implementation of dynamic hyperlinks.

  • PDF

Pattern matching Using Correlation In Fourier Domain (푸리에영역에서의 상관을 이용한 패턴매칭)

  • 이충호;이원경;김응규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.499-501
    • /
    • 2002
  • 본 논문은 푸리에영역에서 상관을 계산하기 위한 합성화상을 이용하여 에러가 포함된 화상의 패턴매칭 및 검증에 유효한 새로운 패턴매칭 알고리즘을 제안한다. 두개의 화상을 푸리에변환하여 합성화상을 계산하면 원화상의 중요한 성질은 푸리에영역에서 만들어진 합성화상의 중심부분에 집중된다는 데 착안하여 푸리에공간에 나타난 화상의 중심부분만을 추출하여 비교함으로써 화상의 동일여부에 관한 검증이 보다 단순하게 이루어질 수 있음을 보인다. 또한 원화상에 잡음이 포함된 경우에 푸리에변환의 공간에서 잡음이 중심 부분에서 먼 곳에 분포되는 것에 착안하여 잡음이 포함된 화상과 원화상의 매칭에도 유효함을 보인다. 실험을 통하여 10개의 표준화상과 가우시안잡음이 첨가된 화상을 사용하여 화상을 구분해 내고, 잡음이 있는 화상은 동일한 화상으로 인식함을 보인다. 실험결과는 합성화상의 중심부분에 존재하는 전체의 0.5%의 화소만을 비교함으로써 패턴인식이 가능함을 보여준다.

  • PDF