• Title/Summary/Keyword: search similarity

Search Result 535, Processing Time 0.023 seconds

Genomic Organization of ancop Gene for ${\alpha}-COP$ Homolog from Aspergillus nidulans

  • Lee, Hwan-Hee;Chae, Shun-Kee;Kim, Jeong-Yoon;Maeng, Pil-Jae;Park, Hee-Moon
    • Mycobiology
    • /
    • v.28 no.4
    • /
    • pp.171-176
    • /
    • 2000
  • We have cloned a ${\alpha}-COP$ homolog, ancop, from Aspergillus nidulans by colony hybridization of chromosome specific library using ${\alpha}-COP$ homologous fragment as a probe. The probe DNA was amplified with degenerated primers designed by comparison of conserved region of the amino acid sequences of Saccharomyces cerevisiae ${\alpha}-COP$, Homo sapiens HEP-COP, and Drosophila melanogaster ${\alpha}-COP$. Full length cDNA clone was also amplified by RT-PCR. Comparison of genomic DNA sequence with cDNA sequence obtained by RT-PCR revealed 7 introns. Amino acid sequence similarity search of the anCop with other ${\alpha}-COPs$ gave an overall identity of 52% with S. cerevisiae, 47% with human and bovine, 45% with Drosophila and Arabidopsis. In upstream region from the transcription start site, a putative TATA and CAAT motif were also identified.

  • PDF

Survey on Top-k Related Pair Search Method Using Cosine Similarity (코사인 유사도 기법을 이용한 top-k 관련쌍 검색 방법 조사)

  • Kim, Sungchul;Kim, Jeong-Hwan;Kim, Na-Yeong;Kim, Taehoon;Yu, Hwanjo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.808-809
    • /
    • 2017
  • 유사도 검색은 전통적으로 데이터베이스 그리고 웹검색 분야의 핵심이었으나, 대용량 데이터의 등장으로 검색의 정확도뿐만이 아니라 효율성 측면에서의 요구가 증가하며 여전히 다양한 분야에서 활발히 연구되고 있다. 아이템간의 유사도를 측정하기 위한 방법론 중 코사인 유사도 방법론은 고차원공간에서의 활용이 유리하다는 이점 때문에 가장 널리 활용되고 있는 방법론으로, 정보검색, 장바구니 분석, 생물정보학 등 다양한 분야에서 활용되고 있다. 본 논문에서는 코사인 유사도를 소개하고, 연관성 분석 측면에서 코사인 유사도를 사용한 기존의 연구들을 소개한다.

Generating Combined Query Plan for Content-Based Image Retrieval (내용 기반 이미지 검색을 위한 복합 질의문 계획 생성 기법)

  • Park, Mi-Hwa;Eom, Gi-Hyeon
    • Journal of KIISE:Databases
    • /
    • v.27 no.4
    • /
    • pp.562-571
    • /
    • 2000
  • 이미지 데이터는 텍스트 데이터와는 달리 다양한 색상과 모양, 질감과 같은 비정형적인 특징을 가진다. 따라서 이미지 데이터베이스는 텍스트 기반의 전통 데이터베이스와는 다른 모델링 방법과 질의, 검색 방법을 사용한. 특히, 내용 기반 이미지 검색에서의 검색 속도와 정확도를 향상시키기 위해서는 새로운 복합 질의문 계획 생성 기법이 필요하다. 본 논문에서는 이를 위해 먼저, 단일 조건을 갖는 시각 질의에 대한 처리 기법들을 토대로 여러 조건을 갖는 복합 질의를 처리하기 위한 복합 질의문 계획 생성기법인 SSCC(Similarity Search for Conjunction Combination Query) 알고리즘을 제안한다. SSCC는 이미지 데이터베이스 검색 시스템에서 복합 질의를 처리하기 위한 질의 최적화 과정에서 질의 수행 시간과 투플 I/O를 최소화하는 질의문 계획을 생성하기 위해 사용된다. SSCC 알고리즘은 복합질의를 단일 질의들로 준해하고 퍼지 집합 이론을 도입하여 단일 질의의 결과들을 통합한다. 논문에서 연구된 내용 기반 복합 질의문 계획 생성 기법은 특정 이미지 영역에 국한되지 않으며 다양한 종류의 시각 질의를 수행하기 위한 효율적인 질의문 계획 생성 기법으로 사용될 수 있다.

  • PDF

Automatic Prediction of 'Anti-Search Variants' of Twitter based on Word Embeddings and Phonetic Similarity (단어 임베딩과 음성적 유사도를 이용한 트위터 '서치 방지 단어'의 자동 예측)

  • Lee, Sangah
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.190-193
    • /
    • 2017
  • '서치 방지 단어'는 SNS 상에서 사용자들이 작성한 문서의 검색 및 수집을 피하기 위하여 사용하는 변이형을 뜻한다. 하나의 검색 키워드가 있다면 그와 같은 대상을 나타내는 변이형이 여러 형태로 존재할 수 있으며, 이들 변이형에 대한 검색 결과를 함께 수집할 수 있다면 데이터 확보가 중요하게 작용하는 다양한 연구에 큰 도움이 될 것이다. 본 연구에서는 특정 단어가 주어진 키워드로부터 의미 벡터 상의 거리가 가까울수록, 그리고 주어진 키워드와 비슷한 음성적 형태 즉 발음을 가질수록, 해당 키워드의 변이형일 가능성이 높을 것이라고 가정하였다. 이에 따라 단어 임베딩을 이용한 의미 유사도와 최소 편집 거리를 응용한 음성적 유사도를 이용하여 주어진 검색 키워드와 유사한 변이형들을 제안하고자 하였다. 그 결과 구성된 변이형 후보의 목록에는 다양한 형태의 단어들이 포함되었으며, 이들 중 다수가 실제 SNS 상에서 같은 의미로 사용되고 있음이 확인되었다.

  • PDF

Design of Cellular Manufacturing Systems Integrating Automated Guided Vehicles under a Tandem Configuration (Tandem형 AGV 를 통합한 셀형 제조시스템의 설계)

  • 고창성
    • Journal of the Korean Operations Research and Management Science Society
    • /
    • v.23 no.1
    • /
    • pp.17-28
    • /
    • 1998
  • This study suggests a procedure for designing cellular manufacturing systems (CMS) which are combined with automated guided vehicles (AGVs) using a tandem configuration. So far most of the previous studies have dealt with conventional design problems not considering the layout and the characteristics of transporters used in CMS. A mathematical model is developed using the service time to perform material transfers as a suitable meassure. The service capacity of AGVs and space limitations are also reflected in this model. As the model can be shown strongly NP-hard, a heuristic algorithm is presented, in which each cell is temporarily formed using both the set covering model and similarity coefficients, and then locations of the cells are determined by means of tabu search and finally machine perturbations are carried out. An example problem is solved to demonstrate the algorithm developed.

  • PDF

Efficient Image Transmission System Using IFS (IFS를 이용한 고효율 영상전송 시스템)

  • Kim, Sang Hyun
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.15 no.11
    • /
    • pp.6810-6814
    • /
    • 2014
  • The concept of IFS (Iterated Function System) was applied to compress and transmit image data efficiently. To compress the image data with IFS, self-similarity was used to search a similar block. To improve the coding performance for the iterated function system with natural images, the image will be formed of properly transformed parts of itself to minimize the coding error. The simulation results using the proposed IFS represent high PSNR performance and improved compression efficiency with the coefficient of a recursive function.

The Extraction of End-Pixels in Feature Space for Remote Sensing Data and Its Applications

  • YUAN Lu;SUN Wei-dong
    • Proceedings of the KSRS Conference
    • /
    • 2004.10a
    • /
    • pp.136-139
    • /
    • 2004
  • The extraction of 'end-pixels' (i.e. end-members) aims to quantify the abundance of different materials in a single pixel, which becomes popular in the subpixel analysis for hyperspectral dataset. In this paper, we present a new concept called 'End-Pixel of Features (EPF)' to extends the concept of end-pixels for multispectral data and even panchromatic data. The algorithm combines the advantages of previous simplex and clustering methods to search the EPFs in the feature space and reduce the effects of noise. Some experimental results show that, the proposed methodology can be successfully used to hyperspectral data and other remote sensing data.

  • PDF

Design of digital DBNN for pattern recoginition (패턴인식을 위한 디지탈 DBNN의 설계)

  • 송창영;문성룡;김환용
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.21 no.11
    • /
    • pp.3001-3011
    • /
    • 1996
  • In this paper, using DBNN algorithm which is used in the binary pattern classification or speech signal processing the digital DBNN circuit is designed having the variable expansion depending the size of input data and pattern type. The processing elemen(PE) of the proposed network consists of the synapse and MAXNET circuits for the similarity measurement between reference and input pattern. Global MAXNET selects the global winner among the local winners which is selected in each PE. Through the several simultions, and thus each PE and global MAXNET search the reference pattern that was the most simlar to input pattern for the discord of the pattern.

  • PDF

Efficient Processing of Subsequence Searching in Sequence Databases (시퀀스 데이터베이스를 위한 서브시퀀스 탐색의 효율적인 처리)

  • Park, Sang-Hyun;Kim, Sang-Wook;Park, Jeong-Il
    • Journal of Industrial Technology
    • /
    • v.21 no.A
    • /
    • pp.155-166
    • /
    • 2001
  • This paper deals with the subsequence searching problem under time-warping. Our work is motivated by the observation that subsequence searches slow down quadratically as the average length of data sequences increases. To resolve this problem, the Segment-Based Approach for Subsequence Searches (SBASS) is proposed. The SBASS divides data and query sequences into a series of segments, and retrieves all data subsequences. Our segmentation scheme allows segments to have different lengths; thus we employ the time warping distance as a similarity measure for each segment pair. For efficient retrieval of similar subsequences, we extract feature vectors from all data segments exploiting their monotonically changing properties, and build a spatial index using feature vectors. The effectiveness of our approach is verified through extensive experiments.

  • PDF

Interest Point Detection Using Hough Transform and Invariant Patch Feature for Image Retrieval

  • Nishat, Ahmad;An, Young-Eun;Park, Jong-An
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.8 no.1
    • /
    • pp.127-135
    • /
    • 2009
  • This paper presents a new technique for corner shape based object retrieval from a database. The proposed feature matrix consists of values obtained through a neighborhood operation of detected corners. This results in a significant small size feature matrix compared to the algorithms using color features and thus is computationally very efficient. The corners have been extracted by finding the intersections of the detected lines found using Hough transform. As the affine transformations preserve the co-linearity of points on a line and their intersection properties, the resulting corner features for image retrieval are robust to affine transformations. Furthermore, the corner features are invariant to noise. It is considered that the proposed algorithm will produce good results in combination with other algorithms in a way of incremental verification for similarity.

  • PDF