• 제목/요약/키워드: Similarity Function

검색결과 553건 처리시간 0.026초

Similarity Analysis of Exports Value Added by Country and Implication for Korea's Global Value Added Chains

  • Cho, Jung-Hwan
    • Journal of Korea Trade
    • /
    • 제23권4호
    • /
    • pp.103-114
    • /
    • 2019
  • Purpose - This paper investigates the structure of exports across countries in terms of value added. Exports value added is examined under two categories, domestic and overseas. Using a statistical classification method by distance based on these two value added categories, this paper estimates the similarity of exports value added across countries including Korea. Design/methodology - The model of study is to employ a generalized distance function and then derive the Manhattan and Euclidean distances. The paper also performs cluster analysis using the Partitioning Around Medoids (PAM) and hierarchical methods to classify the 44 sample countries considered in this study. Findings - Our main findings are as follows. The 44 countries can be classified under 5 groups by their domestic and overseas value added in exports. Korea has a sandwich global value chains (GVCs) position between Japan, China, and Taiwan in the East Asian region. Originality/value - Existing papers point out the double counting problem of trade statistics as the intermediate goods trade across borders increases. This paper addresses the double counting problem by using the World Input-Output Table. The paper shows the need to explore the similarity of value added in exports structure across countries and investigate the GVCs position and role of each country.

청각 기억 게임을 위한 리듬 유사도 측정 기술 (Measurement of Rhythmic Similarity for Auditory Memory Game)

  • 김주완;이세원;박호종
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.136-141
    • /
    • 2011
  • 본 논문에서는 청각 기억 게임을 위하여 두 개의 소리 파형을 비교하여 파형의 리듬 유사도를 정량적으로 측정하는 기술을 제안한다. 제안한 방법은 두 입력 파형에 대하여 에너지 변화, 에너지 피크의 지속 시간, 음색 등을 분석하여 각 파형에 포함된 비트 위치를 검출하고, 두 파형의 템포 차이와 비트 수의 차이를 보상하는 과정을 통하여 두 파형의 리듬 벡터를 각각 정의한다. 다음, 두 리듬 벡터 사이의 차이와 비트 수의 차이를 적용하여 두 입력 파형의 리듬 유사도를 정량적으로 표현하는 식을 정의한다. 제안한 방법으로 측정한 리듬 유사도와 주관적 청취 평가로 측정한 리듬 유사도를 비교하였으며, 두 방법에 의한 리듬 유사도가 상관도 0.86을 가지는 것을 확인하였다.

A Tolerant Rough Set Approach for Handwritten Numeral Character Classification

  • Kim, Daijin;Kim, Chul-Hyun
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 The Third Asian Fuzzy Systems Symposium
    • /
    • pp.288-295
    • /
    • 1998
  • This paper proposes a new data classification method based on the tolerant rough set that extends the existing equivalent rough set. Similarity measure between two data is described by a distance function of all constituent attributes and they are defined to be tolerant when their similarity measure exceeds a similarity threshold value. The determination of optimal similarity theshold value is very important for the accurate classification. So, we determine it optimally by using the genetic algorithm (GA), where the goal of evolution is to balance two requirements such that (1) some tolerant objects are required to be included in the same class as many as possible. After finding the optimal similarity threshold value, a tolerant set of each object is obtained and the data set is grounded into the lower and upper approximation set depending on the coincidence of their classes. We propose a two-stage classification method that all data are classified by using the lower approxi ation at the first stage and then the non-classified data at the first stage are classified again by using the rough membership functions obtained from the upper approximation set. We apply the proposed classification method to the handwritten numeral character classification. problem and compare its classification performance and learning time with those of the feed forward neural network's back propagation algorithm.

  • PDF

Identification Performance of Low-Molecular Compounds by Searching Tandem Mass Spectral Libraries with Simple Peak Matching

  • Milman, Boris L.;Zhurkovich, Inna K.
    • Mass Spectrometry Letters
    • /
    • 제9권3호
    • /
    • pp.73-76
    • /
    • 2018
  • The number of matched peaks (NMP) is estimated as the spectral similarity measure in tandem mass spectral library searches of small molecules. In the high resolution mode, NMP provides the same reliable identification as in the case of a common dot-product function. Corresponding true positive rates are ($94{\pm}3$) % and ($96{\pm}3$) %, respectively.

Clustering Parts Based on the Design and Manufacturing Similarities Using a Genetic Algorithm

  • Lee, Sung-Youl
    • 한국산업정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.119-125
    • /
    • 2011
  • The part family (PF) formation in a cellular manufacturing has been a key issue for the successful implementation of Group Technology (GT). Basically, a part has two different attributes; i.e., design and manufacturing. The respective similarity in both attributes is often conflicting each other. However, the two attributes should be taken into account appropriately in order for the PF to maximize the benefits of the GT implementation. This paper proposes a clustering algorithm which considers the two attributes simultaneously based on pareto optimal theory. The similarity in each attribute can be represented as two individual objective functions. Then, the resulting two objective functions are properly combined into a pareto fitness function which assigns a single fitness value to each solution based on the two objective functions. A GA is used to find the pareto optimal set of solutions based on the fitness function. A set of hypothetical parts are grouped using the proposed system. The results show that the proposed system is very promising in clustering with multiple objectives.

초고주파용 필터설계를 위한 결합행렬 합성법 (Coupling Matrix Synthesis Methods for RF/Microwave Filter Design)

  • 최동묵;김채영
    • 한국통신학회논문지
    • /
    • 제32권12A호
    • /
    • pp.1346-1353
    • /
    • 2007
  • 본 논문에서는 필터함수의 감쇄극점(poles)과 반사손실(Return Loss)로부터 전송계수($S_{21}$)와 반사계수($S_{11}$)를 도출하고, 이 값들로부터 대역통과필터 설계를 위한 결합계수행렬 계산법을 제시하였다. 계산된 결합계수행렬에 유사변환을 적용하여서 결합계수행렬을 접힌 표준형 필터 구조의 커플링계수 행렬로 변환하였다. 그 결과를 이용하여 접힌 표준형 필터를 설계하였다.

Functional Analysis of ESTs from the Flower Bud of Korean Ginseng

  • Yang, Deok-Chun;In, Jun-Gyo;Kim, Moo-Sung;Jeon, Jong-Seong
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2003년도 춘계 학술발표대회
    • /
    • pp.124-124
    • /
    • 2003
  • In order to study gene expression in a reproductive organ, we constructed a cDNA library of immature flower buds in Korean ginseng and generated expressed sequence tags (ESTs) of 3,360 clones randomly selected. The ESTs could be clustered into 1,844 non-redundant groups. Similarity search of the non-redundant ESTs against public non-redundant databases of both protein and DNA indicated that 1,254 groups show similarity to genes of known function. These ESTs clones were divided into sixteen categories depending upon gene function. The most abundant transcripts were unknown protein (72), chlorophyll a/b-binding protein (48), and stylar glycoprotein. There are no useful informations of gene expression during the development of flower bud in Korean ginseng. These results could help to understand the development of flower bud in Korean ginseng.

  • PDF

Massive Music Resources Retrieval Method Based on Ant Colony Algorithm

  • Yun Meng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권5호
    • /
    • pp.1208-1222
    • /
    • 2024
  • Music resources are characterized by quantization, diversification and complication. With the rapid increase of the demand for music resources, the storage of music resources is very large. In order to improve the retrieval effect of music resources, a massive music resources retrieval method based on ant colony algorithm is proposed to effectively use music resources. This paper constructs autocorrelation function to extract pitch feature of music resource, classifies the music resource information by calculating feature similarity. Using ant colony algorithm to correlate the feature of music resource, gain the result of correlative, locate the result of detection and get the result of multi-module. Simulation results show that the proposed method has high precision and recall, short retrieval time and can effectively retrieve massive music resources.

GORank: Gene Ontology를 이용한 유전자 산물의 의미적 유사성 검색 (GORank: Semantic Similarity Search for Gene Products using Gene Ontology)

  • 김기성;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.682-692
    • /
    • 2006
  • 유사한 생물학적 특성을 가진 유전자 산물을 검색하는 것은 생물정보학 연구에 필수적인 기술이다. 현재 대부분의 생물학 데이타베이스에서 Gene Ontology의 용어를 사용하여 유전자 산물의 생물학적 특성을 기술하고 있다. 본 논문에서는 이런 유전자 산물의 주석 정보를 사용해 의미적으로 유사한 유전자 산물을 검색하는 방법을 제안한다. 이를 위해 우선 정보 이론에 기반한 유전자 산물간의 의미적 유사도를 정의하였다. 그리고 이 유사도를 이용한 의미적 유사성 검색 알고리즘을 제안하였다. 의미적 유사성 검색을 처리하기 위해 Fagin의 문턱값 알고리즘(threshold algorithm)을 다음과 같이 변형한 기법을 사용하였다. 우선 사용하는 유사도 함수가 단조 증가 성질을 갖지 않기 때문에 유사도 함수에 맞는 문턱값을 재정의 하였다. 또 역색인 리스트의 구조를 사용하여 중간 검색을 생략할 수 있는 클러스터 스키핑 기법과 역색인 리스트 액세스 순서를 제안하였다. 실제 GO와 주석 정보를 이용하여 성능 평가를 했으며 제안한 알고리즘은 효율적인 알고리즘임을 보였다.

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Clustering-based Statistical Machine Translation Using Syntactic Structure and Word Similarity)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.297-304
    • /
    • 2010
  • 통계기계번역에서 번역성능의 향상을 위해서 문장의 유형이나 장르에 따라 클러스터링을 수행하여 도메인에 특화된 번역을 시도하는 방법이 있다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 각 문장의 문법적 구조 유사도에 따른 유형별분류 기법과, 단어 유사도 정보를 사용한 장르 구분법을 적용하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 도메인 특화 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조 유사도와 단어 유사도의 계산 방법으로는 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정에서는 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.