• 제목/요약/키워드: measure of structural similarity

검색결과 52건 처리시간 0.024초

Global Sequence Homology Detection Using Word Conservation Probability

  • Yang, Jae-Seong;Kim, Dae-Kyum;Kim, Jin-Ho;Kim, Sang-Uk
    • Interdisciplinary Bio Central
    • /
    • 제3권4호
    • /
    • pp.14.1-14.9
    • /
    • 2011
  • Protein homology detection is an important issue in comparative genomics. Because of the exponential growth of sequence databases, fast and efficient homology detection tools are urgently needed. Currently, for homology detection, sequence comparison methods using local alignment such as BLAST are generally used as they give a reasonable measure for sequence similarity. However, these methods have drawbacks in offering overall sequence similarity, especially in dealing with eukaryotic genomes that often contain many insertions and duplications on sequences. Also these methods do not provide the explicit models for speciation, thus it is difficult to interpret their similarity measure into homology detection. Here, we present a novel method based on Word Conservation Score (WCS) to address the current limitations of homology detection. Instead of counting each amino acid, we adopted the concept of 'Word' to compare sequences. WCS measures overall sequence similarity by comparing word contents, which is much faster than BLAST comparisons. Furthermore, evolutionary distance between homologous sequences could be measured by WCS. Therefore, we expect that sequence comparison with WCS is useful for the multiple-species-comparisons of large genomes. In the performance comparisons on protein structural classifications, our method showed a considerable improvement over BLAST. Our method found bigger micro-syntenic blocks which consist of orthologs with conserved gene order. By testing on various datasets, we showed that WCS gives faster and better overall similarity measure compared to BLAST.

A Tracking Method of Same Drug Sales Accounts through Similarity Analysis of Instagram Profiles and Posts

  • Eun-Young Park;Jiyeon Kim;Chang-Hoon Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.109-118
    • /
    • 2024
  • 전 세계 소셜 미디어 사용자가 증가하면서 다양한 범죄의 수단으로 소셜 미디어가 악용되는 사례가 증가하고 있다. 특히, 소셜 미디어를 통한 마약 유통은 마약 판매자와 소비자의 높은 접근성으로 인해 청소년들의 마약 호기심을 자극하고, 구매를 용이하게 한다는 점에서 심각한 사회문제로 대두되고 있다. 본 논문에서는 다양한 소셜 미디어 중, 국내 19세에서 24세 청소년이 가장 많이 사용하는 인스타그램을 대상으로 프로필 사진, 소개글, 게시물 사진과 게시글을 수집하고, 각 정보의 유사도 분석을 통해 수집한 다수의 계정을 활용하여 마약을 유통하는 마약사범 추적 기술을 개발한다. 4개 수집 정보 중, 이미지 형태의 프로필 사진 및 게시물 사진은 SSIM(Structural Similarity Index Measure) 기반으로 유사도를 분석하고, 텍스트 형태의 소개글 및 게시글은 자카드 유사도 및 코사인 유사도 기법을 사용하여 유사도를 분석한다. 이와 같은 유사도 분석을 통해, 각 수집 정보별 계정 간의 유사도를 측정할 수 있으며 유의수준 이상의 유사성을 갖는 계정들에 대해 동일 마약 유통 계정으로 판단할 수 있다. 또한, 수집한 4개 정보에 대해 로지스틱 회귀분석을 수행하여 게시물 사진을 제외한 프로필 사진, 소개글, 게시글이 동일 마약 판매 계정을 추적하는 데에 유효한 정보임을 확인하였다.

SSIM 목적 함수와 CycleGAN을 이용한 적외선 이미지 데이터셋 생성 기법 연구 (Synthetic Infra-Red Image Dataset Generation by CycleGAN based on SSIM Loss Function)

  • 이하늘;이현재
    • 한국군사과학기술학회지
    • /
    • 제25권5호
    • /
    • pp.476-486
    • /
    • 2022
  • Synthetic dynamic infrared image generation from the given virtual environment is being the primary goal to simulate the output of the infra-red(IR) camera installed on a vehicle to evaluate the control algorithm for various search & reconnaissance missions. Due to the difficulty to obtain actual IR data in complex environments, Artificial intelligence(AI) has been used recently in the field of image data generation. In this paper, CycleGAN technique is applied to obtain a more realistic synthetic IR image. We added the Structural Similarity Index Measure(SSIM) loss function to the L1 loss function to generate a more realistic synthetic IR image when the CycleGAN image is generated. From the simulation, it is applicable to the guided-missile flight simulation tests by using the synthetic infrared image generated by the proposed technique.

Designing a Hydro-Structural Ship Model to Experimentally Measure its Vertical Bending and Torsional Vibrations

  • Houtani, Hidetaka;Komoriyama, Yusuke;Matsui, Sadaoki;Oka, Masayoshi;Sawada, Hiroshi;Tanaka, Yoshiteru;Tanizawa, Katsuji
    • Journal of Advanced Research in Ocean Engineering
    • /
    • 제4권4호
    • /
    • pp.174-184
    • /
    • 2018
  • We herein propose a new design procedure of a flexible container ship model where the vertical bending and torsional vibration modes are similar to its prototype. To achieve similarity in torsional vibration mode shapes, the height of the shear center of the model must be located below the bottom hull, similar to an actual container ship with large opening decks. Therefore, we designed a ship model by imparting appropriate stiffness to the hull, using urethane foam without a backbone. We built a container ship model according to this design strategy and validated its dynamic elastic properties using a decay test. We measured wave-induced structural vibrations and present the results of tank experiments in regular and freak waves.

Image compression using K-mean clustering algorithm

  • Munshi, Amani;Alshehri, Asma;Alharbi, Bayan;AlGhamdi, Eman;Banajjar, Esraa;Albogami, Meznah;Alshanbari, Hanan S.
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.275-280
    • /
    • 2021
  • With the development of communication networks, the processes of exchanging and transmitting information rapidly developed. As millions of images are sent via social media every day, also wireless sensor networks are now used in all applications to capture images such as those used in traffic lights, roads and malls. Therefore, there is a need to reduce the size of these images while maintaining an acceptable degree of quality. In this paper, we use Python software to apply K-mean Clustering algorithm to compress RGB images. The PSNR, MSE, and SSIM are utilized to measure the image quality after image compression. The results of compression reduced the image size to nearly half the size of the original images using k = 64. In the SSIM measure, the higher the K, the greater the similarity between the two images which is a good indicator to a significant reduction in image size. Our proposed compression technique powered by the K-Mean clustering algorithm is useful for compressing images and reducing the size of images.

A Clustering Algorithm Considering Structural Relationships of Web Contents

  • Kang Hyuncheol;Han Sang-Tae;Sun Young-Su
    • Communications for Statistical Applications and Methods
    • /
    • 제12권1호
    • /
    • pp.191-197
    • /
    • 2005
  • Application of data mining techniques to the world wide web, referred to as web mining, has been the focus of several recent researches. With the explosive growth of information sources available on the world wide web, it has become increasingly necessary to track and analyze their usage patterns. In this study, we introduce a process of pre-processing and cluster analysis on web log data and suggest a distance measure considering the structural relationships between web contents. Also, we illustrate some real examples of cluster analysis for web log data and look into practical application of web usage mining for eCRM.

차량이 포함된 이미지를 고려한 사장재 케이블의 장력 측정 (Tension Measurement of Stay Cables in Consideration with Image Including Vehicle )

  • 김성완;박동욱;김진수;박승수;박재봉
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제27권2호
    • /
    • pp.58-66
    • /
    • 2023
  • 이 연구에서는 진동법을 이용하여 케이블 장력을 추정하고 비접촉 방식으로 케이블의 변위 응답을 측정하기 위한 센서로 영상기반시스템을 적용하였다. 영상기반시스템에서 카메라는 대상 구조물과 카메라의 시야를 고려한 위치에 설치된다. 그러나 설치하려는 위치의 이미지에는 대상 구조물과 차량 등의 다른 구조물이 포함될 수 있어 구조물의 변위 응답 측정에 필요한 기준점을 인식하기 어려울 수 있다. 영상기반시스템의 설치 위치로 인해 차량이 포함된 왜곡된 이미지는 이미지 해석에서 부정확한 결과를 나타내므로 두 이미지 사이의 유사성을 산정하여 차량이 포함된 이미지를 제거하였다. 제안된 방법을 이용한 사장교 케이블의 장력을 측정하는 방법의 타당성을 확인하기 위해 공용 중인 사장교에서 진동법을 적용하여 장력을 측정하였다.

부모-자식 행렬을 사용한 XML 문서 유사도 측정과 군집 기법 (Similarity Measure and Clustering Technique for XML Documents by a Parent-Child Matrix)

  • 이윤구;김우생
    • 한국정보통신학회논문지
    • /
    • 제19권7호
    • /
    • pp.1599-1607
    • /
    • 2015
  • 최근 들어, 인터넷에서 자주 사용되는 XML 문서들에 대한 접근, 질의와 관리를 위한 효율적인 기법들이 연구 되어 왔다. 이 논문에서, 우리는 XML 문서를 효율적으로 군집화하기 위해 부모-자식 행렬 기법을 제안한다. 부모-자식 행렬은 XML 문서의 내용과 구조의 특징들을 분석한다. 부모-자식 행렬의 각 셀은 XML 트리 노드의 값이거나, 트리에서 부모-자식 관계가 존재할 때의 자식 노드의 값이 된다. 따라서 두 XML 문서의 유사도는 대응하는 부모-자식 행렬들의 유사도로 측정된다. 실험을 통해 우리가 제안하는 기법이 좋은 결과를 냄을 보였다.

강박스교 구조계산서 XML 시맨틱 모델의 스키마 매칭 기법 적용 (Applying the Schema Matching Method to XML Semantic Model of Steelbox-bridge's Structural Calculation Reports)

  • 양영애;김봉근;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.680-687
    • /
    • 2005
  • This study presents a schema matching technique which can be applied to XML semantic model of structural calculation reports of steel-box bridges. The semantic model of structural calculation documents was developed by extracting the optimized common elements from the analyses of various existing structural calculation documents, and the standardized semantic model was schematized by using XML Schema. In addition, the similarity measure technique and the relaxation labeling technique were employed to develop the schema matching algorithm. The former takes into account the element categories and their features, and the latter considers the structural constraints in the semantic model. The standardized XML semantic model of steel-box bridge's structural calculation documents called target schema was compared with existing nonstandardized structural calculation documents called primitive schema by the developed schema matching algorithm Some application examples show the importance of the development of standardized target schema for structural calculation documents and the effectiveness and efficiency of schema matching technique in the examination of the degree of document standardization in structural calculation reports.

  • PDF

어휘와 구조 정보에 기반한 온톨로지의 다단계 매핑 (Multi-level Mapping of Ontologies Based on Lexical and Structural Information)

  • 황세찬;강신재
    • 한국지능시스템학회논문지
    • /
    • 제22권1호
    • /
    • pp.42-48
    • /
    • 2012
  • 시맨틱 웹이 대두되면서 온톨로지의 사용이 점차 늘어나고 있다. 동일한 분야에 관한 온톨로지일지라도 구축 방법과 활용 형태에 따라 같은 개념이 다른 형태로 표현되거나, 다른 개념이 같은 형태로 표현될 수 있다. 이러한 온톨로지들을 공유하고 재사용하기 위해서는 온톨로지의 매핑이 필요하다. 본 논문에서는 온톨로지의 어휘 정보를 이용하여 다단계로 매핑하고, 이 결과를 기반으로 구조 정보의 유사성을 검사하는 방법을 제안한다. 온톨로지에서 어휘 정보가 부여되지 않는 블랭크 노드를 추가로 확장하여 매핑 성능을 향상시켰다. 실험을 통하여 86.38%의 F1-measure값을 얻을 수 있었다.