• 제목/요약/키워드: similarity based clustering

검색결과 322건 처리시간 0.024초

컬러 인접성과 클러스터링 기법을 이용한 객체 기반 영상 검색 (Object-Based Image Retrieval Using Color Adjacency and Clustering Method)

  • 이형진;박기태;문영식
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.31-38
    • /
    • 2005
  • 본 논문은 컬러 인접성과 클러스터링 기법을 이용한 객체 기반 영상 검색 기법을 제안한다. 컬러 인접성이란 영상내의 서로 이웃한 영역에서 나타나는 컬러의 특징값을 말하고, 영상 데이터베이스로부터 사용자가 찾고자하는 영역과 유사한 후보 영역들을 우선 추출하는데 사용된다. 또한 클러스터링 기법은 후보 영역들 가운데 객체가 존재하는 영역만을 추출하는데 사용되고, 질의 영상과 데이터베이스 영상 사이의 유사도 측정을 위하여 히스토그램 인터섹션(histogram intersection) 방법이 사용된다. 제안하는 방법에서 사용되는 영상의 컬러쌍 정보는 객체의 이동, 회전 그리고 크기 변화에 강건하며, 실험을 통하여 제안하는 방법이 기존의 방법보다 우수함을 확인하였다.

Opera Clustering: K-means on librettos datasets

  • 정하림;유주헌
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.45-52
    • /
    • 2022
  • With the development of artificial intelligence analysis methods, especially machine learning, various fields are widely expanding their application ranges. However, in the case of classical music, there still remain some difficulties in applying machine learning techniques. Genre classification or music recommendation systems generated by deep learning algorithms are actively used in general music, but not in classical music. In this paper, we attempted to classify opera among classical music. To this end, an experiment was conducted to determine which criteria are most suitable among, composer, period of composition, and emotional atmosphere, which are the basic features of music. To generate emotional labels, we adopted zero-shot classification with four basic emotions, 'happiness', 'sadness', 'anger', and 'fear.' After embedding the opera libretto with the doc2vec processing model, the optimal number of clusters is computed based on the result of the elbow method. Decided four centroids are then adopted in k-means clustering to classify unsupervised libretto datasets. We were able to get optimized clustering based on the result of adjusted rand index scores. With these results, we compared them with notated variables of music. As a result, it was confirmed that the four clusterings calculated by machine after training were most similar to the grouping result by period. Additionally, we were able to verify that the emotional similarity between composer and period did not appear significantly. At the end of the study, by knowing the period is the right criteria, we hope that it makes easier for music listeners to find music that suits their tastes.

과학기술 논문의 참고문헌 텍스트 정보를 활용한 기술의 군집화 (Technology Clustering Using Textual Information of Reference Titles in Scientific Paper)

  • 박인채;김송희;윤병운
    • 산업경영시스템학회지
    • /
    • 제43권2호
    • /
    • pp.25-32
    • /
    • 2020
  • Data on patent and scientific paper is considered as a useful information source for analyzing technological information and has been widely utilized. Technology big data is analyzed in various ways to identify the latest technological trends and predict future promising technologies. Clustering is one of the ways to discover new features by creating groups from technology big data. Patent includes refined bibliographic information such as patent classification code whereas scientific paper does not have appropriate bibliographic information for clustering. This research proposes a new approach for clustering data of scientific paper by utilizing reference titles in each scientific paper. In this approach, the reference titles are considered as textual information because each reference consists of the title of the paper that represents the core content of the paper. We collected the scientific paper data, extracted the title of the reference, and conducted clustering by measuring the text-based similarity. The results from the proposed approach are compared with the results using existing methodologies that one is the approach utilizing textual information from titles and abstracts and the other one is a citation-based approach. The suggested approach in this paper shows statistically significant difference compared to the existing approaches and it shows better clustering performance. The proposed approach will be considered as a useful method for clustering scientific papers.

절차지향 소프트웨어로부터 클래스와 상속성 추출 (Extraction of Classes and Hierarchy from Procedural Software)

  • 최정란;박성옥;이문근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권9호
    • /
    • pp.612-628
    • /
    • 2001
  • 본 논문은 절차지향 소프트웨어로부터 클래스와 상속성을 추출하기 위한 방법론을 제안한다. 본 논문에서 제안한 방법론은 모든 경우의 객체 후보군으로부터 정의된 클래스 후보군과 그들의 상속성을 생성하여 클래스 후보군과 영역 모델 사이의 관계성과 유서 정도를 가지고 최고 또는 최적의 클래스 후보군을 선택하는데 초점을 둔다. 클래스와 상속성 추출 방법론은 다음과 같은 두드러진 특징을 가지고 있다. 정적(속성)과 동적(메소드)인 클러스터링 방법을 사용하고, 클래스 후보군의 경우는 추상화에 초점을 두며, m개의 클래스 후보군과 n개의 클래스 후보 사이의 상속 관계의 유사도 측정 즉, 2차원적 유사도 측정은 m개의 클래스 후보와 n개의 클래스 후보 사이의 전체 그룹에 대한 유사도를 구하는 수평적 측정과 클래스 후보군들에서 상속성을 가진 클래스의 집합과 영역 모델에서 같은 클래스 상속성을 가진 클래스 집합 사이의 유사도를 위한 수직적 측정방법이 있다. 이러한 방법론은 최고 또는 최적의 클래스 후보군을 선택하기 위해 제공학 전문가에게 광범위하고 통합적인 환경을 제시하고 있다.

  • PDF

SDS 환경의 유사도 기반 클러스터링 및 다중 계층 블룸필터를 활용한 분산 중복제거 기법 (Distributed data deduplication technique using similarity based clustering and multi-layer bloom filter)

  • 윤다빈;김덕환
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.60-70
    • /
    • 2018
  • 클라우드 환경에서 다수의 사용자가 물리적 서버를 가상화하여 사용할 수 있도록 편의성을 제공하는 Software Defined Storage(SDS)를 적용하고 있지만 한정된 물리적 자원을 고려하여 공간 효율성을 최적화하는 솔루션이 필요하다. 기존의 데이터 중복제거 시스템에서는 서로 다른 스토리지에 업로드 된 중복 데이터가 중복제거되기 어렵다는 단점이 있다. 본 논문에서는 유사도기반 클러스터링과 다중 계층 블룸 필터를 적용한 분산 중복제거 기법을 제안한다. 라빈 해시를 이용하여 가상 머신 서버들 간의 유사도를 판단하고 유사도가 높은 가상머신들을 클러스터 함으로써 개별 스토리지 노드별 중복제거 효율에 비하여 성능을 향상시킨다. 또한 중복제거 프로세스에 다중 계층 블룸 필터를 접목하여 처리 시간을 단축하고 긍정오류를 감소시킬 수 있다. 실험결과 제안한 방법은 IP주소 기반 클러스터를 이용한 중복제거 기법에 비해 처리 시간의 차이가 없으면서, 중복제거율이 9% 높아짐을 확인하였다.

사진 사용 이력을 이용한 이벤트 클러스터링 알고리즘 (Adaptive Event Clustering for Personalized Photo Browsing)

  • 김기응;박태서;박민규;이영범;김연배;김상룡
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.711-716
    • /
    • 2006
  • Since the introduction of digital camera to the mass market, the number of digital photos owned by an individual is growing at an alarming rate. This phenomenon naturally leads to the issues of difficulties while searching and browsing in the personal digital photo archive. Traditional approach typically involves content-based image retrieval using computer vision algorithms. However, due to the performance limitations of these algorithms, at least on the casual digital photos taken by non-professional photographers, more recent approaches are centered on time-based clustering algorithms, analyzing the shot times of photos. These time-based clustering algorithms are based on the insight that when these photos are clustered according to the shot-time similarity, we have "event clusters" that will help the user browse through her photo archive. It is also reported that one of the remaining problems with the time-based approach is that people perceive events in different scales. In this paper, we present an adaptive time-based clustering algorithm that exploits the usage history of digital photos in order to infer the user's preference on the event granularity. Experiments show significant performance improvements in the clustering accuracy.

  • PDF

퍼지 클러스터링 기법을 이용한 MPEG 비디오의 장면 전환 검출 (Shot Change Detection Using Fuzzy Clustering Method on MPEG Video Frames)

  • 임성재;김운;이배호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.159-162
    • /
    • 2000
  • In this paper, we propose an efficient method to detect shot changes in compressed MPEG video data by using reference features among video frames. The reference features among video frames imply the similarities among adjacent frames by prediction coded type of each frame. A shot change is detected if the similarity degrees of a frame and its adjacent frames are low. And the shot change detection algorithm is improved by using Fuzzy c-means (FCM) clustering algorithm. The FCM clustering algorithm uses the shot change probabilities evaluated in the mask matching of reference ratios and difference measure values based on frame reference ratios.

  • PDF

MPEG 비디오 프레임에서 FCM 클러스터링 기법을 이용한 효과적인 장면 전환 검출 (Efficient Shot Change Detection Using Clustering Method on MPEG Video Frames)

  • 임성재;이배호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.751-754
    • /
    • 2000
  • In this paper, we propose an efficient method to detect abrupt shot changes in compressed MPEG video data by using reference ratios among video frames. The reference ratios among video frames imply the degree of similarities among adjacent frames by prediction coded type of each frames. A shot change is detected if the similarity degrees of a frame and its adjacent frames are low. This paper proposes an efficient shot change detection algorithm by using Fuzzy c-means(FCM) clustering algorithm. The FCM clustering uses the shot change probabilities evaluated in the mask matching of reference ratios and difference measure values based on frame reference ratios.

  • PDF

Conditional Random Fields 구조에서 궤적군집화를 이용한 혼잡 영상의 이동 객체 검출 (Detection of Moving Objects in Crowded Scenes using Trajectory Clustering via Conditional Random Fields Framework)

  • 김형기;이광국;김회율
    • 한국멀티미디어학회논문지
    • /
    • 제13권8호
    • /
    • pp.1128-1141
    • /
    • 2010
  • 본 논문은 궤적을 군집화하여 혼잡한 영상에서 이동 객체를 검출하는 방법을 제안한다. 제안하는 방법은 객체의 외형 정보에 기반한 기존의 방법들과는 달리 객체의 움직임 정보만을 이용해 이동 객체를 검출한다. 이를 위하여 입력 영상의 매 프레임에서 특징점을 추출하며, 인접한 프레임간의 추적 과정을 통하여 특징점들의 궤적을 생성한다. 동일 객체에서 얻어진 궤적들은 유사한 움직임을 보일 것이라는 가정 하에 군집화 과정을 통하여 이동 객체를 검출한다. 궤적들의 군집화를 위하여 특징점 간의 위치, 움직임, 연속성에 기반한 에너지 함수로 궤적 간 유사도를 측정하였으며, conditional random fields (CRFs)를 이용하여 최적의 군집을 결정하였다. 기존의 궤적 군집화를 통한 이동 객체 검출 방법이 군집화 과정에서 한번 잘못 분류된 궤적은 잘못된 결과를 생성하는 것과는 달리, 제안한 방법에서는 군집화가 CRFs 상에서 에너지 최소화에 의해 수행되기 때문에 잘못 분류된 궤적이 반복 과정에서 다시 올바른 군집으로 재배열되는 것이 가능하다. 제안한 방법의 성능 측정을 위하여 서로 다른 혼잡도를 가지는 세 개의 영상을 이용하였으며, 약 94%의 검출률과 7%의 허위 경보율을 나타내었다.

객체지향 소프트웨어 재사용을 위한 클래스 라이브러리 설계에 관한 연구 (The Study of Class Library Design for Reusable Object-Oriented Software)

  • 이해원;김진석;김혜규;하수철
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2350-2364
    • /
    • 1999
  • 본 논문은 객체지향 C++ 클래스 컴포넌트를 분류하여 재사용자에게 필요한 컴포넌트를 제공하기 위한 저장소의 클래스 라이브러리 설계방법을 제안한 것이다. 클래스 라이브러리를 설계하기 위해서 컴포넌트 구성 모델을 정의하였고, Enumerative 분류 방법을 이용한 멀티미디어 영역을 분류하였으며, 문서 클러스터링 방법을 확장하여 유사도에 의한 C++ 클래스를 유사한 그룹으로 분류하는 클러스터 생성 기준을 제안하고 있다. 이 유사 그룹인 클러스터는 클래스 멤버 데이터와 멤버함수 그리고 클래스 유사도를 기반으로 분류되며, 분류된 컴포넌트들은 유사도 관계의 계층구조로 구성된다. 마지막으로 객체지향 개념인 Generalization/Specialization의 C++ 상속관계를 계층구조로 표현할 수 있는 클래스 라이브러리를 설계하였다.

  • PDF