• 제목/요약/키워드: Entropy threshold

검색결과 54건 처리시간 0.021초

사용자의 평가 횟수와 협동적 필터링 성과간의 관계 분석 (Analysis of the Number of Ratings and the Performance of Collaborative Filtering)

  • 이홍주;김종우;박성주
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.629-638
    • /
    • 2005
  • In this paper, we consider two issues in collaborative filtering, which are closely related with the number of ratings of a user. First issue is the relationship between the number of ratings of a user and the performance of collaborative filtering. The relationship is investigated with two datasets, EachMovie and Movielens datasets. The number of ratings of a user is critical when the number of ratings is small, but after the number is over a certain threshold, its influence on recommendation performance becomes smaller. We also provide an explanation on the relationship between the number of ratings of a user and the performance in terms of neighborhood formations in collaborative filtering. The second issue is how to select an initial product list for new users for gaining user responses. We suggest and analyze 14 selection strategies which include popularity, favorite, clustering, genre, and entropy methods. Popularity methods are adequate for getting higher number of ratings from users, and favorite methods are good for higher average preference ratings of users.

  • PDF

분할된 패스워드 기반 인증된 키교환 프로토콜 (Split Password-Based Authenticated Key Exchange)

  • 류종호;염흥열
    • 정보보호학회논문지
    • /
    • 제14권5호
    • /
    • pp.23-36
    • /
    • 2004
  • 본 논문은 신뢰할 수 없는 네트워크를 통해서도 사용자를 인증하고 안전한 암호통신용 세션키 교환에 적합한 패스워드 기반 인증 프로토콜을 제안한다. 기본 아이디어는 패스워드를 분할한 후 각 분할된 패스워드 지식들을 확대(amplification)하는 구조로 설계하는 것으로서, 이는 패스워드 검증정보의 램덤성(randomness)을 증가시키기 위한 것이다. 또한 서버 검증자 파일을 암호화하여 보관함으로서 서버 파일 타협에 의한 오프라인 사전추측 공격에 강인하도록 구성한다. 더불어 검증자 파일 및 서버의 암호화 키가 다수의 서버들에게 분산되도록 설계된 방식을 제안한다.

데이터의 공간적 분포를 고려한 퍼지 이산화와 특징선택에의 응용 (Fuzzy discretization with spatial distribution of data and Its application to feature selection)

  • 손창식;신아미;이인희;박희준;박형섭;김윤년
    • 한국지능시스템학회논문지
    • /
    • 제20권2호
    • /
    • pp.165-172
    • /
    • 2010
  • 임상 데이터마이닝에서 최적의 특징 집합을 선택하는 것은 주어진 데이터로부터 생성된 모델의 복잡성을 줄일 뿐만 아니라 유용성을 향상시키는 데에 매우 중요하고, 선택된 특징들의 임계값은 질병의 감별진단을 위해 임상 전문가의 결정기준으로 사용된다. 본 논문에서는 데이터의 공간적인 분포, 즉 중첩영역에서 중복 속성값을 포함하는 데이터의 분리성 정도를 평가함으로써 연속형 속성을 가진 데이터에 대한 퍼지 이산화기법을 제안한다. 제안된 방법에서 중복 속성값의 가중치 평균값은 각 특징의 임계값(즉 경계값)을 결정하기 위해서 사용되었고, 러프집합은 전체 특징들 중에서 중요특징들의 집합을 선택하기 위해서 이용하였다. 제안된 방법의 타당성을 검증하기 위해 호흡곤란을 주호소로 내원한 668명의 환자 데이터를 근거로 3가지 이산화방법과 제안된 이산화방법에 대한 실험을 수행하였다. 실험결과, 퍼지분할을 기반으로 한 이산화방법이 하드분할을 기반으로 한 이산화방법에 비해서 평균 분류정확도와 G-mean 성능에서 보다 좋은 결과를 제공함을 확인하였다.

적응적인 움직임 벡터 해상도를 이용한 움직임 벡터 부호화 방법 (Motion Vector Coding Using Adaptive Motion Resolution)

  • 장명훈;서찬원;한종기
    • 방송공학회논문지
    • /
    • 제17권1호
    • /
    • pp.165-178
    • /
    • 2012
  • MPEG-2, MPEG-4와 같은 기존의 비디오 코덱에서는 인터 예측을 수행할 때 고정된 해상도의 움직임 벡터를 사용한다. 그러나 KTA 참조 소프트웨어에서는 움직임 벡터의 해상도를 슬라이스 단위로 선택하여 사용할 수 있는 기능을 지원한다. 그러나 선택된 하나의 움직임 벡터 해상도를 슬라이스 전체에 일괄적으로 적용하기 때문에 영상의 국지적인 특성을 반영하는데 어려움이 있다. 본 논문에서는 탐색 구간에 따라 적응적으로 움직임 벡터의 해상도를 결정하는 방법을 제안한다. 움직임 벡터의 탐색 영역을 움직임 벡터가 예측 움직임 벡터로부터 떨어진 거리에 따라 다수개의 구간으로 분할하고, 각 구간에 대하여 하나의 움직임 벡터 해상도를 할당하여 움직임 예측에 적용한다. 따라서 제안하는 방법의 부호화 효율은 각 구간을 분할하는 Threshold와 움직임 벡터를 부호화하는 엔트로피 코딩 방법에 영향을 받는다. HEVC의 참조 소프트웨어인 HM3.0을 이용하여 실험한 결과, Random Access 부호화 구조에서는 평균적으로 약 0.9%의 성능 향상을 얻을 수 있었으며, Low Delay 부호화 구조에 B picture를 적용한 경우는 약 0.6%, P picture를 적용한 경우에서는 약 2.7%의 평균 발생 비트량 감소를 확인할 수 있었다.

단일 레이블 분류를 이용한 종단 간 화자 분할 시스템 성능 향상에 관한 연구 (A study on end-to-end speaker diarization system using single-label classification)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.536-543
    • /
    • 2023
  • 다수의 화자가 존재하는 음성에서 "누가 언제 발화했는가?"에 대해 레이블링하는 화자 분할은 발화 중첩 구간에 대한 레이블링과 화자 분할 모델의 최적화를 위해 심층 신경망 기반의 종단 간 방법에 대해 연구되었다. 대부분 심층 신경망 기반의 종단 간 화자 분할 시스템은 음성의 각 프레임에서 발화한 모든 화자의 레이블들을 추정하는 다중 레이블 분류 문제로 분할을 수행한다. 다중 레이블 기반의 화자 분할 시스템은 임계값을 어떤 값으로 설정하는지에 따라 모델의 성능이 많이 달라진다. 본 논문에서는 임계값 없이 화자 분할을 수행할 수 있도록 단일 레이블 분류를 이용한 화자 분할 시스템에 대해 연구하였다. 제안하는 화자 분할 시스템은 기존의 화자 레이블을 단일 레이블 형태로 변환하여 모델의 출력으로부터 레이블을 바로 추정한다. 훈련에서는 화자 레이블 순열을 고려하기 위해 Permutation Invariant Training(PIT) 손실함수와 교차 엔트로피 손실함수를 조합하여 사용하였다. 또한 심층 구조를 갖는 모델의 효과적인 학습을 위해 화자 분할 모델에 잔차 연결 구조를 추가하였다. 실험은 Librispeech 데이터베이스를 이용해 화자 2명에 대한 시뮬레이션 잡음 데이터를 생성하여 사용하였다. Diarization Error Rate(DER) 성능 평가 지수를 이용해 제안한 방법과 베이스라인 모델을 비교 평가했을 때, 제안한 방법이 임계값 없이 분할이 가능하며, 약 20.7 %만큼 향상된 성능을 보였다.

불규칙 RR 간격 리듬의 비선형적 특성 분석을 통한 심방세동 검출 알고리즘 (Atrial Fibrillation Detection Algorithm through Non-Linear Analysis of Irregular RR Interval Rhythm)

  • 조익성;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2655-2663
    • /
    • 2011
  • 지금까지 심방세동을 검출하는 방법은 P파의 형태, 시간 주파수 영역 분석법이 주를 이루었다. 하지만 P파는 잡음의 영향을 많이 받는 환경에서는 검출의 정확도가 떨어지며, 시간 주파수 영역 분석법은 RR 간격에 따라 변화하는 불규칙적 리듬에 관한 정보를 정확하게 얻지 못하는 단점이 있다. 본 연구에서는, P파의 형태는 고려하지 않고, 불규칙 RR 간격 리듬의 비선형적 특성 분석을 통한 심방세동 검출 알고리즘을 제안한다. 이를 위해 불규칙 RR 간격 리듬을 다양성, 무작위성, 복잡성으로 각각 정의하고 제곱평균제곱근(RMSSD), 전환점비(TPR), 표본 엔트로비(SpEn)의 3가지 비선형적 특성 분석을 통하여 심방세동을 분류하였다. 제안된 알고리즘의 검출 성능을 평가하기 위해 3가지 통계치의 최적값을 설정하고 MIT-BIH 심방세동 데이터베이스와 부정맥 데이터베이스를 이용하여 실험하였다. 성능 평가 결과, MIT-BIH 심방세동 데이터베이스에 대해서는 민감도(sensitivity:94.5%), 특이도(specificity:96.2%)를 각각 나타내었으며, 부정맥 데이터베이스에 대해서는 민감도(89.8%), 특이도(89.62%)를 각각 나타내었다.

통계적 특징 기반 SVM을 이용한 야간 전방 차량 검출 기법 (Night Time Leading Vehicle Detection Using Statistical Feature Based SVM)

  • 정정은;김현구;박주현;정호열
    • 대한임베디드공학회논문지
    • /
    • 제7권4호
    • /
    • pp.163-172
    • /
    • 2012
  • A driver assistance system is critical to improve a convenience and stability of vehicle driving. Several systems have been already commercialized such as adaptive cruise control system and forward collision warning system. Efficient vehicle detection is very important to improve such driver assistance systems. Most existing vehicle detection systems are based on a radar system, which measures distance between a host and leading (or oncoming) vehicles under various weather conditions. However, it requires high deployment cost and complexity overload when there are many vehicles. A camera based vehicle detection technique is also good alternative method because of low cost and simple implementation. In general, night time vehicle detection is more complicated than day time vehicle detection, because it is much more difficult to distinguish the vehicle's features such as outline and color under the dim environment. This paper proposes a method to detect vehicles at night time using analysis of a captured color space with reduction of reflection and other light sources in images. Four colors spaces, namely RGB, YCbCr, normalized RGB and Ruta-RGB, are compared each other and evaluated. A suboptimal threshold value is determined by Otsu algorithm and applied to extract candidates of taillights of leading vehicles. Statistical features such as mean, variance, skewness, kurtosis, and entropy are extracted from the candidate regions and used as feature vector for SVM(Support Vector Machine) classifier. According to our simulation results, the proposed statistical feature based SVM provides relatively high performances of leading vehicle detection with various distances in variable nighttime environments.

음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution)

  • 황재천
    • 한국융합학회논문지
    • /
    • 제8권5호
    • /
    • pp.13-17
    • /
    • 2017
  • 음성 인식에서 기존의 음성 특징 추출 방법은 명확하지 않은 스레숄드 값으로 인해 부정확한 음성 인식률을 가진다. 본 연구에서는 음성과 비음성에 대한 특징 추출을 묵음 특징 정규화를 융합한 음성 인식 성능 향상을 위한 방법을 모델링 한다. 제안한 방법에서는 잡음의 영향을 최소화하여 모델을 구성하였고, 각 음성 프레임에 대해 음성 신호 특징을 추출하여 음성 인식 모델을 구성하였고, 이를 묵음 특징 정규화를 융합하여 에너지 스펙트럼을 엔트로피와 유사하게 표현하여 원래의 음성 신호를 생성하고 음성의 특징이 잡음을 적게 받도록 하였다. 셉스트럼에서 음성과 비음성 분류의 기준 값을 정하여 신호 대 잡음 비율이 낮은 신호에서 묵음 특징 정규화로 성능을 향상하였다. 논문에서 제시하는 방법의 성능 분석은 HMM과 CHMM을 비교하여 결과를 보였으며, 기존의 HMM과 CHMM을 비교한 결과 음성 종속 단계에서는 2.1%p의 인식률 향상이 있었으며, 음성 독립 단계에서는 0.7%p 만큼의 인식률 향상이 있었다.

인간시각 인식특성을 지닌 효율적 비선형 스케치 특징추출 필터 (Effective Nonlinear Filters with Visual Perception Characteristics for Extracting Sketch Features)

  • 조성목;조옥래
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.139-145
    • /
    • 2006
  • 디지털 영상에서의 특징점 추출 기술은 로봇비전, 의료영상 진단시스템 및 비디오 전송과 같은 분야 등에서 많이 응용되고 있다. 디지털 영상에서 특징점을 추출하는 방법에는 비선형 그래디언트, 비선형 라프라시안, 엔트로피와 같은 필터들이 있다. 그런데 인간의 시각에서 영상의 특징이 형성되는 과정을 살펴보면, 밝은 영역보다는 어두운 영역에서의 특징에 더 민감한 특성을 가지고 있으므로 기존의 필터로써 특징점을 추출하는데 효과적이지 못하다. 본 논문에서는 국부영역의 밝기를 고려하는 특징점 추출 필터들을 제안한다. 이들 필터들은 연산이 간단하여 매우 신속하게 특징점을 추출할 수 있으며, 국부적인 밝기를 고려하지만 기존의 엔트로피 연산자가 지닌 단점을 극복하여 어두운 영역에서의 미세한 밝기 변화에는 강건한 특성을 가지는 특성을 지닌다. 실험결과 다양한 밝기변화와 국부영역에 걸쳐 매우 뛰어난 특징점 추출결과를 나타내었다.

  • PDF

Probabilistic Models for Local Patterns Analysis

  • Salim, Khiat;Hafida, Belbachir;Ahmed, Rahal Sid
    • Journal of Information Processing Systems
    • /
    • 제10권1호
    • /
    • pp.145-161
    • /
    • 2014
  • Recently, many large organizations have multiple data sources (MDS') distributed over different branches of an interstate company. Local patterns analysis has become an effective strategy for MDS mining in national and international organizations. It consists of mining different datasets in order to obtain frequent patterns, which are forwarded to a centralized place for global pattern analysis. Various synthesizing models [2,3,4,5,6,7,8,26] have been proposed to build global patterns from the forwarded patterns. It is desired that the synthesized rules from such forwarded patterns must closely match with the mono-mining results (i.e., the results that would be obtained if all of the databases are put together and mining has been done). When the pattern is present in the site, but fails to satisfy the minimum support threshold value, it is not allowed to take part in the pattern synthesizing process. Therefore, this process can lose some interesting patterns, which can help the decider to make the right decision. In such situations we propose the application of a probabilistic model in the synthesizing process. An adequate choice for a probabilistic model can improve the quality of patterns that have been discovered. In this paper, we perform a comprehensive study on various probabilistic models that can be applied in the synthesizing process and we choose and improve one of them that works to ameliorate the synthesizing results. Finally, some experiments are presented in public database in order to improve the efficiency of our proposed synthesizing method.