• 제목/요약/키워드: Normalized Mutual Information

검색결과 28건 처리시간 0.027초

NEW INFORMATION INEQUALITIES ON ABSOLUTE VALUE OF THE FUNCTIONS AND ITS APPLICATION

  • CHHABRA, PRAPHULL
    • Journal of applied mathematics & informatics
    • /
    • 제35권3_4호
    • /
    • pp.371-385
    • /
    • 2017
  • Jain and Saraswat (2012) introduced new generalized f-information divergence measure, by which we obtained many well known and new information divergences. In this work, we introduce new information inequalities in absolute form on this new generalized divergence by considering convex normalized functions. Further, we apply these inequalities for getting new relations among well known divergences, together with numerical verification. Application to the Mutual information is also presented. Asymptotic approximation in terms of Chi- square divergence is done as well.

NPMI를 이용한 어휘의 감성분석 연구 (A Study on Sentiment Analysis of Words using Normalized PMI)

  • 류기곤;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1333-1336
    • /
    • 2015
  • 감성분석은 최근 오피니언 마이닝에서 주목받고 있는 분야로써, 특정 주제, 상품, 유명인사 등에 대한 사람들의 반응을 긍정 또는 부정으로 구분하거나 점수를 이용하여 긍정 또는 부정의 강도를 분석하는데 이용되고 있다. PMI(pointwise mutual information)와 SO-PMI(semantic orientation from pointwise mutual information)는 비교적 빠르고 간편하게 극성을 판단할 수 있다는 장점이 있지만, 어휘와 기준 어휘 사이의 극성 값이 넓은 범위를 갖는다는 단점이 있다. 본 논문에서는 일상적인 언어 사용 환경에서 나타나는 어휘로부터 감성을 분석하고자 하였다. 특히 어휘의 극성 값 편차로 인해 나타날 수 있는 어려움을 보완하기 위해 NPMI(normalized pointwise mutual information)를 이용하여 어휘의 감성을 분석하였다. PMI와 NPMI를 비교 분석한 결과 어휘의 감성 강도를 나타내는 데 있어서 밀집도에서 큰 차이를 보였다.

An information-theoretical analysis of gene nucleotide sequence structuredness for a selection of aging and cancer-related genes

  • Blokh, David;Gitarts, Joseph;Stambler, Ilia
    • Genomics & Informatics
    • /
    • 제18권4호
    • /
    • pp.41.1-41.8
    • /
    • 2020
  • We provide an algorithm for the construction and analysis of autocorrelation (information) functions of gene nucleotide sequences. As a measure of correlation between discrete random variables, we use normalized mutual information. The information functions are indicative of the degree of structuredness of gene sequences. We construct the information functions for selected gene sequences. We find a significant difference between information functions of genes of different types. We hypothesize that the features of information functions of gene nucleotide sequences are related to phenotypes of these genes.

정규상호정보와 지지벡터기계를 이용한 천식 관련 단일염기다형성 유전형 자료 분석 (Analysis of Asthma Related SNP Genotype Data Using Normalized Mutual Information and Support Vector Machines)

  • 이중섭;김승현;신기섭;임규철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권9호
    • /
    • pp.691-696
    • /
    • 2009
  • 서론: 천식에는 아스피린 과민증 (aspirin hypersensitivity)에 따라 아스피린 불내성 (aspirin intolerant asthma, AIA)과 내성 천식 (aspirin tolerant asthma, ATA) 두 가지 유형이 있다. 천식과 관련된 유전적 위험 요인들은 집중적으로 또한 광범위하게 연구되고 있다. 그러나 단일염기다형성들의 조합의 효과에 대해서는 거의 평가되지 않았다. 본 논문에서는 두 유형의 천식 진단에 유용한 단일염기다형성의 최상의 조합을 찾는다. 방법: 본 논문에서는 246명의 천식환자들을 조사하였다. (94명은 아스피린 불내성 천식을 152명은 아스피린 내성 천식을 가지고 있다) 그리고 천식과 관련된 것으로 추측되는 25개의 단일염기다형성들을 분석하였다. 단일염기다형성의 조합의 정규상호정보 값을 계산하여 높은 정규상호정보 값을 갖는 단일염기다형성들의 조합을 선택하고 선택된 조합들의 예측 정확도를 지지벡터기계를 사용하여 계산하였다. 결과: 최상의 조합은 4개짜리이고 ALOX5_p1_1708, B2ADR_q1_46, CCR3_p1_520, CysLTR1_p1_534로 구성된 모델이다. 이것은 0.053의 정규상호정보 값과 71.14%의 ATA 질병에 대한 예측 정확도를 갖는다.

An enhanced feature selection filter for classification of microarray cancer data

  • Mazumder, Dilwar Hussain;Veilumuthu, Ramachandran
    • ETRI Journal
    • /
    • 제41권3호
    • /
    • pp.358-370
    • /
    • 2019
  • The main aim of this study is to select the optimal set of genes from microarray cancer datasets that contribute to the prediction of specific cancer types. This study proposes the enhancement of the feature selection filter algorithm based on Joe's normalized mutual information and its use for gene selection. The proposed algorithm is implemented and evaluated on seven benchmark microarray cancer datasets, namely, central nervous system, leukemia (binary), leukemia (3 class), leukemia (4 class), lymphoma, mixed lineage leukemia, and small round blue cell tumor, using five well-known classifiers, including the naive Bayes, radial basis function network, instance-based classifier, decision-based table, and decision tree. An average increase in the prediction accuracy of 5.1% is observed on all seven datasets averaged over all five classifiers. The average reduction in training time is 2.86 seconds. The performance of the proposed method is also compared with those of three other popular mutual information-based feature selection filters, namely, information gain, gain ratio, and symmetric uncertainty. The results are impressive when all five classifiers are used on all the datasets.

Wavelet Transform based Image Registration using MCDT Method for Multi-Image

  • Lee, Choel;Lee, Jungsuk;Jung, Kyedong;Lee, Jong-Yong
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제7권1호
    • /
    • pp.36-41
    • /
    • 2015
  • This paper is proposed a wavelet-based MCDT(Mask Coefficient Differential and Threshold) method of image registration of Multi-images contaminated with visible image and infrared image. The method for ensure reliability of the image registration is to the increase statistical corelation as getting the common feature points between two images. The method of threshold the wavelet coefficients using derivatives of the wavelet coefficients of the detail subbands was proposed to effectively registration images with distortion. And it can define that the edge map. Particularly, in order to increase statistical corelation the method of the normalized mutual information. as similarity measure common feature between two images was selected. The proposed method is totally verified by comparing with the several other multi-image and the proposed image registration.

재귀적 국소영역 정규상호정보를 이용한 적외선 영상과 가시광 영상의 정합기법 및 구현방법 (EO/IR Images Registration using Recursive Localized Normalized Mutual Information and Implementation)

  • 전윤호
    • 한국군사과학기술학회지
    • /
    • 제16권4호
    • /
    • pp.537-544
    • /
    • 2013
  • This paper proposes a recursive localized Normalized Mutual Information(NMI) algorithm to overcome shortcomings of the conventional NMI algorithm and the localized NMI algorithm which proposed before. The localized NMI algorithm divides images into few fixed size segments and applies NMI algorithm to each segments. By extension, the proposed algorithm uses variable size segments using its characteristic. Dividing each segment recursively, the algorithm selects a suitable segment size and improves a performance of the image registration. Experimental result shows the performance of the proposed algorithm.

Hybrid Affine Registration Using Intensity Similarity and Feature Similarity for Pathology Detection

  • June-Sik Kim;Ho-Sung Kim;Jong-Min Lee;Jae-Seok Kim;In-Young Kim;Sun I. Kim
    • 대한의용생체공학회:의공학회지
    • /
    • 제23권1호
    • /
    • pp.39-47
    • /
    • 2002
  • 본 연구의 목적은 선형 변환을 이용한 레지스트레이션의 정확도를 높이는데 있다. 서로 다른 개인간의 뇌영상을 비교분석하기 위해서는 공통된 좌표계로 각 영상을 변환하는 작업이 필요하다 정확한 변환을 위해서는 전체적인 뇌영상의 매치와 국소적 영역의 매치가 모두 중요하다 일반적으로 상호정보를 이용한 레지스트레이션은 전체적인 뇌영상을 매치시키는데 유리하다. 그러나 관심영역에 대한 매치는 특징기반 레지스트레이션 방법이 더 유리하다. 본 논문에서 제시하는 통합 레지스트레이션은 특징정보와 더불어 복셀기반의 상호정보를 함께 사용하였다. 이러한 접근 방법은 정신분열증을 판단하는 기준으로 많이 사용되는 뇌량을 포함하는 뇌의 중심부분의 매칭에 유리함을 실험을 통해 확인하였다 상호정보만을 사용하는 복셀기반 레지스트레이션이나 탈라이락 좌표계를 이용한 정규화에 비해 본 연구의 통합 레지스트레이션은 전체적 뇌영상 뿐만 아니라 관심 영역에서의 레지스트레이션 오차가 더 작았다.

점진적 샘플링과 정규 상호정보량을 이용한 온라인 기계학습 공조기 급기온도 예측 모델 개발 (Development of Online Machine Learning Model for AHU Supply Air Temperature Prediction using Progressive Sampling and Normalized Mutual Information)

  • 추한경;신한솔;안기언;라선중;박철수
    • 대한건축학회논문집:구조계
    • /
    • 제34권6호
    • /
    • pp.63-69
    • /
    • 2018
  • The machine learning model can capture the dynamics of building systems with less inputs than the first principle based simulation model. The training data for developing a machine learning model are usually selected in a heuristic manner. In this study, the authors developed a machine learning model which can describe supply air temperature from an AHU in a real office building. For rational reduction of the training data, the progressive sampling method was used. It is found that even though the progressive sampling requires far less training data (n=60) than the offline regular sampling (n=1,799), the MBEs of both models are similar (2.6% vs. 5.4%). In addition, for the update of the machine learning model, the normalized mutual information (NMI) was applied. If the NMI between the simulation output and the measured data is less than 0.2, the model has to be updated. By the use of the NMI, the model can perform better prediction ($5.4%{\rightarrow}1.3%$).

위성영상으로 DSM을 생성하기 위한 SGM Cost의 비교 (Comparison of SGM Cost for DSM Generation Using Satellite Images)

  • 이효성;박순용;권원석;한동엽
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.473-479
    • /
    • 2019
  • 본 연구는 ISPRS (International Society for Photogrammetry and Remote Sensing)에서 제공하는 스페인 Terrassa 지역의 WorldView-1 고해상도 스테레오 위성영상으로부터 DSM (Digital Surface Model) 제작을 위해 SGM을 적용하였다. SGM (Semi Global Matching)은 스테레오 영상에 대한 매칭 Cost를 여러 방향에서 계산하고, 계산된 Cost를 순차적으로 누적시킨 후, 누적된 Cost의 최소(또는 최대) 값에 해당하는 시차를 계산하는 영상매칭 알고리즘이다. SGM 적용을 위한 Cost는 MI (Mutual Information, NCC (Normalized Cross-Correlation), CT (Census Transform)를 적용하였으며, 각각의 Cost별 DSM에서 지형지물의 외곽선 표현결과 정확도와 그 성능을 제시하였다. 사용 영상과 실험 대상지역을 토대로, CT Cost 결과 정확도가 가장 우수하였으며, 외곽선 표현 또한 가장 선명하게 묘사되었다. 아울러 SGM 방법은 기존 소프트웨어에 비해 보다 세밀한 외곽선을 표현한 반면 수계지역에서는 많은 오류가 발생하였다.