• 제목/요약/키워드: Similarity solution

검색결과 296건 처리시간 0.031초

A New Similarity Measure Based on Intraclass Statistics for Biometric Systems

  • Lee, Kwan-Yong;Park, Hye-Young
    • ETRI Journal
    • /
    • 제25권5호
    • /
    • pp.401-406
    • /
    • 2003
  • A biometric system determines the identity of a person by measuring physical features that can distinguish that person from others. Since biometric features have many variations and can be easily corrupted by noises and deformations, it is necessary to apply machine learning techniques to treat the data. When applying the conventional machine learning methods in designing a specific biometric system, however, one first runs into the difficulty of collecting sufficient data for each person to be registered to the system. In addition, there can be an almost infinite number of variations of non-registered data. Therefore, it is difficult to analyze and predict the distributional properties of real data that are essential for the system to deal with in practical applications. These difficulties require a new framework of identification and verification that is appropriate and efficient for the specific situations of biometric systems. As a preliminary solution, this paper proposes a simple but theoretically well-defined method based on a statistical test theory. Our computational experiments on real-world data show that the proposed method has potential for coping with the actual difficulties in biometrics.

  • PDF

한국어 단모음의 지각적 모음공간과 심적 표상 (Perceptual Vowel Space and Mental Representation of Korean Monophthongs)

  • 최양규
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.287-301
    • /
    • 2003
  • The purpose of this study was to examine whether the same vowel sounds are perceived differently by the two local dialect speakers, Seoul dialect speakers (SDS) and Kyungnam dialect speakers (KDS), whose vowel systems differ each other. In the first experiment SDS and KDS heard vowels synthesized in vowel space with F1 by F2 and categorized them into one of 10 Korean monophthongs. The results showed that SDS and KDS perceived the synthesized vowels differently. For example, /$\varepsilon$ versus /e/ contrast, ${\o}$/, and /y/ are differentiated by SDS, whereas they are perceptually confused by KDS. We also observed that /i/ could not be perceived unless the vowel synthesis included F3 or higher formants. In the second experiment SDS and KDS performed the similarity rating task of 10 synthesized Korean monophthongs. Two-dimensional MDS solution based on the similarity rating scores was obtained for each dialect group. The first dimension can be named 'vowel advancement' and the second 'vowel height'. The comparison of the two MDS solutions showed that the overall psychological distances among the vowels are shorter in KDS than SDS and that especially the distance between /$\Lambda$/ and /i/ is shorter in KDS than SDS. The result suggested that perception or mental representation of vowels depends on the vowel system of the listener's dialect or language. Further research problems were discussed in the final section.

  • PDF

Relevancy contemplation in medical data analytics and ranking of feature selection algorithms

  • P. Antony Seba;J. V. Bibal Benifa
    • ETRI Journal
    • /
    • 제45권3호
    • /
    • pp.448-461
    • /
    • 2023
  • This article performs a detailed data scrutiny on a chronic kidney disease (CKD) dataset to select efficient instances and relevant features. Data relevancy is investigated using feature extraction, hybrid outlier detection, and handling of missing values. Data instances that do not influence the target are removed using data envelopment analysis to enable reduction of rows. Column reduction is achieved by ranking the attributes through feature selection methodologies, namely, extra-trees classifier, recursive feature elimination, chi-squared test, analysis of variance, and mutual information. These methodologies are ranked via Technique for Order of Preference by Similarity to Ideal Solution (TOPSIS) using weight optimization to identify the optimal features for model building from the CKD dataset to facilitate better prediction while diagnosing the severity of the disease. An efficient hybrid ensemble and novel similarity-based classifiers are built using the pruned dataset, and the results are thereafter compared with random forest, AdaBoost, naive Bayes, k-nearest neighbors, and support vector machines. The hybrid ensemble classifier yields a better prediction accuracy of 98.31% for the features selected by extra tree classifier (ETC), which is ranked as the best by TOPSIS.

TOPTSIS를 이용한 낙동강 지류에서의 수질측정망 평가 연구 (A Study on Evaluation of Water Quality Measurement Network in the Nakdong River Tributary Using TOPSIS)

  • 갈병석;박재범;김성민;심규현;신상민;최수연
    • 한국습지학회지
    • /
    • 제24권1호
    • /
    • pp.44-51
    • /
    • 2022
  • 본 연구에서는 TOPSIS(Techniques for Order Performance by Similarity to Ieal Solution)을 이용하여 낙동강수계 34개 지천에서의 수질측정망 설치 지점에 대하여 평가하였다. 낙동강수계에서는 지난 2011년부터 195개 지천에서 수질 및 유량을 측정하고 있다. 특히, 34개 중점관리지점은 오염원이 많고 수질이 불량한 지역으로서 지속적인 수질이 관리가 필요하다. 관리가 필요한 지점 선정을 위해 평가항목은 10개 지표를 선정하였으며 선정된 지표를 표준화하고, 엔트로피 방법(Entropy Method)을 이용하여 가중치를 부여하였다. 가중치 산정결과, 인근 측정망 유무가 가장 크고 평균 수질과 산업단지 유무도 높은 가중치를 얻었다. 평가결과, 상위 지점은 인근 측정망이 없고 산업단지와 폐수처리시설이 있고 평균 수질이 타 지점보다 높은 지점이다. 평가된 자료는 향후 낙동강수계에서의 신규 수질측정망 설정 및 지속적인 지류에서의 수질 관리를 위해 필요한 연구 결과로 판단된다.

유추 사상의 명료화를 통한 문장제 해결에 관한 연구 (A Study on Solving Word Problems through the Articulation of Analogical Mapping)

  • 김지은;신재홍
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제27권4호
    • /
    • pp.429-448
    • /
    • 2013
  • 본 연구의 목적은 문장제에서 사상 명료화 활동을 통한 문제해결과정을 살펴보고, 문제를 해결할 때 드러나는 사고과정의 특징을 유사성 관점에서 분석함으로써 사상 명료화 과정을 활용한 교수 학습 자료의 개발 및 학생들의 문제해결활동 향상에 기여하는 것이다. 중학교 2학년 남학생 33명을 대상으로 총 3차시의 서술형 검사지를 제작하여 수업을 실시하였고, 이들 33명 중 서로 다른 결과를 보이는 학생 5명을 선정하여 개별 면담을 통해 보다 구체적으로 분석적 사고와 의사 분석적 사고의 관점에서 그 사고 특성을 분석하였다. 연구결과 사상 과정에서 대응되는 성분들을 직접적으로 짝짓기를 하는 사상 명료화 활동이 학생들의 문제해결에 무조건 도움이 되는 것은 아니며, 문제에 따라 또는 문제가 유사하더라도 구조적 변형의 정도에 따라 문제 해결과정에 미치는 영향이 달랐다. 이는 사상 명료화 활동이 유사한 문장제 해결에 있어서 도움을 주지만 이전 문제의 모방을 통해 바람직하지 않은 사고로 정답을 구하는 의사 분석적 사고가 발생할 수 있음을 시사한다.

주제 유사성 기반 클러스터링을 이용한 블로그 검색기법 연구 (Study for Blog Clustering Method Based on Similarity of Titles)

  • 이기준;이명진;김우주
    • 지능정보연구
    • /
    • 제15권2호
    • /
    • pp.61-74
    • /
    • 2009
  • 웹 2.0에 기반한 정보화 사회에 있어 참여를 통한 자료의 축적 속도는 더욱 더 가속화 되어가고 있다. 이러한 현상속에서, 웹 2.0으로 인해 정보의 저장 및 공유 형태 역시 단순 웹 페이지에서 블로그로 나아가 포드캐스팅, 비디오 등의 다양한 모습으로 분화되어가고 있는 실정인데, 이는 웹 상의 정보에 대한 통합적이고 효율적인 접근을 오히려 방해할 수 있는 요소이기에 보다 효과적인 정보 검색 방법을 요구하게 된다. 본 연구에서는 특히 블로그 검색에 초점을 맞추어 기존 웹 검색 방식의 문제점을 도출, 해결하고자 한다. 논문에서 제안하고자 바는 특정 검색어에 대해 블로그 검색을 수행한 후, 검색 결과에서 주요 주제들을 효과적으로 추출하고, 주제별로 결과물들을 클러스터링하여 순위별로 제공하고자 하는 것이다. 이를 통해 블로그 검색에의 정보 추출에서 사용자에게 특정 검색어에 대해 보다 동적인 추가 주제 카탈로그를 제시함으로써 대량의 의미 없는 정보들을 단순 브라이징하는 방식을 벗어날 수 있으며, 빠르게 검색 의도에 유의한 자료들에 접근할 수 있도록 할 수 있다.

  • PDF

확률 유사성척도를 활용한 웹 기반의 상품추천시스템 (Web-based Product Recommendation System with Probability Similarity Measure)

  • 최상현;안병석
    • 지능정보연구
    • /
    • 제13권1호
    • /
    • pp.91-105
    • /
    • 2007
  • 본 연구에서는 사용자와 시스템간 양방향 의사소통 방법을 가능하게 하는 확률 유사성척도 기반의 추천시스템을 제안한다. 본 시스템에서 활용한 알고리즘의 주요한 아이디어는 사용자가 제시한 상품 사양에 대한 선호정보를 사용하여 상품의 효용 범위를 구하고, 두 상품의 효용범위 값들 간의 유사도의 값으로서 겹침 확률을 계산한다. 앞에서 구해진 상품 간 유사도의 값을 사용하게 되면, 유사 정도가 가장 높은 상품들을 유사상품으로 등록하게 된다. 본 추천시스템은 개별 사용자 별로 제시된 정보를 사용하므로 차별화 된 추천이 가능해진다. 본 시스템을 활용하게 되면 상품 정보를 공유하는 기업들이 협업 전자상거래 프로세스를 수행할 수 있다. 협업 기업들은 협업을 위한 상품들을 등록하고 해당 상품들과 유사한 상품들을 각 기업의 유사상품 데이터베이스에 저장하여, 향후 유사상품 추천에 활용할 수 있다. 본 연구에서 제시된 유사상품 추천시스템은 웹기반의 응용시스템으로서 인터넷이 가능한 어떠한 환경에서도 수행될 수 있다. 본 연구에서 제시된 절차의 효과를 검증하기 위하여 사용자 실험을 수행하였다. 실험결과를 살펴보면 효용기반의 방법론이 정확도와 만족도 측면에서 상품추천 문제에 대한 하나의 효과적인 해결책으로 사용될 수 있다는 것이 검증되었다.

  • PDF

SDS 환경의 유사도 기반 클러스터링 및 다중 계층 블룸필터를 활용한 분산 중복제거 기법 (Distributed data deduplication technique using similarity based clustering and multi-layer bloom filter)

  • 윤다빈;김덕환
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.60-70
    • /
    • 2018
  • 클라우드 환경에서 다수의 사용자가 물리적 서버를 가상화하여 사용할 수 있도록 편의성을 제공하는 Software Defined Storage(SDS)를 적용하고 있지만 한정된 물리적 자원을 고려하여 공간 효율성을 최적화하는 솔루션이 필요하다. 기존의 데이터 중복제거 시스템에서는 서로 다른 스토리지에 업로드 된 중복 데이터가 중복제거되기 어렵다는 단점이 있다. 본 논문에서는 유사도기반 클러스터링과 다중 계층 블룸 필터를 적용한 분산 중복제거 기법을 제안한다. 라빈 해시를 이용하여 가상 머신 서버들 간의 유사도를 판단하고 유사도가 높은 가상머신들을 클러스터 함으로써 개별 스토리지 노드별 중복제거 효율에 비하여 성능을 향상시킨다. 또한 중복제거 프로세스에 다중 계층 블룸 필터를 접목하여 처리 시간을 단축하고 긍정오류를 감소시킬 수 있다. 실험결과 제안한 방법은 IP주소 기반 클러스터를 이용한 중복제거 기법에 비해 처리 시간의 차이가 없으면서, 중복제거율이 9% 높아짐을 확인하였다.

불소화합물을 첨가한 생리식염수에서 아말감의 부식거동에 관한 전기화학적 연구 (AN ELECTROCHEMICAL STUDY ON THE CORROSION BEHAVIOUR OF AMALGAMS IN THE SALINE SOLUTIONS WITH FLUORIDE COMPOUNDS)

  • 윤정훈;권혁춘;엄정문
    • Restorative Dentistry and Endodontics
    • /
    • 제22권1호
    • /
    • pp.396-412
    • /
    • 1997
  • The purpose of this study is to observe the corrosion characteristics of five dental amalgams(CAULK FINE CUT, OPTALLOY II, DISPERSALLOY, TYTIN, and VALIANT) in the solutions with fluoride compound through the anodic polarization curve obtained by using a potentiostat. After each amalgam alloy and Hg being triturated, the triturated mass was inserted into the cylindrical metal mold, and condensed by hydraulic pressure(160 kg/$cm^2$). Each specimen was removed from the metal mold. Specimens were polished with the silicone carbide grinding paper 24 hours after condensation and stored at room temperature for 1 week. The anodic polarization curves were employed to compare the corrosion behaviours of the amalgams in 0.9 % saline solution and in the saline solutions with 2.2 ppm, 0.05 %, 2 % NaF, and 8 % $SnF_2$ at $37^{\circ}C$ with 3-electrode potentiostat. After the immersion of specimen in electrolyte for 30 minutes, the potential scan was begun. The potential scan range was -1500m V to + 800m V(vs. S.C.E.) in the working electrode and the scan rate was 50 mV/sec. The results were as follows, 1. The corrosion potential, the potential of anodic current peak, and transpassive potential in the saline solutions with NaF shifted to lower direction than those in normal saline solution, and the current density in the saline solutions with NaF was higher than that in normal saline solution. The differences were increased as the concentrations of NaF became higher. 2. The corrosion potential and transpassive potential in the saline solution with $SnF_2$ shifted to higher direction than those in normal saline solution, and the current density in the saline solution with $SnF_2$ was higher than that in normal saline solution after the corrosion potential. The anodic polarization curves in the saline solution with $SnF_2$ had no outstanding anodic current peak. 3. The corrosion potentials for high-copper amalgams were much higher than those for CAULK FINE CUT and OPTALLOY II in normal saline solution, but, as the concentrations of fluoride compound became higher, the differences in corrosion potentials between them were decreased. The corrosion potentials had the similarity in the saline solution with 2% NaF or 8% $SnF_2$. 4. The current density for TYTIN was the lowest among the others in normal saline solution and in the saline solution with 2.2 ppm or 0.05 % NaF. 5. There was no significant difference in current density between Pd-enriched VALIANT and other high-copper amalgams.

  • PDF

빅데이터 기반 추천시스템 구현을 위한 다중 프로파일 앙상블 기법 (A Multimodal Profile Ensemble Approach to Development of Recommender Systems Using Big Data)

  • 김민정;조윤호
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.93-110
    • /
    • 2015
  • 기존의 협업필터링 추천시스템 연구는 상품에 대한 고객의 평점(rating)이나 구매 여부 데이터로부터 하나의 프로파일을 생성하고 이를 기반으로 추천 성능을 향상시킬 수 있는 새로운 알고리즘을 개발하는 위주로 진행되어 왔다. 그러나 빅데이터 환경이 도래하면서 기업이 수집할 수 있는 고객 데이터가 풍부해지고 다양해짐에 따라, 보다 정확하게 고객의 선호도나 행태를 파악하는 것이 가능하게 되었고 이러한 데이터, 즉 퍼스널 빅데이터(personal big data)를 추천시스템에 활용하는 연구의 필요성이 대두되고 있다. 본 연구에서는 마케팅의 시장세분화 이론에 근거하여 퍼스널 빅데이터로부터 고객의 선호도나 행태를 다양한 관점에서 표현할 수 있는 5종의 다중 프로파일(multimodal profile)을 개발하고, 이를 활용하여 협업필터링 추천시스템의 성능을 개선하고자 한다. 제안하는 5종의 다중 프로파일은 프로파일 통합 유사도, 개별 프로파일 유사도 평균, 개별 프로파일 유사도 가중 평균이라는 세 가지 앙상블 기법을 통해 협업필터링의 이웃(neighborhood) 탐색과정에 적용된다. 실제 퍼스널 빅데이터에 본 연구에서 제안하는 방법론을 적용한 결과, 단일 프로파일을 사용하는 협업필터링 알고리즘보다 추천 성능이 상당히 개선되었으며 앙상블 방법 중에서는 개별 프로파일 유사도 가중 평균 기법이 가장 높은 추천 성능을 보여주었다. 본 연구는 빅데이터 환경에서 추천시스템을 개발하고자 할 때, 어떠한 성격의 데이터로부터 고객의 특성을 규명하는 프로파일을 만들고 이를 어떻게 결합하여 사용하는 것이 효과적인 지 처음으로 제안하였다는 점에서 그 의의가 있다.