• 제목/요약/키워드: One-Class Classification

검색결과 348건 처리시간 0.023초

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권2호
    • /
    • pp.101-112
    • /
    • 1995
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 클러스터러(clusterer)로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사상(local topographical mapping)에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해 먼저, 인식 대상음소는 모음군 17개, 자음의 경우 파열음9개, 마찰음 3개, 파찰음 3개, 유음 및 비음 4개, 음소의 성질이 다른 종성 7개의 음소군으로 모두 43개의 음소를 대상으로 실험하였으며, 각 음소군에 대한 특징 지도를 구성하여 레이블러(labeler)의 기능을 수행하게 하였다. 화자 종속 인식 실험 결과 $87.2\%$의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

한국적 의학 기준에 근거한 고혈압환자의 Angiotensin II Receptor Blockers와 Calcium Channel Blockers의 약물 평가 (Evaluation of Therapeutic Differences of Angiotensin II Receptor Blockers and Calcium Channel Blockers Among Hypertensive Patients Classified by Oriental Traditional Way)

  • 이옥상;천영주;예경남;윤희영;김정태;이윤정;임성실
    • 약학회지
    • /
    • 제58권2호
    • /
    • pp.141-149
    • /
    • 2014
  • Background: Oriental lifestyle for treating diseases has been developed and well-accepted for a long time among Koreans. Sasang Constitution theory, originated from Korean traditional medicine, suggests that medication treatment should be differentiated by each patient's body classification (So-yang [SY], So-eum [SE], Tae-yang [TY], and Tae-eum [TE]), in contrary to western medicine's theory that medication should be applied equally by disease indication without such classification. However, the pharmacotherapeutic outcomes of these theories have not been compared to date. In this study, we aimed to compare the two theories by evaluating blood pressure (BP), which is lowered as a therapeutic outcome, among hypertensive patients taking angiotensin II receptor blockers (ARBs) or calcium channel blockers (CCBs), two most commonly used antihypertensive classes in Korea. Methods: From April 2006 to June 2012, we retrospectively collected data on hypertensive patients with Sasang Constitution classification at Kyunghee University Hospital at Gangdong, one of the East-West collaborative medical centers in Korea. We collected information on age, gender, underlying diseases, antihypertensive drugs (ARB, CCB, ARB+CCB), and BP by reviewing the electronic medical records. We excluded patients with missing blood pressure at baseline or follow-up, or those who had a change in their antihypertensive drug class during follow-up. Results: We selected a total of 573 patients (SY: 165, SE: 158, TY: 0, TE: 250). Baseline BPs were on average 139.0/82.0 mmHg for SY, 137.8/78.5 mmHg for SE, and 138.7/79.2 mmHg for TE. In all three groups, CCBs were the most prescribed, followed by combination therapy with ARB+CCB, then ARBs. BP reduction after 1 month of initial medication was significantly different among the drug classes, but not in Sasang constitutional classification (ARB [SY: -12.4/-4.7, SE: -12.3/-2.5, TE: -8.6/-1.8], CCB [SY: -12.3/-5.4, SE: -13.0/-2.3, TE: -10.8/-6.0], ARB+CCB [SY: -15.6/-6.7, SE: -18.4/-8.1, TE: -20.2/-6.7], drug [$P{\leq}0.05$/P>0.05], constitutional type [P>0.05/P>0.05]). Conclusion: We observed significant differences in reduction of blood pressure by classes of drugs (ARB+CCB>CCB>ARB) but not by Sasang constitutional classification. Therefore, current approach of antihypertensive pharmacotherapy assisted by Western medicine is appropriate for treatment of hypertension. However, further larger scale or prospective studies are required in order to confirm these results.

기계학습 기반 모델을 활용한 시화호의 수질평가지수 등급 예측 (WQI Class Prediction of Sihwa Lake Using Machine Learning-Based Models)

  • 김수빈;이재성;김경태
    • 한국해양학회지:바다
    • /
    • 제27권2호
    • /
    • pp.71-86
    • /
    • 2022
  • 해양환경을 정량적으로 평가하기 위해 수질평가지수(water quality index, WQI)가 사용되고 있다. 우리나라는 해양수산부고시 해양환경기준에 따라 WQI를 5개 등급으로 구분하여 수질을 평가한다. 하지만, 방대한 수질 조사 자료에 대한 WQI 계산은 복잡하고 많은 시간이 요구된다. 이 연구는 기존의 조사된 수질 자료를 활용하여 WQI 등급을 예측할 수 있는 기계학습(machine learning, ML) 기반의 모델을 제안하고자 한다. 특별관리해역인 시화호를 모델링 지역으로 선정하였다. AdaBoost와 TPOT 알고리즘을 모델 훈련을 위해 사용하였으며, 분류 모델 평가 지표(정확도, 정밀도, F1, Log loss)로 모델 성능을 평가하였다. 훈련하기 전, 각 알고리즘 모델의 최적 입력자료 조합을 탐색하기 위해 변수 중요도와 민감도 분석을 수행하였다. 그 결과 저층 용존산소(dissolved oxygen, DO)는 모델의 성능에서 가장 중요한 인자였다. 반면, 표층 용존무기질소(dissolved inorganic nitrogen, DIN)와 표층 용존무기인(dissolved inorganic phosphorus, DIP)은 상대적으로 영향이 적었다. 한편, 최적 모델의 시공간적 민감도와 WQI 등급 별 민감도를 비교한 결과 각 조사 정점 및 시기, 등급 별 모델의 예측 성능이 상이하였다. 결론적으로 TPOT 알고리즘이 모든 입력자료 조합에서 성능이 더 우수하여 충분한 자료로 훈련된 최적 모델은 새로운 수질 조사 자료의 WQI 등급을 정확하게 분류할 수 있을 거라 판단된다.

의사결정트리에서 공간사건 예측을 위한 리프노드 등급 결정 방법 분석 (Analysis of Leaf Node Ranking Methods for Spatial Event Prediction)

  • 연영광
    • 한국지리정보학회지
    • /
    • 제17권4호
    • /
    • pp.101-111
    • /
    • 2014
  • 공간사건들은 데이터마이닝 분류알고리즘을 이용하여 예측 가능하며, 의사결정 트리는 대표적인 분류알고리즘들 중 하나로 사용되고 있다. 의사결정 트리는 레이블 값을 갖는 분류작업에 주로 사용되었으나 규칙평가 기법을 트리 리프노드 등급 계산에 응용하면서부터 공간사건 예측에 이용되고 있다. 이 논문에서는 의사결정 트리에서 사용되는 규칙평가 방법들을 공간예측에 적용하여 비교하였다. 실험을 위해 의사결정 트리 알고리즘인 C4.5알고리즘과 규칙 평가기법인 Laplace, M-estimate 및 m-branch 기법들을 구현하여 자연환경에서 발생되는 대표적인 공간예측 응용분야인 산사태에 적용하였다. 적용한 규칙 평가 기법들의 정확도 평가결과, 그 특성에 따라 정확도의 차이가 있었으며 m-branch가 가장 높은 성능을 보였다. 그러나 m-branch 및 M-estimate와 같이 별도의 파라미터를 갖는 경우 반복적으로 최적의 파라미터 값을 찾는 과정을 요구하였다. 따라서 적용 대상에 따라 선택적으로 활용할 수 있다. 이러한 의사결정 트리를 이용한 공간예측은 예측 결과뿐만 아니라 특정 위치에서의 예측결과에 대한 원인분석을 가능하게 함으로 다양한 응용을 가능하게 한다.

토마토 역병균 항균 활성 데이터의 이분번 근사모델링 (Two Class Approximation of TLB (Tomato Late Blight) Activity Data)

  • 한호규;;조승주
    • 농약과학회지
    • /
    • 제9권2호
    • /
    • pp.140-145
    • /
    • 2005
  • 정량적 구조 활성관계 모델링은 물리적인 성질과 생물학적 활성이 관계 있다는 것을 전제로 한다. 그러나, 퍼센트 활성과 같은 데이터들은 모델링에 많이 활용되지 않았다. 이것의 중요한 이유중의 하나는 이러한 값들이 정량적이 아니고 정성적인 데에 있다. 본 연구에서는 분자모델링에 퍼센트활성 데이터를 활용하기 위하여 데이터 값들을 2개의 계층으로 분류하고 CoMFA(비교분자장)를 판별함수로 활용하였다. 즉, 베타-케토아세트아닐라이드 유도체들의 토마토 역병균에 대한 항균력 시험의 퍼센트 활성 데이터를, 한 계층은 활성이 있는 것, 다른 계층은 활성이 없는 것으로 나누었다. 특히, CoMFA를 활용함으로써 화학적인 이해에 중요한 3차원적인 정보를 얻을 수 있었다. 이 모델은 주어진 데이타를 98%의 정확도로 설명하였으며, LOO 검증을 해본 결과 예측력은 약 69% 정도였다 이 결과는 활성 데이터를 근사적으로 2개의 계급으로 나누고 CoMFA를 활용하는 방식이 구조활성관계를 이해하고 화합물 유도체를 합성하는데 활용될 수 있음을 보여준다.

SVM을 이용한 웨이블릿 기반 프로파일 분류에 관한 연구 (A Wavelet-based Profile Classification using Support Vector Machine)

  • 김성준
    • 한국지능시스템학회논문지
    • /
    • 제18권5호
    • /
    • pp.718-723
    • /
    • 2008
  • 베어링은 각종 설비에서 활용되는 중요한 기계요소 중 하나이다. 설비고장의 상당수는 베어링의 결함이나 파손에 기인하고 있다. 따라서 베어링에 대한 온라인모니터링기술은 설비의 정지를 예방하고 손실을 줄이는 데 필수적이다. 본 논문은 진동 신호를 이용하여 베어링의 상태를 예측하기 위한 온라인모니터링에 대해 연구한다. 프로파일로 주어지는 진동신호는 이산 웨이블릿 변환을 통해 분석되고, 분해수준별 웨이블릿 계수로부터 얻은 통계적 특징 중 유의한 것을 선별하고자 분산분석 (ANOVA)을 이용한다. 선별된 특징벡터는 Support Vector Machine (SVM)의 입력이 되는 데, 본 논문에서는 다중클래스 분류문제를 다루기 위한 계층적 SVM 트리를 제안한다. 수치실험 결과, 제안된 방법은 베어링의 결함을 분류하는 데 우수한 성능을 갖는 것으로 나타났다.

한국어 비교 문장 유형 분류를 위한 변환 기반 학습 기법 (Transformation-based Learning for Korean Comparative Sentence Classification)

  • 양선;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.155-160
    • /
    • 2010
  • 본 논문은 비교마이닝(comparison mining)의 일환인 비교 문장 유형 자동 분류에 관하여 연구한다. 비교마이닝은 텍스트 마이닝의 한 분야로서 대용량의 텍스트를 대상으로 비교 관계를 분석하며, 크게 세 단계의 과정을 거치게 되는데 첫 번째 단계는 대용량의 문서에서 비교 문장만을 식별 후 추출해 내는 과정이고, 두 번째 단계는 추출된 비교 문장들을 비교 유형별로 분류하는 과정이며, 앞의 두 선행 과정이 끝나면 유형별로 비교 속성을 추출 및 비교 관계를 분석하는 세 번째 단계를 수행하게 된다. 본 연구에서는 변환 기반 학습(transformation-based learning) 기법을 이용하여 비교 문장들을 일곱 가지의 유형으로 자동 분류하는 두 번째 과제를 수행한다. 자연어 처리 분야 여러 부문에서 사용되고 있는 변환기반 학습은 오류를 감소시키는 최적의 규칙을 자동으로 생성하여 정답을 찾아가는 규칙 기반 학습 방법이다. 웹상의 다양한 도메인에서 추출된 비교 문장들을 대상으로 유형 분류를 수행한 결과 정확도 80.01%의 성능으로 일곱 가지 유형을 분류할 수 있었다.

Privacy Disclosure and Preservation in Learning with Multi-Relational Databases

  • Guo, Hongyu;Viktor, Herna L.;Paquet, Eric
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.183-196
    • /
    • 2011
  • There has recently been a surge of interest in relational database mining that aims to discover useful patterns across multiple interlinked database relations. It is crucial for a learning algorithm to explore the multiple inter-connected relations so that important attributes are not excluded when mining such relational repositories. However, from a data privacy perspective, it becomes difficult to identify all possible relationships between attributes from the different relations, considering a complex database schema. That is, seemingly harmless attributes may be linked to confidential information, leading to data leaks when building a model. Thus, we are at risk of disclosing unwanted knowledge when publishing the results of a data mining exercise. For instance, consider a financial database classification task to determine whether a loan is considered high risk. Suppose that we are aware that the database contains another confidential attribute, such as income level, that should not be divulged. One may thus choose to eliminate, or distort, the income level from the database to prevent potential privacy leakage. However, even after distortion, a learning model against the modified database may accurately determine the income level values. It follows that the database is still unsafe and may be compromised. This paper demonstrates this potential for privacy leakage in multi-relational classification and illustrates how such potential leaks may be detected. We propose a method to generate a ranked list of subschemas that maintains the predictive performance on the class attribute, while limiting the disclosure risk, and predictive accuracy, of confidential attributes. We illustrate and demonstrate the effectiveness of our method against a financial database and an insurance database.

재귀적 분할 평균에 기반한 점진적 규칙 추출 알고리즘 (An Incremental Rule Extraction Algorithm Based on Recursive Partition Averaging)

  • 한진철;김상귀;윤충화
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.11-17
    • /
    • 2007
  • 패턴 분류에 많이 사용되는 기법 중의 하나인 메모리 기반 추론 알고리즘은 단순히 메모리에 저장된 학습패턴 또는 초월평면과 테스트 패턴간의 거리를 계산하여 가장 가까운 학습패턴의 클래스로 분류하기 때문에 테스트 패턴을 분류하는 기준을 설명할 수 없다는 문제점을 가지고 있다. 이 문제를 해결하기 위하여, 메모리 기반 학습 기법인 RPA를 기반으로 학습패턴들에 내재된 규칙성을 표현하는 IF-THEN 형태의 규칙을 생성하는 점진적 학습 알고리즘을 제안하였다. 하지만, RPA에 의해 생성된 규칙은 주어진 학습패턴 집합에만 충실히 학습되어 overfitting 현상을 보이게 되며, 또한 패턴 공간의 과도한 분할로 인하여 필요 이상으로 많은 개수의 규칙이 생성된다. 따라서, 본 논문에서는 생성된 규칙으로부터 불필요한 조건을 제거함으로써 ovefitting 현상을 해결함과 동시에 생성되는 규칙의 개수를 줄일 수 있는 점진적 규칙 추출 알고리즘을 제안하였으며, UCI Machine Learning Repository의 벤치마크 데이터를 이용하여 제안한 알고리즘의 성능을 입증하였다.

영상자료의 식생지수를 이용한 제주 북동부 지역의 풍력자원지도 작성에 관한 연구 (A Study on the Mapping of Wind Resource using Vegetation Index Technique at North East Area in Jeju Island)

  • 변지선;이병걸;문서정
    • 대한공간정보학회지
    • /
    • 제23권1호
    • /
    • pp.15-22
    • /
    • 2015
  • 풍력자원지도의 작성을 위해 기본적으로 지형고도자료, 지면조도자료, 풍황자료가 필요하다. 그 중 지면조도자료의 경우 토지피복분류 기법을 통한 토지피복지도를 이용하여 구할 수 있다. 지면조도지도의 경우 토지피복의 성질에 따라 풍속의 조도계수가 다르게 되며, 이러한 조도계수에 근거하여 정확한 지면조도지도를 만들 수 있다. 본 연구에서는 Landsat위성자료를 이용하여 무감독 분류 방법과 식생지수법을 사용하여 지면조도자료를 생성한 후 풍력자원지도를 작성하였다. 이렇게 만들어진 풍력자원지도를 근거로 식생지수법의 사용이 무감독 분류 기법에 비하여 타당한지를 검증하였다. 그 결과, 식생지수를 사용한 풍력자원지도는 관측 자료와 비교한 경과 60% 이상의 등급 일치율을 보였고 불일치하는 픽셀에 대해서는 최대 등급의 차이를 넘지 않았다. 따라서 풍력자원지도 생성 시 필요한 지면조도지도를 계산할 경우 식생지수를 이용한 분류방법이 효과적인 것으로 판단된다.