• 제목/요약/키워드: Improved K-means algorithm

검색결과 143건 처리시간 0.03초

준 실시간 뉴스 이슈 분석을 위한 계층적·점증적 군집화 (Hierarchical and Incremental Clustering for Semi Real-time Issue Analysis on News Articles)

  • 김호용;이승우;장홍준;서동민
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.556-578
    • /
    • 2020
  • 실시간으로 발생하는 뉴스 기사로부터 이슈를 분석하기 위한 다양한 연구가 진행되어 왔다. 하지만 범주에 따라 계층적으로 이슈를 분석하는 연구는 많이 진행되지 않았고, 계층적 이슈 분석을 위한 기존의 연구에서 제안하는 방식 또한 뉴스 기사 증가에 따라 군집화 속도가 느려지는 문제점이 있다. 따라서 본 논문에서는 준 실시간으로 뉴스 기사의 이슈를 분석하는 계층적·점증적 군집화 방식을 제안한다. 제안하는 군집화 방식은 샴 신경망을 이용한 가중 코사인 유사도 측정 모델 기반의 k-평균 알고리즘을 이용한 단어 군집 기반 문서 표현 방식을 통해 뉴스 기사를 문서 벡터로 표현한다. 그리고 문서 벡터로부터 초기 이슈 군집 트리를 생성하고, 새로 발생한 뉴스 기사를 해당 이슈 군집 트리에 추가하는 점증적 군집화 방식을 제안함으로써 뉴스 기사의 계층적 이슈를 준 실시간으로 분석한다. 마지막으로, 본 논문에서 제안하는 방식과 기존 방식들과의 성능평가를 통해 제안하는 군집화 방식이 정확도 측면에서 기존 방식 대비 NMI 지표 기준 0.26 정도 성능이 향상되었고, 속도 측면에서 약 10배 이상의 성능이 향상됨을 입증하였다.

내적 조합 모델 PLS를 이용한 소프트 센서 설계 (Soft sensor design based on PLS with hybrid inner model)

  • 홍선주;한종훈
    • 한국가스학회지
    • /
    • 제2권3호
    • /
    • pp.49-53
    • /
    • 1998
  • 온라인 가스 크로마토그래피와 같은 실시간 분석기기는 데이터 채취 및 분석과정의 시간이 오래 걸려 측정 신뢰성이 낮으며 또한 설치 및 보수비용이 많이 들어서, 실제 가스 산업 공정에서는 온도, 압력과 같은 공정의 운전 변수들을 이용하여 간접적으로 가스의 성분 및 양을 감지하는 소프트 센서에 관한 연구가 활발하게 진행 중이다. 본 연구에서는 데이터 기반 소프트 센서의 설계에 있어서 공정 데이터가 갖는 패턴을 잘 반영하여 추정 능력을 높이는 내적 조합모델 PLS를 제안하고, 이를 산업체의 농도 추정 목적으로 적용하였다. 제안된 PLS모델은 기존에 제시된 모델들보다 뛰어난 추정 능력을 보였다.

  • PDF

적응 모듈러스와 적응 스텝 크기를 이용한 Hybrid-SE-MMA 적응 등화기의 성능 평가 (Performance Evaluation of Hybrid-SE-MMA Adaptive Equalizer using Adaptive Modulus and Adaptive Step Size)

  • 임승각
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.97-102
    • /
    • 2020
  • 본 논문은 부호간 간섭을 최소화시킬 수 있는 SE-MMA 적응 등화기에서 adaptive modulus와 adaptive step size를 이용한 등화 성능을 개선할 수 있는 Hybrid-SE-MMA에 관한 것이다. 적응 등화를 위한 MMA 알고리즘에서는 오차 신호를 이용하여 등화기 탭 계수를 갱신하고, SE-MMA는 오차 신호의 부호만을 이용하므로 연산량을 단순화시킨 구조이다. 연산량을 단순화시킴으로서 수렴 속도와 알고리즘 처리 속도에서는 향상 효과를 얻을 수 있지만 등화 성능이 저하되는 한계를 단점이 있다. 논문에서는 등화기 출력 신호의 전력에 비례하는 적응 modulus와 적응 step size를 SE-MMA에 적용하므로서 등화 성능을 더욱 개선할 수 있음을 컴퓨터 시뮬레이션을 통해 확인한다. 개선된 등화 성능을 기존 SE-MMA와 비교하기 위하여 수신측에서의 등화기 출력 신호인 복원된 신호 성상도, 잔류 isi, MD (Maximum Distortion), MSE 및 외부 잡음에 대한 알고리즘의 강인성을 알 수 있는 SER 성능을 사용하였다. 컴퓨터 시뮬레이션 결과 Hybrid-SE-MMA 알고리즘은 잔류 isi와 MD, MSE 및 SER등의 모든 성능 지수에서 SE-MMA 보다 개선됨을 알 수 있었다.

클러스터링과 차원축약 기법을 통합한 영상 검색 시스템 (Combined Image Retrieval System using Clustering and Condensation Method)

  • 이세한;조정원;최병욱
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.53-66
    • /
    • 2006
  • 본 논문에서는 전체 차원으로 데이터베이스 내의 모든 영상에 대해 순차적인 검색을 했을 때의 상세 검색 결과와 동일한 적합성을 유지하면서 검색 속도를 훨씬 더 향상시킬 수 있는 통합 검색 시스템을 제안한다. 통합 검색 시스템은 적합성을 유지하는 서로 다른 두 독립적인 시스템이 병합되어 있다. 하나는 특징 벡터 차원 축약을 이용한 2단계 검색 시스템이고 나머지 하나는 이진 트리 클러스터링을 이용한 2단계 검색 시스템이다. 각각의 방법은 1단계에서 상세 검색에서의 검색 결과를 항상 포함하는 후보 영상들을 추출하고, 추출된 후보 영상들을 대상으로 2단계 검색에서 전체 차원으로 재 검색을 한다 그러므로 각 방법과 통합 검색 방법은 모두 상세 검색을 수행했을 때와 동일한 검색 결과를 얻게 된다. 특징 벡터 차원 축약을 이용한 2단계 검색 방법은 Cauchy- Schwartz 부등식의 성질을 이용하여 특징 벡터를 차원 축약하여 검색에 사용하는 방법이다. 이때 전체 검색 시간을 최소로 하는 최적 차원 축약율이 존재하게 되고, 이를 후보 영상 추출을 위한 1차 검색에 적용하게 된다. 이진 트리 클러스터링을 이용한 2단계 검색 방법은 재귀적인 2-means 클러스터링을 통해 각 클러스터의 반경이 동일하게 동적으로 분할하는 방법이다. 동일한 적합성 유지를 위해 유사도 기준이 보정된 질의를 통해 1단계 검색에서 후보 클러스터를 추출하고, 2단계 검색에서 후보 클러스터 내의 영상을 대상으로 최종 결과 영상들을 얻게 된다. 통합 검색 방법은 위의 두 검색 방법을 통합한 것으로 서로 독립적인 두 방법을 동시에 적용함으로써 검색 시스템의 성능을 훨씬 더 향상시킬 수 있다 제안하는 방법은 상세 검색의 적합성을 유지하면서도 검색 속도를 훨씬 더 향상시킬 수 있음이 실험을 통해 입증되었다.

Design and experimental characterization of a novel passive magnetic levitating platform

  • Alcover-Sanchez, R.;Soria, J.M.;Perez-Aracil, J.;Pereira, E.;Diez-Jimenez, E.
    • Smart Structures and Systems
    • /
    • 제29권3호
    • /
    • pp.499-512
    • /
    • 2022
  • This work proposes a novel contactless vibration damping and thermal isolation tripod platform based on Superconducting Magnetic Levitation (SML). This prototype is suitable for cryogenic environments, where classical passive, semi active and active vibration isolation techniques may present tribological problems due to the low temperatures and/or cannot guarantee an enough thermal isolation. The levitating platform consists of a Superconducting Magnetic Levitation (SML) with inherent passive static stabilization. In addition, the use of Operational Modal Analysis (OMA) technique is proposed to characterize the transmissibility function from the baseplate to the platform. The OMA is based on the Stochastic Subspace Identification (SSI) by using the Expectation Maximization (EM) algorithm. This paper contributes to the use of SSI-EM for SML applications by proposing a step-by-step experimental methodology to process the measured data, which are obtained with different unknown excitations: ambient excitation and impulse excitation. Thus, the performance of SSI-EM for SML applications can be improved, providing a good estimation of the natural frequency and damping ratio without any controlled excitation, which is the main obstacle to use an experimental modal analysis in cryogenic environments. The dynamic response of the 510 g levitating platform has been characterized by means of OMA in a cryogenic, 77 K, and high vacuum, 1E-5 mbar, environment. The measured vertical and radial stiffness are 9872.4 N/m and 21329 N/m, respectively, whilst the measured vertical and radial damping values are 0.5278 Nm/s and 0.8938 Nm/s. The first natural frequency in vertical direction has been identified to be 27.39 Hz, whilst a value of 40.26 Hz was identified for the radial direction. The determined damping values for both modes are 0.46% and 0.53%, respectively.

EPID를 사용한 세기조절방사선치료의 정도관리에 있어 축이탈 보정(Off-axis Correction)의 적용 (Application of Off-axis Correction Method for EPID Based IMRT QA)

  • 조일성;곽정원;박성호;안승도;정동혁;조병철
    • 한국의학물리학회지:의학물리
    • /
    • 제23권4호
    • /
    • pp.317-325
    • /
    • 2012
  • Varian의 전자표탈영상장치(EPID, electronic portal imaging device) 검출기로 측정된 선량값은 PDIP알고리즘으로 예측된 선량 값과 비교하여 빔 중심으로부터 EPID 검출기 모서리로 갈수록 측정된 선량 값이 커지는 경향을 가지고 있다. 이를 손쉽게 임상에서 보정할 수 있는 축이탈보정(off-axis correction)알고리즘이 제안되어 본원에 설치된 Varian 선형가속기를 대상으로 적용하였다. $38{\times}28cm$의 조샤야를 열고 SSD 100 cm에서 6 MV, 15 MV 광자빔을 100 MU 조사하여 선량을 측정하고 이를 PDIP 알고리즘을 적용한 예측 선량과 비교하였다. 측정된 선량과 예측된 선량값의 비율을 축이탈거리의 4차 다항함수로 근사하여 가로선량분포 보정에 사용되는 $40{\times}40cm$ 주대각 빔 측정 데이터에 가중치로 두어 축이탈 보정을 실시했다. 보정전 $38{\times}28cm$ 조사면에서 계산된 선량값과 측정된 선량사이에는 6 MV 빔의 경우 $4.17{\pm}2.76$ CU, 15 MV 빔은 $3.23{\pm}2.59$ CU의 차이가 있었으나 보정 후 두 선량값의 차이는 각각 $0.18{\pm}0.8$ CU, $04{\pm}0.85$ CU로 1% 이내로 줄였다. PDIP 알고리즘 사용준비에 사용되는 피라미드 형태 유동량(fluence)의 감마 성공률(gamma pass rate)은 절대 선량 측정값을 기준으로 허용기준 4%, 4 mm에서 6 MV는 98.7%, 15 MV는 99.1%로 나타났으며 보정 후 각각 99.8%와 99.9%로 향상되었다. 축이탈 보정을 실시하고 임의로 두경부암과 전립선암의 세기조절방사선치료계획을 선정하여 세기조절방사선 치료의 정도관리를 진행했으며 보정 전과 비교하여 허용기준 3%, 3 mm에서 감마 성공률이 보정 전, 후 각각 두경부암: $94.7{\pm}3.2%$, $98.2{\pm}1.4%$ 및 전립선암: $95.5{\pm}2.6%$, $98.4{\pm}1.8%$로 평균적으로 3% 향상되었다. 축이탈보정은 EPID를 사용하는 세기조절 방사선치료의 정도관리에 있어 축이탈거리에 따른 계산된 선량값과 측정된 선량값의 차이를 효과적 보정하는 방법으로 임상에서 쉽게 적용하여 사용할 수 있을 것으로 기대된다.

불균형 데이터 환경에서 변수가중치를 적용한 사례기반추론 기반의 고객반응 예측 (Response Modeling for the Marketing Promotion with Weighted Case Based Reasoning Under Imbalanced Data Distribution)

  • 김은미;홍태호
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.29-45
    • /
    • 2015
  • 고객반응 예측모형은 마케팅 프로모션을 제공할 목표고객을 효과적으로 선정할 수 있도록 하여 프로모션의 효과를 극대화 할 수 있도록 해준다. 오늘날과 같은 빅데이터 환경에서는 데이터 마이닝 기법을 적용하여 고객반응 예측모형을 구축하고 있으며 본 연구에서는 사례기반추론 기반의 고객반응 예측모형을 제시하였다. 일반적으로 사례기반추론 기반의 예측모형은 타 인공지능기법에 비해 성과가 낮다고 알려져 있으나 입력변수의 중요도에 따라 가중치를 상이하게 적용함으로써 예측성과를 향상시킬 수 있다. 본 연구에서는 프로모션에 대한 고객의 반응여부에 영향을 미치는 중요도에 따라 입력변수의 가중치를 산출하여 적용하였으며 동일한 가중치를 적용한 예측모형과의 성과를 비교하였다. 목욕세제 판매데이터를 사용하여 고객반응 예측모형을 개발하고 로짓모형의 계수를 적용하여 입력변수의 중요도에 따라 가중치를 산출하였다. 실증분석 결과 각 변수의 중요도에 기반하여 가중치를 적용한 예측모형이 동일한 가중치를 적용한 예측모형보다 높은 예측성과를 보여주었다. 또한 고객 반응예측 모형과 같이 실생활의 분류문제에서는 두 범주에 속하는 데이터의 수가 현격한 차이를 보이는 불균형 데이터가 대부분이다. 이러한 데이터의 불균형 문제는 기계학습 알고리즘의 성능을 저하시키는 요인으로 작용하며 본 연구에서 제안한 Weighted CBR이 불균형 환경에서도 안정적으로 적용할 수 있는지 검증하였다. 전체데이터에서 100개의 데이터를 무작위로 추출한 불균형 환경에서 100번 반복하여 예측성과를 비교해 본 결과 본 연구에서 제안한 Weighted CBR은 불균형 환경에서도 일관된 우수한 성과를 보여주었다.

그래프 컷을 이용한 학습된 자기 조직화 맵의 자동 군집화 (Automatic Clustering on Trained Self-organizing Feature Maps via Graph Cuts)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.572-587
    • /
    • 2008
  • SOFM(Self-organizing Feature Map)은 고차원의 데이타를 군집화(clustering)하거나 시각화(visualization)하기 위해 많이 사용되고 있는 비교사 학습 신경망(unsupervised neural network)의 한 종류이며, 컴퓨터비전이나 패턴인식 분야에서 다양하게 활용되고 있다. 최근 SOFM이 실제 응용분야에 다양하게 활용되고 좋은 결과를 보이고 있지만, 학습된 SOFM의 뉴론(neuron)을 다시 군집화해야 하는 후처리가 필요하며, 대부분의 경우 수동으로 이루어지고 있다. 후처리를 자동으로 하기 위해 k-means와 같은 기존의 군집화 알고리즘을 많이 이용하지만, 이 방법은 특히 다양한 모양의 클래스를 가진 고차원의 데이타에서 만족스럽지 못한 결과를 보인다. 다양한 모양의 클래스에서 좋은 성능을 보이기 위해, 본 논문에서는 그래프 컷(graph cut)을 이용하여 학습된 SOFM을 자동으로 군집화하는 방법을 제안한다. 그래프 컷을 이용할 때 터미널(terminal)이라는 두 개의 추가적인 정점(vertex)이 필요하며, 터미널과 각 정점 사이의 가중치는 대부분 사용자에 의해 입력받은 사전정보를 기반으로 설정된다. 제안된 방법은 SOFM의 거리 매트릭스(distance matrix)를 기반으로 한 모드 탐색(mode-seeking)과 모드의 군집화를 통하여 자동으로 사전정보를 설정하며, 학습된 SOFM의 군집화를 자동으로 수행한다. 실험에서 효율성을 검증하기 위해 제안된 방법을 텍스처 분할(texture segmentation)에 적용하였다. 실험 결과에서 제안된 방법은 기존의 군집화 알고리즘을 이용한 방법보다 높은 정확도를 보였으며, 이는 그래프기반의 군집화를 통해 다양한 모양의 클러스터를 처리할 수 있기 때문이다.

고품질 스테레오 음악을 위한 오디오 워터마크 정보 삽입/추출 기술 (An Embedding /Extracting Method of Audio Watermark Information for High Quality Stereo Music)

  • 배경율
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.21-35
    • /
    • 2018
  • 본 논문에서는 스테레오 음악에 오디오 워터마크를 삽입하기 위한 알고리즘을 제안하였다. 스테레오 음악은 2개의 채널을 갖고 있기 때문에 기존 워터마킹 기술은 일반적으로 각 채널을 독립적으로 생각하고 처리하는 경우가 많다. 그러나 스테레오를 모노로 변환하는 과정에서 워터마크의 손실이 발생하는 경우가 많이 발생할 수 있다. 제안한 알고리즘은 스테레오를 모노로 변환하더라도 워터마크의 손실이 발생하지 않도록 워터마크를 삽입할 때 스테레오와 모노변환의 특성을 이용하였다. 제안된 알고리즘에 사용된 오디오 워터마크는 "Copyright"와 "Copy_free"라는 두 가지 정보를 터보코드를 이용하여 생성하였다. 두 워터마크는 9바이트(72비트)로 이루어져 있으며, 오류정정을 위하여 터보코드를 적용하면 222비트로 삽입해야 하는 정보량이 늘어난다. 222비트의 워터마크는 추가적인 오류에 강인하도록 1024비트로 확장하여 최종적으로 스테레오 음악에 삽입할 워터마크로 사용하였다. 평균적으로 SNR은 40dB를 넘어서서 전통적인 양자화 방식보다 10dB 이상의 음질 개선을 가져왔다. 이는 상대적으로 10배의 음질 개선도를 의미하는 것으로 매우 유의미한 결과이다. 또한 워터마크의 추출에 필요한 샘플길이는 1초 이내의 길이면 충분히 추출이 가능하고, 128Kbps의 비트레이트를 갖는 MP3 압축에 대해서도 모두 1초 이내 길이의 음악 샘플로부터 워터마크의 완전한 추출이 가능하였다. 전통적인 양자화 방식이 10초 길이의 샘플을 이용해도 대부분 워터마크의 추출에 실패한 것에 비하면 1/10에 불과한 길이로 워터마크의 추출이 가능하다.

비대칭적 전이효과와 SVM을 이용한 변동성 매도전략의 수익성 개선 (Performance Improvement on Short Volatility Strategy with Asymmetric Spillover Effect and SVM)

  • 김선웅
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.119-133
    • /
    • 2020
  • Fama에 의하면 효율적 시장에서는 일시적으로 높은 수익을 얻을 수는 있지만 꾸준히 시장의 평균적인 수익을 초과하는 투자전략을 만드는 것은 불가능하다. 본 연구의 목적은 변동성의 장중 비대칭적 전이효과를 이용하는 변동성 매도전략을 기준으로 투자 성과를 추가적으로 개선하기 위하여 SVM을 활용하는 투자 전략을 제안하고 그 투자성과를 분석하고자 한다. 한국 시장에서 변동성의 비대칭적 전이효과는 미국 시장의 변동성이 상승한 날은 한국 시장의 아침 동시호가에 변동성 상승이 모두 반영되지만, 미국 시장의 변동성이 하락한 날은 한국 시장의 변동성이 아침 동시호가에서 뿐만 아니라 장 마감까지 계속해서 하락하는 이상현상을 말한다. 분석 자료는 2008년부터 2018년까지의 S&P 500, VIX, KOSPI 200, V-KOSPI 200 등의 일별 시가지수와 종가지수이다. 11년 동안의 분석 결과, 미국 시장의 변동성이 상승으로 마감한 날은 그 영향력이 한국 시장의 아침 동시호가 변동성에 모두 반영되지만, 미국 시장의 변동성이 하락으로 마감한 날은 그 영향력이 한국 시장의 아침 동시호가뿐만 아니라 오후 장 마감까지도 계속해서 유의적으로 영향을 미치고 있다. 시장이 효율적이라면 미국 시장의 전일 변동성 변화는 한국 시장의 아침 동시호가에 모두 반영되고 동시호가 이후에는 추가적인 영향력이 없어야 한다. 이러한 변동성의 장중 비정상적 전이 패턴을 이용하는 변동성 매도전략을 제안하였다. 미국 시장의 전날 변동성이 하락한 경우 한국 시장에서 아침 동시호가에 변동성을 매도하고 장 마감시에 포지션을 청산하는 변동성 데이트레이딩전략을 분석하였다. 연수익률은 120%, 위험지표인 MDD는 -41%, 위험과 수익을 고려한 성과지수인 Sharpe ratio는 0.27을 기록하고 있다. SVM 알고리즘을 이용해 변동성 데이트레이딩전략의 성과 개선을 시도하였다. 2008년부터 2014년까지의 입력자료를 이용하여 V-KOSPI 200 변동성지수의 시가-종가 변동 방향을 예측하고, 시가-종가 변동율이(-)로 예측되는 경우에만 변동성 매도포지션을 진입하였다. 거래비용을 고려하면 2015년부터 2018년까지 테스트기간의 연평균수익률은 123%로 기준 전략 69%보다 크게 높아지고, 위험지표인 MDD도 -41%에서 -29%로 낮아져, Sharpe ratio가 0.32로 개선되고 있다. 연도별로도 모두 수익을 기록하면서 안정적 수익구조를 보여주고 있고, 2015년을 제외하고는 투자 성과가 개선되고 있다.