• Title/Summary/Keyword: 군집 적합도

Search Result 339, Processing Time 0.031 seconds

A Comparative Study on Clustering Methods for Grouping Related Tags (연관 태그의 군집화를 위한 클러스터링 기법 비교 연구)

  • Han, Seung-Hee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.43 no.3
    • /
    • pp.399-416
    • /
    • 2009
  • In this study, clustering methods with related tags were discussed for improving search and exploration in the tag space. The experiments were performed on 10 Delicious tags and the strongly-related tags extracted by each 300 documents, and hierarchical and non-hierarchical clustering methods were carried out based on the tag co-occurrences. To evaluate the experimental results, cluster relevance was measured. Results showed that Ward's method with cosine coefficient, which shows good performance to term clustering, was best performed with consistent clustering tendency. Furthermore, it was analyzed that cluster membership among related tags is based on users' tagging purposes or interest and can disambiguate word sense. Therefore, tag clusters would be helpful for improving search and exploration in the tag space.

Malicious Codes Re-grouping Methods using Fuzzy Clustering based on Native API Frequency (Native API 빈도 기반의 퍼지 군집화를 이용한 악성코드 재그룹화 기법연구)

  • Kwon, O-Chul;Bae, Seong-Jae;Cho, Jae-Ik;Moon, Jung-Sub
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.18 no.6A
    • /
    • pp.115-127
    • /
    • 2008
  • The Native API is a system call which can only be accessed with the authentication of the administrator. It can be used to detect a variety of malicious codes which can only be executed with the administrator's authority. Therefore, much research is being done on detection methods using the characteristics of the Native API. Most of these researches are being done by using supervised learning methods of machine learning. However, the classification standards of Anti-Virus companies do not reflect the characteristics of the Native API. As a result the population data used in the supervised learning methods are not accurate. Therefore, more research is needed on the topic of classification standards using the Native API for detection. This paper proposes a method for re-grouping malicious codes using fuzzy clustering methods with the Native API standard. The accuracy of the proposed re-grouping method uses machine learning to compare detection rates with previous classifying methods for evaluation.

Regional Frequency Analysis for Rainfall Data using the Burr XII Distribution (Burr XII 분포형을 이용한 강우자료 지역빈도해석)

  • Seo, Jungho;Shin, Hongjoon;Ahn, Hyunjun;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.162-162
    • /
    • 2017
  • 최근 우리나라는 전 지구적인 기후변화로 인하여 집중호우 및 돌발 홍수와 같은 극치 사상들이 증가하고 있는 추세이며, 이에 대한 분석을 위해 극치 분포를 이용한 수문통계적 특성에 대한 접근이 주로 이루어지고 있다. 이를 위해서는 충분한 수의 자료가 필요하나 우리나라 강우자료는 지점별로 자료 보유 년 수가 비교적 많지 않기 때문에, 이러한 문제를 극복하기 위하여 하나의 지역, 즉 주어진 지점을 포함하여 수문학적으로 동일한 조건을 만족하는 주변 지점의 자료를 모두 포함하여 빈도해석을 실시하는 지역빈도해석이 필요하다. 따라서 본 연구에서는 지역빈도해석과 두 개의 형상매개변수를 포함하여 다양한 극치 수문통계특성을 나타낼 수 있다고 알려진 Burr XII 분포를 이용하여 우리나라 강우자료에 대한 그 적용성을 살펴보았다. 이를 위해 군집분석을 통한 강우지점의 지역화 과정을 거치고 분류된 지역을 L-moment ratio diagram에 도시하여, Burr XII 분포 영역 내 포함여부를 통해 Burr XII 분포의 적합도를 도시적으로 살펴보고, Hosking and Wallis (1997)이 제안한 적합성 척도($^{IST}$)를 통한 적합성 여부를 판별하였다. 또한 우리나라 강우자료에 비교적 적합하다고 알려진 분포인 generalized extreme value, generalized logistic, Gumbel 분포와의 비교를 위해, 전체 지역에 대하여 재현기간에 따른 상대편의 (relative bias)와 상대평균제곱근오차 (relative root mean square error)를 산정하여 Burr XII 분포형의 적용 가능성을 살펴보았다.

  • PDF

Seasonal Characteristics of Temperature and Salinity Variations Around the Tongyeong and Geoje Coastal Waters by a Cluster Analysis (군집분석을 이용한 통영·거제 연안역의 수온·염분 계절 변동 특성)

  • Kim, Byeong Kuk;Lee, Chang Rae;Lee, Moon Ock;Kim, Jong Kyu
    • Journal of the Korean Society for Marine Environment & Energy
    • /
    • v.19 no.3
    • /
    • pp.173-184
    • /
    • 2016
  • This study was carried out to understand the characteristic distributions of water temperature and salinity in accordance with seasons atound the Tongyeong and Geoje, based on a cluster analysis. Water temperatures in coastal areas were $1-2^{\circ}C$ higher than those in open seas when in the spring, autumn and winter. In particular, a south-northward isothermal line was established at the bottom layer in the winter of 2014, unlikely to the surface layer. In addition, a south-northward isohaline was also established at the bottom layer in the winter of 2013. Therefore, we recognized that a moving pattern of water masses has also a difference since forming directions of those lines were not equivalent with each other between the surface and bottom layers. In contrast, stratification appeared in the summer with a roughly difference of water temperature of $10^{\circ}C$ and a salinity of 2-10 psu between the layers. A cluster analysis indicated that the southeastern coastal waters have three distinct water masses, even though some complicated situations exist due to the seawater inflow from the outside. However, the result of a cluster analysis turned out quite reasonable because the result of a regression analysis proved that it is appropriate, just except for the timing of a south-northward front formation.

A Study on the Hyperspectral Image Classification with the Iterative Self-Organizing Unsupervised Spectral Angle Classification (반복최적화 무감독 분광각 분류 기법을 이용한 하이퍼스펙트럴 영상 분류에 관한 연구)

  • Jo, Hyun-Gee;Kim, Dae-Sung;Kim, Yong-Il
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2005.11a
    • /
    • pp.41-45
    • /
    • 2005
  • 분광각(Spectral Angle)을 이용한 분류는 같은 종류의 지표 대상물의 분광 특성이 대기 및 지형적인 영향으로 인해 원점을 기준으로 선형적인 분포 모양을 가진다는 가정에 기초한 새로운 접근의 분류 방식이다. 최근 분광각을 이용한 무감독 분류에 대한 연구가 활발히 이루어지고 있으나, 원격탐사 데이터의 특성을 반영한 효과적인 무감독 분류에 대한 연구는 미진한 상태이다. 본 연구는 하이퍼스펙트럴 영상 분류에 있어서 기존 무감독 분광각 분류(USAC, Unsupervised Spectral Angle Classification) 연구에서 해결하지 못한 문제점들을 보완한 반복최적화 무감독 분광각 분류(ISOUSAC, Iterative Self-Organizing USAC) 기법을 제안하고 있다. 이를 위해, 무감독 분광각 분류에 적합한 각 분할(Angle Range Division) 기법을 적용하여 군집 초기 중심을 설정하였으며, 병합(Merge)과 분할(Split)를 통한 유동적인 군집 분석을 수행하였다. 결과를 통해, 제안된 알고리즘이 기존의 기법보다 수행 시간뿐 아니라 시각적인 면에서도 우수한 결과를 도출함을 확인할 수 있었다.

  • PDF

A Study on Words Representing Human Visual Sensibility in Residential Environment (주거환경이 시각적 감성어휘)

  • 윤정선;신미경;이강의;구아현
    • Science of Emotion and Sensibility
    • /
    • v.3 no.2
    • /
    • pp.67-74
    • /
    • 2000
  • 본 연구는 주거환경에 대한 시각 감성을 대표하는 어휘를 선발하기 위해 수행되었다. 어휘수집의 첫 단계에서는 주거환경 중 시각 환경에 대한 감성을 표현하는 어휘 235개를 수집하였다. 두 번째 단계에서는 수집된 어휘를 다른 피험자들에게 제시하여 주거 환경의 분위기를 나타내는 어휘 로서 적절함의 정도를 7점 척도로 표시하도록 하여 매우 적절하다고 판단된 24개의 어휘를 선발하였다. 세 번째 단계에서는 이들 어휘를 무선 적으로 두 개씩 짝을 지어 두 단어가 유사한 정도를 7점 척도로 평가하도록 하였다. 이 설문으로부터 나온 데이터에 대해 요인분석, 군집분석, 다차원분석을 실시하여 시각적 주거환경에 대한 9개의 감성어휘를 추출하였다. 이와 함께 최종 단계에서 연구자들이 400여장의 실물 사진 열람을 통해 추출된 9개의 감성 어휘가 실제 시각적 주거환경을 나타내는 데에 적함한지를 다시 한번 검증하여 다음과 같은 10개의 어휘를 선발하였다. ‘안락한’, ‘개방적인’, ‘세련된’, ‘경쾌한’, ‘개성적인’, ‘단순한’, ‘화려한’, ‘중후한’, ‘고풍스로운’, ‘전원적인’.

  • PDF

A Study on Selection model of Operation method using Machine learning (머신 러닝을 이용한 수술 방법 선정 모델 연구)

  • Kim, Se-Jun;Lee, Byung-Jun;Kim, Kyoung-tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.01a
    • /
    • pp.39-40
    • /
    • 2018
  • 본 논문에서는 환자 데이터를 군집화 하여 군집 내 시도된 수술 방법을 추출함으로써, 수술 방법 선정 시에 데이터를 압축하여 선정에 소요되는 시간을 줄이고 불필요한 노이즈를 줄이는 모델을 제시하였다. 또한 환자 데이터의 분석을 통해 추출된 수술 방법들 중 환자에게 가장 적합한 수술 방법을 제공하는 모델을 제안하였다. 이를 통해, 수술 여부, 방법을 판단하는데 있어서 객관적인 판단을 하기 위한 정보를 제공할 수 있을 것으로 기대된다.

  • PDF

Intelligent Digital Signage Platform Design Using Edge Computing Based Cluster Recommendation Algorithm (엣지컴퓨팅기반 군집추천 알고리즘을 이용한 지능형 디지털 사이니지 플랫폼 설계)

  • Lee, Ki-hoon;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1166-1168
    • /
    • 2019
  • 본 논문은 엣지컴퓨팅 환경에서 딥러닝기반 추천모델을 이용한 지능형 디지털 사이니지 플랫폼을 제안한다. 제안하는 플랫폼은 서버와 엣지로 구성되어 있다. 서버는 데이터를 관리하고, 광고추천 모델을 학습시키며, 엣지는 학습된 광고추천 모델을 이용하여 실시간으로 광고될 상품을 결정한다. 광고추천 모델은 상품을 선별하는 단계와 구매확률을 예측하는 단계로 구성되어 있다. 선별단계에서는 DNN에 벡터화된 사용자 기본정보와 상품 메타데이터를 입력하여 구매할 만한 상품을 도출한다. 최종적으로 군집의 예측된 구매확률을 이용하여 가장 적합한 광고를 선정한다. 제안하는 시스템은 서버와 통신하지 않고 엣지에서 학습된 모델로 광고를 결정한다. 이를 다수의 사용자에게 즉각적인 반응을 필요로 하는 디지털 사이니지에 적용했다.

Proximate Word Filtering by Hierarchical Clustering (계층적 군집화를 이용한 근사 단어 필터링 기법)

  • Kim, Sung-Hwan;Cho, Hwan-Gue
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1101-1104
    • /
    • 2012
  • 단어 필터링은 유해정보를 차단위한 기본적인 기능이다. 그러나 악의적인 사용자는 필터링 시스템을 우회하기 위하여 금지 단어에 의도적인 변형을 가한다. 이에 대응하기 위해 일정 오류를 허용하여 필터링을 수행하는 근사 단어 필터링이 있다. 근사 단어를 검색하기 위한 문자열 색인 방법으로는 주로 기준 단어(Pivot)을 이용한 유클리드 공간에의 사상을 이용하는데, 이는 단어 필터링에 응용하기에는 근본적인 구조상의 한계점이 있다. 본 논문에서는 필터링 대상이 되는 단어 집합 내에서 군집화를 수행하여 계층적인 자료구조를 구성하고, 단어 필터링을 위한 필터링 질의(Filtering query)를 정의한 뒤 그에 적합한 탐색 상의 적용에 관하여 설명한다. 실험 결과 기존의 기준 단어(Pivot)을 이용한 색인 기법에 비하여 16.9%~26.6%의 탐색 속도 향상을 확인할 수 있었다.

A Correlation Analysis between Physical Disturbance and Fish Habitat Suitability before and after Channel Structure Rehabilitation (하천구조 개선에 따른 어류 서식적합도와 물리적 교란의 상관분석)

  • Choi, Heung Sik;Lee, Woong Hee
    • Ecology and Resilient Infrastructure
    • /
    • v.2 no.1
    • /
    • pp.33-41
    • /
    • 2015
  • In this study, an optimal improvement method of stream channel structure is presented for the enhancement of fish habitat suitability by genetic algorithm. The correlation between fish habitat suitability and physical disturbance in stream is analyzed according to the changes of hydraulic characteristics by channel structure rehabilitation. Zacco koreanus which is an indicator fish of the soundness of aquatic ecosystem was selected as a restoration target species by investigating the community characteristics of fish fauna and river environments in Wonju stream. The habitat suitability is investigated by PHABSIM with the habitat suitability index of Zacco koreanus. Hydraulic analysis by HEC-RAS and physical disturbance evaluation in stream are carried out. The optimal channel width modified for the enhancement of fish habitat suitability is provided. The correlation analysis between habitat suitability and physical disturbance with the change of hydraulic characteristics by channel modification showed that the proper channel modification enhanced fish habitat suitability and mitigated physical disturbance in the stream. The improvement of physical disturbance score by the channel structure rehabilitation for the enhancement of fish habitat suitability was confirmed in this study.