• 제목/요약/키워드: Co-clustering

검색결과 223건 처리시간 0.028초

시공간 데이터를 위한 클러스터링 기법 성능 비교 (Performance Comparison of Clustering Techniques for Spatio-Temporal Data)

  • 강나영;강주영;용환승
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.15-37
    • /
    • 2004
  • 최근 데이터 양이 급증하면서 데이터 마이닝에 대한 연구가 활발하게 진행되고 있으며 특히 GPS 시스템, 감시시스템, 기상 관측 시스템과 같은 다양한 응용 시스템으로부터 수집된 데이터를 분석하고자 하는 시공간 데이터 마이닝 연구에 대한 관심이 더욱 높아지고 있다. 기존의 시공간 데이터 마이닝 연구들에서는 비시공간 데이터 기반의 일반적인 클러스터링 기법들을 그대로 적용하고 있으나 데이터의 속성이 다른 시공간 데이터 마이닝에서 기존의 알고리즘들이 어느 정도의 성능을 보장하는지, 데이터의 시공간 속성에 따라 적절한 마이닝 알고리즘을 선택하기 위한 기준이 무엇인지 등에 대한 연구는 미흡한 실정이다. 본 논문에서는 기존의 시공간 데이터 마이닝 연구에서 일반적으로 많이 사용되어 온 알고리즘인 SOM(Self-Organizing Map)을 기반으로 시공간 데이터 마이닝 모듈을 개발하고, 개발된 클러스터링 모듈의 성능을 K-means과 두 가지 응집 계층(Hierarchical Agglomerative) 알고리즘들과 균질도, 분리도, 반면영상 너비, 정확도의 네 가지 평가 기준을 기반으로 비교하였다. 또한 입력 데이터의 특성 가시화 및 클러스터링 결과의 정확한 분석을 위해 시공간 데이터 클러스터링을 위한 가시화 모듈을 개발하였다.

  • PDF

사스-코로나바이러스-2 공기 중 부유 전파이론과 에어로졸 제어기술 (Control Methods for Aerosols and Airborne Spreading Theory of SARS-CoV-2)

  • 이병욱
    • 한국환경보건학회지
    • /
    • 제47권2호
    • /
    • pp.123-130
    • /
    • 2021
  • Objectives: Control methods against severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) aerosols have been introduced. Airborne spreading theories for SARS-CoV-2 were analyzed in this study. Methods: Control methods for airborne microorganisms were discussed. Studies on theoretical estimations for airborne spreading of SARS-CoV-2 were presented and analyzed. Analytic calculations were conducted for explaining control techniques for airborne microorganisms. Results: Control methods for SARS-CoV-2 aerosols can include physical or biological procedures. Characterization of SARS-CoV-2 aerosols and massive clustering infection cases of COVID-19 support the airborne spreading theories of SARS-CoV-2. It is necessary to consider the disadvantages of control methods for airborne microorganisms. Conclusions: A study on control methods against bioaerosols is necessary to prevent the spreading of viruses. Airborne spreading theories of SARS-CoV-2 were supported by the current evidence, but further studies are needed to confirm these theories.

한글 웹 문서 클러스터링 성능향상을 위한 자질선정 기법 비교 연구 (A Comparative Study of Feature Selection Methods for Korean Web Documents Clustering)

  • 김영기
    • 한국문헌정보학회지
    • /
    • 제39권1호
    • /
    • pp.45-58
    • /
    • 2005
  • 이 연구는 한글 웹 문서를 클러스터링 하기 위한 자질 선정 방법에 대한 비교연구이다. 이 연구에는 두 개의 코퍼스가 사용되었다. 클러스터링을 위한 실험 문서는 Naver의 자연과학 범주에서, 자질 선정을 위한 학습문서는 Yahoo Korea의 같은 범주에서 수집하였다. 우선 실험 문서를 단어자질과 동시링크, 그리고 이 둘을 혼합한 방법으로 클러스터링 한 다음 그 성능을 비교하였다. 다음으로 학습문서에서 카이제곱 통계량$(X^2)$, 정보획득량(IG), 그리고 상호정보량(MI)을 이용하여 용어자질을 선정한 다음. 이를 실험문서에 적용하여 클러스터링 성능을 비교하였다. 석기에 각 범주별로 최댓값을 갖는 용어들만을 해당 범주를 대표하는 자질로 선정하는 '최댓간 자질 선정기법'을 실험적으로 도입하여 적용해 보았다. 실험 결과 사용된 자질에 따른 한글 웹 문서 클러스터링 정확률은 자연어 $ 72.3\%$, 동시링크 $74.3\%$, 단어-링크 혼합 $74.8\%$, $X^2\;79.6\%\;Max\;X^2\;83.8\%$로 나타났다. 전통적 자질 선정 기법 중에서는 $X^2$가 약간 나은 성능을 보여 주었지만 큰 차이는 발견되지 않았다. 그러나 최댓값 자질 선정기법을 적용하였을 때 클러스터링 성능은 크게 향상되었다. 이 논문에서 제안된 최댓간 자질 선정 기법은 웹 문서의 자질 공간 축소와 한글 웹 문서의 클러스터링을 위한 간단하면서도 효과적인 수단이다.

Co-word를 이용한 알트메트리얼 필리트의 지적 구조 연구 (Intellectual Structure of the Altmetrics field: A Co-Word Analysis)

  • 이가베;이효맹;이현창;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.148-150
    • /
    • 2017
  • In recent years, "altmetrics", given birth by social media and the academic community, have become a metric source for measuring the academic impact of scientific literature. This study has undertaken a co-word analysis of author keywords in "Altmetrics" articles from the Web of Science database from 2012 to 2017 and used a co-occurrence matrix to create a clustering of the words. "Altmetrics" co-occurrence network map was derived and the research hotspots was analyzed.

  • PDF

단어의 공기정보를 이용한 클러스터 기반 다중문서 요약 (Multi-document Summarization Based on Cluster using Term Co-occurrence)

  • 이일주;김민구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권2호
    • /
    • pp.243-251
    • /
    • 2006
  • 대표문장 추출에 의한 다중문서 요약에서는 비슷한 정보가 여러 문서에서 반복적으로 나타나는 정보의 중복문제에 대해 문장의 유사성과 차이점을 고려하여 이를 해결할 수 있는 효율적인 방법이 필요하다. 본 논문에서는 단어의 공기정보에 의한 관련단어 클러스터링 기법을 이용하여 문장의 중복성을 제거하고 중요문장을 추출하는 다중문서 요약을 제안한다. 관련단어 클러스터링 기법에서는 각 단어들은 서로 독립적으로 존재하는 것이 아니라 서로 간에 의미적으로 연관되어 있다고 보며 주제별 문장클러스터단위의 단어 연관성(cohesion)을 이용한다. 평가용 실험문서인 DUC(Document Understanding Conferences) 데이타를 이용하여 실험한 결과 본 논문에서 제안한 문장클러스터단위의 단어 공기정보를 이용한 방법이 단순 통계정보와 문서단위 단어 공기정보, 문장단위 단어 공기정보에 의한 다중문서 요약에 비해 좋은 결과를 보였다.

ATM 클러스터링 시스템을 위한 효율적인 에러 복구 프로토콜 (Efficient Error Recovery Protocol for ATM Clustering Systems)

  • 정재웅;이종권;김용재;김탁곤;박규호;유승화
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권12호
    • /
    • pp.1493-1503
    • /
    • 1999
  • ATM Clustering System과 같이 SAN(System Area Network) 환경에서 동작하는 시스템은 낮은 지연시간과 넓은 대역폭의 네트워크가 필수적이나 기존의 에러 복구 프로토콜들은 이러한 요구를 충족시키기에는 큰 오버헤드를 가지고 있다. 제안된 새로운 에러 복구 프로토콜은 ATM Clustering System 환경에서 최적의 성능을 나타내는 light-weight 프로토콜로 에러가 없는 상황과 에러 복구가 진행중인 상황에 따라 acknowledgement 주기를 적응적으로 변화시키는 adaptive acknowledgement scheme를 제안하여 적용하였다. 제안된 프로토콜은 상용 툴인 SDT를 이용한 논리 검증 받았고, DEVSim++ 환경에서의 성능 분석을 통해 프로토콜이 최상의 성능을 보이기 위한 파라메터 값을 찾았고, 이 값을 적용하였을 때의 성능을 기존의 프로토콜과 비교하여 제안된 프로토콜이 더 우수함을 확인하였다.Abstract While a system working with SAN, such as ATM Clustering System, requires a network with low latency and wide bandwidth, the previous error recovery protocols have a serious network overhead to satisfy this requirement. The suggested error recovery protocol is a light-weight protocol which can shows its best performance at ATM Clustering System and uses a newly suggested adaptive acknowledgement scheme. In the adaptive acknowledgement scheme, the period of acknowledgement is dynamically changed depending on the state of the network. We proved the logical correctness of our protocol with SDT and did performance analysis with DEVSim++. From the analysis, we found the optimal parameter values for best performance and showed that our protocol works better than the previous error recovery protocols.

웹 문서 클러스터링에서의 자질 필터링 방법 (Feature Filtering Methods for Web Documents Clustering)

  • 박흠;권혁철
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.489-498
    • /
    • 2006
  • 색인전문가에 의해 분류된 웹문서들을 통계적 자질 선택방법으로 자질을 추출하여 클라스터링을 해 보면, 자질 선택에 사용된 데이터셋에 따라 성능과 결과가 다르게 나타난다. 그 이유는 많은 웹 문서에서 문서의 내용과 관계없는 단어들을 많이 포함하고 있어 문서의 특정을 나타내는 단어들이 상대적으로 잘 두드러지지 않기 때문이다. 따라서 클러스터링 성능을 향상시키기 위해 이런 부적절한 자질들을 제거해 주어야 한다. 따라서 본 논문에서는 자질 선택에서 자질의 문서군별 자질값뿐만 아니라, 문서군별 자질값의 분포와 정도, 자질의 출현여부와 빈도를 고려한 자질 필터링 알고리즘을 제시한다. 알고리즘에는 (1) 단위 문서 내 자질 필터링 알고리즘(FFID : feature filtering algorithm in a document), (2) 전체 데이터셋 내 자질 필터링 알고리즘(FFIM : feature filtering algorithm in a document matrix), (3)FFID와 FFIM을 결합한 방법(HFF:a hybrid method combining both FFID and FFIM) 을 제시한다. 실험은 단어반도를 이용한 자질선택 방법, 문서간 동시-링크 정보의 자질확장, 그리고 위에서 제시한 3가지 자질 필터링 방법을 사용하여 클러스터링 했다. 실험 결과는 데이터셋에 따라 조금씩 차이가 나지만, FFID보다 FFIM의 성능이 좋았고, 또 FFID와 FFIM을 결합한 HFF 결과가 더 나은 성능을 보였다.

연관 규칙 학습과 군집분석을 활용한 멸종위기 기수갈고둥과 생태계 내 종 간 연관성 분석 (Analyzing the Co-occurrence of Endangered Brackish-Water Snails with Other Species in Ecosystems Using Association Rule Learning and Clustering Analysis)

  • 임성호;도윤호
    • 생태와환경
    • /
    • 제57권2호
    • /
    • pp.83-91
    • /
    • 2024
  • 본 연구는 한국의 멸종위기야생생물 II급으로 분류된 기수갈고둥 (Clithon retropictum)과 생태계 내 다른 종들 사이의 공동출현 양상을 분석하고자, 연관 규칙 학습과 군집분석 방법론을 통합적으로 사용했다. 이 연구의 주요 목적은 기수갈고둥과 다른 생물종 사이의 공동출현 패턴을 파악하는 것이다. 대규모 데이터 세트를 통한 연관 규칙 학습으로 종 간의 공동 출현 패턴과 그들사이의 연관성을 탐색하였고, K-mean와 계층적 군집분석을 통해 종들 간의 생태적 유사성과 차이에 기반으로 한 그룹화를 진행하였다. 연구 결과는 기수갈고둥과 다른 종들 사이에 상당한 공동 출현 관계가 있음을 보여주며, 이러한 공동 출현은 특정 환경 조건과 밀접하게 연결되어 있음을 나타냈다. 특히, 기수갈고둥이 출현하는 지점에서는 특정종의 출현 빈도가 높게 나타나는 패턴을 보였고, 이는 기수갈고둥이 생태계 내에서 중요한 생물지표종으로서의 역할을 수행하고 있음을 시사한다. 이러한 접근 방식은 기수갈고둥과 같은 멸종 위기종의 보존과 생태계 관리 전략 수립에 있어 중요한 의미를 지닌다. 생태계 내에서 공동으로 출현하는 종들 간의 복잡한 연관성을 이해함으로써, 보다 효과적인 보존 전략을 개발하고 생태계의 건강과 안정성을 유지하는 데 기여할 수 있다. 본 연구는 생태계 연구에 있어 데이터기반 접근법의 중요성을 강조하며, 생물 다양성 보존을 위한 새로운 방향을 제시한다.

THE $^{13}CO$ DISTRIBUTION AND CORRELATION WITH EXTINCTION IN L134

  • MINN YOUNG KEY;LEE HYE KYUNG
    • 천문학회지
    • /
    • 제29권1호
    • /
    • pp.75-81
    • /
    • 1996
  • We mapped the $^{13}CO$ line in the dark nebula L134 using the 14-m Taeduck radio telescope with a 57 arcsec beam and one beam spacing. The cloud has a spherical shape with an intensity peak ridge extended from the northwest to the southeast directions. The halfwidth and the radial velocity of the lines peak at the region of the cloud center. The radial velocity decreases from the cloud center towards the north and south directions. The integrated line intensity distributions in the space-velocity plane show some structure and a velocity gradient. The $^{13}CO$ and $H_2CO$ clouds and dark clouds are closely related in space in shape, outer boundary, and intensity peak positions. The $^{13}CO$ integrated line intensity is linearly proportional to the visual extinction.

  • PDF

SWS 490A 강의 용접 열영향부 음향방출 특성에 대한 연구(2) (A Study on the Acoustic Emission Characteristics of Weld Heat Affected Zone in SWS 490A Steel(2))

  • 이장규;우창기
    • 한국공작기계학회논문집
    • /
    • 제15권5호
    • /
    • pp.104-113
    • /
    • 2006
  • The main objective of this study is to investigate the effect of compounded welding by using acoustic emission (AE) signals and doing a source location for weld heat affected zone (HAZ) through tensile testing. This study was carried out an SWS 490A high strength steel for electric shield metal arc welding, SMAW; $CO_2$ gas metal arc welding, GMAW($CO_2$); and gas tungsten arc welding, GTAW/TIG. Data displays are based on the measured parameters of the AE signals, along with environmental variables such as time and load. For instance, Gutenberg-Richter magnitude-frequency relationship (G-R MFR) offers useful b-value in data analysis. Namely event identification, source location gives the X- and Y-coordinates of the AE source. And K-means clustering analysis by Euclidean distance confirmed that was powerful to source location. Generally, strength of welded metal zone was stronger than strength of base metal. As the result, confirmed certainly that fracture is produced in HAZ instead of welded metal zone from source location.