• 제목/요약/키워드: Root clustering

검색결과 37건 처리시간 0.025초

기계학습을 이용한 뿌리산업 작업 환경 위험도 피크레벨 결정방법 (A Method for Determining the Peak Level of Risk in Root Industry Work Environment using Machine Learning)

  • 이상민;김준영;강석찬;김경준
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.127-136
    • /
    • 2024
  • 뿌리산업의 유해한 작업 환경과 높은 작업 강도는 작업자의 건강에 영향을 미칠 수 있기 때문에 기존에는 유해한 물질로부터 현장 작업자를 보호하기 위해 반년 단위로 작성한 환경을 측정하여 규제하고 있다. 그러나 작업환경 외에 작업자 건강 상태 등에 대해서는 정량화된 관련 기준이 부재하여 상시로 피해를 주는 임계치 이하 유해 물질의 지속적인 노출에 따른 직업병을 예방하는데 어려움이 상존하고 있다. 따라서 본 논문에서는 기계학습을 이용한 뿌리산업 작업 환경의 위험도 피크레벨 결정방법을 제안하고 이를 토대로 작업장의 실시간 안전 평가를 가능하게 하였다.

Spatial Region Estimation for Autonomous CoT Clustering Using Hidden Markov Model

  • Jung, Joon-young;Min, Okgee
    • ETRI Journal
    • /
    • 제40권1호
    • /
    • pp.122-132
    • /
    • 2018
  • This paper proposes a hierarchical dual filtering (HDF) algorithm to estimate the spatial region between a Cloud of Things (CoT) gateway and an Internet of Things (IoT) device. The accuracy of the spatial region estimation is important for autonomous CoT clustering. We conduct spatial region estimation using a hidden Markov model (HMM) with a raw Bluetooth received signal strength indicator (RSSI). However, the accuracy of the region estimation using the validation data is only 53.8%. To increase the accuracy of the spatial region estimation, the HDF algorithm removes the high-frequency signals hierarchically, and alters the parameters according to whether the IoT device moves. The accuracy of spatial region estimation using a raw RSSI, Kalman filter, and HDF are compared to evaluate the effectiveness of the HDF algorithm. The success rate and root mean square error (RMSE) of all regions are 0.538, 0.622, and 0.75, and 0.997, 0.812, and 0.5 when raw RSSI, a Kalman filter, and HDF are used, respectively. The HDF algorithm attains the best results in terms of the success rate and RMSE of spatial region estimation using HMM.

입력자료 군집화에 따른 앙상블 머신러닝 모형의 수질예측 특성 연구 (The Effect of Input Variables Clustering on the Characteristics of Ensemble Machine Learning Model for Water Quality Prediction)

  • 박정수
    • 한국물환경학회지
    • /
    • 제37권5호
    • /
    • pp.335-343
    • /
    • 2021
  • Water quality prediction is essential for the proper management of water supply systems. Increased suspended sediment concentration (SSC) has various effects on water supply systems such as increased treatment cost and consequently, there have been various efforts to develop a model for predicting SSC. However, SSC is affected by both the natural and anthropogenic environment, making it challenging to predict SSC. Recently, advanced machine learning models have increasingly been used for water quality prediction. This study developed an ensemble machine learning model to predict SSC using the XGBoost (XGB) algorithm. The observed discharge (Q) and SSC in two fields monitoring stations were used to develop the model. The input variables were clustered in two groups with low and high ranges of Q using the k-means clustering algorithm. Then each group of data was separately used to optimize XGB (Model 1). The model performance was compared with that of the XGB model using the entire data (Model 2). The models were evaluated by mean squared error-ob servation standard deviation ratio (RSR) and root mean squared error. The RSR were 0.51 and 0.57 in the two monitoring stations for Model 2, respectively, while the model performance improved to RSR 0.46 and 0.55, respectively, for Model 1.

Detection and Control of Variation Source for a Production Unit

  • Xu, Jichao;Akpolat, Hasan
    • International Journal of Quality Innovation
    • /
    • 제4권1호
    • /
    • pp.148-159
    • /
    • 2003
  • Variation is the archenemy of quality. To reduce or control the variation in a complex production unit, firstly we need to identify the location of the root cause of the variation. This paper discusses the detection of variability and the techniques used for reduction of variation for a production unit consisting of many processes. In the first part of this paper, the background of variability detection in production systems is introduced which is then followed by a weighted network corresponding to correlation matrix of all processes. Based on the network and clustering criterion of maximum spanning tree, a classification of all processes is derived. Furthermore, the variation of each process in a class is determined by residual analysis. In the last part, the use of methods of robust design for the processes with a larger variability is discussed.

에너지 효율적 무선 센서 네트워크를 위한 트리 기반 클러스터링 프로토콜 (Tree-Based Clustering Protocol for Energy Efficient Wireless Sensor Networks)

  • 김경태;윤희용
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.69-80
    • /
    • 2010
  • 다수의 센서로 구성된 무선 센서 네트워크는 다양한 환경에서의 정보 수집을 목적으로 하며 현재 다양한 분야에 응용 및 활용이 되고 있다. 센서 네트워크를 구성하는 각 센서 노드들은 한정된 전력의 배터리로 동작하므로 에너지 효율성 및 장시간의 네트워크 수명을 제공하는 것이 센서 네트워크의 중요한 연구 목표 중 하나이다. 본 논문에서는 무선 센서 네트워크의 에너지 효율성을 향상 시키기 위한 새로운 트리 기반의 클러스터링 프로토콜(tree based clustering protocol)을 제안한다. 제안된 기법은 클러스터를 형성하고 클러스터에서의 노드들은 클러스터 헤드를 루트로 하는 트리를 구성한다. 트리의 높이는 멤버 노드들과 클러스터 헤드의 거리를 기반으로 결정된다. 시뮬레이션을 통해 기존에 제안되었던 LEACH, PEGASIS와 TREEPSI와 비교해 제안된 기법이 노드들 사이에서의 에너지 소비를 균등하게 하여 에너지 효율성을 향상시키고 네트워크 수명을 연장하였음을 확인하였다.

온톨로지를 이용한 단어 군집화 성능 개선 (Performance Improvement of Word Clustering Using Ontology)

  • 박은진;김재훈;옥철영
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.337-344
    • /
    • 2006
  • 이 논문은 사전의 뜻 풀이말을 이용하여 단어 군집화 시스템을 설계하고 구현한다. 군집화를 위해서는 다양한 형태의 자질이 요구되며 어떤 자질을 사용하느냐에 따라 군집화의 성능이 좌우된다. 뜻 풀이말은 표제어를 자세히 설명하고 있기는 하지만, 뜻 풀이말에 사용된 단어가 너무 함축적이거나 추상적이어서 뜻 풀이말이 그다지 길지 않다. 뜻 풀이말로부터 추출된 자질을 그대로 군집화에 이용할 경우에는 다수의 작은 군집이 형성된다. 뜻 풀이말을 이용하여 보다 더 좋은 군집화 결과를 얻기 위해서는 뜻 풀이말의 의미를 크게 손상하지 않는 범위에서 보다 더 일반적인 단어로 바꾸어 군집화에 필요한 자질을 확장할 필요가 있다. 이 논문에서 추상적인 말을 온톨로지 상에서 한 단계 위의 단어로 확장하거나 온톨로지 상에서 고정 높이에 해당하는 단어로 확장함으로써 단어 군집화 성능을 향상시키는 방법을 제안한다. 실험을 통해서 온톨로지를 이용해서 자질을 확장할 경우 단어 군집화 성능이 크게 개선되었으며, 전체적으로 보면 온톨로지 상에서 고정 높이에 해당하는 단어로 확장할 경우가 더 좋은 성능을 보였다. 또한 단어 군집화를 위한 자질로 동사가 매우 유용함을 관찰할 수 있었다.

중복을 허용한 계층적 클러스터링에 의한 복합 개념 탐지 방법 (Hierarchical Overlapping Clustering to Detect Complex Concepts)

  • 홍수정;최중민
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.111-125
    • /
    • 2011
  • 클러스터링(Clustering)은 유사한 문서나 데이터를 묶어 군집화해주는 프로세스이다. 클러스터링은 문서들을 대표하는 개념별로 그룹화함으로써 사용자가 자신이 원하는 주제의 문서를 찾기 위해 모든 문서를 검사할 필요가 없도록 도와준다. 이를 위해 유사한 문서를 찾아 그룹화하고, 이 그룹의 대표되는 개념을 도출하여 표현해주는 기법이 요구된다. 이 상황에서 문제점으로 대두되는 것이 복합 개념(Complex Concept)의 탐지이다. 복합 개념은 서로 다른 개념의 여러 클러스터에 속하는 중복 개념이다. 기존의 클러스터링 방법으로는 문서를 클러스터링할 때 동일한 레벨에 있는 서로 다른 개념의 클러스터에 속하는 중복된 복합 개념의 클러스터를 찾아서 표현할 수가 없었고, 또한 복합 개념과 각 단순 개념(Simple Concept) 사이의 의미적 계층 관계를 제대로 검증하기가 어려웠다. 본 논문에서는 기존 클러스터링 방법의 문제점을 해결하여 복합 개념을 쉽게 찾아 표현하는 방법을 제안한다. 기존의 계층적 클러스터링 알고리즘을 변형하여 동일 레벨에서 중복을 허용하는 계층적 클러스터링(Hierarchical Overlapping Clustering, HOC) 알고리즘을 개발하였다. HOC 알고리즘은 문서를 클러스터링하여 그 결과를 트리가 아닌 개념 중복이 가능한 Lattice 계층 구조로 표현함으로써 이를 통해 여러 개념이 중복된 복합 개념을 탐지할 수 있었다. HOC 알고리즘을 이용해 생성된 각 클러스터의 개념이 제대로 된 의미적인 계층 관계로 표현되었는지는 특징 선택(Feature Selection) 방법을 적용하여 검증하였다.

Study on the grading standard of Panax notoginseng seedlings

  • Chen, Lijuan;Yang, Ye;Ge, Jin;Cui, Xiuming;Xiong, Yin
    • Journal of Ginseng Research
    • /
    • 제42권2호
    • /
    • pp.208-217
    • /
    • 2018
  • Background: The quality differences in seedlings of medicinal herbs often affect the quality of medicinal parts. The establishment of the grading standard of Panax notoginseng seedlings is significant for the stable quality of medicinal parts of P. notoginseng. Methods: To establish the grading standard of P. notoginseng seedlings, a total of 36,000 P. notoginseng seedlings were collected from 30 producing areas, of which the fresh weight, root length, root diameter, bud length, bud diameter, and rootlet number were measured. The K-means clustering method was applied to grade seedlings and establish the grading standard. Results: The fresh weight and rootlet number of P. notoginseng seedlings were determined as the final indices of grading. P. notoginseng seedlings from different regions of Yunnan could be preliminarily classified into four grades: the special grade, the premium grade, the standard grade, and culled seedlings. Conclusion: The grading standard was proven to be reasonable according to the agronomic characters, emergence rate, and photosynthetic efficiency of seedlings after transplantation, and the yields and contents of active constituents of the medicinal parts from different grades of seedlings.

Performance Analysis of ILEACH and LEACH Protocols for Wireless Sensor Networks

  • Miah, Md. Sipon;Koo, Insoo
    • Journal of information and communication convergence engineering
    • /
    • 제10권4호
    • /
    • pp.384-389
    • /
    • 2012
  • In this paper, we examine the problems of the low energy adaptive clustering hierarchy (LEACH) protocol and present ideas for improvement by selecting the cluster head node. The main problem with LEACH lies in the random selection of cluster heads. There exists a probability that the formed cluster heads are unbalanced and may remain in one part of the network, which makes some part of the network unreachable. In this paper, we present a new version of the LEACH protocol called the improved LEACH (ILEACH) protocol, which a cluster head is selected based on its ratio between the current energy level and an initial energy level, and multiplies by the root square of its number of neighbor nodes. The simulation results show that the proposed ILEACH increases the energy efficiency and network lifetime.

금융 빅 데이터를 이용한 주식수익률 행태 분석 (An Analysis of Stock Return Behavior using Financial Big Data)

  • 정헌용;김상식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.708-710
    • /
    • 2014
  • 최근 금융 분야에서는 빅 데이터를 이용하여 주가예측 모형을 만들어내고 있으며, 특히 금융 시계열 자료의 변동성 집중 현상을 금융 빅 데이터를 이용하여 분석함으로써 세계 주식시장의 동조화 현상을 분석하고 있다. 본 논문에서는 한국과 중국의 일별 주가지수수익률과 일중 주가지수수익률을 이용하여 이들 2개 국가의 대표적인 주가지수 시계열 데이터에 변동성 집중 현상이 존재하는지를 보다 세밀하게 추적하여 양국 주식시장의 동조화 현상을 분석한다. 분석 결과, 한국의 KOSPI와 중국의 Shanghai 종합주가지수의 지수수익률 시계열 자료는 단위근이 존재하지 않으며, 변동성 집중 현상을 보이는 것으로 나타났다. 또한 한국보다는 중국 주식시장의 변동성 집중현상이 보다 강하게 나타나며, 이러한 현상은 일중 주가지수수익률 시계열 자료에서 보다 두드러지게 나타났다.

  • PDF