• 제목/요약/키워드: Correlation Network

검색결과 1,395건 처리시간 0.067초

Hybrid 시계열 모델을 활용한 스마트 공장 내 수요예측 알고리즘 개발 (Development of Demand Forecasting Algorithm in Smart Factory using Hybrid-Time Series Models)

  • 김명수;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.187-194
    • /
    • 2019
  • 시장의 급속한 변화와 개별 수요자 요구의 다양화로 인하여 전통적인 예측 방식은 기업의 요구사항을 충족시키기 어렵다. 다변화하는 생산 환경에서의 올바른 수요예측은 원활한 수율관리를 위한 중요한 요소이다. 현재 산업에서 보편적으로 사용되는 기존의 많은 예측 모델은 조금씩 기능에 제한이 있다. 제안된 모델은 각 모델이 개별적으로 더 잘 수행하는 부분을 고려하여 이러한 한계를 극복하도록 설계 되었다. 본 논문에서는 동적 프로세스 분석에 적합한 Grey Relational 분석을 통한 변수 추출을 하고, ARIMA 예측값을 통하여 산출되는 과거 수요 데이터의 특징을 포함하는 통계적으로 예측된 데이터를 생성한다. 이후, LSTM 모델과 결합하여 신경망모델이 가지는 특성인 유연성, 장기적인 의존성 문제를 피하도록 구성되어진 구조를 통하여 수요예측에 영향을 주는 많은 요인들을 특징을 반영하여 수요예측을 산출할 수 있다.

지역빈도해석을 통한 건조지역의 미계측 지점 확률홍수량 추정을 위한 연구 (Analysis for Flood Quantile Estimates at Ungauged Sites in Arid and Semi-arid Regions Based on Regional Frequency Analysis)

  • 정기철;강부식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.51-51
    • /
    • 2017
  • 지역빈도해석은 짧은 기간의 자료를 보유하고 있는 계측 지점이나 자료가 없는 미계측 지점에서의 확률수문량을 산정하기 위하여 많이 쓰여 진다. 지역빈도해석을 실시하기 위한 조건으로는 우선 수집된 하천유역들을 대상으로 수문학적 동질 지역을 구분하는 것이 중요하다. 그리고 구분되어진 지역에 포함되는 모든 지점들의 자료를 빈도해석 함으로써 관심 지점의 신뢰할 만한 확률수문량을 산정하는 것이다. 그동안의 지역빈도해석은 주로 비건조지역을 중심으로 홍수와 같은 재난재해 대비 그리고 수자원 관리를 위한 연구들을 실시해왔다. 본 연구의 주 목적은 건조지역의 수자원 관리를 위해 건조지역 하천유역을 중심으로 지역빈도해석을 실시하여 신뢰할만한 확률수문량을 산정하는 것이다. 확률수문량 산정값의 정확도를 향상시키기 위해 지역빈도해석 모델에 쓰여 지는 새로운 지형학적 변수들을 제공하였고 수문학적 동질 지역을 구분 위해 수집된 각 하천유역의 형상들을 확인하여 동질 지역을 정의하였다. 예를 들면, 수지형 유역, 부채형 유역, 격자형 유역과 같은 다른 형상들을 구분하여 각 유역 형상 종류별로 동질 지역을 만들었다. 건조지역의 지역빈도해석을 위해 미국 건조지역의 105개 하천유역 유량자료들을 수집 및 이용하였다. 확률수문량 산정을 위하여 앙상블 인경신경망 (Ensemble Artificial Neural Network)과 정준 상관 계수(Canonical Correlation Analysis)를 이용한 지역빈도해석 모델을 만들었다. 제안된 모델의 수행평가와 정확성 평가를 위해 리샘플링 기법인 10-겹 교차 검증 (10-fold cross-validation), 잭나이프 (Jackknife) 기법들을 이용하였고 모델로부터 산정된 확률수문량값을 편향 (Bias), 상대 편향(rBias), 평균 제곱근 오차 (RMSE), 상대 평균 제곱근 오차 (rRMSE)를 통하여 산정 값과 실제 관측 값의 차이를 분석하였다. 그 결과 건조지역의 지역빈도해석을 위해 새롭게 제시된 지형학적 변수들을 사용하였을 때 모델의 수행능력이 향상되었음을 확인하였다. 또한 하천유역 형상에 따라 동질 지역을 구분하였을 때 향상된 확률수문량이 산정되었다. 향상된 지역빈도해석 모델을 통해 건조지역의 신뢰할만한 확률수문량을 산정함으로써 건조지역의 효과적인 수자원 관리를 위한 수공시설물 설계에 중요한 정보들을 제공할 것이다.

  • PDF

적대적 생성망을 이용한 부동산 시계열 데이터 생성 방안 (A Methodology for Realty Time-series Generation Using Generative Adversarial Network)

  • 유재필;한창훈;신현준
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.9-17
    • /
    • 2021
  • 최근 빅데이터 분석, 인공지능, 기계학습 등의 발전으로 인해서 데이터를 과학적으로 분석하는 기술이 발전하고 있으며 이는 의사결정 문제를 최적으로 해결해주고 있다. 그러나 특정 분야의 경우에는 데이터의 양이 부족해서 과학적 방식에 적용하는 것이 어렵다. 예컨대 부동산과 같은 데이터는 데이터 발표 시점이 최근이거나 비 유동성 자산이다 보니 발표 주기가 긴 경우가 많다. 따라서 본 연구에서는 이런 문제점을 극복하기 위해서 TimeGAN 모형을 통해 기존의 시계열의 확장 가능성에 대해서 연구하고자 한다. 이를 위해 부동산과 관련된 총 45개의 시계열을 데이터 셋에 맞게 2012년부터 2021년까지 주 단위로 데이터를 수집하고 시계열 간의 상관관계를 고려해서 총 15개의 최종 시계열을 선정한다. 15개의 시계열에 대해서 TimeGAN 모형을 통해 데이터 확장을한 결과, PCA 및 T-SNE 시각화 알고리즘을 통해 실제 데이터와 확장 데이터 간의 통계적 분포가 유사하다는 것을 확인할 수 있었다. 따라서 본 논문을 통해서 데이터의 과적합 또는 과소적합이라는 한계점을 극복할 수 있는 다양한 실험이 연구되기를 기대한다.

배전관제센터의 운전영역 구분을 위한 정량적 업무량 분석 (Quantitative Analysis of Workload for Classifying the Operating Area of Distribution Control Center)

  • 고석일;서동권;최준호;안선주;김현우;윤상윤
    • 전기학회논문지P
    • /
    • 제67권4호
    • /
    • pp.200-207
    • /
    • 2018
  • In recent, KEPCO (Korea Electric Power Corporation) faced difficulties of the DCC (distribution control center) due to the increase of field equipment and operational cost, and aging of operating staffs. In response to these changes in the DCC, KEPCO is trying to change the organization and system of the DCC. In this paper, we present a new attempt to change organization and structure of distribution control center, which was implemented by KEPCO recently. This paper is divided into three major parts. First, to examine the adequacy of the divided basis of current DCCs based on the quantity of installed electrical equipment, we analyzed the correlation between the operational history of the DCCs and the number of equipment. Through the analysis, we confirmed that there is little relationship between the number of equipment and actual workload. Second, we conducted visits and questionnaire surveys of all the DCCs to identify factors affecting the actual workload of distribution operators and then summarized the results. Third, based on this survey, a general formula for analyzing the workload of a DCC was derived, and each DCC's average annual total workload, day/night workload, and required number of personnel were calculated. Through this study, we proposed a more realistic management method of DCCs that can overcome the division criteria based on equipment quantity.

고해상도 격자 기후자료 내 이상 기후변수 수정을 위한 통계적 보간법 적용 (Application of a Statistical Interpolation Method to Correct Extreme Values in High-Resolution Gridded Climate Variables)

  • 정여민;음형일
    • 한국기후변화학회지
    • /
    • 제6권4호
    • /
    • pp.331-344
    • /
    • 2015
  • A long-term gridded historical data at 3 km spatial resolution has been generated for practical regional applications such as hydrologic modelling. However, overly high or low values have been found at some grid points where complex topography or sparse observational network exist. In this study, the Inverse Distance Weighting (IDW) method was applied to properly smooth the overly predicted values of Improved GIS-based Regression Model (IGISRM), called the IDW-IGISRM grid data, at the same resolution for daily precipitation, maximum temperature and minimum temperature from 2001 to 2010 over South Korea. We tested various effective distances in the IDW method to detect an optimal distance that provides the highest performance. IDW-IGISRM was compared with IGISRM to evaluate the effectiveness of IDW-IGISRM with regard to spatial patterns, and quantitative performance metrics over 243 AWS observational points and four selected stations showing the largest biases. Regarding the spatial pattern, IDW-IGISRM reduced irrational overly predicted values, i. e. producing smoother spatial maps that IGISRM for all variables. In addition, all quantitative performance metrics were improved by IDW-IGISRM; correlation coefficient (CC), Index Of Agreement (IOA) increase up to 11.2% and 2.0%, respectively. Mean Absolute Error (MAE) and Root Mean Square Error (RMSE) were also reduced up to 5.4% and 15.2% respectively. At the selected four stations, this study demonstrated that the improvement was more considerable. These results indicate that IDW-IGISRM can improve the predictive performance of IGISRM, consequently providing more reliable high-resolution gridded data for assessment, adaptation, and vulnerability studies of climate change impacts.

Digital Epidemiology: Use of Digital Data Collected for Non-epidemiological Purposes in Epidemiological Studies

  • Park, Hyeoun-Ae;Jung, Hyesil;On, Jeongah;Park, Seul Ki;Kang, Hannah
    • Healthcare Informatics Research
    • /
    • 제24권4호
    • /
    • pp.253-262
    • /
    • 2018
  • Objectives: We reviewed digital epidemiological studies to characterize how researchers are using digital data by topic domain, study purpose, data source, and analytic method. Methods: We reviewed research articles published within the last decade that used digital data to answer epidemiological research questions. Data were abstracted from these articles using a data collection tool that we developed. Finally, we summarized the characteristics of the digital epidemiological studies. Results: We identified six main topic domains: infectious diseases (58.7%), non-communicable diseases (29.4%), mental health and substance use (8.3%), general population behavior (4.6%), environmental, dietary, and lifestyle (4.6%), and vital status (0.9%). We identified four categories for the study purpose: description (22.9%), exploration (34.9%), explanation (27.5%), and prediction and control (14.7%). We identified eight categories for the data sources: web search query (52.3%), social media posts (31.2%), web portal posts (11.9%), webpage access logs (7.3%), images (7.3%), mobile phone network data (1.8%), global positioning system data (1.8%), and others (2.8%). Of these, 50.5% used correlation analyses, 41.3% regression analyses, 25.6% machine learning, and 19.3% descriptive analyses. Conclusions: Digital data collected for non-epidemiological purposes are being used to study health phenomena in a variety of topic domains. Digital epidemiology requires access to large datasets and advanced analytics. Ensuring open access is clearly at odds with the desire to have as little personal data as possible in these large datasets to protect privacy. Establishment of data cooperatives with restricted access may be a solution to this dilemma.

Validity of the Korean Developmental Screening Test for very-low-birth-weight infants

  • Kim, Chae Young;Jung, Euiseok;Lee, Byong Sop;Kim, Ki-Soo;Kim, Ellen Ai-Rhan
    • Clinical and Experimental Pediatrics
    • /
    • 제62권5호
    • /
    • pp.187-192
    • /
    • 2019
  • Purpose: The importance of the neurodevelopmental outcomes of very-low-birth-weight (VLBW) infants has been emphasized as their mortality rate has markedly improved. This study aimed to assess the validity of the Korean Developmental Screening Test (K-DST), a developmental screening tool approved by the Korean Society of Pediatrics, for the timely diagnosis of neurodevelopmental delay in VLBW infants. Methods: Subjects included VLBW infants enrolled in the Korean Neonatal Network database between January 2012 and December 2014. The collected data were analyzed for sensitivity, specificity, positive predictive value, and negative predictive value (NPV) in the K-DST compared to those in the Bayley Scales of Infant Development-II for VLBW infants. Results: A total of 173 patients were enrolled. Their mean gestational age and mean birth weight were $27.5{\pm}2.8weeks$ and $980.5{\pm}272.1g$, respectively. The frequency of failed psychomotor developmental index (PDI) <85 was similar to that in at least one domain of K-DST <1 standard deviation. Failure in more than one K-DST domain compared with a mental developmental index (MDI) <85 showed a sensitivity and NPV of 73.2% and 75.0%, respectively. Failure in more than one K-DST domain compared with PDI <85 showed a sensitivity and NPV of 60.3% and 71.6%, respectively. Each K-DST domain had a stronger correlation with predicting a failing MDI <85 than a failing PDI <85 (P<0.05). Conclusion: K-DST could be a useful screening tool for predicting mental developmental delay in VLBW infants and referring them for neurodevelopmental assessments.

SNS 게시물에 대한 공공기록화 수용에 관한 연구 (A Study on Acceptance of Public Recording for SNS Post)

  • 윤승욱;장준갑;김건
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.1-12
    • /
    • 2019
  • 본 연구는 SNS 게시물 기록화 수용의도에 미치는 요인들을 탐색하였으며, SPSS 21.0 프로그램과 AMOS 21.0 프로그램을 활용, 탐색적 요인분석과 확인적 요인분석, 상관관계 분석, 경로분석 등을 통해 주요 결과를 도출하였다. 주요 결과를 살펴보면, 첫째, SNS 게시물 기록화에 대한 개인정보 유출 위험은 SNS 게시물 기록화에 대한 태도에 통계적으로 유의한 부적 영향을 미치는 것으로 나타났다. 둘째, SNS 게시물 기록화에 대한 보안은 SNS 게시물 기록화에 대한 태도에 통계적으로 유의한 정적 영향을 미치는 것으로 나타났다. 셋째, SNS 게시물 기록화에 대한 프라이버시 염려는 SNS 게시물 기록화에 대한 태도에 통계적으로 유의한 부적 영향을 미치는 것으로 나타났다. 넷째, SNS 게시물 기록화에 대한 태도는 SNS 게시물 기록화 수용의도에 통계적으로 유의한 정적 영향을 미치는 것으로 나타났다. 이상의 결과는 SNS 게시물 기록화의 경우에 장기적인 관점에서 SNS 사용자들의 의견을 충분히 수렴해야 함을 시사한다.

국내 오픈액세스 분야의 지적구조 분석에 관한 연구 (A Study on the Intellectual Structure of Domestic Open Access Area)

  • 신주은;김성희
    • 한국문헌정보학회지
    • /
    • 제55권2호
    • /
    • pp.147-178
    • /
    • 2021
  • 본 연구에서는 국내 오픈액세스 분야의 지적구조 분석을 위해 동시출현단어 분석을 시행하였다. KCI와 RISS를 통해 수집한 국내 오픈액세스 관련 연구물 124편의 논문을 분석 대상으로 선정했으며, 제목과 초록에서 총 1,157개의 키워드를 추출하였다. 선정된 키워드를 대상으로 네트워크 분석을 시행하여 3개 영역과 20개 세부 군집으로 구분하여 제시하였다. 패스파인더 네트워크를 통해 키워드들의 지적 관계를 시각화하였으며, 가중 네트워크를 위한 중심성 분석을 통해 핵심 키워드를 확인하였다. 다음으로 군집분석을 실시하여 5개의 군집을 도출하고, 다차원 축적 지도상에 표시함으로써 키워드 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구 결과는 국내 오픈액세스 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 앞으로 국내 오픈액세스 연구의 방향성을 예측하는데 기초 자료로 활용할 수 있을 것으로 기대한다.

현실과 예술적 기능으로서의 자살 이미지 (The Image of Suicide as the Functions of Reality and Art)

  • 최은주
    • 영미문화
    • /
    • 제13권1호
    • /
    • pp.83-103
    • /
    • 2013
  • This paper focuses on the function of suicidal images in the history of art including literature. Death has been romanticized or repoliticized into an existential act of defiance and rebellion in literary works, so questions remain about the correlation between literary suicide and the essence of suicide. Although Jacques Ranciere insists that the order of art contrasts with the order of common people whose acts and gestures can express either their specific purposes nor the rationalities of their frustration, literary suicide reflects the outside life of readers. In fact, images of suicide produces the order of things about the real world. William Shakespeare's Hamlet handled two oppositional self-murder significantly. As Ron M. Brown pointed out, Hamlet, by choosing confrontation, seeks out an end which is voluntary, thus he avoids self-destruction and feels triumph of heroic fashion. Ophelia's self-chosen death stems from loss, frailty and the disintegration of reason, which demeans the act and diminishes her from the tragic to the pathetic(16). In the $19^{th}$ century, the resurrection of Ophelia acted as the context for later periods where life itself is fictionalized from the differing periods of network of signifier and texts. Finally, in Ophelia's case, fiction became life(Brown 285). Her suicidal image was fixed in the Victorian Culture whose visual discourse was strikingly similar to that of the men. Likewise, the ambiguities of the suicide became intertwined with the social, cultural issues of a certain period, and the paradigm of suicide was conformed to the changing needs of successive generations. However, if literary art understands that a European culture grappled with the almost impossible task and coming to terms with this strangest and most persistent of phenomena, it will be able to focus on of the multi-layered suicide by recognizing the inherent instability of the verbal sign which cannot reveal the design and grammar of truth.