• Title/Summary/Keyword: 이차 데이터 분석

Search Result 105, Processing Time 0.012 seconds

Efficient Search of Similar Regions in Two-Dimensional Array Data (이차원 배열 데이터에서 유사 구역의 효율적인 탐색 기법)

  • Choe, YeonJeong;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.562-565
    • /
    • 2016
  • 첨단 과학 장비를 이용한 시뮬레이션의 결과로 데이터의 정확도 및 정밀도가 향상되어 대용량의 이차원 배열 데이터가 생성되고 있다. 대용량의 이차원 배열 데이터에서 유사 구역 (similar region)을 찾아내는 것은 매우 의미 있는 일이다. 따라서 본 논문에서는 대용량의 이차원 배열데이터에서 유사 구역을 찾는 단순 방법(naïve method)과 효율적으로 탐색할 수 있는 알고리즘을 제안한다. 또한 단순 방법과 제안 알고리즘의 시간 복잡도(time complexity)를 분석하고 실험을 통해 제안 방법이 단순 방법보다 더 빠르게 처리함을 보인다.

A Review of the Methodology for Sophisticated Data Classification (정교한 데이터 분류를 위한 방법론의 고찰)

  • Kim, Seung Jae;Kim, Sung Hwan
    • Journal of Integrative Natural Science
    • /
    • v.14 no.1
    • /
    • pp.27-34
    • /
    • 2021
  • 전 세계적으로 인공지능(AI)을 구현하려는 움직임이 많아지고 있다. AI구현에서는 많은 양의 데이터, 목적에 맞는 데이터의 분류 등 데이터의 중요성을 뺄 수 없다. 이러한 데이터를 생성하고 가공하는 기술에는 사물인터넷(IOT)과 빅데이터(Big-data) 분석이 있으며 4차 산업을 이끌어 가는 원동력이라 할 수 있다. 또한 이러한 기술은 국가와 개인 차원에서 많이 활용되고 있으며, 특히나 특정분야에 집결되는 데이터를 기준으로 빅데이터 분석에 활용함으로써 새로운 모델을 발견하고, 그 모델로 새로운 값을 추론하고 예측함으로써 미래비전을 제시하려는 시도가 많아지고 있는 추세이다. 데이터 분석을 통한 결론은 데이터가 가지고 있는 정보의 정확성에 따라 많은 변화를 가져올 수 있으며, 그 변화에 따라 잘못된 결과를 발생시킬 수도 있다. 이렇듯 데이터의 분석은 데이터가 가지는 정보 또는 분석 목적에 맞는 데이터 분류가 매우 중요하다는 것을 알 수 있다. 또한 빅데이터 분석결과 통계량의 신뢰성과 정교함을 얻기 위해서는 각 변수의 의미와 변수들 간의 상관관계, 다중공선성 등을 고려하여 분석해야 한다. 즉, 빅데이터 분석에 앞서 분석목적에 맞도록 데이터의 분류가 잘 이루어지도록 해야 한다. 이에 본 고찰에서는 AI기술을 구현하는 머신러닝(machine learning, ML) 기법에 속하는 분류분석(classification analysis, CA) 중 의사결정트리(decision tree, DT)기법, 랜덤포레스트(random forest, RF)기법, 선형분류분석(linear discriminant analysis, LDA), 이차선형분류분석(quadratic discriminant analysis, QDA)을 이용하여 데이터를 분류한 후 데이터의 분류정도를 평가함으로써 데이터의 분류 분석률 향상을 위한 방안을 모색하려 한다.

Profit analysis of life insurance products with interest rate options (이자율 보증옵션이 내재된 생명보험의 이차익 분석)

  • Lee, Hangsuck
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.4
    • /
    • pp.737-753
    • /
    • 2013
  • Interest rate options embedded in life insurance products provide policyholders with minimum guaranteed rates credited to the corresponding surrender values. This paper discusses current low-interest environment and several types of interest rate options embedded in life insurance products. In addition, this paper shows profit structures of the life insurance products and calculates values of the interest rate options under stochastic interest model and the corresponding VaR (value at risk). Finally, some implications are discussed.

Local Thermal Equilibrium 모델에 의한 이차이온 질량분석의 정량화 방법

  • Gwak, Byeong-Hwa;Gwon, O-Jun
    • ETRI Journal
    • /
    • v.10 no.2
    • /
    • pp.63-69
    • /
    • 1988
  • SIMS(Secondary Ion Mass Spectrometry) 분석 데이터의 정량화 방법으로 이온주입에 의한 실험적 접근법과 LTE(Local Thermal Equilibrium) 모델을 사용한 준이론적 접근법 2가지가 주로 논의되고 있다. 본 고에서는 LTE 모델을 사용, SIMS data를 정량화하는 방법에 대하여 기술하였으며 아울러 BASIC language로 된 간단한 LTE 프로그램을 제시하였다.

  • PDF

A Study for Improving the Performance of Data Mining Using Ensemble Techniques (앙상블기법을 이용한 다양한 데이터마이닝 성능향상 연구)

  • Jung, Yon-Hae;Eo, Soo-Heang;Moon, Ho-Seok;Cho, Hyung-Jun
    • Communications for Statistical Applications and Methods
    • /
    • v.17 no.4
    • /
    • pp.561-574
    • /
    • 2010
  • We studied the performance of 8 data mining algorithms including decision trees, logistic regression, LDA, QDA, Neral network, and SVM and their combinations of 2 ensemble techniques, bagging and boosting. In this study, we utilized 13 data sets with binary responses. Sensitivity, Specificity and missclassificate error were used as criteria for comparison.

New Suggestion of Effective Moment of Inertia for Beams Reinforced with the Deformed GFRP Rebar (이형 GFRP Rebar로 보강된 보의 유효단면이차모멘트 산정식 제안)

  • Sim, Jong-Sung;Oh, Hong-Seob;Ju, Min-Kwan;Lim, Jun-Hyun
    • Journal of the Korea Concrete Institute
    • /
    • v.20 no.2
    • /
    • pp.185-191
    • /
    • 2008
  • To fundamentally solve the problem of deterioration of concrete structures, it has been researched that the high durable concrete structure reinforced with the FRP rebar can be one of major solution to the newly-developed concrete structure. FRP rebar has lots of advantages such as non-corrosive, high performance and light weight against the conventional steel rebar. Among these kinds of FRP rebars, GFRP rebar has usually been considered as the best reinforcement because of its economic point of view. Even though the material capacity of the GFRP rebar was already investigated, there are some problems such as low modulus of elastic that will be cause for degrade of the serviceability of flexural concrete member reinforced with the GFRP rebar. Thus, the deflection characteristics of the GFRP rebar reinforced concrete structure should be considered then investigated. In this study, ACI 440 guideline (2003), ISIS Canada Design Manual (2001) and Toutanji et al. (2000) was considered for predicting the moment of inertia of the concrete beam reinforced with the GFRP rebar. And it was also evaluated that load-deflection relationship had a good accordance with the test and analysis result. In the result of this study, it could be estimated that the load-deflection relationship using the suggested equation of moment of inertia in this study indicated better accordance with the test result than that of the others until failure.

Principal Component Analysis of Higher-Order Hyperedges in EEG Data (EEG 데이터의 고차원 하이퍼에지에서의 주성분 분석)

  • Kim, Joon-Shik;Lee, Chung-Yeon;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.414-416
    • /
    • 2012
  • 고차 주성분 방법으로는 텐서 분석이 있었다. Electroencephalography(EEG) 데이터나 Social Network 데이터에 텐서 분석이 적용되어 주요한 성분들을 찾는 연구들이 있었다. 그러나 텐서 분석은 직관적으로 이해하기에 어려움이 있으며 중요한 노드를 찾는데에는 다소 어려움이 있다. 본 논문에서는 고차 하이퍼에지로 이차원 행렬을 만들고 주성분분석법을 이용하여 중요한 노드를 찾는 새로운 방법론을 제시한다. 데이터로는 Multimodal Memory Game(MMG) 수행시 촬영한 EEG 데이터를 사용하였다. MMG는 TV 드라마 기반의 기억인출게임이다. 베타파의 Power Spectrum Density(PSD)는 각 위치의 채널들의 활성도를 나타내는 지표이다. 우리는 Random Sampling을 바탕으로 PSD 상위 50%의 채널들간의 전이행렬을 구하였다. 그 후 고유치와 고유벡터를 구하였다. 가장 큰 고유치의 고유벡터는 주성분을 나타내며 고유벡터의 각 원소들은 중요도를 나타내는 centrality 이다. 세 명의 피험자에 대한 centrality 상위 30개의 중요한 채널들을 구하였고 세명에 공통적으로 포함되는 채널을 확인하였다.

Numerical Analysis of Flow Characteristics of Secondary Currents in Curved Channels (사행수로에서 2차류 거동에 대한 수치해석)

  • Seo, Il-Won;Shin, Jae-Hyun;Kim, Tae-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.558-558
    • /
    • 2012
  • 다수의 자연 하천은 유사 이동과 하안의 침식으로 인하여 사행 하천이 발생한다. 사행 하천에서의 이차류는 원심력, 편수위로 발생하는 중력에 의한 압력차, 그리고 난류로 인하여 발생하는 응력으로 인하여 형성되며 나선형 구조 형태로 표면 유속은 외부로 향하고 하천 바닥의 유속은 안으로 향하게 된다. 이러한 2차류의 형성은 주 흐름의 특성을 변형시킨다. 자연하천에서 2차류는 주 흐름의 15-25%의 크기를 가지고 있으나, 하상의 변화, 유사의 이동 등과 연관되므로 2차류의 영향을 정확히 해석하는 것은 수리학적으로 매우 중요하다. 본 연구에서는 사행수로에서 발생하는 2차류 거동을 수치모의를 통하여 수행하였다. 우선 2차류의 분석을 위하여 실험을 통한 결과물을 비교하였다. 자연 하천의 특성을 반영할 수 있도록 서일원(2006)이 수행한 S-자 형태의 실험 수로의 실험 결과를 분석하였다. 수치 모의를 위하여 3차원 전산유체역학 프로그램을 사용하여 사행수로의 2차원 유속 구조를 모의할 수 있도록 하였다. FLOW-3D 프로그램을 이용하여 실험 결과와 모의 결과를 비교할 수 있도록 하였으며 비교 후 보정을 실시하였다. 모의는 주로 LES (Large Eddy Simulation) 모형을 통해 이루어졌으며, 이를 통하여 실험에서 획득한 결과와 비슷한 유속구조 분포를 확인할 수 있었다. 보정 및 검증 후 수치 모의를 통한 유속 데이터를 이용하여 민감도 분석을 실행하였다. 이후로는 수로의 만곡부, 조도, 수심 등 인공수로의 조건을 변경하여 수치 모의를 수행하였다. 보정된 결과를 이용하여 추가적인 모의를 통한 유속 분포 구조의 비교가 이루어졌다. 이를 통하여 각 조건이 이차류의 크기에 미치는 영향을 확인할 수 있었으며, 모의를 통한 유속분포 결과는 대체적으로 실험을 통한 이차류의 연직분포 구조와 일치하였다.

  • PDF

Two-dimensional Coupled Moisture and Heat Flow Model and Sensitivity Analysis (이차원 복합적 습기와 열흐름의 분석모델과 민감도 분석)

  • Kim, Suk-Nam
    • Journal of the Korean Geotechnical Society
    • /
    • v.19 no.5
    • /
    • pp.99-107
    • /
    • 2003
  • Moisture flow and heat flow within pavement systems have been recognized as coupled processes with complex interactions between them. The distribution of moisture and temperature within pavement due to the moisture flow and heat flow varies not only seasonally but also vertically and horizontally. This paper presents an analysis model by the finite element method for the two-dimensional coupled moisture and heat flow in unsaturated soils. To test the model the analysis result by the model is compared with the analysis result by the software, GEO-SLOPE developed by GEO-SLOPE International Ltd. in Alberta, Canada. And a sensitivity analysis using ASTM method is performed to identify how model inputs affect the modeling analysis.

Design of Digit Recognition System Realized with the Aid of Fuzzy RBFNNs and Incremental-PCA (퍼지 RBFNNs와 증분형 주성분 분석법으로 실현된 숫자 인식 시스템의 설계)

  • Kim, Bong-Youn;Oh, Sung-Kwun;Kim, Jin-Yul
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.26 no.1
    • /
    • pp.56-63
    • /
    • 2016
  • In this study, we introduce a design of Fuzzy RBFNNs-based digit recognition system using the incremental-PCA in order to recognize the handwritten digits. The Principal Component Analysis (PCA) is a widely-adopted dimensional reduction algorithm, but it needs high computing overhead for feature extraction in case of using high dimensional images or a large amount of training data. To alleviate such problem, the incremental-PCA is proposed for the computationally efficient processing as well as the incremental learning of high dimensional data in the feature extraction stage. The architecture of Fuzzy Radial Basis Function Neural Networks (RBFNN) consists of three functional modules such as condition, conclusion, and inference part. In the condition part, the input space is partitioned with the use of fuzzy clustering realized by means of the Fuzzy C-Means (FCM) algorithm. Also, it is used instead of gaussian function to consider the characteristic of input data. In the conclusion part, connection weights are used as the extended diverse types in polynomial expression such as constant, linear, quadratic and modified quadratic. Experimental results conducted on the benchmarking MNIST handwritten digit database demonstrate the effectiveness and efficiency of the proposed digit recognition system when compared with other studies.