• 제목/요약/키워드: 이차 데이터 분석

검색결과 105건 처리시간 0.027초

이차원 배열 데이터에서 유사 구역의 효율적인 탐색 기법 (Efficient Search of Similar Regions in Two-Dimensional Array Data)

  • 최연정;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.562-565
    • /
    • 2016
  • 첨단 과학 장비를 이용한 시뮬레이션의 결과로 데이터의 정확도 및 정밀도가 향상되어 대용량의 이차원 배열 데이터가 생성되고 있다. 대용량의 이차원 배열 데이터에서 유사 구역 (similar region)을 찾아내는 것은 매우 의미 있는 일이다. 따라서 본 논문에서는 대용량의 이차원 배열데이터에서 유사 구역을 찾는 단순 방법(naïve method)과 효율적으로 탐색할 수 있는 알고리즘을 제안한다. 또한 단순 방법과 제안 알고리즘의 시간 복잡도(time complexity)를 분석하고 실험을 통해 제안 방법이 단순 방법보다 더 빠르게 처리함을 보인다.

정교한 데이터 분류를 위한 방법론의 고찰 (A Review of the Methodology for Sophisticated Data Classification)

  • 김승재;김성환
    • 통합자연과학논문집
    • /
    • 제14권1호
    • /
    • pp.27-34
    • /
    • 2021
  • 전 세계적으로 인공지능(AI)을 구현하려는 움직임이 많아지고 있다. AI구현에서는 많은 양의 데이터, 목적에 맞는 데이터의 분류 등 데이터의 중요성을 뺄 수 없다. 이러한 데이터를 생성하고 가공하는 기술에는 사물인터넷(IOT)과 빅데이터(Big-data) 분석이 있으며 4차 산업을 이끌어 가는 원동력이라 할 수 있다. 또한 이러한 기술은 국가와 개인 차원에서 많이 활용되고 있으며, 특히나 특정분야에 집결되는 데이터를 기준으로 빅데이터 분석에 활용함으로써 새로운 모델을 발견하고, 그 모델로 새로운 값을 추론하고 예측함으로써 미래비전을 제시하려는 시도가 많아지고 있는 추세이다. 데이터 분석을 통한 결론은 데이터가 가지고 있는 정보의 정확성에 따라 많은 변화를 가져올 수 있으며, 그 변화에 따라 잘못된 결과를 발생시킬 수도 있다. 이렇듯 데이터의 분석은 데이터가 가지는 정보 또는 분석 목적에 맞는 데이터 분류가 매우 중요하다는 것을 알 수 있다. 또한 빅데이터 분석결과 통계량의 신뢰성과 정교함을 얻기 위해서는 각 변수의 의미와 변수들 간의 상관관계, 다중공선성 등을 고려하여 분석해야 한다. 즉, 빅데이터 분석에 앞서 분석목적에 맞도록 데이터의 분류가 잘 이루어지도록 해야 한다. 이에 본 고찰에서는 AI기술을 구현하는 머신러닝(machine learning, ML) 기법에 속하는 분류분석(classification analysis, CA) 중 의사결정트리(decision tree, DT)기법, 랜덤포레스트(random forest, RF)기법, 선형분류분석(linear discriminant analysis, LDA), 이차선형분류분석(quadratic discriminant analysis, QDA)을 이용하여 데이터를 분류한 후 데이터의 분류정도를 평가함으로써 데이터의 분류 분석률 향상을 위한 방안을 모색하려 한다.

이자율 보증옵션이 내재된 생명보험의 이차익 분석 (Profit analysis of life insurance products with interest rate options)

  • 이항석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.737-753
    • /
    • 2013
  • 금리변동형 보험상품은 시장금리에 연동하여 이자율 (공시이율)을 적용하는 보험상품이지만, 시장금리의 하락시에도 해약환급금의 이자율을 보증하기 위해 최저보증이율을 설정하도록 하고 있다. 즉, 공시이율이 계약할 당시 설정한 최저보증이율을 하회할 경우 보험사는 공시이율과 최저보증이율 중에 큰 금액으로 책임준비금을 적립하고 계약자가 보험계약을 해지할 경우 해약환급금을 지급해야 한다. 이러한 이자율 보증옵션은 시장금리가 하락하는 최근의 저금리 기조에서 생명보험회사의 손익을 악화시키는 요인이 되고 있다. 본 논문에서는 현재의 저금리 상황과 이자율 보증옵션 적용방식 현황을 살펴보고, 금리변동형 종신보험과 금리변동형 연금보험의 이차손익 구조 및 이자율 보증옵션의 가치와 리스크를 분석한다. 그리고, 이자율 보증옵션의 분석 결과를 토대로 시장이율과 최저보증이율의 금리차와 이차손익과의 관계에 대한 시사점을 제시한다.

Local Thermal Equilibrium 모델에 의한 이차이온 질량분석의 정량화 방법

  • 곽병화;권오준
    • ETRI Journal
    • /
    • 제10권2호
    • /
    • pp.63-69
    • /
    • 1988
  • SIMS(Secondary Ion Mass Spectrometry) 분석 데이터의 정량화 방법으로 이온주입에 의한 실험적 접근법과 LTE(Local Thermal Equilibrium) 모델을 사용한 준이론적 접근법 2가지가 주로 논의되고 있다. 본 고에서는 LTE 모델을 사용, SIMS data를 정량화하는 방법에 대하여 기술하였으며 아울러 BASIC language로 된 간단한 LTE 프로그램을 제시하였다.

  • PDF

앙상블기법을 이용한 다양한 데이터마이닝 성능향상 연구 (A Study for Improving the Performance of Data Mining Using Ensemble Techniques)

  • 정연해;어수행;문호석;조형준
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.561-574
    • /
    • 2010
  • 본 논문은 8가지 방법의 데이터 마이닝 알고리즘(CART, QUEST, CRUISE, 로지스틱 회귀분석, 선형판별분석, 이차판별분석, 신경망분석, 서포트 벡터 머신) 기법과 단일 알고리즘에 2가지 앙상블기법(배깅, 부스팅)을 적용한 16가지 방법을 바탕으로 총 24가지의 방법을 비교하였다. 알고리즘의 성능 비교를 위하여 13개의 이항반응변수로 구성된 데이터를 사용하였다. 비교 기준은 민감도, 특이도 및 오분류율을 사용하여 데이터 마이닝 기법의 성능향상에 대해 평가하였다.

이형 GFRP Rebar로 보강된 보의 유효단면이차모멘트 산정식 제안 (New Suggestion of Effective Moment of Inertia for Beams Reinforced with the Deformed GFRP Rebar)

  • 심종성;오홍섭;주민관;임준현
    • 콘크리트학회논문집
    • /
    • 제20권2호
    • /
    • pp.185-191
    • /
    • 2008
  • 최근 콘크리트 열화와 같은 문제를 근본적으로 해결하기 위해 고내구성을 보유한 콘크리트구조물의 장수명화에 대한 연구가 활발히 진행되고 있는 가운데, 신설 구조물로의 철근대체 FRP rebar를 적용한 고내구성 콘크리트구조물에 대한 연구 개발 및 활용이 점차 증가되는 추세이다. 이에 대해 콘크리트구조물의 경제적인 측면에서 적용 가능한 FRP rebar로서는 GFRP rebar가 주목을 받고 있으며 그 사용성 또한 증대되고 있다. 하지만 GFRP rebar로 보강된 콘크리트구조물에 대한 휨모멘트 성능은 이미 그 우수성이 구명되어 있으나 GFRP의 단점 중 하나인 처짐에 대한 사용성 측면은 개선되어야 할 점으로 지적되고 있다. 본 연구에서는 개발된 이형 GFRP rebar로 보강 콘크리트 보 구조물의 처짐 거동 예측을 위해 기존의 유효단면이차모멘트 제안식들과 비교 분석을 실시하였으며, 그 결과 기존의 유효단면이차모멘트 산정식은 균열모멘트 이후 극한모멘트의 50% 수준까지의 유효단면이차모멘트는 비교적 정확히 예상할 수 있었으나 이후에는 실제 유효단면이차모멘트보다 다소 높은 값을 나타냄으로써 최종 파괴시까지의 처짐량을 과소평가하는 것으로 분석되었다. 따라서 본 연구에서는 탄성계수 환산비를 적용한 보강비를 사용한 Toutanji et al. (2000)의 유효단면이차모멘트 제안식을 바탕으로 이형 GFRP rebar로 보강된 콘크리트보에 대한 유효단면이차모멘트 제안식을 도출하였으며, 그 결과 제안된 식을 적용하여 각 시험체의 시험데이터와 비교 분석을 통하여 최종 파괴시까지의 하중-처짐 관계를 비교적 정확히 예측할 수 있는 것으로 분석되었다.

EEG 데이터의 고차원 하이퍼에지에서의 주성분 분석 (Principal Component Analysis of Higher-Order Hyperedges in EEG Data)

  • 김준식;이충연;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.414-416
    • /
    • 2012
  • 고차 주성분 방법으로는 텐서 분석이 있었다. Electroencephalography(EEG) 데이터나 Social Network 데이터에 텐서 분석이 적용되어 주요한 성분들을 찾는 연구들이 있었다. 그러나 텐서 분석은 직관적으로 이해하기에 어려움이 있으며 중요한 노드를 찾는데에는 다소 어려움이 있다. 본 논문에서는 고차 하이퍼에지로 이차원 행렬을 만들고 주성분분석법을 이용하여 중요한 노드를 찾는 새로운 방법론을 제시한다. 데이터로는 Multimodal Memory Game(MMG) 수행시 촬영한 EEG 데이터를 사용하였다. MMG는 TV 드라마 기반의 기억인출게임이다. 베타파의 Power Spectrum Density(PSD)는 각 위치의 채널들의 활성도를 나타내는 지표이다. 우리는 Random Sampling을 바탕으로 PSD 상위 50%의 채널들간의 전이행렬을 구하였다. 그 후 고유치와 고유벡터를 구하였다. 가장 큰 고유치의 고유벡터는 주성분을 나타내며 고유벡터의 각 원소들은 중요도를 나타내는 centrality 이다. 세 명의 피험자에 대한 centrality 상위 30개의 중요한 채널들을 구하였고 세명에 공통적으로 포함되는 채널을 확인하였다.

사행수로에서 2차류 거동에 대한 수치해석 (Numerical Analysis of Flow Characteristics of Secondary Currents in Curved Channels)

  • 서일원;신재현;김태원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.558-558
    • /
    • 2012
  • 다수의 자연 하천은 유사 이동과 하안의 침식으로 인하여 사행 하천이 발생한다. 사행 하천에서의 이차류는 원심력, 편수위로 발생하는 중력에 의한 압력차, 그리고 난류로 인하여 발생하는 응력으로 인하여 형성되며 나선형 구조 형태로 표면 유속은 외부로 향하고 하천 바닥의 유속은 안으로 향하게 된다. 이러한 2차류의 형성은 주 흐름의 특성을 변형시킨다. 자연하천에서 2차류는 주 흐름의 15-25%의 크기를 가지고 있으나, 하상의 변화, 유사의 이동 등과 연관되므로 2차류의 영향을 정확히 해석하는 것은 수리학적으로 매우 중요하다. 본 연구에서는 사행수로에서 발생하는 2차류 거동을 수치모의를 통하여 수행하였다. 우선 2차류의 분석을 위하여 실험을 통한 결과물을 비교하였다. 자연 하천의 특성을 반영할 수 있도록 서일원(2006)이 수행한 S-자 형태의 실험 수로의 실험 결과를 분석하였다. 수치 모의를 위하여 3차원 전산유체역학 프로그램을 사용하여 사행수로의 2차원 유속 구조를 모의할 수 있도록 하였다. FLOW-3D 프로그램을 이용하여 실험 결과와 모의 결과를 비교할 수 있도록 하였으며 비교 후 보정을 실시하였다. 모의는 주로 LES (Large Eddy Simulation) 모형을 통해 이루어졌으며, 이를 통하여 실험에서 획득한 결과와 비슷한 유속구조 분포를 확인할 수 있었다. 보정 및 검증 후 수치 모의를 통한 유속 데이터를 이용하여 민감도 분석을 실행하였다. 이후로는 수로의 만곡부, 조도, 수심 등 인공수로의 조건을 변경하여 수치 모의를 수행하였다. 보정된 결과를 이용하여 추가적인 모의를 통한 유속 분포 구조의 비교가 이루어졌다. 이를 통하여 각 조건이 이차류의 크기에 미치는 영향을 확인할 수 있었으며, 모의를 통한 유속분포 결과는 대체적으로 실험을 통한 이차류의 연직분포 구조와 일치하였다.

  • PDF

이차원 복합적 습기와 열흐름의 분석모델과 민감도 분석 (Two-dimensional Coupled Moisture and Heat Flow Model and Sensitivity Analysis)

  • Kim, Suk-Nam
    • 한국지반공학회논문집
    • /
    • 제19권5호
    • /
    • pp.99-107
    • /
    • 2003
  • 포장 시스템 내에서의 습기흐름과 열흐름은 상호간에 복합적인 작용을 하는 과정들로 인식되어 왔다. 습기의 흐름과 열흐름에 기인한 포장내에서의 습기와 온도의 분포는 계절적으로 변화할 뿐만 아니라 수직 그리고 수평적으로도 변화한다. 이 논문은 불포화토에서의 이차원 복합적인 습기와 열흐름에 대해서 유한요소법을 사용한 분석모델을 제시한다. 모델을 검증하기 위해 모델에 의한 분석결과는 Canada Alberta에 소재한 GEO-SLOPE사에 의해 개발된 소프트웨어인 GEO-SLOPE에 의해 분석된 결과와 비교하였다. 그리고 모델에서 사용된 입력데이터가 모델분석에 미치는 영향을 알아보기 위해 ASTM 방법에 의한 민감도 분석을 수행하였다.

퍼지 RBFNNs와 증분형 주성분 분석법으로 실현된 숫자 인식 시스템의 설계 (Design of Digit Recognition System Realized with the Aid of Fuzzy RBFNNs and Incremental-PCA)

  • 김봉연;오성권;김진율
    • 한국지능시스템학회논문지
    • /
    • 제26권1호
    • /
    • pp.56-63
    • /
    • 2016
  • 본 연구에서는 퍼지 RBFNNs과 증분형 주성분 분석법으로 실현된 숫자인식 시스템의 설계를 소개한다. 주성분 분석법은 차원축소를 위해 사용되는 알고리즘으로 학습데이터의 차원 수가 고차원이거나 데이터의 양이 많을 때 특징 추출을 위한 많은 계산 시간을 필요로 한다. 따라서 고차원 데이터의 효율적인 차원축소와 점진적인 학습을 위해 증분형 주성분분석법을 적용하는 방법을 제안한다. 방사형 기저함수 신경회로망의 구조는 조건부, 결론부, 추론부의 3가지 기능적 모듈로서 구분이 가능하다. 조건부에서는 FCM 클러스터링 알고리즘의 도움으로 실현된 퍼지 클러스터링의 사용으로 입력 공간을 분할한다. 또한 가우시안 함수 대신 FCM(Fuzzy C-Means)클러스터링 알고리즘의 멤버쉽 값을 사용함으로써 입력 데이터의 특성을 좀 더 잘 반영할 수 있도록 개선하였으며, 결론부에서 연결가중치는 상수항에서 일차식과 이차식, 그리고 변형된 이차식과 같은 다항식의 형태로 확장하여 사용한다. 실험 결과는 공인 숫자 데이터인 MNIST 필기체 숫자 데이터를 사용하여 제안된 숫자 인식 시스템의 효율성을 다른 연구와의 비교를 통해 입증한다.