• 제목/요약/키워드: 데이터결합

검색결과 2,382건 처리시간 0.034초

포섭 구조기반 OVR SVM 결합을 통한 다중부류 암 분류 (Multi-class Cancer Classification by Integrating OVR SVMs based on Subsumption Architecture)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.37-39
    • /
    • 2006
  • 지지 벡터 기계(Support Vector Machine; SVM)는 기본적으로 이진분류를 위해 고안되었지만, 최근 다양한 분류기 생성전략과 결합전략이 고안되어 다중부류 분류에도 적용되고 있다. 본 논문에서는 OVR(One-Vs-Rest) 전략으로 생성된 SVM을 NB(Naive Bayes) 분류기를 이용하여 동적으로 구성함으로써, OVR SVM을 이용한 다중부류 분류 시스템에서 자주 발생하는 동점을 효과적으로 해결하는 방법은 제안한다. 이 방법을 유전발현 데이터를 이용한 다중부류 암 분류에 적용하였는데, 고차원의 데이터로부터 NB 분류기 구축에 유용한 유전자를 선택하기 위해 Pearson 상관계수를 사용하였다. 14개의 암 유형과 16,063개의 유전발현 수준을 가지는 대표적인 다중부류 암 분류 데이터인 GCM 암 데이터에 적용하여 제안하는 방법의 유용성을 확인하였다.

  • PDF

결합적 방법에 의한 귀납법칙 집합의 생성 (An Integrated Method for Generating Inductive Rule Sets)

  • 이창환
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.27-32
    • /
    • 2003
  • 귀납법칙 생성 시스템은 데이터에서부터 법칙을 자동으로 발견하는 시스템으로서 현재 많은 연구가 진행되고 있다. 본 논문은 정보이론을 이용하여 데이터로부터 귀납법칙을 자동으로 생성하는 시스템을 제시하고 또한 귀납법칙 생성 시스템에 의하여 생성되는 규칙들 중에서 가장 좋은 성능을 보이는 규칙 집합을 구하기 위하여 이를 유전자 알고리즘과 결합시켜 최적화된 귀납법칙 집합을 탐색하는 방법을 제시하였다. 제안된 시스템의 성능을 평가하기 위하여 다수의 기계학습 데이터를 사용하여 기존의 다른 방법들과 비교하였으며, 제안된 시스템은 대부분의 경우에 좋은 정확도를 제공하였다.

감정 분석에서의 심리 모델 적용 비교 연구 (A Comparative Study on Sentiment Analysis Based on Psychological Model)

  • 김해준;도준호;선주오;정서희;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.450-452
    • /
    • 2020
  • 기술의 발전과 함께 사용자에게 가까이 자리 잡은 소셜 네트워크 서비스는 이미지, 동영상, 텍스트 등 활용 가능한 데이터의 수를 폭발적으로 증가시켰다. 작성자의 감정을 포함하고 있는 텍스트 데이터는 시장 조사, 주가 예측 등 다양한 분야에서 이용할 수 있으며, 이로 인해 긍부정의 이진 분류가 아닌 다중 감정 분석의 필요성 또한 높아지고 있다. 본 논문에서는 딥러닝 기반 감정 분류에 심리학 이론의 기반 감정 모델을 활용한 결합 모델과 단일 모델을 비교한다. 학습을 위해 AI Hub에서 제공하는 데이터와 노래 가사 데이터를 복합적으로 사용하였으며, 결과에서는 대부분의 경우에 결합 모델이 높은 결과를 보였다.

  • PDF

데이터사이언스 연구의 지적 구조 분석 및 시각화 (Analyzing and Visualizing the Intellectual Structure of Data Science)

  • 박형주
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.18-29
    • /
    • 2022
  • 본 탐색적 연구의 목적은 데이터사이언스 관련 논문의 연구 동향을 분석하는 것이다. 본 연구는 Clarivate Analytics사의 Web of Science(WoS)에 색인된 데이터사이언스 관련 논문을 분석의 대상으로 했다. 2012년부터 2021년까지 WoS에 색인된 데이터사이언스 관련 논문 총 17,997편을 분석했다. 데이터사이언스 연구의 지적 구조를 집중 분석하기 위해 기술 분석, 인용 분석, 공동 저자 네트워크 분석, 동시 출현 네트워크 분석, 서지 결합 분석, 동시 인용 분석을 수행했다. 본 연구의 결과는 향후 데이터사이언스 관련 연구의 방향성 모색에 유용하게 사용될 수 있다.

X-선 회절로 얻은 수소결합의 결합거리 보정 방법: 중성자 회절결과와 결합원자가 방법 이용 (Correction Method of the Hydrogen Bond-Distance from X-ray Diffraction: Use of Neutron Data and Bond Valence Method)

    • 한국광물학회지
    • /
    • 제16권1호
    • /
    • pp.65-73
    • /
    • 2003
  • 이 연구에서는 X-선 회절법으로 측정한 수소결합의 거리를 보정하는 두 가지 방법을 제시하였다 O…O 거리가 2.5 $\AA$ 이상인 수소결합의 경우는 저온에서 측정한 중성자 회절에 의한 수소결합 데이터를 이용하여 얻은 최적화 곡선 식 d(O-H)=exp((2.173-d(O…O))/0.138)+0.958을 이용하여 수소결합 거리를 보정한다. O…O 거리가 2.5 $\AA$ 이하의 짧은 수소결합의 경우는 결합원자가 최적화 방법(valence-least-squares)을 이용하는 것이 효과적이다. X-선 회절분석으로 얻은 긴 O…O 거리를 갖는 분자간 수소결합의 경우는 수소결합의 거리보정을 해주어야 한다.

채널 결합 기반 상향스트림 스케줄링 알고리즘 설계와 성능평가 (Performance Evaluation and Design of Upstream Scheduling Algorithms To Support Channel Bonding)

  • 노선식
    • 대한전자공학회논문지TC
    • /
    • 제46권5호
    • /
    • pp.8-18
    • /
    • 2009
  • 광대역가입자망으로 DOCSIS 기반 HFC 망을 고도화하기 위해 채널 결합 기법을 핵심기술로 하는 DOCSIS 3.0 표준안이 제시되었다. 본 논문에서는 DOCSIS 망에서 채널 결합 기법을 효율적으로 구현하기 위해 결합그룹 스케줄링과 채널 스케줄링으로 구성된 상향스트림 스케줄러를 설계하였다. 채널 결합 기능을 제공하는 CM들의 요구 대역을 결합 채널에 할당하기 위해 균등요구대역 할당알고리즘, 현재 할당된 요구대역 기반 요구대역 할당알고리즘, 그리고 이전 대역 할당 기반 요구대역 할당알고리즘 등 세 가지 결합그룹 스케줄링 알고리즘을 설계하여 제안하였다. OPNET을 이용하여 DOCSIS 3.0 MAC 시뮬레이션 모델을 구현하고, 제안한 알고리즘들을 적용하여 성능평가를 수행하였다. 성능평가를 통해 채널 결합 기법이 정상적으로 수행됨을 검증하였고, 스케줄링 알고리즘에 대한 비교평가결과 균등요구대역 할당알고리즘이 전송 지연과 데이터 전송량에 있어서 우수한 성능을 나타내었다. 또한 DOCSIS MAC 프로토콜에 대한 성능평가를 수행하였으며, DOCSIS 3.0 프로토콜이 DOCSIS 3.0 이전 프로토콜보다 대용량 데이터를 전송할 수 있음을 확인하였다.

생산공장에 있어서의 마이크로컴퓨터의 응용(5)-산업용 데이터 전송 시스템의 응용-

  • 대한전기협회
    • 전기저널
    • /
    • 4호통권88호
    • /
    • pp.94-102
    • /
    • 1984
  • 계층형분산제어시스템을 널리 채용하게되어 지역적, 계층적으로 분산하는 컴퓨터, 콘트로울러, 단말장치, 입출력I/O등의 효율적, 경제적인 결합장치가 필요하게 되었다. 산업용 데이터 전송 시스템은 이와같은 니이즈에 대응 하는 것이다. 이하에서 각종전송 시스템에 대해 기술한다.

  • PDF

비정형 데이터를 활용한 가뭄평가 - 보령지역을 중심으로 - (Drought evaluation using unstructured data: a case study for Boryeong area)

  • 정진홍;박동혁;안재현
    • 한국수자원학회논문집
    • /
    • 제53권12호
    • /
    • pp.1203-1210
    • /
    • 2020
  • 가뭄은 다양한 수문학적 또는 기상학적 인자들이 복합적으로 작용하여 발생하기 때문에 가뭄의 사상을 정확히 평가하는 것은 어려운 일이나, 이를 정량적으로 해석하기 위해 다양한 가뭄지수들이 개발되어 왔다. 하지만 현재 활용중인 가뭄지수들은 단일변량의 부족량을 통해 산정되며, 복합적인 원인으로 발생하는 가뭄의 사상을 정확히 판단하지 못하는 문제가 있다. 단순 단일변량의 부족을 가뭄이라고 판단하기는 어렵기 때문이다. 최근에는 빅데이터 분석에서 많이 활용되고 있는 비정형 데이터를 활용하여 지수를 개발하는 연구들이 타 분야에서 진행되고 있으며 우수성이 입증되고 있다. 따라서 본 연구에서는 기존 가뭄지수에 활용 중인 기상 및 수문정보(강수량, 댐 유입량)에 각각 비정형 데이터(뉴스데이터)를 결합하여 가뭄지수를 산정하고, 산정된 가뭄지수의 검증을 통해 가뭄해석의 활용성을 평가하고자 한다. 결합가뭄지수 산정을 위해 Clayton Copula 함수를 활용하였으며, 매개변수 추정은 교정방법을 이용하였다. 분석결과, 기존의 가뭄지수(SPI, SDI)보다 비정형 데이터를 결합한 가뭄지수가 가뭄기간을 적절히 재현하는 것으로 나타났다. 또한 Receiver Operating Characteristic (ROC) score가 기존의 가뭄지수들보다 높게 산정되어 가뭄해석에 있어 활용성이 우수하였다. 본 연구에서 산정된 결합가뭄지수는 기존 단일변량 가뭄지수의 해석적 한계를 보완하고 비정형데이터를 활용한 가뭄지수의 활용성이 우수하다는 점에서 활용성이 높다고 판단된다.

금융 마이데이터의 전략적 활용에 관한 사례 연구 (A study on strategic use of MyData: Focused in Financial Services)

  • 이주희
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.181-189
    • /
    • 2022
  • 모바일 기기의 확산과 ICT 기술로 핀테크 혁신이 더욱 가속화 될 것으로 전망되는 가운데, 최근 금융의 화두는 '디지털 전환'이며, 여기에는 빅데이터의 활용이 주요 요소라 할 수 있다. 특히 오픈 뱅킹이라는 인프라가 마이데이터와 마이페이먼트 산업과 연계되어 금융정보의 이종결합, 자산 조회 및 이체 기능이 결합되는 오픈 파이낸스 시대가 도래고 있다. 마이데이터는 데이터 활용을 통한 가치 창출에 주목하여 나타난 개념으로, 데이터의 주체가 능동적인 자기결정권을 갖는데 의의가 있는데 현재 국내에서도 마이데이터가 시행 되며 전략적 활용방안을 모색되고 있다. 이에 본 연구는 마이데이터 관련 비즈니스 사례를 분석하여 향후 금융의 디지털 전환을 위한 전략적 활용방안을 제시하는 것을 목적으로 하였다. 해외 주요국가에서 마이데이터 개념을 적용한 PSD2 및 오픈뱅킹 정책을 적극 추진하고 있는 가운데 성공적인 비즈니스 모델(Mint, Information Bank, Strands)의 분석을 통해 데이터 기반 비즈니스의 타당성을 확인하고 공통점을 모색하기 위한 사례 연구를 수행하였다. 거래의 효율성과 다양성을 향상시키는 사업 모델을 제공한다는 관점에서 마이데이터는 기존의 사업 모델을 개선할 수 있는 잠재력이 있음을 확인할 수 있었다. 마이데이터는 본인 중심의 모든 데이터로부터 개별적인 데이터 생태계를 쉽게 구현하고 관리할 수 있어야 하는데 개인이 스스로 이를 관리, 통제, 활용하는 것은 현실적으로 어렵다. 따라서 마이데이터 오퍼레이터 또는 마이데이터 서비스 제공자 역할을 할 수 있는 비즈니스 모델이 적극적으로 모색될 필요가 있겠다.

집합 결합과 신경망을 이용한 복합질환의 예측 (A Prediction Model for Complex Diseases using Set Association & Artificial Neural Network)

  • 최현주;김승현;위규범
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.323-330
    • /
    • 2008
  • 복합질환은 다수의 유전자들이 상호작용하여 유발되는 질병으로서, 여러 유전자들이 관여한다는 복잡성 때문에 전통적인 분석 방법을 적용하는데 한계가 있다. 최근에는 기계학습 기법을 이용한 새로운 분석 방법들이 제안되고 있다. 신경망은 이처럼 복잡한 데이터에서 일정한 패턴을 찾아 이를 분류하는데 적합한 모델이다. 그러나 다량의 데이터가 입력으로 들어오는 경우에 학습에 오랜 시간이 걸리고 패턴을 찾기가 어려워지는 단점이 있다. 본 연구에서는 다량의 SNP 데이터로부터 질병에 연관된 소수의 중요 SNP을 찾기 위한 통계학적인 방법인 집합결합(set association)과 신경망을 결합한 모델을 제시한다. 이 모델을 천식 관련 SNP 데이터에 적용하여 천식 발병 여부를 예측한 결과, 신경망만 사용했을 때보다 실행 시간도 빠르고 예측 정확도도 높았다. 이 모델은 다른 복합질환의 예측에도 효과적으로 사용할 수 있을 것으로 기대한다.