• 제목/요약/키워드: 데이터 분석론

검색결과 1,383건 처리시간 0.022초

통합 수리계획법을 이용한 개인신용평가모형 (Consumer Credit Scoring Model with Two-Stage Mathematical Programming)

  • 이성욱;노태협
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제16권1호
    • /
    • pp.1-21
    • /
    • 2007
  • 신용평점을 위한 부도예측의 분류 문제를 다루는데 있어서 통계적 판별분석 및 인공신경망 및 유전자알고리즘 등을 이용한 데이터 마이닝의 방법들이 일반적으로 고려되어왔다. 이 연구에서는 수리계획법을 응용하여 classification gap을 고려한 이단계 수리계획 접근방법을 신용평가에 적용하는 방법론을 제안하여 수리계획법을 통한 신용평가모형 구축의 가능성을 제시한다. 1단계에서는 선형계획법을 이용해서 대출 신청자에게 대출을 허가할 것 인지의 여부를 결정하게 되는 대출 심사 filtering으로의 적용단계이고, 2단계에서는 정수계획법을 이용하여 오분류 비용이 최소가 되도록 하는 판별점수를 찾는 과정으로 모형을 구성한다. 개인 대출 신청자의 데이터(German Credit Data)에 대하여 피셔의 선형 판별함수, 로지스틱 회귀모형 및 기존의 수리계획 기법들과의 비교를 통해서 제안된 모델의 성능을 평가한다. 이단계 수리계획 접근법의 평가 결과를 통하여 신용평가모형에의 적용가능성을 기존 통계적인 접근방법 및 수리계획 접근법과 비교하여 제시하고 있다.

  • PDF

체계적인 하천정보서비스 방안 (Method of systematic river information service)

  • 황의호;채효석;고덕구
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.217-224
    • /
    • 2005
  • 하천정보의 관리기관이 다양하고 정보의 표현 및 분석단위가 관리주체에 따라 다르며, 하천정보의 체계적이고 종합적인 정책자료 분석 제공 기능의 부재로 인한 이수 및 치수, 하천 환경 등을 고려한 국가수자원종합계획의 수립을 어렵게 해왔다. 하천 및 유역정보의 관리단위를 일원화하여 국가적으로 표준화시키고, 유역정보, 수문정보 등에 대해서 국가 수자원 정보망의 형성을 통해서 하천정보의 유기적인 공동이용을 추구해야 한다. 또한, 정보시스템 구축에 있어서 시스템간 중복을 방지하고 상호 연계가 원활히 이루어져 대정부, 대국민에 대한 종합적인 정보 제공이 가능하도록 추진을 할 필요가 있다. 본 연구에서는 하천정보 신뢰성 높고 다양한 하천정보 DB 구축을 통하여 보다 편리하고 유용한 시스템 사용 환경을 제공 및 지원하기 위한 방안을 제시하고자 하였다. 이를 위해 국내외 하천정보서비스 구축사례를 분석하고 국내 실정에 맞는 하천정보서비스의 구축방안을 제시하였으며, 이를 위해서는 지속적인 중장기종합정보화전략계획 수립과 국내에 적합한 필수 데이터 항목도출, 데이터모델과 구축방법론 표준화로 체계적인 유지관리가 가능하도록 하여야 할 것이다. 또한 하천공간정보의 유통체계는 기존의 국가공간정보 유통 기구를 이용하는 것이 합리적인 것으로 사료된다.

  • PDF

신용카드 고객의 신용 예측을 위한 지식기반 방법들: 적용 및 비교 연구 (Knowledge-Based methodologies for the Credit Rating : Application and Comparison)

  • 주석진;김재경;성태경;김중한
    • 지능정보연구
    • /
    • 제5권1호
    • /
    • pp.49-64
    • /
    • 1999
  • 본 연구는 백화점 고객이 신용 카드 신청 요구 시에 작성되는 가입 정보 및 사용되고 있는 고객의 거래 정보는 카드 사용 패턴으로 신용도를 예측하는 여러 방법론을 제시하고 성능을 비교하였다. 가입 정보를 분석하기 위해 역전파 신경망(Back-Propagation Neural Network, BPNN), 사례기반추론(Case-Based reasoning)을, 거래 정보를 분석하기 위해 역전파 신경망과 더불어 시간지연 신경망(Time-Delayed Neural Network, TDNN)을 각각 사용하여 그 결과를 비교하였다. 또한 전체시스템의 적중률을 높이기 위햐여, ID3와 신경망을 이용한 Meta-Leaning 방법을 제시하였으며, Meta-Learning 방법과 다른 방법들을 비교, 분석을 하였다. 본 연구에서는 모형 수립과 검증을 위하여 T백화점의 실제 신용 카드 가입 고객 데이터를 이용하여 실험하였다. 데이터의 성격에 따라 각 모델의 예측력에는 차이가 나타났으나, 신경망 모형의 예측력이 우수하였으며, 시간적 특성을 고려하는 시간지연 신경회로망 모형의 예측력은 더욱 우수하게 나타났다. 또한 Meta-Learning 모형을 사용하면 예측력이 더 높아진다는 것을 확인할 수 있었다.

  • PDF

Knowledge Extraction from Academic Journals Using Data Mining Techniques

  • 남수현;김홍기
    • 디지털융복합연구
    • /
    • 제3권1호
    • /
    • pp.75-88
    • /
    • 2005
  • 최근 우리는 인접학문 간 그리고 학계와 산업계간의 연구협조가 점차 증가하고 있음을 보아오고 있다. 이러한 현상은 특히 학술저널 간 지식의존성을 촉진하는 계기를 제공하고 있다고 할 수 있다. 본 논문의 목적은 관련저널 간 지식상호 의존성을 규명하고 저널지식의 구조화를 위하여 연관성 (association), 군집화, 링크분석 등 데이터마이닝 기법을 적용하는 방법론을 제시하는 것이다. 제시된 방법을 통하여 기대되는 점들은 1) 논문의 기본 속성인 키워드, 저자, 그리고 인용데이터를 통합하는 규칙 집합을 통하여 논문지식검색기능의 향상, 2) 키워드를 기반으로 관련 저널 간 그리고 저널내부의 군집분석으로 지식동향 파악, 3) Kleinberg (1999)의 권위와 허브 개념을 인용데이터 분석에 활용하여 기존의 양적 평가 기준인 영향력지수 (impact factor)의 문제점을 보완하며, 4) 특정 논문이나 저널의 지식파급과 관련한 영향력을 산출하는 잠재적 지식파급 지수를 제안하는 것이다.

  • PDF

협력형 차량 안전 시스템의 잠재적 안전 효과 분석 연구 (Potential Safety Benefit Analysis of Cooperative Driver Assistance Systems Via Vehicle-to-vehicle Communications)

  • 강지웅;송봉섭
    • 한국ITS학회 논문지
    • /
    • 제17권2호
    • /
    • pp.128-141
    • /
    • 2018
  • 본 논문에서는 대표적인 6대 협력형 차량 안전 시스템 대한 잠재적인 사회적 안전효과를 분석하는 방법론을 제시하고자 한다. 협력형 차량 안전시스템의 도입 및 확산을 위해서는 사회적으로 어떠한 파급효과를 가져올지에 대하여 안전 시스템 별 정량적 분석이 필요하다. 국내에서 사고유형 기반으로 분석이 이루어진 사례들이 있으나, 사고 시나리오를 기반으로 한 분석방법론을 찾아보기 어렵다. 이러한 방법론을 제시하기 위해서 우선 승용차나 승합차만을 대상으로 한 국내 사망교통사고 데이터를 기반으로 사고 시나리오를 분류한다. 다음으로 사고 시나리오를 분석하여 협력형 차량 안전 시스템에 적용 가능한 시나리오를 선정하고 결과적으로 사망 사고 빈도수를 통해 안전 시스템의 잠재적인 사회적 안전효과를 정량적으로 제시한다. 마지막으로 안전효과의 정량적 분석을 이용하여 협력형 차량 안전 시스템의 인증을 위한 대표 평가 시나리오를 제시한다.

생물학 문헌 데이터의 제목과 본문을 이용한 질병 관련 유전자 추론 방법 (Inferring Disease-related Genes using Title and Body in Biomedical Text)

  • 김정우;김현진;여윤구;신민철;박상현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권1호
    • /
    • pp.28-36
    • /
    • 2017
  • 1990년대 게놈프로젝트 이후 유전자와 관련된 많은 연구가 진행되고 있다. 데이터 저장 기술의 발달로 연구의 결과물들은 다량의 문헌들로 기록되고 있으며, 이러한 문헌들은 새로운 생물학적 관계들을 추론하는 데이터로 유용하게 사용되고 있다. 이러한 이유로 본 연구에서는 생물학 문헌들을 활용하여 질병과 관련한 유전자를 추론하는 방법론에 대해서 제안한다. 문헌들을 제목과 본문으로 구분하고, 각 영역에서 등장한 유전자들을 추출한다. 제목 영역에서 추출된 유전자는 중심 유전자로 구분하고, 본문 영역에서 추출된 유전자는 제목에서 추출된 유전자와 관계를 갖는 주변 유전자로 구분한다. 이러한 과정을 각 문헌에 적용하여, 지역 유전자 네트워크를 구축한다. 구축된 지역 유전자 네트워크는 모두 연결하여 전역유전자 네트워크를 구축한다. 구축한 네트워크를 분석하여 질병 관련 유전자를 추론하였으며, 비교 실험을 통해 제안하는 방법론이 질병 관련 유전자를 추론하는 유용한 방법론임을 입증하였다.

연구자의 논문 게재 이력을 고려한 저널 결정 요인별 중요도 학습 기반의 저널 추천 방법론 (Development of Journal Recommendation Method Considering Importance of Decision Factors Based on Researchers' Paper Publication History)

  • 손연빈;장태우;최예림
    • 인터넷정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.73-79
    • /
    • 2019
  • 연구자는 논문을 투고할 저널을 선택하는 과정에서 저널의 수가 방대하다는 점, 고려할 저널 결정 요인이 다양하다는 점에서 어려움을 겪는다. 이러한 어려움을 해소하기 위해 IRA(intelligent research assistant)의 한 종류로 연구자별로 논문 투고에 적합한 저널을 추천해주는 저널 추천 서비스를 활용할 수 있다. 하지만 현재 운영 중인 저널 추천 서비스의 경우 주제 유사도 및 수치적 필터링을 기반으로 저널 추천을 실행하고 있으며, 이 경우 연구자가 논문 데이터를 입력하지 않으면 주제 유사도를 고려할 수 없고, 수치적 필터링 기능도 연구자 스스로 결정 요인별 수치 범위를 명확하게 정하기에 어려움이 있다는 한계점이 존재한다. 따라서 본 논문에서는 연구자의 논문 게재 이력을 이용해 선호도 행렬을 형성하고, 이를 기반으로 저널 별 선호 점수를 고려한 저널 추천 방법론을 제안한다. 연구자는 다수의 저널 결정 요인에 대해 상이한 중요도를 가지고 있는데, 결정 요인 별 선호 민감도를 계산해 중요도를 학습한 뒤 이를 기반으로 모든 저널에 대한 선호 점수를 도출하여 저널을 추천한다는 점에서 의의가 있다. 실제 데이터를 이용하여 저널 추천실험을 수행했으며 제안 방법론의 우수한 성능을 확인하였다.

정형 비정형 빅데이터의 융합분석을 위한 소비 트랜드 플랫폼 개발 (Consumer Trend Platform Development for Combination Analysis of Structured and Unstructured Big Data)

  • 김성현;장석호;이상원
    • 디지털융복합연구
    • /
    • 제15권6호
    • /
    • pp.133-143
    • /
    • 2017
  • 데이터는 금융업에서 가장 중요한 자산으로 평균 71%의 금융기관이 데이터 분석으로 경쟁우위를 창출하고 있다. 특히, 금융업 중 카드 업종에서는 전체 고객의 소비행위 패턴 및 선호 트랜드 분석에 의한 가맹점 정보, 경기 변동 상황, 상권정보 제공 서비스 개발에 빅데이터가 폭 넓게 활용되고 있지만 데이터의 융복합을 통한 새로운 가치 창출은 미흡한 편이다. 본 연구는 소셜 데이터와 BC 카드 매출데이터의 융합 분석한 신용카드 회사의 '소비 트랜드 분석 및 예측' 사례를 다룬다. BC카드는 소셜 데이터를 활용한 트랜드 프로파일링 작업과 카드 및 소셜 데이터를 연계하는 알고리즘 개발 및 분석 내용 시각화 시스템을 개발하였다. 성과 검증을 위해 '식스포켓' 관련 트랜드를 분석하고 마케팅을 시행해 본 결과 40~100%이상의 마케팅 승수 증대 효과를 거두었다. 본 연구는 그동안 개별적으로 이루어져 오던 정형, 비정형데이터 분석을 융합하여 분석하는 방법론과 사례를 창출한 의의가 있으며 이는 앞으로 카드 업종 뿐만 아니라 타 업종에도 변화하는 트랜드에 유용하게 대응할 수 있는 시사점을 제공할 것이다.

공급체인관리에서의 지능형 생산체제 설계 (Design of Intelligent Production System in the Supply Chain Management)

  • 이장희
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 추계 학술대회
    • /
    • pp.151-154
    • /
    • 2006
  • 본 연구는 공급사슬관리하에서 부품 및 원재료 공급기업에서 고객기업인 제조기업의 주문 사항과 공급기업내 생산관련 제약사항을 동시에 고려하여 최적의 생산 체제를 구축할 수 있는 방법론을 제시한다. 본 연구에서는 수주 및 비용 데이터베이스로부터 주문 및 생산관련 데이터를 SOM 신경망분석을 통해 그룹핑하고 고객기업군별로 특성분석을 통해 이에 맞는 생산체제를 구축할 것을 제안하였다. 공급사슬관리 환경하에서 원재료/부품 공급기업이 고객기업의 주문 요구와 내부 생산상의 제약을 동시에 고려함으로써 SCM 적용 성과를 극대화할 수 있다는 점에서 본 연구는 의미가 있다.

  • PDF

오토인코더 기반 심층 지도 네트워크를 활용한 계층형 데이터 분류 방법론 (Methodology for Classifying Hierarchical Data Using Autoencoder-based Deeply Supervised Network)

  • 김윤하;김남규
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.185-207
    • /
    • 2022
  • 최근 딥 러닝 기술의 발전으로 인해, 텍스트, 이미지 등 비정형 데이터 분석에 딥 러닝 알고리즘을 적용하는 연구가 활발히 수행되고 있다. 그중 텍스트 분류는 학계 및 업계에서 오랜 기간 연구되어 온 분야로, 분류의 성능을 향상시키기 위해 계층형 레이블 등 데이터 자체의 특성을 활용하기 위한 다양한 시도가 이루어지고 있다. 하지만 계층적 분류를 위해 주로 사용되는 하향식 접근법은 상위 레벨의 오분류가 하위 레벨의 정분류 기회를 차단한다는 한계가 있다. 따라서, 본 연구에서는 레이블의 계층적인 관계를 고려하면서도 상위 레벨의 분류가 하위 레벨의 분류를 차단하지 않도록 하여 분류 성능을 향상시키기 위해, 오토인코더 기반 심층 지도 네트워크를 활용한 계층형 데이터 분류 방법론을 제안한다. 제안 방법론은 오토인코더의 잠재변수에 하위 레이블을 예측하는 주 분류기를 추가하고, 인코더의 은닉층에 상위 레벨의 레이블 예측하는 보조 분류기를 추가하여 End-to-End 학습을 진행한다. 제안 방법론의 성능을 평가하기 위하여 국내 논문 데이터 총 22,512건에 대한 실험을 수행한 결과, 제안 모델이 기존의 지도 오토인코더 및 DNN 모델에 비해 분류 정확도와 F1-Score에서 우수한 성능을 나타냄을 확인하였다.