• 제목/요약/키워드: statistical process

검색결과 3,302건 처리시간 0.034초

데이터마이닝을 이용한 허위거래 예측 모형: 농산물 도매시장 사례 (Detection of Phantom Transaction using Data Mining: The Case of Agricultural Product Wholesale Market)

  • 이선아;장남식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.161-177
    • /
    • 2015
  • 정보기술의 빠른 진화, 빅데이터의 등장, 분석기법의 고도화 등으로 인해 다량의 데이터로부터 의미있는 정보를 추출하는 데이터마이닝을 다양한 영역에 활용하고자 하는 시도들이 활발히 진행되고 있다. 그 중의 한 분야가 농산물 유통영역인데, 농산물에 대한 지속적인 수요 증가와 전자경매의 활성화 등으로 수도권 농산물 도매시장에서만도 연간 수천만건 이상의 거래가 이루어 진다. 그러나 급속한 거래량 증가와 더불어 과거로부터 관행적으로 이루어지고 있는 부정거래도 함께 증가하고 있는데 거래참가자들 사이의 결탁에 의해 발생하는 농산물 도매시장의 부정거래는 점차 지능화되는 추세이며, 이들을 감지하고 적발하기가 매우 어려운 실정이다. 이로 인해 농산물 유통환경의 공정거래 질서는 침해되고 시장에 대한 신뢰는 훼손되곤 한다. 따라서 거래투명성을 제고하고 유통비리를 구조적으로 개선하기 위한 과학적이고 자동화된 부정탐지시스템의 필요성이 어느 때보다도 절실히 요구되는 상황이다. 본 연구에서는 데이터마이닝의 의사결정나무를 이용하여 실제 발생하지 않은 거래를 실물 없이 거래한 것처럼 조작하여 대금을 정산하는 행위인 허위거래를 탐지하는 모형을 제시하였다. 이를 위해 실제 농산물 도매시장의 데이터를 수집하였고, 데이터의 정제 및 표준화 등의 선행작업을 수행하였다. 또한 변수 간의 상관관계 및 분포도 분석 등을 통해 데이터의 특성을 파악한 후 예측모형을 구축하여 허위거래와 정상거래를 분류하는 패턴을 도출하였으며, 최종적으로 시험용 데이터를 이용하여 모형을 평가하는 단계를 거쳐 결과의 적합성을 확인하였다. 향후 데이터마이닝을 이용한 부정탐지 모형을 허위거래뿐만 아니라 낙찰부정, 경매조작 등과 같이 다양화되는 부정거래에 적용하게 되면 보다 지대한 효과를 거둘 수 있으리라 사료된다.

디지털 산림자원정보 구축을 위한 최적의 지상LiDAR 스캔 경로 분석 (Analysis of Optimal Pathways for Terrestrial LiDAR Scanning for the Establishment of Digital Inventory of Forest Resources)

  • 고치웅;임종수;김동근;강진택
    • 대한원격탐사학회지
    • /
    • 제37권2호
    • /
    • pp.245-256
    • /
    • 2021
  • 본 연구는 LiDAR 센서의 산림자원조사 적용성 검토를 위하여 제주 절물자연휴양림을 대상으로 삼나무의 개체목 탐지, 흉고직경과 수고를 측정하여 전통적인 산림자원조사와 정확성과 효율성을 비교·분석하였다. 백팩형 지상라이다(Backpack Personal Laser Scanning; BPLS)는 Greenvalley International 사(社)의 Model D50을 사용하였다. 최적의 데이터 수집을 위하여 표준지의 밀도와 작업 효율성을 고려한 LiDAR스캔의 표본추출방법을 7가지로 구분하였다. 분석은 개체목 변수 측정의 정확성을 파악하고 요소작업별 시간과 전체 분석시간을 조사하여 효율성을 평가하였다. 분석 결과, 백팩형 지상라이다를 이용한 입목 탐지율은 모든 패턴이 100%로 나타났다. 정확성은 패턴5(흉고직경: RMSE: 1.07 cm, Bias: -0.79 cm, 수고: RMSE: 0.95 m, Bias: -3.2 m)와 패턴7(흉고직경: RMSE: 1.18 cm, Bias: -0.82 cm, 수고: RMSE 1.13 m, Bias: -2.62 m)이 현장조사 방법으로 얻은 결과와 비교하였을 때 통계적 정확성이 높은 결과를 보였다. BPLS와 현장조사를 이용하여 1 ha의 데이터를 처리하는데 걸린 시간을 환산한 결과 BPLS는 약 115분~135분이 소요되며, 현장조사방법은 375분~1,115분으로 BPLS를 이용한 방법이 더 효율적인 것으로 나타났다. 따라서 하층식생이 적고 비교적 관리가 잘 된 인공 침엽수림에서는 BPLS 장비를 활용하여 효율적인 산림자원조사가 가능하며, 앞으로 다양한 임분 조건에서 적용 가능성을 분석할 필요가 있다고 판단된다.

대학도서관 이용자의 공동체의식이 이용자 만족도 및 충성도에 미치는 영향 연구 (A Study on the Effect of University Library User's Sense of Community on User Satisfaction and Loyalty)

  • 노효진;장우권
    • 정보관리학회지
    • /
    • 제36권1호
    • /
    • pp.137-168
    • /
    • 2019
  • 이 연구의 목적은 대학도서관 이용자의 공동체의식과 대학도서관 서비스품질 평가, 이용자만족도 및 충성도를 측정 및 분석하여 대학도서관 이용자의 공동체의식이 이용자만족도 및 충성도에 미치는 영향 관계를 규명하고자 한다. 이를 위해 연구모형과 연구가설을 설정하였다. 가설 검증을 위하여 J대학교 중앙도서관을 이용한 경험이 있는 학생들을 대상으로 최종 282부의 유효표본을 분석에 사용하였다. 측정변수들의 평균값을 기술통계량으로 분석하였으며, 가설 검증을 위해 Hayes의 PROCESS macro프로그램 모형 4번과 6번을 사용하여 매개효과분석을 실시하였다. 이 연구의 결과, 1) 대학도서관 이용자의 공동체의식은 대학도서관 서비스 품질평가에 따라 이용자만족도에 유의한 영향을 미치는 것으로 나타났다. 대학도서관 이용자의 공동체의식을 구성하는 요소인 서비스 혜택 지각 및 충족감, 상호영향의식이 통계적 유의수준 하에서 서비스 품질평가에 정(+)의 영향을 미치며, 이를 매개로 이용자만족도에 정(+)의 영향을 미치는 것으로 나타나, 대학도서관 이용자의 공동체의식이 높을수록 서비스 품질평가가 높으며, 이를 통해 이용자만족도가 높아진다는 것을 알 수 있었다. 2) 대학도서관 이용자의 공동체의식은 대학도서관 서비스 품질평가와 이용자만족도에 따라 이용자충성도에 유의한 영향을 미치는 것으로 나타났다. 대학도서관 이용자의 공동체의식을 구성하는 요소인 서비스 혜택 지각 및 충족감, 상호영향의식이 서비스 품질평가를 매개로 이용자만족도에 통계적으로 유의한 영향을 미치고(가설1), 이용자만족도를 매개로 통계적 유의수준 하에서 이용자충성도에 정(+)의 영향을 미치는 것으로 나타났다. 따라서, 대학도서관 이용자의 공동체의식이 높을수록 서비스 품질평가가 높고, 이용자만족도가 높아지며, 이를 통해 이용자충성도가 높아진다는 것을 확인할 수 있었다.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

중소기업 ESG 경영 도입의도에 영향을 미치는 요인 : 태도의 매개효과 및 종업원 혁신저항성의 조절효과 (A Study on Factors Affecting ESG Management Intentions of Small and Medium Enterprises : Focusing on the Mediating Effect of Attitude and the Moderating Effect of Employees' Innovation Resistance)

  • 이윤효;박경희;정병규
    • 벤처혁신연구
    • /
    • 제6권2호
    • /
    • pp.41-65
    • /
    • 2023
  • 본 연구는 최근 화두가 되고 있는 중소기업의 ESG(환경·사회·지배구조) 경영 도입 의도에 영향을 미치는 요인을 실증적으로 분석하기 위해 수행되었다. 이를 위해 독립변수로 ESG의 유용성과 용이성을 일차적으로 도출하였다. 또한 중소기업에서 의사결정은 CEO의 결정이 매우 절대적이고 필수적이므로 CEO 의지를 도출하였다. 그리고, ESG 경영의 제도적 요인으로 ESG 경영에 관한 고객사의 요구, 정부 지원, 신용평가 반영 등이 중요한 결정 요인으로 판단되어 이를 독립변수로 채택하였다. 이러한 영향 관계에서 태도의 매개효과와 종업원 혁신 저항성의 조절효과도 동시에 분석 하였다. 이를 위해 유효한 368개의 표본을 SPSS 24.0을 활용하여 분석하였다. 매개효과와 조절 효과는 Process Macro 4.0을 사용하여 분석하였다. 실증분석 결과는 다음과 같다. ESG 도입의 유용성과 용이성, CEO 의지, 고객사 요구, 정부지원, 신용평가 반영 모두 ESG 경영 도입의도에 유의한 정(+)의 영향을 미쳤다. 특히 CEO의 의지가 가장 큰 영향을 미치는 것으로 나타났다. 또한 ESG 경영 도입에 미치는 영향 요인과 도입의도와의 관계에서 태도가 매개역할을 하는 것으로 확인되었고, 종업원 혁신저항성의 조절 효과도 있는 것으로 나타났다. 본 연구의 학술적 시사점은 중소기업 ESG와 관련해서 선행연구가 부족한 상황 속에서 ESG 경영 도입 관련 각각의 영향 변수를 도출하고 실증적으로 검정했다는 것이다. 또한 이러한 요인들이 도입의도에 미치는 영향력의 우선순위를 밝혀 ESG 경영 도입 촉진을 방안을 도출했다는 점이다. 실무적 시사점으로는 중소기업의 성공적인 ESG 도입을 위해서는 무엇보다 CEO의 인식개선과 정부지원, 대기업과의 상생 관계가 중요하다는 점이다. 원활한 ESG 경영 도입을 위하여 조직 구성원들과 충분한 소통을 통하여 필요성을 인식하게 함으로써 저항감을 낮출 방안을 모색해야 할 필요도 있었다.

캠페인 효과 제고를 위한 자기 최적화 변수 선택 알고리즘 (Self-optimizing feature selection algorithm for enhancing campaign effectiveness)

  • 서정수;안현철
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.173-198
    • /
    • 2020
  • 최근 온라인의 비약적인 활성화로 캠페인 채널들이 다양하게 확대되면서 과거와는 비교할 수 없을 수준의 다양한 유형들의 캠페인들이 기업에서 수행되고 있다. 하지만, 고객의 입장에서는 중복 노출로 인한 캠페인에 대한 피로감이 커지면서 스팸으로 인식하는 경향이 있고, 기업입장에서도 캠페인에 투자하는 비용은 점점 더 늘어났지만 실제 캠페인 성공률은 오히려 더 낮아지고 있는 등 캠페인 자체의 효용성이 낮아지고 있다는 문제점이 있어 실무적으로 캠페인의 효과를 높이고자 하는 다양한 연구들이 지속되고 있다. 특히 최근에는 기계학습을 이용하여 캠페인의 반응과 관련된 다양한 예측을 해보려는 시도들이 진행되고 있는데, 이 때 캠페인 데이터의 다양한 특징들로 인해 적절한 특징을 선별하는 것은 매우 중요하다. 전통적인 특징 선택 기법으로 탐욕 알고리즘(Greedy Algorithm) 중 SFS(Sequential Forward Selection), SBS(Sequential Backward Selection), SFFS(Sequential Floating Forward Selection) 등이 많이 사용되었지만 최적 특징만을 학습하는 모델을 생성하기 때문에 과적합의 위험이 크고, 특징이 많은 경우 분류 예측 성능 하락 및 학습시간이 많이 소요된다는 한계점이 있다. 이에 본 연구에서는 기존의 캠페인에서의 효과성 제고를 위해 개선된 방식의 특징 선택 알고리즘을 제안한다. 본 연구의 목적은 캠페인 시스템에서 처리해야 하는 데이터의 통계학적 특성을 이용하여 기계 학습 모델 성능 향상의 기반이 되는 특징 부분 집합을 탐색하는 과정에서 기존의 SFFS의 순차방식을 개선하는 것이다. 구체적으로 특징들의 데이터 변형을 통해 성능에 영향을 많이 끼치는 특징들을 먼저 도출하고 부정적인 영향을 미치는 특징들은 제거를 한 후 순차방식을 적용하여 탐색 성능에 대한 효율을 높이고 일반화된 예측이 가능하도록 개선된 알고리즘을 적용하였다. 실제 캠페인 데이터를 이용해 성능을 검증한 결과, 전통적인 탐욕알고리즘은 물론 유전자알고리즘(GA, Genetic Algorithm), RFE(Recursive Feature Elimination) 같은 기존 모형들 보다 제안된 모형이 보다 우수한 탐색 성능과 예측 성능을 보임을 확인할 수 있었다. 또한 제안 특징 선택 알고리즘은 도출된 특징들의 중요도를 제공하여 예측 결과의 분석 및 해석에도 도움을 줄 수 있다. 이를 통해 캠페인 유형별로 중요 특징에 대한 분석과 이해가 가능할 것으로 기대된다.

고객만족이 기업의 신용평가에 미치는 영향 (The Effect of Customer Satisfaction on Corporate Credit Ratings)

  • 전인수;전명훈;유정수
    • Asia Marketing Journal
    • /
    • 제14권1호
    • /
    • pp.1-24
    • /
    • 2012
  • 본 연구는 고객만족과 기업가치 성과간의 관계를 분석하는 것이 목적이다. 기업가치성과는 주가와 신용등급으로 나눌 수 있는데, 전자는 기업의 시장가치이고 후자는 자금조달비용이라 구분하여 사용되고 있다. 고객만족과 주가와의 관계는 비교적 오래전부터 연구되어 왔으나 신용등급과의 관계는 최근 들어 연구되기 시작하였다. 대표적으로 Anderson and Mansi(2009)의 연구에서는 양자가 긍정적으로 관련된 것으로 밝혀졌으나, 윤상운(2010)이 국내자료를 사용한 연구에서는 그 관계가 입증되지 못하였다. 일치하지 않는 두 연구의 결과에서 아이디어를 얻어 본 연구에서는 고객만족이 신용등급에 긍정적 영향을 미치는 것으로 보고 이를 검증하였다. 두 연구에서 사용한 모델을 참고로 하였고 특히 우리나라 실정에서는 정부지원이 중요한 변수임을 감안하여 이를 포함한 연구모형을 설정하여 검증한 결과 긍정적 관련성이 있는 것으로 나타났다. 추가분석에서 자산규모가 큰 기업보다 작은 기업에서, 제조업보다 서비스업에서 고객만족이 신용등급에 더 유의한 긍정적 영향을 미치는 것으로 나타났다.

  • PDF

Support Vector Regression을 이용한 GARCH 모형의 추정과 투자전략의 성과분석 (Estimation of GARCH Models and Performance Analysis of Volatility Trading System using Support Vector Regression)

  • 김선웅;최흥식
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.107-122
    • /
    • 2017
  • 주식시장의 주가 수익률에 나타나는 변동성은 투자 위험의 척도로서 재무관리의 이론적 모형에서뿐만 아니라 포트폴리오 최적화, 증권의 가격 평가 및 위험관리 등 투자 실무 영역에서도 매우 중요한 역할을 하고 있다. 변동성은 주가 수익률이 평균을 중심으로 얼마나 큰 폭의 움직임을 보이는가를 판단하는 지표로서 보통 수익률의 표준편차로 측정한다. 관찰 가능한 표준편차는 과거의 주가 움직임에서 측정되는 역사적 변동성(historical volatility)이다. 역사적 변동성이 미래의 주가 수익률의 변동성을 예측하려면 변동성이 시간 불변적(time-invariant)이어야 한다. 그러나 대부분의 변동성 연구들은 변동성이 시간 가변적(time-variant)임을 보여주고 있다. 이에 따라 시간 가변적 변동성을 예측하기 위한 여러 계량 모형들이 제안되었다. Engle(1982)은 변동성의 시간 가변적 특성을 잘 반영하는 변동성 모형인 Autoregressive Conditional Heteroscedasticity(ARCH)를 제안하였으며, Bollerslev(1986) 등은 일반화된 ARCH(GARCH) 모형으로 발전시켰다. GARCH 모형의 실증 분석 연구들은 실제 증권 수익률에 나타나는 두터운 꼬리 분포 특성과 변동성의 군집현상(clustering)을 잘 설명하고 있다. 일반적으로 GARCH 모형의 모수는 가우스분포로부터 추출된 자료에서 최적의 성과를 보이는 로그우도함수에 대한 최우도추정법에 의하여 추정되고 있다. 그러나 1987년 소위 블랙먼데이 이후 주식 시장은 점점 더 복잡해지고 시장 변수들이 많은 잡음(noise)을 띠게 됨에 따라 변수의 분포에 대한 엄격한 가정을 요구하는 최우도추정법의 대안으로 인공지능모형에 대한 관심이 커지고 있다. 본 연구에서는 주식 시장의 주가 수익률에 나타나는 변동성의 예측 모형인 GARCH 모형의 모수추정방법으로 지능형 시스템인 Support Vector Regression 방법을 제안한다. SVR은 Vapnik에 의해 제안된 Support Vector Machines와 같은 원리를 회귀분석으로 확장한 모형으로서 Vapnik의 e-insensitive loss function을 이용하여 비선형 회귀식의 추정이 가능해졌다. SVM을 이용한 회귀식 SVR은 두터운 꼬리 분포를 보이는 주식시장의 변동성과 같은 관찰치에서도 우수한 추정 성능을 보인다. 2차 손실함수를 사용하는 기존의 최소자승법은 부최적해로서 추정 오차가 확대될 수 있다. Vapnik의 손실함수에서는 입실론 범위내의 예측 오차는 무시하고 큰 예측 오차만 손실로 처리하기 때문에 구조적 위험의 최소화를 추구하게 된다. 금융 시계열 자료를 분석한 많은 연구들은 SVR의 우수성을 보여주고 있다. 본 연구에서는 주가 변동성의 분석 대상으로서 KOSPI 200 주가지수를 사용한다. KOSPI 200 주가지수는 한국거래소에 상장된 우량주 중 거래가 활발하고 업종을 대표하는 200 종목으로 구성된 업종 대표주들의 포트폴리오이다. 분석 기간은 2010년부터 2015년까지의 6년 동안이며, 거래일의 일별 주가지수 종가 자료를 사용하였고 수익률 계산은 주가지수의 로그 차분값으로 정의하였다. KOSPI 200 주가지수의 일별 수익률 자료의 실증분석을 통해 기존의 Maximum Likelihood Estimation 방법과 본 논문이 제안하는 지능형 변동성 예측 모형의 예측성과를 비교하였다. 주가지수 수익률의 일별 자료 중 학습구간에서 대칭 GARCH 모형과 E-GARCH, GJR-GARCH와 같은 비대칭 GARCH 모형에 대하여 모수를 추정하고, 검증 구간 데이터에서 변동성 예측의 성과를 비교하였다. 전체 분석기간 1,487일 중 학습 기간은 1,187일, 검증 기간은 300일 이다. MLE 추정 방법의 실증분석 결과는 기존의 많은 연구들과 비슷한 결과를 보여주고 있다. 잔차의 분포는 정규분포보다는 Student t분포의 경우 더 우수한 모형 추정 성과를 보여주고 있어, 주가 수익률의 비정규성이 잘 반영되고 있다고 할 수 있다. MSE 기준으로, SVR 추정의 변동성 예측에서는 polynomial 커널함수를 제외하고 linear, radial 커널함수에서 MLE 보다 우수한 예측 성과를 보여주었다. DA 지표에서는 radial 커널함수를 사용한 SVR 기반의 지능형 GARCH 모형이 가장 우수한 변동성의 변화 방향에 대한 방향성 예측력을 보여주었다. 추정된 지능형 변동성 모형을 이용하여 예측된 주식 시장의 변동성 정보가 경제적 의미를 갖는지를 검토하기 위하여 지능형 변동성 거래 전략을 도출하였다. 지능형 변동성 거래 전략 IVTS의 진입규칙은 내일의 변동성이 증가할 것으로 예측되면 변동성을 매수하고 반대로 변동성의 감소가 예상되면 변동성을 매도하는 전략이다. 만약 변동성의 변화 방향이 전일과 동일하다면 기존의 변동성 매수/매도 포지션을 유지한다. 전체적으로 SVR 기반의 GARCH 모형의 투자 성과가 MLE 기반의 GARCH 모형의 투자 성과보다 높게 나타나고 있다. E-GARCH, GJR-GARCH 모형의 경우는 MLE 기반의 GARCH 모형을 이용한 IVTS 전략은 손실이 나지만 SVR 기반의 GARCH 모형을 이용한 IVTS 전략은 수익으로 나타나고 있다. SVR 커널함수에서는 선형 커널함수가 더 좋은 투자 성과를 보여주고 있다. 선형 커널함수의 경우 투자 수익률이 +526.4%를 기록하고 있다. SVR 기반의 GARCH 모형을 이용하는 IVTS 전략의 경우 승률도 51.88%부터 59.7% 사이로 높게 나타나고 있다. 옵션을 이용하는 변동성 매도전략은 방향성 거래전략과 달리 하락할 것으로 예측된 변동성의 예측 방향이 틀려 변동성이 소폭 상승하거나 변동성이 하락하지 않고 제자리에 있더라도 옵션의 시간가치 요인 때문에 전체적으로 수익이 실현될 수도 있다. 정확한 변동성의 예측은 자산의 가격 결정뿐만 아니라 실제 투자에서도 높은 수익률을 얻을 수 있기 때문에 다양한 형태의 인공신경망을 활용하여 더 나은 예측성과를 보이는 변동성 예측 모형을 개발한다면 주식시장의 투자자들에게 좋은 투자 정보를 제공하게 될 것이다.

UV 공정을 이용한 N-Nitrosodimethylamine (NDMA) 광분해 및 부산물 생성에 관한 연구: 박스-벤켄법 실험계획법을 이용한 통계학적 분해특성평가 및 반응모델 수립 (A study on the Degradation and By-products Formation of NDMA by the Photolysis with UV: Setup of Reaction Models and Assessment of Decomposition Characteristics by the Statistical Design of Experiment (DOE) based on the Box-Behnken Technique)

  • 장순웅;이시진;조일형
    • 대한환경공학회지
    • /
    • 제32권1호
    • /
    • pp.33-46
    • /
    • 2010
  • 본 연구는 광분해 산화공정으로 난분해성 물질인 N-Nitrosodimethylamine (NDMA)인 제거 및 부산물 생성 특성을 파악하기 위한 3개의 독립변수 (자외선 강도($X_1:\;1.5{\sim}4.5\;mW/cm^2$, 초기 NDMA 농도($X_2:\;100{\sim}300\;uM$), pH(X3:3~9))와 4개의 종속변수(NDMA 제거율($Y_1$), dimethylamine (DMA) 생성농도($Y_2$), dimethylformamide (DMF) 생성농도($Y_3$) 및 $NO_2$-N 생성농도($Y_4$))로 구성된 박스-벤켄 설계를 이용한 실험계획을 적용시켜 예측 모델과 광분해 산화 최적조건을 수립하였다. 실험결과 2시간 광분해 후 NDMA는 거의 완전히 제거되었으며 DMA, DMF와 $NO_2$-N은 NDMA 광분해와 동시에 부산물로 생성되었다. 광분해 최적의 조건을 얻기 위해 정준분석을 수행하여 최적 점 (반응값, 독립변수 조건)과 예측반응모델을 수립한 결과, 다음과 같은 결과를 얻었다 ($Y_1=117+21X_1-0.3X_2-17.2X_3+{2.43X_1}^2+{0.001X_2}^2+{3.2X_3}^2-0.08X_1X_2-1.6X_1X_3-0.05X_2X_3$ ($R^2$ = 96%, Adjusted $R^2$ = 88%)와 99.3% ($X_1:\;4.5\;mW/cm^2$, $X_2:\;190\;uM$, $X_3:\;3.2$), $Y_2=-101+18.5X_1+0.4X_2+21X_3-{3.3X_1}^2-{0.01X_2}^2-{1.5X_3}^2-0.01X_1X_2-0.07X_1X_3-0.01X_2X_3$ ($R^2$= 99.4%, 수정 $R^2$ = 95.7%)와 35.2 uM ($X_1:\;3\;mW/cm^2$, $X_2:\;220\;uM$, $X_3:\;6.3$), $Y_3=-6.2+0.2X_1+0.02X_2+2X_3-{0.26X_1}^2-{0.01X_2}^2-{0.2X_3}^2-0.004X_1X_2+0.1X_1X_3-0.02X_2X_3$ ($R^2$= 98%, 수정 $R^2$ = 94.4%)와 3.7 uM ($X_1:\;4.5\;mW/cm^2$, $X_2:\;290\;uM$, $X_3:\;6.2$), $Y_4=-25+12.2X_1+0.15X_2+7.8X_3+{1.1X_1}^2+{0.001X_2}^2-{0.34X_3}^2+0.01X_1X_2+0.08X_1X_3-3.4X_2X_3$ ($R^2$= 98.5%, 수정 $R^2$ = 95.7%)와 74.5 uM ($X_1:\;4.5\;mW/cm^2$, $X_2:\;220\;uM$, $X_3:\;3.1$). 반응표면분석법 중 하나인 박스-벤켄법은 UV 광분해에 의한 NDMA 분해 및 부산물 생성에 대한 통계학적 및 수학적인 결과 및 최적의 운전조건을 제시하였다. 예측모델의 검정을 통하여 박스-벤켄법은 매우 높은 신뢰성을 보였다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.