• 제목/요약/키워드: intelligent system

검색결과 9,774건 처리시간 0.036초

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.

증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측 (The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF)

  • 양수연;이채록;원종관;홍태호
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.237-262
    • /
    • 2022
  • 본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영향을 미치는 요인이라는 것을 확인할 수 있었다.

KB-BERT: 금융 특화 한국어 사전학습 언어모델과 그 응용 (KB-BERT: Training and Application of Korean Pre-trained Language Model in Financial Domain)

  • 김동규;이동욱;박장원;오성우;권성준;이인용;최동원
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.191-206
    • /
    • 2022
  • 대량의 말뭉치를 비지도 방식으로 학습하여 자연어 지식을 획득할 수 있는 사전학습 언어모델(Pre-trained Language Model)은 최근 자연어 처리 모델 개발에 있어 매우 일반적인 요소이다. 하지만, 여타 기계학습 방식의 성격과 동일하게 사전학습 언어모델 또한 학습 단계에 사용된 자연어 말뭉치의 특성으로부터 영향을 받으며, 이후 사전학습 언어모델이 실제 활용되는 응용단계 태스크(Downstream task)가 적용되는 도메인에 따라 최종 모델 성능에서 큰 차이를 보인다. 이와 같은 이유로, 법률, 의료 등 다양한 분야에서 사전학습 언어모델을 최적화된 방식으로 활용하기 위해 각 도메인에 특화된 사전학습 언어모델을 학습시킬 수 있는 방법론에 관한 연구가 매우 중요한 방향으로 대두되고 있다. 본 연구에서는 금융(Finance) 도메인에서 다양한 자연어 처리 기반 서비스 개발에 활용될 수 있는 금융 특화 사전학습 언어모델의 학습 과정 및 그 응용 방식에 대해 논한다. 금융 도메인 지식을 보유한 언어모델의 사전학습을 위해 경제 뉴스, 금융 상품 설명서 등으로 구성된 금융 특화 말뭉치가 사용되었으며, 학습된 언어 모델의 금융 지식을 정량적으로 평가하기 위해 토픽 분류, 감성 분류, 질의 응답의 세 종류 자연어 처리 데이터셋에서의 모델 성능을 측정하였다. 금융 도메인 말뭉치를 기반으로 사전 학습된 KB-BERT는 KoELECTRA, KLUE-RoBERTa 등 State-of-the-art 한국어 사전학습 언어 모델과 비교하여 일반적인 언어 지식을 요구하는 범용 벤치마크 데이터셋에서 견줄 만한 성능을 보였으며, 문제 해결에 있어 금융 관련 지식을 요구하는 금융 특화 데이터셋에서는 비교대상 모델을 뛰어넘는 성능을 보였다.

금리 스프레드와 산업별 주식 수익률 관계 분석 (Analysis of the relationship between interest rate spreads and stock returns by industry)

  • 김규형;박진수;서지혜
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.105-117
    • /
    • 2022
  • 본 연구는 다항회귀분석을 통해 장기금리와 단기금리의 차이인 금리 스프레드와 주식 수익률 간 영향을 분석한다. 기존 연구들은 미국시장을 중심으로 금리 스프레드를 통한 경기를 예측에 초점을 맞추어 진행되었다. 선행 연구들은 장단기금리의 기간을 조절하고 선행정도를 분석하며 금리 스프레드를 경기예측 선행지표로 검증했다. 국내에서도 2006년 경기종합지수 제 7차 개편 이후 금리스프레드를 경기 선행지수 구성항목에 포함하였으며 현재까지도 활용하고 있다. 그럼에도 불구하고 국내 주식시장에서 금리스프레드와 산업별 주식 수익률에 대한 연구는 부족하다. 때문에 본 연구에서는 국내주식시장을 대상으로 금리스프레드와 산업별 주식 수익률은 분석했다. 회귀분석을 통해 인과관계가 높은 장단기 금리를 선정하고 선행기간 및 산업별 상관관계를 파악했다. 연구 과정에서 단순 선형회귀 분석(Simple Linear Regression)의 한계를 극복하기 위해 다항 회귀분석(Polynomial Linear Regression)을 활용해 설명력을 높였다. 분석 결과 6개월 선행하여 무보증 3년 회사채(AA-) 수익률과 콜금리 수익률의 차이 금리스프레드로 사용했을 때 높은 인과를 확인하였으며 산업별 주식수익률을 분석한 결과 해당 금리 스프레드와 자동차산업의 수익률의 관계가 가장 밀접함을 확인했다. 본 연구를 통해 국내에서 금리 스프레드가 경기예측뿐만 아니라 주식수익률과도 인과관계가 있음을 확인한 것에 의의가 있다. 금리스프레드만 사용하여 주식 가격을 예측하는 것에는 한계가 있을 수 있으나 다양한 요인들과 적절히 활용할 경우 강력한 팩터로 역할을 할 것이라 기대한다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

이미지 기반의 경험재, 텍스트 기반의 탐색재: 조절초점에 따른 제품 정보 구성 방식과 제품 유형의 일치 효과 (Image based Experience Goods, Text-based Search Goods: Cognitive Fit between Product Information Composition and Product Type depending on Regulatory Focus)

  • 박경희;서봉군;박도형
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.75-100
    • /
    • 2022
  • 코로나19가 장기화하면서 비대면 모바일 커머스 시장은 더욱더 치열한 경쟁 속에 있으며 기업들은 소비자에게 더 나은 쇼핑 경험을 제공하기 위하여 다각도의 노력을 하고 있다. 하지만 구매 결정에 중요한 역할을 하는 상세페이지는 대부분 비슷한 형태와 구성으로 소비자에게 제공되고 있다. 따라서 본 연구는 모바일 상세페이지의 상품 설명 영역의 정보 구성방식 (이미지 중심 vs 텍스트 중심)과 제품 유형 (탐색재 vs 경험재)에 따라 소비자들의 정보 인식이 달라져 제품 태도에 영향을 주는 것을 확인하였다. 즉 정보 탐색이 쉽고 품질 예측이 가능한 탐색재(Search Goods)의 경우는 이미지(Image) 중심 정보 구성 방식에서, 직접 경험하지 않으면 상품의 품질을 예측 불가능한 경험재(Experience Goods)의 경우에는 텍스트(Text) 중심의 정보 구성 방식에서 제품 태도에 더 긍정적인 영향을 미친다는 것을 알 수 있었다. 또한 Higgins의 자기조절초점(Self-Regulatory Focus) 이론을 적용하여 소비자의 조절초점 성향에 따라 제품 유형과 정보 구성 방식 간의 일치 효과는 다르게 나타난다는 결과를 확인하였다. 향상초점(Promotion Focus) 성향의 소비자는 제품 유형과 정보 구성 방식 간의 일치 효과가 나타났으며, 예방초점(Prevention Focus) 성향의 소비자는 제품 유형과 정보 구성 방식 간의 일치 효과가 나타나지 않았다. 구체적으로 향상초점 성향의 소비자는 경험재에 대하여 이미지 중심의 정보 구성 방식에서, 탐색재에 대해서는 텍스트 중심의 정보 구성 방식에서 더 긍정적인 제품 태도를 가진다는 결과를 확인하였고, 예방초점 성향의 소비자는 탐색재 및 경험재에 대하여 이미지 중심 또는 텍스트 중심의 정보 구성 방식을 제시하더라도 제품 태도에 영향을 미치지 못하는 것을 확인하였다. 본 연구는 모바일 쇼핑몰 상세페이지 상품 상세 영역에서 정보 구성 방식을 제품 유형과 소비자 성향을 고려하여 소비자에게 제공되어야 할 것이라는 시사점을 갖는다.

정부창업지원 프로그램 참여에 따른 ICT 기업 프로파일링과 성과창출 메커니즘 (ICT Company Profiling Analysis and the Mechanism for Performance Creation Depending on the Type of Government Start-up Support Program)

  • 하상집;박도형
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.237-258
    • /
    • 2022
  • 국내 ICT 산업은 세계 시장 환경이 변화함에 따라, 세계에 미치는 영향력이 점차 커지고 있다. 이 산업은 국가 경제에 기술적, 사회적 측면에서 중요한 원동력으로 여겨지고 있다. 특히 ICT 산업 내 중소기업은 다양성 추구, 기술 발전 및 고용 창출 측면에서 국내 경제 발전의 반드시 필요한 주체로서 여겨지고 있다. 하지만 대기업이나 중견 기업에 비해 작은 규모이기 때문에, 불완전하고 급변하는 환경 속에서 중소기업이 차별화된 전략을 가지고 살아 남기 어려운 상황에 직면해 있다. 그래서 중소기업은 자신이 가진 역량을 향상시키기 위해서 많은 노력을 해야 하며, 정부도 이들이 지속적으로 경쟁력을 갖추도록 기업 내부자원에 맞는 바람직한 도움을 제공해 줄 필요성이 있다. 본 연구는 정부지원 프로그램에 참여하고 있는 ICT 중소기업의 유형을 분류하고, 각각의 유형별로 기업들이 가지고 있는 자원들과 성과창출 간의 관계를 분석하였다. 분석 자료로는 과학기술정보통신부에서 매년 실시하고 있는 ICT 중소기업 실태조사의 데이터를 사용하였다. 이를 위해, 본 연구는 첫번째 단계에서 ICT 중소기업들을 정부지원 프로그램 경험에 따라 공통의 요소를 기반으로 군집화 하였다. 세 개의 군집이 의미 있게 분류되었으며, 각각의 군집은 '적극적 참여형,' '초기 지원형,' '홀로서기형'으로 명명하였다. 두번째 단계로, 본 연구는 각 군집에 대해 프로파일링 분석을 통해 각 군집의 특성을 비교하였다. 본 연구가 수행한 세번째 단계는 군집별로 R&D 성과창출 메커니즘을 회귀분석을 통해 알아보았는데, 각 군집별로 서로 상이한 요인들이 성과창출에 영향을 주었고, 그 영향력의 크기도 서로 달랐다. 구체적으로, "적극적 참여형"은 "현재 보유 인력", "기술경쟁력", "전년도 R&D 투자액"이 "R&D 성과창출"에 중요한 요인들로 밝혀졌다. "초기 지원형"은 "연구개발전담조직 보유 여부", "전년도 R&D 투자액", "대기업 매출 비중", "대기업 납품 벤더 비중"이 성과에 기여하는 것으로 파악되었다. 마지막으로 "홀로서기형"의 경우, "현재 보유 인력"과 더불어 "미래 충원 계획", "기술경쟁력", "R&D 투자액", "대기업 매출 비중", "해외매출 비중"이 유의한 관계를 보여주었다. 본 연구는 정부의 창업프로그램 참여 방식에 따라, 향후 중소기업을 지원할 때, 어떤 전략을 수립해야 하는지를 보여준다는 정책적 시사점을 가지며, 구체적으로 어떤 지원을 제공해야 하는지에 대한 가이드를 제공한다는 실무적 시사점을 가진다.

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

프로세스 마이닝을 이용한 군수품 계약업무 분석 : 공군 군수사 계약업무를 중심으로 (Analysis of Munitions Contract Work Using Process Mining)

  • 주용선;김수환
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.41-59
    • /
    • 2022
  • 군수물자의 적기 조달은 군의 작전능력 유지를 위해서 필수적이며, 계약업무는 적기 조달을 위한 첫 단추라고 할 수 있다. 또한 신속한 계약체결은 수요자의 여유로운 납기설정을 가능케 하며, 예산 집행의 가능성을 높여주기 때문에 예산의 조기집행과 이·불용 방지를 위해서도 계약 프로세스 개선이 필수적이다. 최근 빅데이터를 이용한 연구가 여러 분야에서 활발히 진행되고 있으며, 빅데이터를 이용한 프로세스 분석 및 개선 기법인 프로세스 마이닝 역시 민간에서 널리 활용되고 있다. 하지만 군 내 계약업무에 대한 분석은 업무 담당자의 경험과 단편적인 정보를 활용한 이·불용 문제사례별 원인 파악 및 대응적 모색과 같은 개별적 분석수준에 그치고 있다. 본 연구는 계약 프로세스 개선을 위해 공군 군수사령부 재정처가 2019년 11월부터 약 1년간 직접 계약한 총 560건의 계약업무에 관한 데이터를 가지고 프로세스 마이닝 기법을 이용하여 분석하였다. 분산된 데이터를 종합하여 프로세스 맵을 도출하고, 프로세스의 흐름, 수행시간 분석, 병목 분석 및 추가 세부분석을 실시했다. 분석결과 다수 계약 건에서 의뢰 후 재검토/수정이 반복 발생하고 있음을 발견할 수 있었다. 반복적인 재검토/수정은 원가계산 완료까지의 소요일수 지연에 크게 영향을 미치고 있으며, 이는 병목 지점 시각화를 통해서도 명확하게 드러났다. 재검토/수정은 계약의뢰가 많은 상위 5개 부서에서 60% 이상 발생하고, 의뢰가 집중되는 상반기에 주로 발생하는데 이는 소요부서의 계약의뢰 전 면밀한 사전검토가 필요함을 의미한다. 그리고 재정처의 계약업무는 법령에 따른 절차대로 수행되고 있었으나, 일부 업무의 순서조정이 필요함을 알 수 있었다. 본 연구는 군 내 계약업무 분석에 프로세스 마이닝을 이용한 첫 사례이다. 이를 기반으로 프로세스 마이닝을 군대 내 다양한 업무에 적용하기 위한 연구가 더욱 수행된다면, 각종 업무의 효율화를 이끌어 낼 수 있을 것으로 기대한다.