• 제목/요약/키워드: 인식 모델

검색결과 4,429건 처리시간 0.033초

이진 분류문제에서의 딥러닝 알고리즘의 활용 가능성 평가 (Feasibility of Deep Learning Algorithms for Binary Classification Problems)

  • 김기태;이보미;김종우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.95-108
    • /
    • 2017
  • 최근 알파고의 등장으로 딥러닝 기술에 대한 관심이 고조되고 있다. 딥러닝은 향후 미래의 핵심 기술이 되어 일상생활의 많은 부분을 개선할 것이라는 기대를 받고 있지만, 주요한 성과들이 이미지 인식과 자연어처리 등에 국한되어 있고 전통적인 비즈니스 애널리틱스 문제에의 활용은 미비한 실정이다. 실제로 딥러닝 기술은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Boltzmann Machine (DBM) 등 알고리즘들의 선택, Dropout 기법의 활용여부, 활성 함수의 선정 등 다양한 네트워크 설계 이슈들을 가지고 있다. 따라서 비즈니스 문제에서의 딥러닝 알고리즘 활용은 아직 탐구가 필요한 영역으로 남아있으며, 특히 딥러닝을 현실에 적용했을 때 발생할 수 있는 여러 가지 문제들은 미지수이다. 이에 따라 본 연구에서는 다이렉트 마케팅 응답모델, 고객이탈분석, 대출 위험 분석 등의 주요한 분류 문제인 이진분류에 딥러닝을 적용할 수 있을 것인지 그 가능성을 실험을 통해 확인하였다. 실험에는 어느 포르투갈 은행의 텔레마케팅 응답여부에 대한 데이터 집합을 사용하였으며, 전통적인 인공신경망인 Multi-Layer Perceptron, 딥러닝 알고리즘인 CNN과 RNN을 변형한 Long Short-Term Memory, 딥러닝 모형에 많이 활용되는 Dropout 기법 등을 이진 분류 문제에 활용했을 때의 성능을 비교하였다. 실험을 수행한 결과 CNN 알고리즘은 비즈니스 데이터의 이진분류 문제에서도 MLP 모형에 비해 향상된 성능을 보였다. 또한 MLP와 CNN 모두 Dropout을 적용한 모형이 적용하지 않은 모형보다 더 좋은 분류 성능을 보여줌에 따라, Dropout을 적용한 CNN 알고리즘이 이진분류 문제에도 활용될 수 있는 가능성을 확인하였다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.

계좌 이용 과정과 결과의 투명성이 온라인 뱅킹 이용자의 보안 인식에 미치는 영향 (The Role of Control Transparency and Outcome Feedback on Security Protection in Online Banking)

  • 이은곤;최지은;이호근
    • 경영정보학연구
    • /
    • 제14권3호
    • /
    • pp.75-97
    • /
    • 2012
  • 온라인 뱅킹 서비스의 성공을 위해서는 이용 고객의 신뢰를 제고하는 것이 필수적이다. 현재까지 인터넷 뱅킹 이용자들의 신뢰를 제고하는 보안 메커니즘으로 공인인증 서비스가 가장 유력한 대안으로 사용되어 왔다. 그러나 최근 공인인증서를 통한 보안 메커니즘은 해커 등 악의적인 사용자의 침입에 취약할 수 있다는 주장이 제기되고 있다. 본 연구에서는 온라인 뱅킹 보안 메커니즘의 견고성을 높이기 위한 추가적인 대안으로 공인인증서 사용과 관련된 과정의 투명성과 결과 피드백의 투명성이라는 두 가지 요소를 제안하였다. 과정의 투명성은 거래과정에 대한 정보를 이용자에게 제공함으로써 거래 과정을 통제할 수 있도록 하는 것이다. 결과 피드백은 거래결과를 이용자에게 알려줌으로써 이용자가 거래가 의도한 대로 완료되었음을 확인할 수 있도록 하는 것이다. 정보의 투명성에 관한 선행 연구에 따르면, 거래과정과 결과에 대한 정보를 제공하여 투명성을 제고하면 정보시스템 이용자의 의사결정 품질이 제고된다. 거래과정에 대한 정보의 투명성이 확보되면, 정보시스템 이용자들은 거래가 원활하게 수행되고 있는지를 확인할 수 있게 되고, 거래 과정과 결과를 자신이 의도한 대로 통제할 수 있게 되기 때문에, 이용자들의 거래 위험을 감소시킬 수 있다. "구조기반 신뢰" 에 대한 연구에 따르면, 정보시스템 이용자들은 자신들이 성공적으로 거래를 할 수 있도록 구조적인 요소를 제공하는 서비스 제공자들을 보다 신뢰하는 속성이 있다. 거래과정과 거래결과를 확인할 수 있는 정보의 투명성은 정보시스템 이용자가 거래를 원활하게 추진할 수 있는 구조적 기반을 제공하므로 서비스 제공자에 대한 신뢰는 증가하게 된다. 거래 위험이 감소하고 신뢰가 증가되면, 이용자들은 제공되는 서비스에 대해 보다 만족하게 되고, 따라서 서비스 제공자에 대해 충성도가 제고되거나 서비스에 대해 지불 의사를 가지게 될 것이다. 본 연구에서는 실험실 실험을 통해 연구 가설 및 연구 모델을 실증적으로 검증하고자 하였다. 실험설계는 과정의 투명성과 결과의 투명성이라는 두 가지 요인에 따라 $2{\times}2$ 집단으로 구성하여 진행하였다. 공인인증서 사용과 관련된 과정의 투명성과 결과 피드백 요소가 현재 온라인 뱅킹 사이트에서 제공되고 있지 않기 때문에 가상의 온라인 뱅킹 사이트를 구축하여 실험을 진행하였다. 총 138개의 유효한 자료를 실험을 통해 수집하였으며 PLS 알고리즘을 활용하여 분석을 진행하였다. 분석 결과, 과정의 투명성은 온라인 뱅킹 거래의 위험을 줄이고 온라인 뱅킹 사이트에 대한 신뢰를 증가시키는 것으로 나타났다. 결과 피드백은 온라인 뱅킹 사이트에 대한 신뢰를 증가시키는 것으로 나타났다. 이렇게 증가된 신뢰와 감소된 거래위험은 서비스 만족도를 증가시킴으로써 온라인 뱅킹 서비스 이용 고객의 서비스에 대한 지불의도와 온라인 뱅킹 사이트에 대한 충성도를 증가시키는 것으로 조사되었다. 본 연구에서는 온라인 뱅킹 서비스의 보안이라는 주제에 대해 정보의 투명성이 보안에 미치는 영향을 실증자료를 통해 분석함으로써 온라인 보안 메커니즘 연구의 범위를 확대하였을 뿐만 아니라 실제 구현이 가능한 보안 메커니즘에 대한 효과를 검증함으로써 실무적 측면에서의 동헌도가 있다고 판단된다.

  • PDF

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

지역 기록화를 위한 도큐멘테이션 전략의 적용 (Directions of Implementing Documentation Strategies for Local Regions)

  • 설문원
    • 기록학연구
    • /
    • 제26호
    • /
    • pp.103-149
    • /
    • 2010
  • 자치시대에 지방의 기록관리는 지역의 고유한 특성을 반영하여 독립적으로 추진할 필요가 있다. 그러나 아직 제대로 된 지방영구기록물관리기관이 한 곳도 설립되어 있지 않은 상황에서 다각적이고 적극적인 해결책을 모색할 필요가 있는데 지방기록관리의 방향을 '시설' 중심에서 '기록'과 '전문적 관리(사람)' 중심으로 바꾸는 것이 하나의 대안이다. 특히 중앙의 기록관리 프로세스라는 보편성에 매몰되었던 개별 지역의 다양성과 역동성을 찾기 위해서는 새로운 지역 기록화 전략을 적극 탐구할 필요가 있다. 도큐멘테이션 전략은 특정 지역, 주제, 사건 등에 관한 적절한 정보를 기록 생산자, 보존 기록관, 기록 이용자의 상호 협력을 통해 선별하여 수집하는 방법론으로서 80년대에 미국을 중심으로 제안되고 다양한 분야에서 다양한 방식으로 실험되어온바 있다. 이 연구에서는 도큐멘테이션 전략이 지역 기록화를 위한 방법론으로 어떤 의미를 갖는지 살펴보고 우리의 지역 환경에 적용하기 위해서 고려해야할 점과 추진 방향을 모색해보고자 하였다. 서구에서 개발된 도큐멘테이션 전략이 현 상황에서 우리에게 주는 시사점은 다음과 같다. 첫째, 아카이브즈 및 아키비스트의 능동적 역할을 추구하며 특히 지역사회에서 기록전문직의 가치를 인식시키는 데에 기여할 수 있다. 이 전략은 지방기록관리기관들은 행정사를 넘어서 지역사를 포괄적으로 기록화 하는 주체가 될 것을 촉구한다. 이에 따라 지방의 기록전문직들은 공공기록을 수동적으로 이관 받는 데에서 그치는 것이 아니라 능동적으로 지역의 기록을 수집하고 이를 서비스하기 위해 노력해야 한다. 둘째, 지역 내 기록 수집기관들의 협력을 통해 단일 조직의 기능 재현에서 폭넓은 사회적 재현을 성취할 수 있다는 점이다. 서구에서 이러한 협력 모델은 과도한 업무 부담으로 실패한 경우가 많았지만 디지털 환경은 새로운 가능성을 보여주고 있다. 지역 내에 존재하는 다양한 기록 생산 및 소장기관들과 협력을 통해 지역의 지식역량은 물론 지역정보서비스의 수준을 높일 수 있을 것이다. 셋째, 도큐멘테이션 전략은 다양한 집단들과의 연대를 추구한다. 이 전략은 도큐멘테이션 주제와 관련된 집단이나 공동체로부터 열정과 에너지, 전문지식을 가져올 수 있는 장점을 가지며, 도큐멘테이션 전략은 기억을 남기고자 하는 주체들이 실천적 기록문화운동을 추진하는 하나의 방법론을 제공할 수 있을 것이다. 이 연구에서는 우리의 지역 현실에 적합한 기록화 방향을 다음과 같이 제안하였다. 첫째, 선택적이고 집중적인 기록화를 지향한다. 지역에 관한 모든 영역에 관한 포괄적 기록화를 추진하기 보다는 지역의 로컬리티를 가장 잘 반영하는 영역과 대상을 선정하여 기록화를 추진한다. 지역을 구성하는 다양한 요소들인 사람, 사회 문화, 조직과 제도, 건조(建造) 환경, 공간 등이 상호작용하면서 만들어지고 변화하는 실체인 로컬리티를 규명하기 위해서는 전문가 집단과 지역민의 의견을 반영하는 구조가 필요하다. 둘째, 분산 보존과 통합적 재현을 지향한다. 기록화 주관기관은 다양한 기록 소장기관들과 소장자들을 연결하는 협력체계를 구축하여 분산 소장된 기록들을 통합적으로 검색할 수 있도록 한다. 즉, 한 지역의 역사 기록을 집중 보존할 기관을 정하기보다는 연계를 통한 기록화를 추진하는 것이 현실적일 것이다. 이를 위한 도구로서 지역 게이트웨이 구축을 제안하였다. 셋째, 열린 구조의 디지털 기록화를 지향한다. 지역 기록화는 맥락 재구성을 바탕으로 기록을 수집하는 방법론을 적용하게 되므로 선별된 기록에는 이미 수집자나 맥락 해석자의 의도가 반영되어 있다. 특히 맥락 분석에 의거하여 스토리를 구성하고 이에 따라 기록을 수집하거나 연계할 경우, 자의적이고 주관적인 선별이라는 비판을 받기 쉽다. 이러한 문제를 보완하기 위해 기록 맥락의 해석과 기록화 영역의 선정 등의 과정에 지역 내 다양한 집단의 의견이 반영될 수 있도록 해야 할 것이며, 디지털 네트워크를 통해 여러 집단 및 개인의 참여가 쉽게 이루어질 수 있도록 보장해야 한다. 넷째, 지역 내 협력기관들의 영역별 기록화 수준을 정한다. 기록화에 참여하는 기관들이 디지털 기록화에 맞는 역할을 분담 받아야 하고, 각 기관은 협력적 기록화에 참여함으로써 자관 이용자들에게는 더 나은 포괄적인 기록 서비스를 제공할 수 있을 것이다. 이를 위해 도서관의 디지털 장서개발에 활용하는 컨스펙터스 모형을 응용하여 디지털 기록화 방법론을 새롭게 설계할 것을 제안하였다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

공공 정보지원 인프라 활용한 제조 중소기업의 특징과 성과에 관한 연구 (The Characteristics and Performances of Manufacturing SMEs that Utilize Public Information Support Infrastructure)

  • 김근환;권태훈;전승표
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.1-33
    • /
    • 2019
  • 제조 중소기업들은 지속적인 성장과 생존을 위해 새로운 제품 개발에 필요한 많은 정보가 필요할 뿐만 아니라 자원의 한계를 극복하기 위한 네트워킹(networking)을 추구하지만, 규모의 한계로 인해 한계점에 봉착하게 된다. 초연결성으로 인해 비즈니스 환경의 복잡성과 불확실성이 더욱 높아지는 새로운 시대에 중소기업은 신속한 정보 확보와 네트워킹 문제를 해결이 더욱 절실해지고 있다. 이러한 문제를 해결하기 위해 공공기관인 정부출연(연)구기관(이하 '출연(연)')은 중소기업의 정보 비대칭성 문제를 해결해야하는 중요한 임무와 역할을 맞이하고 있다. 본 연구에서는 비즈니스 인텔리젼스의 경쟁 지능화(competitive intelligence) 기능과 외부 네트워크 활성화를 위한 서비스 인프라(service infrastructure)의 기능을 포함한 공공 정보지원 인프라를 통한 간접지원의 성과를 확산하고자 하는 목적으로 출연(연)이 중소기업의 혁신역량 제고를 위해 제공하는 공공 정보지원 인프라를 활용하는 중소기업의 차별적 특징을 파악하고, 인프라가 기업의 성과에 어떻게 기여하는 가를 규명하고자 하였다. 이를 위해 첫째, 출연(연)이 제공한 정보지원 인프라를 활용하는 제조 중소기업은 다른 중소기업과 어떤 차별적인 특정이 있는가? 라는 연구 질의를 도출하였다. 추가적으로 단순히 선택적 편의 여부를 판단하는 것을 넘어서 출연(연) 정보지원 인프라를 활용한 제조 중소기업의 특징을 복수 집단의 특징과 비교하는 연구를 진행하였다. 둘째, 출연(연)이 제공하는 정보지원 인프라를 활용한 제조 중소기업의 외부 네트워킹 역량이 제품 경쟁력에 어떻게 기여했는가? 라는 연구 질의이다. 본 연구에서 공공 정보지원 인프라에 의해서 강화된 외부 네트워킹 역량이 어떻게 제품 경쟁력에 영향을 미쳤는지 정밀하게 분석하기 위해 복수의 변수에 대한 매개 및 조절 효과 분석을 수행하였다. 연구 모형을 도출하기하기 위해 첫째, 외부 네트워킹이 기술혁신성과에 영향력에 대한 평가를 수행하였다. 일반적으로 기업들은 외부 네트워킹(networking) 전략을 통해 혁신에 필요한 가치 있는 정보를 획득할 수 있기 때문에 기술혁신성과를 높일 수 있다. 정보 획득은 중소 제조기업 경영자의 혁신에 대한 인식을 강화할 뿐만아니라, 의사결정을 효율적으로 하여 경쟁력을 강화시킬 수 있게 된다. 대기업에 비해 인력과 자금의 규모 한계를 극복하기 위해 중소기업은 외부 조직과의 협력관계를 보다 적극적으로 추구한다. 둘째, 기술사업화 역량이 기술혁신성과에 미치는 관계에 대한 평가를 수행하였다. 기술사업화는 생산과 마케팅을 통합하여 새로운 기술을 만드는 역량을 말한다. 우수한 생산 역량을 보유한 기업은 소비자의 수요를 가격, 품질, 신기능 측면에서 신속하게 충족시킬 수 있어 시장내 경쟁우위를 창출하고, 그 결과로 높은 재무적 혁신적 성과를 가져온다고 본다. 혁신적인 기업은 생산 역량과 마케팅 역량에서 일반 기업보다 높은 성과를 나타내는데, 기술혁신성과의 대표 지표로 제품 경쟁력을 지목하고 있다. 마지막으로 기업의 규모가 작을수록 새로운 혁신 정보를 확보할 수 있는 자체 정보지원 인프라가 없는 경향이 있다. 중소기업용 정보인프라는 기업의 제품 또는 서비스 역량을 강화하기 위한 전략에 필요한 중요한 정보를 확보할 수 있어야 하며, 데이터에 대한 해석 기능이 있어야 하고, 기업의 성장과 발전을 위한 다양한 주제(대기업, 공급자, 소비자 등)와의 협력 전략을 수립을 도울 수 있는 기능이 요구된다. 종합하면, 연구모형은 외부 네트워킹 역량(독립변수)이 기술혁신성과인 제품 경쟁력(종속변수)에 영향을 주는 기본 모형에 기술사업화 역량을 매개요인으로 적용하였고, 이들의 관계에 기업의 내부역량(연구원 집중도, 매출액, 업력)이 영향을 줄 수 있기 때문에 기업의 내부역량과 관련된 변수들을 통제하였다. 또한 KISTI가 제공한 공공 정보지원 인프라 활용한 기업별 역량 차이를 분석하기 위해, 정보지원 인프라 활용(효율성)과 관련된 KISTI 외부 기술사업화 전문가(멘토링) 정보지원 횟수의 조절 변수로 고려하였다. 본 연구에서 활용한 데이터 원천은 2차 정보인 '제8차 중소기업 기술통계조사' 자료와 1차 정보인 KISTI의 직접 설문 자료다. '제8차 중소기업 기술통계조사' 는 중소기업청과 중소기업중앙회에서 공동으로 매년 실시되고 있으며, 설문 조사의 모집단은 종사자수 5인 이상 300인 미만인 제조업 및 제조업 외 기업 중에서 기술개발을 수행하고 있는 중소기업 43,204개사이다. 이 중에서 2014년 12월 31일 현재 기준으로 기술개발을 수행하고 있는 3,300개 중소기업을 표본추출하여 방문조사를 실시하여 수집한 자료이다. 본 연구에서 KISTI의 정보지원 인프라를 통해 지원받은 290개의 KISTI 패밀리 기업(ASTI)을 대상으로 2017년에 전자 메일을 통해 자료를 수집하였다. 송부된 290개의 설문지 중 222개의 기업에서 회신을 보내왔으며 그 중에서 설문 내용이 유효한 설문 조사는 149건으로 활용율은 51.3%였다. 분석 결과에 대한 살펴보면 다음과 같다. 규모면에서는 공공 정보지원 인프라 활용 제조 중소기업(ASTI 설문 집단)과 R&D 중소기업(KBIZ 설문 집단)의 성향은 통계적으로 유의미하게 차이가 있었지만, 보다 많은 변수를 종합적으로 보면 크게 다르지 않은 집단이라고 판단했다. 공공 정보지원 인프라를 활용하는 제조 중소기업은 이미 출연(연)과 협업이 가능한 집단을 대표하는 성향 보이는 것으로 나타났다. 외부 네트워킹 역량 강화가 제품 경쟁력 제고에 기여하는데 있어서 기술사업화 역량(마케팅 및 생산 역량)이 가지는 매개 효과의 가능성을 탐색하기 위해서 먼저 통제 변수는 고려하지 않고, Baron과 Kenny(1986)의 매개 효과 분석을 수행했다. 분석결과 외부 네트워크 역량 강화 효과가 제품 경쟁력을 강화시키는 것으로 보였지만, 실제는 기술사업화 역량의 제고를 통해 제품 경쟁력을 강화시키는 것으로 나타났다. 공공 정보지원 인프라 활용의 효과성을 판단하기 위한 멘토링 정보지원 횟수의 조절효과 분석을 위해 3단계의 위계적 회귀분석을 수행하였다. 분석 결과 외부 네트워킹 역량과 멘토링 정보지원 횟수의 상호작용항이 혁신성과(제품 경쟁력)에 유의한 영향을 미쳤을 뿐 아니라, 모델의 설명력도 증가하여, 멘토링 정보지원 횟수의 조절 효과가 검증되었다. 마지막으로 앞서 확인된 복수 매개효과와 조절효과가 동시에 나타날 수 있는 가능성을 판단하기 위해서 매개된 조절효과를 검토했다. 분석결과 외부 네트워킹 역량이 높아지면 제품 경쟁력 제고에 양의 영향을 주지만, 조절 변수인 멘토링 지원 횟수가 높아질수록 그 영향은 오히려 약화되었다. 그리고 외부 네트워킹 역량이 높아지면 사업화 역량(마케팅과 생산)이 높아져서 제품 경쟁력이 높아지며, 조절변수인 멘토링 지원 횟수가 높아지면 독립변수 외부 네트워킹 역량이 매개변수 생산 역량에 미치는 역량이 작아졌다. 종합하면, 외부 네트워킹 역량의 제고는 제품 경쟁력을 높이는데 기여하는데, 직접적 기여하지는 않지만 마케팅과 생산 역량을 높여 간접적으로 기여한다(완전 매개 효과). 또한 이 과정에서 멘토링의 정보적 지원 횟수는 외부 네트워킹 역량 제고가 생산 역량을 제고하는 매개효과에 영향을 준다(순수 조절 효과). 그러나 멘토링 정보 지원 횟수는 마케팅 역량 제고와 제품경쟁력에 별다른 조절 효과를 보이진 않는 것으로 나타났다. 연구를 통한 시사점은 다음과 같다. KISTI의 정보지원 인프라는 서비스 활용 마케팅이 이미 잘 진행되고 있다는 결론을 이끌 수도 있지만, 반면에 시장의 정보 불균형을 해소하는 공공적 기능보다는(열위 기업 지원) 성과가 잘 도출될 수 있는 집단을 지원해서(의도적 선택적 편의) 성과가 잘 나타나도록 관리하고 있다는 결론에 이를 수 있다. 연구 결과를 통해서 우리는 공공 정보지원 인프라가 어떻게 제품경쟁력 제고에 기여하는지 확인했는데, 여기서 우리는 다음과 같은 몇 가지 정책적 시사점을 도출할 수 있다. 첫째, 정보지원 인프라는 분석된 정보뿐만아니라 이 정보를 제공하는 기관(또는 전문가)과 지속적인 교류나 이런 기관을 찾는 역량을 높이는 기능이 있어야 한다. 둘째, 공공 정보지원 (온라인) 인프라의 활용이 효과적이라면 병행적인 오프라인 지원인 정보 멘토링이 지속적으로 제공될 필요는 없으며, 오히려 멘토링과 같은 오프라인 병행 지원은 성과 제고보다는 이상징후 감시에 적절한 장치로 활용되어야 한다. 셋째, 셋째, 공공 정보지원 인프라를 통한 네트워킹 역량 제고와 이를 통한 제품경쟁력 제고 효과는 특정 중소기업에서 나타나기 보다는 대부분 형태의 기업에서 나타나기 때문에, 중소기업이 활용 능력을 제고할 노력이 요구된다.