• 제목/요약/키워드: traditional system

검색결과 6,539건 처리시간 0.037초

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.

고려(高麗) 금동탑(金銅塔)을 통해 본 법주사(法主寺) 팔상전(捌相殿)의 구조형식계통(構造形式系統) (The Structural Lineage of Palsangjeon in Pubjoo Temple Analyzed through Gilt-bronze Pagoda in the Koryo Period)

  • 김경표
    • 건축역사연구
    • /
    • 제14권1호
    • /
    • pp.89-105
    • /
    • 2005
  • The central aim of this thesis is to see if the structure of Palsangjeon(捌相殿) in Pubjoo Temple(法住寺), a five sto wooden pagoda in Chosen(朝鮮) Dynasty, was handed down from the ancient and middle ages. This study was performed through an analysis of Gilt-Bronze Pagoda built in Koryo(高麗) period. In other words, it is aimed at analyzing which lineage the structure of Palsangjeonbelongs to as a wooden pagoda. In analyzing the structure of Palsangjeon, I attempted to find out its source from the remains of Koryo period prior to the Chosen Dynasty. Examples are the Gilt-Bronze Pagoda, built during the Koryo period. I have also examined its relationship with other existing wooden pagodas and remains. The analysis of Palsangjeon, a five story wooden pagoda in Chosen Dynasty, focuses on the following: First, I explored the possibilities of whether the structure of Palsangjeon was newly invented in Chosen Dynasty, or if it had been derived from the wooden pagodas in the Koryo period. Secondly, I tried to find out if the stable vertical planes, with a great successive diminution ratio, were derived from the middle age, i.e. Koryo period. The results of the study of Palsangjeon through Gilt-Bronze Pagoda analysis are as follows: 1. The structure of Gilt-Bronze Pagoda, a wooden pagoda from the Koryo period, is roughly classified into the accumulation type, using pipe pillars, and the one story type using whole pillars. In the accumulation type, stories are connected in either a flat format or an intervening format. The Gilt-Bronze Pagoda is mainly composed of pipe pillars, with some whole pillars. However, the central pillar was omitted in the building structure. Generally, the upper and lower stories are connected by pipe pillars in a crutch format. All the pillars, whether they are pipe pillars or whole pillars, used Naiten(內轉) technology. The Eave supporter has the Haang type(下昻) and the Muhaang type(無下昻). In most cases, high balustrades are furnished, but few tables of high balustrades have been found. The slanting roof formats have been handed down from Paekche(百濟), Silla(新羅), or Koryo(高麗). However, the structure of the octagon is assumed to be derived from Koguryo(高句麗). The structure of the Gilt-Bronze Pagoda from the Koryo period is mainly composed of accumulated flat squares, with some spire types. intervening format, the structure of Palsangjeon used whole pillars in a half story format in which upper level side pillars are installed on the lower level tie beam. From the Bronze Pagoda from the Koryo period, we can assume that the half story format of wooden pagodas that has stable vertical planes with a great successive diminution ratio was created during the mid-Koryo period at the latest and had been idly developed by the time of the Chosen Dynasty. 3. The whole pillars in Palsangjeon are also found in Gilt-Bronze Pagodas from the Koryo period. Hence, all of the pillars in Palsangjeon seem to have been handed down from the ancient construction technology. They were also used in the construction of wooden pagodas from the Koryo period. Therefore, it is assumed that Palsangjeon was constructed using the construction technology of the Chosen Dynasty that had been developed from the wooden pagoda construction technology of the Koryo period. The stable vertical planes with a great successive diminution ratio in Palsangjeon are derived from ancient Korean wooden pagodas, which have developed into indigenous Korean wooden pagodas with fairly stable vertical planes and a great design, in the half story format of Koryo and Chosen Dynasty. Therefore, it is assumed that the structure of Palsangjeon has a systematic relationship with traditional Korean wooden pagodas and is one of the indigenous Korean wooden pagoda structures. 4. In China, the intervening format has been mainly used between stories in multi-story architecture since the ancient days. At the same time, the flat format as also used in ancient and middle ages. However, the flat format was replaced by whole pillars during the Ming(明) and Manchu(淸) Dynasties, in favor of simple and compact construction. The half-story format, in which upper level side pillars are installed on tie beams, has been found in some cases, but it doesn't seem to have been the primary construction technology. Few traces of the half-story format have been found in multi-story architecture in Japan, and it has not been used as a general construction format. By contrast, the half-story format, which seems to have been derived from the Koryo period, was used as a general construction format in multi-story architecture of the Chosen Dynasty. The construction technology of multi-story architecture is related to that of multi-story wooden pagodas, but they have different production technologies. It seems that the structure of Palsangjeon did not just adopt the construction technology of multi-story architecture in the Chosen Dynasty, but it was developed from wooden pagodas in the Koryo period, including the Gilt-Bronze Pagoda. 5. Since the ancient days, most Chinese and Japanese wooden pagodas have adopted an accumulation type of structure using pipe pillars, with accumulated pointed towers. On the other hand, though most Korean wooden pagodas have also adopted an accumulation type of structure from the ancientdays, one story type using whole pillars was created in the Koryo and Chosen Dynasties. The wooden pagoda structure of Palsangjeon, with stable vertical planes in a half story format, is a unique Korean construction technology, different from the construction technologies of Chinese and Japanese wooden pagodas. This thesis clearly determined the structural characteristics of Palsangjeon. However, various remains have yet to be analyzed in depth, to establish an accurate construction technology system. In the beginning of this thesis, I had difficulty in precisely interpreting the internal structure of the Gilt-Bronze Pagoda from its appearance. However, in the process of study, the more serious problem was that there are few remains or ruins of multi-story architecture in ancient and the middle ages of Korea. Therefore, it is urgent to discover various remains in the future. This thesis succeeded in determining the structural characteristics of Palsangjeon. However, it fell short of clarifying the structural lineage of the stable vertical planes, although they show indigenous Korean architectural taste, representing the unique national emotion, and the construction format of multi-story wooden pagodas in Korea. I hope this is clarified in the future research.

  • PDF

IT교육 서비스품질이 교육만족도, 현업적용의도 및 추천의도에 미치는 영향에 관한 연구: 학습자 직위 및 참여동기의 조절효과를 중심으로 (A Study on the Influence of IT Education Service Quality on Educational Satisfaction, Work Application Intention, and Recommendation Intention: Focusing on the Moderating Effects of Learner Position and Participation Motivation)

  • 강려은;양성병
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.169-196
    • /
    • 2017
  • 제4차 산업혁명의 도래로 IT(information technology)를 활용한 다양한 융합기술에 대한 관심이 높아지고 있으며, 이에 따른 고품질의 IT관련 교육서비스 제공의 필요성 및 중요성 또한 점차 증대되고 있다. 한편, 일반적인 교육서비스 품질 및 만족도에 관한 연구는 그 동안 다양한 맥락에서 활발히 진행된 바 있으나, IT교육 참가자를 대상으로 한 IT교육 서비스품질의 역할을 살펴본 연구는 상대적으로 부족한 것으로 파악된다. 이에 본 연구에서는 SERVPERF 모형 및 관련 선행연구를 바탕으로 IT교육 맥락에서 IT교육 서비스품질의 다섯 가지 차원(유형성, 신뢰성, 반응성, 확신성 및 공감성)을 도출하고, 이러한 세부 IT교육 서비스품질 요인이 학습자의 교육만족도, 나아가 현업적용의도 및 추천의도에 미치는 영향을 검증하였다. 또한, 이러한 영향이 학습자 직위(실무자 집단/관리자 집단) 및 참여동기(자발적 참여집단/비자발적 참여집단)에 따라 어떻게 달라지는지에 대한 추가분석도 실시하였다. 서울 소재 'M'교육기관 203명의 IT교육 참가자 대상 설문을 활용한 구조방정식모형 분석 결과, IT교육 서비스품질의 다섯 가지 차원 가운데 유형성, 신뢰성 및 확신성이 교육만족도에 유의한 영향을 주는 것으로 나타났으며, 이러한 교육만족도는 현업적용의도와 추천의도에도 유의한 영향을 주는 것으로 조사되었다. 또한, IT교육 서비스품질이 교육만족도에 미치는 영향 관계에서 학습자 직위 및 참여동기가 유의한 조절효과를 가진다는 사실을 확인하였다. 본 연구는 SERVPERF 모형을 활용하여 IT교육 맥락에서 IT교육 서비스품질의 영향력을 실증한 최초의 연구라는 점에서 학술적 의의가 있다. 본 연구결과가 IT교육 서비스 제공기관의 교육만족도 제고 및 효율적인 서비스 운영을 위한 실질적인 지침을 제공해 줄 수 있을 것으로 기대한다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 (Product Community Analysis Using Opinion Mining and Network Analysis: Movie Performance Prediction Case)

  • 진위;김정수;김종우
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.49-65
    • /
    • 2014
  • 구전(WOM: Word of Mouth)는 주변 사람들에게 상품에 대한 경험을 입에서 입으로 전달하는 현상을 말하며 소셜 미디어의 발전으로 온라인 구전(eWOM: Electronic Word of Mouth) 형태로 발전하였다. 구전 효과의 중요성으로 인해서 대부분의 기업들의 자사의 상품이나 서비스에 대한 온라인 구전에 촉각을 세우고 있으며, 특히 영화와 같은 경험재의 경우에는 그 영향력이 더욱 크다. 본 연구에서는 영화 커뮤니티에 대한 사회 네트워크 분석을 통해서 영화 흥행성과 지표인 매출에 미치는 영향요인을 규명하고자 한다. 영화 흥행성과 연구들에서 주요하게 다루어진 영화에 대한 구전의 크기(volume)와 방향성(valence)과 같은 구전 요인들을 추가하여, 구전 네트워크의 중심성 척도를 영향 요인에 고려하였다. 구전의 크기, 방향성, 그리고 3가지 중심성 척도(연결 중심성, 매개 중심성, 근접 중심성)의 최종 영화 매출에 영향 관계를 가설로 설정하였다. 제시한 연구 모형을 검증하기 위하여 대표적인 온라인 영화 커뮤니티 사이트인 IMDb(Internet Movie Database)에서 영화 구전 데이터를 수집하였고, Box-Office-Mojo사이트에서 영화 매출 데이터를 수집하였다. 2012년 9월부터 1년 동안, 주간 Top-10에 포함된 적이 있는 영화들을 대상으로 하였으며, 총 103개의 영화가 선정되어 이 영화들에 대한 메타 데이터와 커뮤니티 데이터가 수집되었다. 영화 커뮤니티 네트워크는 평가자들간의 댓글 관계를 기초로 구축하였다. 본 연구에서 사용한 3가지 중심성 척도는 사회 네트워크 분석 도구인 NodeXL을 사용하여 계산되었으며, 각 영화별 커뮤니티 참여자들의 중심성 척도의 평균값을 활용하였다. 가설 검증의 사전 분석을 위한 상관관계 분석에서는 3가지 중심성 척도간에 상관 관계가 높은 것으로 파악되어서, 각각에 대하여 별도로 회귀분석을 수행하였다. 분석 결과, 기존 연구와 일관성 있게 구전의 크기와 방향성은 영화 성과지표인 최종 매출에 긍정적인 영향을 미치는 것으로 파악되었다. 또한 구전 네트워크 내의 참여자 매개중심성 평균은 영화의 최종 매출에 영향을 미치는 것으로 파악되었다. 하지만 연결중심성과 근접중심성은 최종 매출에 영향을 주지 못하는 것으로 나타났다.

적응형 부스팅을 이용한 파산 예측 모형: 건설업을 중심으로 (Bankruptcy Forecasting Model using AdaBoost: A Focus on Construction Companies)

  • 허준영;양진용
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.35-48
    • /
    • 2014
  • 2013년 건설 경기 전망 보고서에 따르면 주택건설경기 침체 상황의 지속으로 건설 기업의 유동성 위기가 지속될 것으로 전망된다. 건설업은 파산으로 인한 사회적 파급효과가 다른 산업에 비해 큰 편이지만, 업종의 특성상 다른 산업과는 상이한 자본구조와 부채비율, 현금흐름을 가지고 있어서 기업의 파산 예측이 더 어려운 측면이 있다. 건설업은 레버리지가 큰 산업으로 부채비율이 매우 높은 업종이며 현금흐름이 프로젝트 후반부에 집중되는 특성이 있다. 그리고 경기사이클에 따른 부침이 매우 심하여 경기하강국면에선 파산이 급증하는 양상을 보인다. 건설업이 레버리지 산업인 이상 건설업체의 파산율 증가는 여신을 공여한 은행에 큰 부담으로 작용한다. 그럼에도 그간의 파산예측모델이 주로 금융기관에 집중되어 왔고 건설업종에 특화된 연구는 드물었다. 기업의 재무 자료를 바탕으로 한 파산 예측 모델에 대한 연구는 오래 전부터 다양하게 진행되었다. 하지만, 일반적인 기업 전체를 대상으로 하는 모델이기 때문에, 건설 기업과 같이 유동성이 큰 기업의 예측에는 적절하지 못할 수 있다. 건설 산업은 오랜 사업 기간과 대규모 투자, 그리고 투자금 회수가 오래 걸리는 특징을 갖는 자본 집약 산업이다. 이로 인해 다른 산업과는 상이한 자본 구조를 갖기 마련이고, 다른 산업의 기업 재무 위험도를 판단하는 기준과 동일한 적용이 곤란할 수 있다. 최근에는 기계 학습을 바탕으로 한 기업 파산 예측 연구가 활발하다. 기계 학습의 대표적 응용 분야인 패턴 인식을 기업의 파산 예측에 응용한 것이다. 기업의 재무 정보를 바탕으로 패턴을 작성하고 이 패턴이 파산 위험 군에 속하는지 안전한 군에 속하는지 판단하는 것이다. 전통적인 Z-Score와 기계 학습을 이용한 파산 예측과 같은 기존 연구들은 특정 산업 분야가 아닌 일반적인 기업을 대상으로 하기 때문에 기업들의 특성을 전혀 고려하고 있지 못하다. 본 논문에서는 건설 기업을 규모에 따라 각 기법들의 예측 능력을 비교하여 적응형 부스팅이 가장 우수함을 확인하였다. 본 논문은 건설 기업을 자본금 규모에 따라 세 등급으로 분류하고 각각에 대해 적응형 부스팅의 예측력을 분석하였다. 실험 결과 적응형 부스팅이 다른 기법에 비해 예측 결과가 좋았고, 특히 자본금 규모가 500억 이상인 기업의 경우 아주 우수한 결과를 보였다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

지역 기록화를 위한 도큐멘테이션 전략의 적용 (Directions of Implementing Documentation Strategies for Local Regions)

  • 설문원
    • 기록학연구
    • /
    • 제26호
    • /
    • pp.103-149
    • /
    • 2010
  • 자치시대에 지방의 기록관리는 지역의 고유한 특성을 반영하여 독립적으로 추진할 필요가 있다. 그러나 아직 제대로 된 지방영구기록물관리기관이 한 곳도 설립되어 있지 않은 상황에서 다각적이고 적극적인 해결책을 모색할 필요가 있는데 지방기록관리의 방향을 '시설' 중심에서 '기록'과 '전문적 관리(사람)' 중심으로 바꾸는 것이 하나의 대안이다. 특히 중앙의 기록관리 프로세스라는 보편성에 매몰되었던 개별 지역의 다양성과 역동성을 찾기 위해서는 새로운 지역 기록화 전략을 적극 탐구할 필요가 있다. 도큐멘테이션 전략은 특정 지역, 주제, 사건 등에 관한 적절한 정보를 기록 생산자, 보존 기록관, 기록 이용자의 상호 협력을 통해 선별하여 수집하는 방법론으로서 80년대에 미국을 중심으로 제안되고 다양한 분야에서 다양한 방식으로 실험되어온바 있다. 이 연구에서는 도큐멘테이션 전략이 지역 기록화를 위한 방법론으로 어떤 의미를 갖는지 살펴보고 우리의 지역 환경에 적용하기 위해서 고려해야할 점과 추진 방향을 모색해보고자 하였다. 서구에서 개발된 도큐멘테이션 전략이 현 상황에서 우리에게 주는 시사점은 다음과 같다. 첫째, 아카이브즈 및 아키비스트의 능동적 역할을 추구하며 특히 지역사회에서 기록전문직의 가치를 인식시키는 데에 기여할 수 있다. 이 전략은 지방기록관리기관들은 행정사를 넘어서 지역사를 포괄적으로 기록화 하는 주체가 될 것을 촉구한다. 이에 따라 지방의 기록전문직들은 공공기록을 수동적으로 이관 받는 데에서 그치는 것이 아니라 능동적으로 지역의 기록을 수집하고 이를 서비스하기 위해 노력해야 한다. 둘째, 지역 내 기록 수집기관들의 협력을 통해 단일 조직의 기능 재현에서 폭넓은 사회적 재현을 성취할 수 있다는 점이다. 서구에서 이러한 협력 모델은 과도한 업무 부담으로 실패한 경우가 많았지만 디지털 환경은 새로운 가능성을 보여주고 있다. 지역 내에 존재하는 다양한 기록 생산 및 소장기관들과 협력을 통해 지역의 지식역량은 물론 지역정보서비스의 수준을 높일 수 있을 것이다. 셋째, 도큐멘테이션 전략은 다양한 집단들과의 연대를 추구한다. 이 전략은 도큐멘테이션 주제와 관련된 집단이나 공동체로부터 열정과 에너지, 전문지식을 가져올 수 있는 장점을 가지며, 도큐멘테이션 전략은 기억을 남기고자 하는 주체들이 실천적 기록문화운동을 추진하는 하나의 방법론을 제공할 수 있을 것이다. 이 연구에서는 우리의 지역 현실에 적합한 기록화 방향을 다음과 같이 제안하였다. 첫째, 선택적이고 집중적인 기록화를 지향한다. 지역에 관한 모든 영역에 관한 포괄적 기록화를 추진하기 보다는 지역의 로컬리티를 가장 잘 반영하는 영역과 대상을 선정하여 기록화를 추진한다. 지역을 구성하는 다양한 요소들인 사람, 사회 문화, 조직과 제도, 건조(建造) 환경, 공간 등이 상호작용하면서 만들어지고 변화하는 실체인 로컬리티를 규명하기 위해서는 전문가 집단과 지역민의 의견을 반영하는 구조가 필요하다. 둘째, 분산 보존과 통합적 재현을 지향한다. 기록화 주관기관은 다양한 기록 소장기관들과 소장자들을 연결하는 협력체계를 구축하여 분산 소장된 기록들을 통합적으로 검색할 수 있도록 한다. 즉, 한 지역의 역사 기록을 집중 보존할 기관을 정하기보다는 연계를 통한 기록화를 추진하는 것이 현실적일 것이다. 이를 위한 도구로서 지역 게이트웨이 구축을 제안하였다. 셋째, 열린 구조의 디지털 기록화를 지향한다. 지역 기록화는 맥락 재구성을 바탕으로 기록을 수집하는 방법론을 적용하게 되므로 선별된 기록에는 이미 수집자나 맥락 해석자의 의도가 반영되어 있다. 특히 맥락 분석에 의거하여 스토리를 구성하고 이에 따라 기록을 수집하거나 연계할 경우, 자의적이고 주관적인 선별이라는 비판을 받기 쉽다. 이러한 문제를 보완하기 위해 기록 맥락의 해석과 기록화 영역의 선정 등의 과정에 지역 내 다양한 집단의 의견이 반영될 수 있도록 해야 할 것이며, 디지털 네트워크를 통해 여러 집단 및 개인의 참여가 쉽게 이루어질 수 있도록 보장해야 한다. 넷째, 지역 내 협력기관들의 영역별 기록화 수준을 정한다. 기록화에 참여하는 기관들이 디지털 기록화에 맞는 역할을 분담 받아야 하고, 각 기관은 협력적 기록화에 참여함으로써 자관 이용자들에게는 더 나은 포괄적인 기록 서비스를 제공할 수 있을 것이다. 이를 위해 도서관의 디지털 장서개발에 활용하는 컨스펙터스 모형을 응용하여 디지털 기록화 방법론을 새롭게 설계할 것을 제안하였다.

부록 3. 모션캡쳐를 이용한 무형문화재의 기록작성 - 국가지정 중요무형문화재 승무·살풀이·태평무를 중심으로 - (Documentation of Intangible Cultural Heritage Using Motion Capture Technology Focusing on the documentation of Seungmu, Salpuri and Taepyeongmu)

  • 박원모;고중일;김용석
    • 헤리티지:역사와 과학
    • /
    • 제39권
    • /
    • pp.351-378
    • /
    • 2006
  • 매체의 발달과 함께 무형문화재에 대한 기록도 여러 가지 방법으로 시도되고 있는데, 과거에는 문자 기록에만 의존하던 것에서 최근에는 사진, 음원 및 영상 등을 많이 활용하게 되었고, 그 방식에 있어서도 아날로그 방식에서 디지털 방식으로 이행하고 있는 추세이다. 이러한 변화의 과정에서 모션캡쳐를 이용한 무형문화재의 기록은 3차원적 기록을 필요로 하는 무용종목 등에서 주목을 받고 있다. 모션캡쳐란 움직이는 물체에 공간상의 위치를 표시하는 센서를 부탁시키고 시간의 흐름에 따라 센서의 위치를 컴퓨터의 좌표공간에 치환하여 기록하는 시스템으로, 모션캡쳐를 이용한 무형문화재의 기록은 형체가 없이 사람의 기예에 의해서 전승되고 있는 무형문화재의 신체적 표현을 디지털화 된 데이터로 나타내줌으써 무형문화재의 보존을 위한 과학적 자료를 제공해 준다. 국립문화재연구소는 멀티미디어 및 디지털 시대에 대응하기 위해 무형문화재에 대한 새로운 기록방안 개발을 목적으로 영화 및 게임 등의 CG제작 현장에서 널리 사용되고 있는 모션캡쳐(Motion Capture) 장비를 이용하여 국가지정의 중요무형문화재에 대한 기록 작업을 실시하고 있다. 본 사업은 복권기금을 사용하여 2005년부터 2007년까지 3개년에 걸쳐서 국가지정의 중요무형문화재 중 신체적 동작이 중요하게 표현되고 있는 무용 7개 종목 11건의 모션캡쳐 작업을 실시할 예정이다. 이미 1차 년도인 2005년에는 승무, 살풀이춤, 태평무 등 기술적 난이도가 낮은 독무(獨舞)를 중심으로 데이터 축적작업을 실시하였고, 2차 년도인 2006년에는 진주검무, 승전무, 처용무 등 군무(群舞)의 데이터를 축적할 예정이며, 3차 년도인 2007년에는 학연화대합설무의 데이터 축적과 함께 축적된 데이터를 이용한 무형문화재의 비교 분석 및 전승을 위한 교육용 프로그램과 대국민 서비스를 위한 3차원 콘텐츠 등을 개발할 계획이다. 본 보고서에서는 사업 초년도인 2005년도에 실시된 보유자 이매방, 이애주, 정재만의 승무, 이매방의 살풀이춤, 강선영의 태평무 등의 모션캡쳐 작업에 대하여 기술하고 있다. 이를 통하여 무형문화재에 대한 새로운 기록 방안을 모색하기 위한 시도를 소개하려고 한다. 이번 사업에서는 기술적으로 다음과 같은 두 가지 문제가 제기되었다. 첫 번째, 장시간(20~30분 가량)의 보유자의 춤을 끊김 없이 모션캡쳐 받을 수 있는가라는 문제였다. 수 차례의 사전 모의테스트를 통해 사업수행 적합성 판단을 마쳤고, 결국 사업수행을 무사히 마칠 수 있었다. 두 번째, 리타겟팅(RE-Targeting)이 없이 정확한 모션캡쳐 동작을 가공해 낼 수 있는가라는 문제였다. 모션캡쳐 데이터에서 국내 최초로 보유자의 골격구조 역추출 방식을 도입하여 최대한 정확한 보유자의 춤 동작을 구현해낼 수 있었다. 이번 작업에서는 이매방, 이애주, 정재만, 강선영 네 보유자의 전신 삼차원 스캔을 통해 정확한 삼차원 신체 모델링을 얻었고, 보유자 본인의 춤사위 동작을 그대로 모션캡쳐에 적용함으로써 최대한 정확도를 유도할 수 있었다.