• 제목/요약/키워드: 데이터 관리기법

검색결과 2,340건 처리시간 0.032초

선형판별분석(LDA)기법을 적용한 국가연구시설장비 표준분류체계의 분류 정확도 검증 (Verifying the Classification Accuracy for Korea's Standardized Classification System of Research F&E by using LDA(Linear Discriminant Analysis))

  • 정석인;송영화;정의덕
    • 경영과정보연구
    • /
    • 제39권1호
    • /
    • pp.35-57
    • /
    • 2020
  • 정부는 연구시설장비가 과학기술의 발전을 견인하는 매우 중요한 도구이자, 수단으로 여겨지면서 국가적으로 R&D와 연구시설장비에 대한 예산 투자를 지속적으로 확대하였다. 또한, 기 구축된 국가연구시설장비의 효율적 운영 및 체계적 관리의 필요성이 점차 대두되면서 2010년 12월, 국가연구시설장비 표준분류체계를 개발하였다. 그러나 연구현장에서는 국가연구시설장비의 NTIS(National Science and Technology Service) 정보수집 초기단계로 누적정보 부족에 따른 표준분류체계의 과학적 검증절차 부재와 동일계층 간 분류기준의 비일관성 문제가 여전히 한계로 제기되고 있다. 따라서 본 연구는 지난 2010년, 2015년 각 제/개정된 국가연구시설장비 표준분류체계(대분류 8개, 중분류 25개, 소분류 410개)의 분류 정확도를 측정하고자 선형판별분석(LDA)과 분산분석(ANOVA) 기법을 적용하여 2단계로 분석하였다. 또한, 본 연구 분석을 위해 지난 10년 동안 NTIS에 누적 등록된 정보데이터(Big-Data) 50,271건을 수집하여 이를 활용하였다. 이는 단순히 국내외 유사 분류체계와 전문가 의견을 토대로 만들어진 현(現) 국가연구시설 표준분류체계를 과학적으로 실증 검증한 첫 연구 사례에 해당된다. 본 연구 결과, 대분류 이하 중분류와 소분류로 분류된 개체 수의 집단별 판별정확도는 92.2% 로 매우 높은 수준이었고, 분산분석을 통한 사후검증에서는 대분류 8개 중 2개 집단의 변별력이 다소 낮게 나타나, 현(現) 표준분류체계 중 일부 개선이 필요한 것으로 조사되었다. 본 연구를 통해 현(現) 국가연구시설장비 표준분류체계가 향후 지속적으로 개선되길 바란다.

단일 카테고리 문서의 다중 카테고리 자동확장 방법론 (A Methodology for Automatic Multi-Categorization of Single-Categorized Documents)

  • 홍진성;김남규;이상원
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.77-92
    • /
    • 2014
  • 텍스트에 대한 사용자의 접근성을 향상시키기 위해, 이들 문서는 정해진 기준에 따라 카테고리로 분류되어 제공되고 있다. 과거에는 카테고리 분류 작업이 수작업으로 수행되었지만, 문서 작성자에게 분류를 맡기는 경우 분류 정확성을 보장할 수 없고 관리자가 모든 분류를 담당하는 경우 많은 시간과 비용이 소요된다는 어려움이 있었다. 이러한 한계를 극복하기 위해 카테고리를 자동으로 식별할 수 있는 문서 분류 기법에 대한 연구가 활발하게 수행되었다. 하지만 대부분의 문서 분류 기법은 각 문서가 하나의 카테고리에만 속하는 경우를 가정하고 있기 때문에, 하나의 문서가 다양한 주제를 갖는 실제 상황과 부합하지 않는다는 한계를 갖는다. 이를 보완하기 위해 최근 문서의 다중 카테고리 식별을 위한 연구가 일부 수행되었으나, 이들 연구는 대부분 이미 다중 카테고리가 부여되어 있는 문서에 대한 학습을 통해 분류 규칙을 생성하므로 단일 카테고리만 부여되어 있는 기존 문서의 다중 카테고리 식별에는 적용할 수 없다는 제약을 갖는다. 따라서 본 연구에서는 이러한 제약을 극복하기 위해, 카테고리, 토픽, 문서간 관계 분석을 통해 단일 카테고리를 갖는 문서로부터 추가 주제를 발굴하여 이를 다중 카테고리로 자동 확장시킬 수 있는 방법론을 제안하였다. 실험 결과 원 카테고리가 식별된 총 24,000건의 문서 중 23,089건에 대해 카테고리를 확장시킬 수 있었다. 또한 정확도 분석에서 카테고리의 특성에 따라 카테고리 분류 정확도가 상이하게 나타나는 현상을 발견하였다. 본 연구는 단일 카테고리로 분류된 문서에 대해 다중 카테고리를 추가로 식별하여 부여함으로써, 규칙 학습 과정에서 다중 카테고리가 부여된 문서를 필요로 하는 기존 다중 카테고리 문서 분류 알고리즘의 활용성을 매우 향상시킬 수 있을 것으로 기대한다.

미세먼지 저감을 위한 그린인프라 계획요소 도출 - 텍스트 마이닝을 활용하여 - (Derivation of Green Infrastructure Planning Factors for Reducing Particulate Matter - Using Text Mining -)

  • 석영선;송기환;한효주;이정아
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.79-96
    • /
    • 2021
  • 그린인프라 계획은 미세먼지 저감을 위한 대표적인 조경 계획 방안 중 하나이다. 이에, 본 연구에서는 미세먼지 저감을 위한 그린인프라 계획 시 활용될 수 있는 요소를 텍스트 마이닝 기법을 활용하여 도출하고자 하였다. 미세먼지 저감계획, 그린인프라 계획 요소 등의 키워드를 중심으로 관련 선행연구, 정책보고서 및 법률 등을 수집하여 텍스트 마이닝을 통해 단어 빈도-역 문서 빈도(Term Frequency-Inverse Document Frequency, 이하 TF-IDF) 분석, 중심성 분석, 연관어 분석, 토픽 모델링 분석을 실시하였다. 연구결과, 첫째, TF-IDF 분석을 통해 미세먼지 및 그린인프라와 관련된 주요 주제어는 크게 환경문제(미세먼지, 환경, 탄소, 대기 등), 대상 공간(도시, 공원, 지역, 녹지 등), 그리고 적용 방법(분석, 계획, 평가, 개발, 생태적 측면, 정책적 관리, 기술, 리질리언스 등)으로 구분할 수 있었다. 둘째, 중심성 분석 결과, TF-IDF와 유사한 결과가 도출되었으며, 주요 키워드들을 연결하는 중심단어는 '그린뉴딜', '유휴부지'임을 확인할 수 있었다. 셋째, 연관어 분석 결과, 미세먼지 저감을 위한 그린인프라 계획 시, 숲과 바람길의 계획이 필요하며, 미기후 조절의 측면에서 수분에 대한 고려가 반드시 필요한 것으로 확인되었다. 또한, 유휴공간의 활용 및 혼효림의 조성, 미세먼지 저감 기술의 도입과 시스템의 이해가 그린인프라 계획 시 중요한 요소가 될 수 있음을 확인할 수 있었다. 넷째, 토픽 모델링 분석을 통해 그린인프라의 계획요소를 생태적·기술적·사회적 기능을 중심으로 분류하였다. 생태적 기능의 계획요소는 그린인프라의 형태적 부분(도시림, 녹지, 벽면녹화 등)과 기능적 부분(기후 조절, 탄소저장 및 흡수, 야생동물의 서식처와 생물 다양성 제공 등), 기술적 기능의 계획요소는 그린인프라의 방재 기능, 완충 효과, 우수관리 및 수질정화, 에너지 저감 등, 사회적 기능의 계획요소는 지역사회 커뮤니티 기능, 이용객의 건강성 회복, 경관 향상 등의 기능으로 분류되었다. 이와 같은 결과는 미세먼지 저감을 위한 그린인프라 계획 시 리질리언스 및 지속가능성과 같은 개념적 키워드 중심의 접근이 필요하며, 특히, 미세먼지 노출 저감의 측면에서 그린인프라 계획요소의 적용이 필요함을 시사한다고 볼 수 있다.

시간에 따른 생축 육계 가슴살의 표현형 변이 (Phenotypic Variation in the Breast of Live Broiler Chickens Over Time)

  • 김지원;한창호;이슬기;이준호;장수용;엄정욱;정강진;장재철;김현욱;양한술;손시환;오상현
    • 한국가금학회지
    • /
    • 제51권2호
    • /
    • pp.97-106
    • /
    • 2024
  • 본 연구는 육계(Ross 308, Arbor Acres)에서 나타나는 가슴살 경화도를 비침습적 디지털 촉진장치인 MyotonPRO®를 사용하여 분석하였다. 이 논문의 목적은 육계의 생축에서 가슴 경직성의 변이를 측정할 수 있는가와 그 변이가 다른 형질과 어떤 상관을 갖는 지 알아보는 것이다. 연구결과, Ross 308과 Arbor Acres 모두에서 주령에 따라 가슴살 경화도의 변화가 관찰되었으며, 특히 2주차와 8주차에 높은 심각도를 보였다. 연구된 다양한 측정 형질들은 모두 WB의 발현과 관련이 있음을 보여준다. 또한, 가슴살의 무게와 가슴살 경화도 간에는 높은 양의 상관관계가 관찰되어, 증가하는 가슴살 무게가 가슴살 경화도 증가와 연관될 수 있음을 시사한다. 본 연구에서는 Ross 308과 Arbor Acres 품종의 가슴살 Stiffness를 측정하고 이를 WB 현상이 보고된 Ross 708의 데이터와 비교했으며, Ross 308과 Arbor Acres에서는 Ross 708에 비해 상대적으로 낮은 Stiffness 수치가 관찰되어 WB 현상이 발현되지 않았음을 시사한다. 이 결과는 품종에 따른 가슴살의 특성 차이를 나타내며, WB 발현에 영향을 미치는 요인에 대한 추가 연구가 필요하다고 사료된다. 사양 실험에서 나타난 결과는 Ross 308과 Arbor Acres 품종에서 WB 발생률과 관리 전략에 대한 이해를 높이는데 기여하며, 더 나아가 가금산업에서 WB를 줄이기 위한 유전적 선발 및 사육 관리 기법 개발에 중요한 정보를 제공할 것으로 기대된다. 또한 본 연구에서는 MyotonPRO® 장비의 효율성과 한계에 대한 평가도 포함되어 있으므로 향후 연구에서는 이 장비의 활용성을 더욱 개선할 수 있는 방안을 모색하는 데 기여하고자 한다.

장기간 SPOT/VEGETATION 정규화 식생지수를 이용한 지면 변화 탐지 개선에 관한 연구 (The Study of Land Surface Change Detection Using Long-Term SPOT/VEGETATION)

  • 염종민;한경수;김인환
    • 한국지리정보학회지
    • /
    • 제13권4호
    • /
    • pp.111-124
    • /
    • 2010
  • 지표면의 환경변화를 관측하는 것은 토지사용과 기후변화, 기상연구, 농업, 지표면의 에너지 균형 및 환경시스템에 매우 중요한 연구로 이용되어지고 있다. 최근 위성영상을 이용한 변화탐지는 국지 단위 환경변화 탐지를 위해 그 필요성이 높아지고 있는 실정이며, 특히 잦은 개발과 변화로 주기적인 탐지가 필요한 도심지역의 변화탐지는 국토환경변화 및 지역계획 연구에 대한 효율적인 의사결정 지원이 가능하므로 그 활용성이 매우 높아지고 있다. 이러한 배경으로, 위성 영상을 이용한 원격탐사 자료를 활용한 분석은 비교적 짧은 시간에 광범위한 지역의 영상 정보를 취득할 수 있기 때문에 국토 환경변화 관리 분야에서의 적용 가능성이 높다. 본 연구에서는 인공위성 자료를 활용하여 변화탐지를 수행할 때 공간정보 추출의 정확성을 높이는 기술 개발을 위해 시계열자료의 통계적 분석을 통한 변화탐지기법 개발을 수행하였다. 전처리된 자료를 이용하여 정규화 식생지수를 산출하고 K-mean clustering 무감독 분류를 통해 처리된 데이터를 연구영역의 10년간 자료를 이용한 평균 정규화 식생지수 값과 표준편차 값을 계산하여 각각의 화소별 상대적인 변화량을 측정하여 변화 정도를 탐지하였다. 일반적으로 변화 탐지 수행 시, 태양광 채널을 이용할 경우 기하학적 특성에 의해 발생하는 방향성 효과를 보정하여야 한다. 본 연구에서는 대기 보정과 방향성 보정이 수행된 중 저해상도 정규화 식생지수를 이용하여 객관적인 변화 임계치 값을 결정하였다. 연구결과 반사도 값의 차이를 이용한 변화탐지보다 객관적이고 명확하게 변화지역을 탐지할 수 있었다.

도로설계 적정화를 위한 새로운 지형구분에 관한 연구 (Development of a New Terrain Type Classification to be used in Highway Design)

  • 김상엽;최재성;이승용;한형관
    • 한국도로학회논문집
    • /
    • 제8권4호
    • /
    • pp.49-62
    • /
    • 2006
  • 우리나라는 그동안 사회기반시설로서 도로역할을 중시하여 도로부문에 매년 대규모 예산을 투입했다. 그 결과 개발이 용이한 평탄지를 중심으로 한 국가 기간 도로망 체계 확보에 결실이 있었다. 그러나 앞으로 지속적인 도로망 체계를 건설하기 위해서는 산악지형과 같은 고비용이 들어가는 지형에 대해서 효율적으로 개발해야 하는 과제를 안고 있다. 이러한 지형은 도로 설계속도 결정단계에서 고려되어야 할 중요한 입력변수이다. 그럼에도 불구하고 현재 도로설계기준상에는 지형구분을 위한 명확하고 객관적인 판단기준이 제시되어 있지 않기 때문에 설계속도가 부정확하게 결정될 수도 있다. 본 연구는 지형구분의 필요성에 대해 인지하고 고도 및 경사 그리고 주행속도 자료를 바탕으로 합리적으로 지형구분을 하였으며, 연구결과는 다음과 같다. 첫째, 본 연구에서는 GIS data를 이용하여 고도와 경사도에 따라 지형을 9가지 AREA로 분류하였으며, 지형분류 data(AREA)와 주행속도 자료를 matching하여 분석한 결과, AREA의 분류에 따른 특성이 주행속도에 영향을 미치는 것으로 나타났다. 둘째, 본 연구에서는 고도와 경사도에 따른 지형분류와 지형분류에 따른 그룹 간 주행속도의 유의성 분석 결과를 근거로 해서 평지, 구릉지, 산지로 우리나라 지형을 구분하였다. 본 연구는 일반국도를 대상으로 한 주행 속도자료를 이용하였기 때문에 지방도나 군도등 기능이 다른 도로에 대해서는 적용상의 한계가 있으나, 향후 도로건설시 도로가 통과하는 지역의 지형적 특성을 반영 할 수 있는 하나의 기준이 될 것으로 기대된다.트 탄성계수나 슬래브 두께가 증가하던지 또는 지반 탄성계수가 감소하면 최대 응력이 생기는 종방향 상 위치가 양쪽 바깥축에서 중간축의 위치로 바뀌게 된다. 문합군(52%)에 비해 통계적으로 유의한 차이를 보였다(p<0.01). 결론: 식도-위 문합 시 경부 문합은 흉부 문합에 비해 문합부 협착의 빈도는 차이가 없고, 역류성 식도염의 빈도는 현저히 적으며, 식도암의 경우 더 여유 있는 절제면을 제공할 수 있는 장점이 있으리라 판단된다. 따라서 식도절제술 및 위-식도 문합 시 특별한 금기증에 해당하지 않는다면 경부 문합을 선호할 수 있을 것으로 생각된다. 문합 방법에 따른 역류성 식도염과 협착의 빈도에서는 유의한 차이를 발견할 수 없었으나, 수술 시간의 단축 등의 몇몇 장점으로 인해 기계 문합을 선호할 수 있을 것으로 생각된다. 향후 식도암의 수술 기법과 술 후 관리의 향상으로 인하여 문합 부위의 역류로 인한 증상과 환자의 일상 생활의 질에 대한 중요성이 지속적으로 강조될 것으로 생각되며, 이에 따른 적극적인 anti-reflux 수술에 대한 고려도 필요할 것으로 생각된다.$14.7{\pm}2.7$ mL로 각 군 간에 통계적인 유의성이 있었다(p<0.05). 혈청내 칼륨 농도는 I군에서 II군에 비해 소생술 후 의의 있게 높았으며(p<0.05), 포도당 농도는 II단계의 I군에서 타군과 비교하여 현저히 낮았다(p<0.05). IL-8은 I 군 $1,834{\pm}437$ pg/mL, II 군 $1,006{\pm}532$ pg/mL,

  • PDF

권역별 입지$\cdot$토양 환경 요인에 의한 임지생산력 추정 (Estimation of forest Site Productivity by Regional Environment and Forest Soil Factors)

  • 원형규;정진현;구교상;송명희;신만용
    • 한국농림기상학회지
    • /
    • 제7권2호
    • /
    • pp.132-140
    • /
    • 2005
  • 본 연구에서는 기존의 지위지수 추정식의 문제점을 보완하기 위해 수치 산림입지도에서 추출한 28개 입지환경 인자 중에서 몇 가지 인자만으로 구성된 최적의 조합에 의해 지역별 주요수종에 대한 지위지수 추정식을 개발하고자 하였다. 본 연구결과에서 도출된 지위지수 추정식에서 채택된 수종별 입지환경 인자는 $4\~5$개로 소수이지만 추정식의 설명력을 나타내는 결정계수가 0.90 이상으로 높은 추정능력을 보였다 이와 같이 개발된 지역별$\cdot$수종별 지위지수 추정식에 대하여 권역별로 수집한 수종별 독립자료를 사용하여 모형의 평균 편의, 정도, 표준오차 등의 3가지 평가통계량에 근거한 검증결과 본 연구에서 도출된 지위지수 추정식의 실용성을 입증할 수 있었다. 지위지수 추정식의 검증결과를 보면 전반적으로 본 연구에서 개발된 수종별 지위지수 추정식의 평가통계량은 낮은 것으로 판명되어 실제 적용하는데는 문제가 없는 것으로 평가되었다. 따라서 본 연구에서 개발한 지역별 주요 수종의 지위지수 추정식은 몇 가지의 입지환경 인자만으로도 지역별 특성을 고려한 수종별 지위지수를 추정할 수 있는 것으로 판명되어 앞으로 활용가치가 높을 것으로 평가된다 특히 본 연구에서 얻어진 결과는 수종별 적지판정과 이를 통한 산림의 경영 및 관리에 유용한 정보로 활용될 수 있을 것으로 기대된다. 또한 본 연구에서 개발된 지위지수 추정식과 산림입지도면의 데이터를 이용하면 지위지수 추정의 전산화가 가능할 것으로 판단되며, GIS 기법을 이용한 적지적수 선정 프로그램의 알고리즘에 수종별 적지분석을 위해 본 연구에서 조제한 지위지수 추정식을 적용하면 보다 정확한 의사결정이 가능할 것으로 기대된다. 하지만 본 연구에서는 일부 수종에 대한 지위지수 추정식을 개발하였기 때문에 실제 적용에는 한계를 가지고 있다. 이를 해결하기 위해서는 앞으로 충분한 입지환경 인자에 대한 자료를 확보하여 다양한 수종에 지위지수 추정식을 개발하는 작업이 이루어져야 하며, 이를 통해 입지조건에 따른 적지적수 선정 문제를 해결하기 위한 노력을 지속해야 할 것이라고 생각된다.

전시 공간에서 다중 인터랙션을 위한 개인식별 위치 측위 기술 연구 (The Individual Discrimination Location Tracking Technology for Multimodal Interaction at the Exhibition)

  • 정현철;김남진;최이권
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.19-28
    • /
    • 2012
  • 전시 공간에서 관객들의 반응에 따른 다중 인터랙션 서비스를 제공하기 위해서는 관람객의 정확한 위치 및 이동 경로를 얻기 위한 위치 추적 기술이 필요하다. 실외 환경에서 위치 추적을 위한 기술로 GPS가 현재 널리 사용되고 있다. GPS는 빠른 속도로 이동하는 이동체의 위치를 실시간으로 파악할 수 있으므로 위치 추적 서비스(Location Tracking Service)를 요구하는 분야에서 중요한 기술로 활용된다. 하지만 위성을 이용한 위치 추적 기법을 사용하기 때문에 위성 신호를 잡을 수 없는 실내에서는 사용할 수 없다는 단점이 있다(Per Enge et al., 1996). 위와 같은 이유로 Wi-Fi 위치 측위 기술을 비롯하여 ZigBee, UWB, RFID 등의 초단거리 통신 기술 등 다양한 형태의 실내 위치 측위 연구가 진행되고 있다(Schiler and Voisad, 2004). 하지만 이러한 기술들은 전시 공간에서 얻고자 하는 위치정보의 밀도가 높아질수록 구현의 난이도가 높아지고 구축 및 관리 비용도 커지며 구축 가능한 환경이 제약된다는 단점이 있다. 이와 같은 문제를 해결하기 위하여 본 논문에서는 실내 환경에서 스마트폰을 이용한 Wi-Fi 위치 측위 데이터를 기반으로 하여 3D카메라의 Depth Map 정보와의 매핑을 통해 사용자들을 식별하고 위치를 추적하는 시스템을 제안한다.

언어네트워크분석을 활용한 한국농수산대학 신입생 자기소개서 분석 - TF-IDF 분석을 기초로 - (Analyzing Self-Introduction Letter of Freshmen at Korea National College of Agricultural and Fisheries by Using Semantic Network Analysis : Based on TF-IDF Analysis)

  • 주진수;이소영;김종숙;김승희;박노복
    • 현장농수산연구지
    • /
    • 제23권1호
    • /
    • pp.89-104
    • /
    • 2021
  • 비정형 데이터인 한국농수산대학 신입생 자기소개서에서 의미 있는 정보를 추출하기 위하여 핵심적인 역할을 하는 단어의 중요도를 평가하는 TF-IDF 가중치를 기초로 한 언어네트워크분석을 하였다. TF-IDF 가중치에 의한 핵심단어는 문항 1에서는 '농업', '수학', '공부', '문제', '친구', 문항 2에서는 '동아리', '식물', '친구', '농업', '작물', 문항 3에서는 '친구', '동아리', '의견', '갈등', '관리', 문항 4에서는 '버섯', '곤충', '아버지', '농업', '농장' 등으로 나타났다. 또한 빈도수는 낮은 단어이지만 핵심단어로 나타난 단어를 보면 문항 1에서는 '수학', '자격증', '성적', '영어', '과학', 문항 2에서는 '식물', '작물', '공부', '쓰레기', '발표', '실험', 문항 3에서는 '동아리', '청소', '봉사', '갈등', '봉사활동', 문항 4에서는 '버섯', '곤충', '양식', '한우', '조경' 등으로 나타났다. 단어들 간의 관계를 시각적으로 분석이 가능한 언어네트워크분석 결과 매개중심성이 높은 단어는 문항 1에서는 '이유', '고등학교', '재학', 문항 2에서는 '쓰레기', '고등학교', '학교', 문항 3에서는 '중요', '오해', '완성', 문항 4에서는 '가공', '사료', '농가'로 나타났다. 연결정도중심성은 문항 1에서는 '고등학교', '탐구', '성적', 문항 2에서는 '쓰레기', '정리', '수업시간', 문항 3에서는 '의견', '회의', '봉사활동', 문항 4에서는 '가공', '공간', '실습'으로 나타났다. 매개중심성 값이 클수록 네트워크의 중앙에 위치하고, 두 범주 사이의 관계가 강할수록 서로 근거리에 위치한다. 연결정도중심성이 클수록 노드의 크기가 크게 나타나며, 노드 연결선은 단어들의 동시 출현 빈도가 높을수록 edge가 굵게 나타났다. 동시 출현 빈도가 높은 즉 상관관계가 높은 단어 조합은 '자격증 - 취득', '문제 - 해결', '과학 - 생명', '오해 - 양보' 등으로 나타났다. 단어 기반의 계층적 클러스터링 기법에 의하여 단어 간 인접, 상호 관계를 계층적으로 나타낸 클러스터 덴드로그램으로 군집의 개수를 결정하였다. 단어들의 군집 간 비유사도의 차이가 큰 군집을 구한 결과 문항 1은 2개, 문항 2와 문항 4는 4개, 문항 3은 5개의 군집으로 분류할 경우 군집내 응집력이 높고, 군집 간 이질성이 큰 적절한 군집을 구할 수 있었다.

사례 기반 지능형 수출통제 시스템 : 설계와 평가 (Export Control System based on Case Based Reasoning: Design and Evaluation)

  • 홍원의;김의현;조신희;김산성;이문용;신동훈
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.109-131
    • /
    • 2014
  • 최근 전 세계적인 원전 설비의 수요 증가로 원자력 전략물자 취급의 중요성이 높아지는 가운데, 국외 수출을 위한 원전 관련 물품 및 기술의 신청 또한 급증하는 추세이다. 전략물자 사전판정 업무는 통상 원자력 물자 관리에 해박한 전문가의 경험 및 지식에 근거하여 수행되어 왔지만, 급증하는 수요에 상응하는 전문 인력의 공급이 부족한 실정이다. 이러한 문제를 극복하기 위하여, 본 연구진은 전략물자 수출 통제를 위한 사례 기반 지능형 수출 통제 시스템을 설계 및 개발하였다. 이 시스템은 현장 전문가의 전담 업무이던 신규 사례에 대한 전략물자 사전판정 과정 업무의 주요 맥락을 자동화 하여 전문가 및 관계 기관이 감당해야 할 업무 부담을 줄이며, 빠르고 정확한 판정을 돕는 의사결정 지원 시스템의 역할을 맡는다. 개발된 시스템은 사례 기반 추론 (Case Based Reasoning) 방식에 기반을 두어 설계되었는데, 이는 과거 사례의 특성을 활용하여 신규 사례의 해법을 유추하는 추론 방법이다. 본 연구에서는 자연어로 작성된 전자문서 처리에 널리 사용되는 텍스트 마이닝 분석 기법을 원자력 분야에 특화된 형태로 응용하여 전략물자 수출통제 시스템을 설계하였다. 시스템 설계의 근거로 선행 연구에서 제안된 반자동식 핵심어 추출 방안의 성능을 보다 엄밀히 검증하였고, 추출된 핵심어로 신규 사례와 유사한 과거 사례를 추출하는 알고리즘을 제안하였다. 제안된 방안은 텍스트 마이닝 분야의 TF-IDF 방법 및 코사인 유사도 점수를 활용한 결과(${\alpha}$)와 원자력 분야에서 통용되는 개념적 지식을 계통으로 분류하여 도출한 결과(${\beta}$)를 조합하여 최종 결과 (${\gamma}$) 를 생성하게 된다. 세부 요소 기술의 성능 검증은 임상 데이터를 활용한 실험 및 실무 전문가의 의견수렴을 통해 이루어졌다. 개발된 시스템은 사전판정 전문 인력을 다수 양성하는 데 드는 비용을 절감하는 데 일조할 것이며, 지식서비스 산업의 의미 있는 응용 사례로서 관련 산업의 성장에 기여할 수 있을 것으로 보인다.