• 제목/요약/키워드: 지식기반 데이터 마이닝

검색결과 128건 처리시간 0.024초

사례 기반 지능형 수출통제 시스템 : 설계와 평가 (Export Control System based on Case Based Reasoning: Design and Evaluation)

  • 홍원의;김의현;조신희;김산성;이문용;신동훈
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.109-131
    • /
    • 2014
  • 최근 전 세계적인 원전 설비의 수요 증가로 원자력 전략물자 취급의 중요성이 높아지는 가운데, 국외 수출을 위한 원전 관련 물품 및 기술의 신청 또한 급증하는 추세이다. 전략물자 사전판정 업무는 통상 원자력 물자 관리에 해박한 전문가의 경험 및 지식에 근거하여 수행되어 왔지만, 급증하는 수요에 상응하는 전문 인력의 공급이 부족한 실정이다. 이러한 문제를 극복하기 위하여, 본 연구진은 전략물자 수출 통제를 위한 사례 기반 지능형 수출 통제 시스템을 설계 및 개발하였다. 이 시스템은 현장 전문가의 전담 업무이던 신규 사례에 대한 전략물자 사전판정 과정 업무의 주요 맥락을 자동화 하여 전문가 및 관계 기관이 감당해야 할 업무 부담을 줄이며, 빠르고 정확한 판정을 돕는 의사결정 지원 시스템의 역할을 맡는다. 개발된 시스템은 사례 기반 추론 (Case Based Reasoning) 방식에 기반을 두어 설계되었는데, 이는 과거 사례의 특성을 활용하여 신규 사례의 해법을 유추하는 추론 방법이다. 본 연구에서는 자연어로 작성된 전자문서 처리에 널리 사용되는 텍스트 마이닝 분석 기법을 원자력 분야에 특화된 형태로 응용하여 전략물자 수출통제 시스템을 설계하였다. 시스템 설계의 근거로 선행 연구에서 제안된 반자동식 핵심어 추출 방안의 성능을 보다 엄밀히 검증하였고, 추출된 핵심어로 신규 사례와 유사한 과거 사례를 추출하는 알고리즘을 제안하였다. 제안된 방안은 텍스트 마이닝 분야의 TF-IDF 방법 및 코사인 유사도 점수를 활용한 결과(${\alpha}$)와 원자력 분야에서 통용되는 개념적 지식을 계통으로 분류하여 도출한 결과(${\beta}$)를 조합하여 최종 결과 (${\gamma}$) 를 생성하게 된다. 세부 요소 기술의 성능 검증은 임상 데이터를 활용한 실험 및 실무 전문가의 의견수렴을 통해 이루어졌다. 개발된 시스템은 사전판정 전문 인력을 다수 양성하는 데 드는 비용을 절감하는 데 일조할 것이며, 지식서비스 산업의 의미 있는 응용 사례로서 관련 산업의 성장에 기여할 수 있을 것으로 보인다.

주경로 분석과 연관어 네트워크 분석을 통한 '구전(WoM)' 관련 연구동향 분석 (Analysis of Research Trends of 'Word of Mouth (WoM)' through Main Path and Word Co-occurrence Network)

  • 신현보;김혜진
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.179-200
    • /
    • 2019
  • 구전(Word-of-Mouth) 활동은 오래 전부터 기업의 마케팅 과정에서 중요성을 인식하고 특히 마케팅 분야에서 많은 주목을 받아왔다. 최근에는 인터넷의 발달에 따라 온라인 뉴스, 온라인 커뮤니티 등에서 사람들이 지식과 정보를 주고 받는 방식이 다양해지면서 구전은 후기, 평점, 좋아요 등으로 입소문의 양상이 다각화되고 있다. 이러한 현상에 따라 구전에 관한 다양한 연구들이 선행되어왔으나, 이들을 종합적으로 분석한 메타 분석 연구는 부재하다. 본 연구는 학술 빅데이터를 활용해 구전 관련 연구동향을 알아내기 위해서 텍스트 마이닝 기법을 적용하여 주요 연구들을 추출하고 시기별로 연구들의 주요 쟁점을 파악하는 기법을 제안하였다. 이를 위해서 1941년부터 2018년까지 인용 데이터베이스인 Scopus에서 'Word-of-Mouth'라는 키워드로 검색되는 총 4389건의 문헌을 수집하였고, 영어 형태소 분석과 불용어 제거 등 전처리 과정을 통해 데이터를 정제하였다. 본 연구는 학문 분야의 발전 궤적을 추적하는 데 활용되는 주경로 분석기법을 적용해 구전과 관련된 핵심 연구들을 추출하여 연구동향을 거시적 관점에서 제시하였고, 단어동시출현 정보를 추출하여 키워드 간 네트워크를 구축하여 시기별로 구전과 관련된 연관어들이 어떻게 변화되었는지 살펴봄으로써 연구동향을 미시적 관점에서 제시하였다. 수집된 문헌 데이터를 기반으로 인용 네트워크를 구축하고 SPC 가중치를 적용하여 키루트 주경로를 추출한 결과 30개의 문헌으로 구성된 주경로가 추출되었고, 연관어 네트워크 분석을 통해서는 시기별로 온라인 시대, 관광 산업 등 다양한 산업군 등 산업 변화가 반영돼 시대적 변화와 더불어 발전하고 있는 학술적 영역의 변화를 확인할 수 있었다.

한국, 중국, 일본 철도연구기관 특허 및 논문실적 비교분석 (The Comparative Analysis of Outcomes on Patents and Papers of Railway Research Institutes in Korea, China and Japan)

  • 백승현;이윤주
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.455-460
    • /
    • 2020
  • 한국, 중국, 일본 정부는 철도에 대한 종합연구기관을 설립하여 운영하고 있다. 한국철도기술연구원, 중국철도과학연구원, 일본철도종합기술연구소는 각 국가의 대표적인 철도종합연구기관으로서, 철도원천기술 및 시스템기술개발에 집중하고 있다. 이 기관들은 특허와 논문 실적을 지속적으로 도출하고 있으며, 특허 및 논문을 통해 각 기관들의 연구성과를 비교 분석할 수 있다. 윈텔립스 DB를 이용하여 2000년 이후 공개특허를 비교한 결과, 특허의 양적 경쟁력에서는 한국철도기술연구원이 1,923건으로 가장 앞서는 것으로 나타났고, 질적 경쟁력에서는 한국철도기술연구원이 토목분야의 특허시장지수가 1.04, 특허영향력지수가 1.33으로 높게 나타났으며 일본철도종합기술연구소가 철도전력분야 특허시장지수가 1.16, 특허영향력지수가 1.32로 높게 나타났다. 세 기관 모두 자국 특허출원 비중이 매우 높게 나타났으나, 한국철도기술연구원이 상대적으로 PCT 출원 108건 등 해외 지식재산권 경쟁력 확보노력을 가장 많이 하는 것으로 나타났다. Scopus DB를 이용하여 논문발표를 비교한 결과, 중국철도과학연구원이 1,527건으로 가장 많은 논문을 발표하였지만, 2015년부터는 한국철도기술연구원이 매년 100건 이상의 논문을 발표하며 가장 많은 실적을 나타냈다. 피인용도를 중심으로 논문영향력을 살펴본 결과, 한국철도기술연구원의 논문영향력지수가 0.45로서 두 기관보다 높은 경쟁력을 갖고 있었다. 향후 세 기관의 특허·논문 정보에 대한 텍스트마이닝 등 빅데이터분석을 활용하여, 기관별 중점연구영역 및 유망기술분야를 도출하고, 과학적 증거에 기반한 철도기술개발 중장기발전계획 등의 수립이 필요할 것으로 판단된다.

핵심 기술 및 특허 추출을 위한 IP 마이닝에 관한 연구 (A Novel Methodology for Extracting Core Technology and Patents by IP Mining)

  • 김현우;김종찬;이준혁;박상성;장동식
    • 한국지능시스템학회논문지
    • /
    • 제25권4호
    • /
    • pp.392-397
    • /
    • 2015
  • 최근 사회는 아날로그 시대를 거쳐 디지털, 스마트 시대로 접어들었고, 모든 분야의 기술은 끊임없는 변화와 매우 빠른 발전을 하고 있다. 이러한 경쟁사회에서 지식재산, 특히 특허분석을 통한 R&D 전략 수립은 기술경쟁력 향상에 많은 도움이 될 수 있다. 특허문서는 명칭, 요약, 상세한 설명, 청구항, 기술분류정보 등 서지정보, 기술문헌과 권리문헌으로 이루어져 있어 대중은 이를 통해 해당 기술에 대한 많은 정보를 수집할 수 있다. 특허문서의 특징을 정량적으로 활용하고 기술 분석을 실시함으로써 분석대상 기술의 동향을 파악하는 것뿐만 아니라, 해당 기술 분야의 핵심기술과 특허를 탐색하여 경쟁력을 향상시키는 것이 가능하다. 본 논문은 특허 데이터에 대한 정량적인 방법을 기반으로 한 핵심 기술과 핵심 특허의 도출 방법을 제안한다. 특허문서에 포함되어 있는 기술분류정보, IPC 코드에 통계분석과 사회네트워크분석을 적용하여 연구개발이 활발한 분야와 중심성이 높은 기술을 탐색한다. 그 후 특허의 인용정보와 패밀리정보 분석을 통해 핵심 기술 분야에서 중요성이 높은 특허를 추출하여, 최종적으로 기술경영 및 특허경영 전략 수립 방법을 제안한다.

데이터마이닝 알고리즘의 분류 및 분석 (Classification and Analysis of Data Mining Algorithms)

  • 이정원;김호숙;최지영;김현희;용환승;이상호;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.279-300
    • /
    • 2001
  • 지식탐사 프로세스의 핵심적인 역할을 담당하는 데이터마이닝 단계에서는 여러 가지 목적에 따라 알고리즘을 선택하여 사용한다. 최근 통계, 비즈니스, 전자 상거래, 의학, 생물학 등의 분야에서 데이터마이닝 기술아 적극적으로 활용되고 있으며, 이를 위해 다양한 알고리즘들이 계속해서 연구.개발되고 있다. 그러나 시간이 지나면 이들 중 각 분야 별로 우수한 응용성을 보이는 알고리즘이나 방대한 양의 데이터를 다루는데 있어 좋은 성능을 보이는 몇몇 알고리즘만이 남게 될 것이며 또한 앞으로는 이러한 알고리즘들만을 선별하여 집중 연구할 필요가 있다. 따라서 본 논문에서는 데이터마이닝에 널리 사용되고 활발한 연구가 진행중인 알고리즘들 중에서 연관규칙(association rule), 클러스터링(clustering), 신경망(neural network), 결정트리(decision tree), 유전자 알고리즘(genetic algorithm), 베이지안 네트워크(bayesian network), 메모리 기반 추론(memory-based reasoning)등 7가지 카테고리에 속하는 알고리즘들을 선정하여 분류.분석하였다. 우선 각 알고리즘의 계통과 특성들을 분석하였고 이를 토대로 비교.분석을 위한 14가지의 분류 기준을 제시하였다. 이러한 분류 기준에 근거하여 세부 알고리즘들을 분석해 보고 비교 가능한 일부 알고리즘은 여러 특징과 성능을 중심으로 각각 최상의 알고리즘을 도출해 보았다. 본 연구 결과는 데이터마이닝 분야의 흔재된 알고리즘들을 분류.분석함으로써 마이닝 기술 적용시 사용자에게 알고리즘 선택의 지표를 제시할 수 있을 것이다.

  • PDF

국내외 단행본 분석을 통한 국제연구협력 동향 연구 (Research on Trends in International Research Cooperation through Analysis of International Research Cooperation Books)

  • 노영희;곽우정
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.35-44
    • /
    • 2022
  • 본 연구에서는 국제협력을 주제로 발행된 단행본이 어떠한 특징을 가지고 있는지, 이 단행본을 통해 어떠한 국제협력 관련 연구가 수행되고 있으며, 주요한 국제협력 내용은 무엇인지를 확인하고자 하였다. 이러한 연구목적을 달성하기 위하여 국내외의 국제연구협력 단행본 데이터 구축, 통계분석, 텍스톰을 기반으로 한 텍스트 마이닝 수행 등을 수행하였다. 연구 결과, 2010년대 이후부터 국제연구 및 국제협력에 대한 특히 높은 관심을 보이고 있는 것으로 알 수 있었으며, 국내외 연구자, 저자, 국공립기관, 사립기관 등 다양한 개인 및 단체에서 국제연구협력 단행본 발간을 통해 국제협력을 통해 개발, 경제, 기술, 발전, 지역, 관계 등을 중심으로 관심을 가지고 있으며 발전을 도모하고자 함을 알 수 있었다. 뿐만 아니라 환경, 무역, 교육, 사회 등의 주제 등도 나타나 환경이나 무역, 교육 등을 중심으로 한 국제연구협력의 관심도도 높아 국제화와 국제적인 협력에 대하여 경제나 지역 관계, 발전을 넘어서 환경, 무역, 교육, 사회 전반에 영향력이 높은 것으로 파악되었다. 본 연구를 통해 국제연구협력을 주제로 출판된 일부 단행본의 특징을 확인하는 기초 연구가 될 수 있다는 점, 국가별, 연도별 국제연구협력의 주제 및 특징에 관한 동향을 확인했다는 점에서 그 연구적 의의를 찾아볼 수 있다.

한국표준산업분류를 기준으로 한 문서의 자동 분류 모델에 관한 연구 (A Study on Automatic Classification Model of Documents Based on Korean Standard Industrial Classification)

  • 이재성;전승표;유형선
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.221-241
    • /
    • 2018
  • 지식사회에 들어서며 새로운 형태의 자본으로서 정보의 중요성이 강조되고 있다. 그리고 기하급수적으로 생산되는 디지털 정보의 효율적 관리를 위해 정보 분류의 중요성도 증가하고 있다. 본 연구에서는 기업의 기술사업화 의사결정에 도움이 될 수 있는 맞춤형 정보를 자동으로 분류하여 제공하기 위하여, 기업의 사업 성격을 나타내는 한국표준산업분류(이하 'KSIC')를 기준으로 정보를 분류하는 방법을 제안하였다. 정보 혹은 문서의 분류 방법은 대체로 기계학습을 기반으로 연구되어 왔으나 KSIC를 기준으로 분류된 충분한 학습데이터가 없어, 본 연구에서는 문서간 유사도를 계산하는 방식을 적용하였다. 구체적으로 KSIC 각 코드별 설명문을 수집하고 벡터 공간 모델을 이용하여 분류 대상 문서와의 유사도를 계산하여 가장 적합한 KSIC 코드를 제시하는 방법과 모델을 제시하였다. 그리고 IPC 데이터를 수집한 후 KSIC를 기준으로 분류하고, 이를 특허청에서 제공하는 KSIC-IPC 연계표와 비교함으로써 본 방법론을 검증하였다. 검증 결과 TF-IDF 계산식의 일종인 LT 방식을 적용하였을 때 가장 높은 일치도를 보였는데, IPC 설명문에 대해 1순위 매칭 KSIC의 일치도는 53%, 5순위까지의 누적 일치도는 76%를 보였다. 이를 통해 보다 정량적이고 객관적으로 중소기업이 필요로 할 기술, 산업, 시장정보에 대한 KSIC 분류 작업이 가능하다는 점을 확인할 수 있었다. 또한 이종 분류체계 간 연계표를 작성함에 있어서도 본 연구에서 제공하는 방법과 결과물이 전문가의 정성적 판단에 도움이 될 기초 자료로 활용될 수 있을 것으로 판단된다.

웹서비스 유사성 평가 방법들의 실험적 평가 (Evaluation of Web Service Similarity Assessment Methods)

  • 황유섭
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.1-22
    • /
    • 2009
  • 월드와이드웹(WWW)은 유용한 정보를 포함하는 자료들의 집합에서 유용한 작업을 수행할 수 있는 서비스들의 집합으로 변화하고 있다. 새롭게 등장하고 있는 웹서비스 기술은 향후 웹의 기술적 변화를 추구하며 최근의 웹의 변화에 중요한 역할을 수행할 것으로 기대된다. 웹서비스는 어플리케이션 간의 통신을 위한 호환성 표준을 제시하며 기업 내/외를 아우를 수 있는 어플리케이션 상호작용 및 통합을 촉진한다. 웹서비스를 서비스 중심 컴퓨팅환경으로서 운용하기 위해서는 웹서비스 저장소는 조직화되어 있어야 할 뿐 아니라, 사용자들의 요구에 맞는 웹서비스 컴포넌트를 찾을 수 있는 효율적인 도구들을 제공하여야 한다. 서비스 중심 컴퓨팅을 위한 웹서비스의 중요성이 증대됨에 따라 웹서비스 발견을 효율적으로 제공할 수 있는 기법의 수요 또한 증대된다. 웹서비스 발견을 위한 많은 기법들이 제안되어 왔지만, 대부분의 선행연구들은 활용하기에는 제대로 발달하지 못하였거나 특정 도메인에 너무 치중하여 일반화하기 어려웠다. 이 논문에서는 군집화기법과 XML기반의 서비스 기술표준인 WSDL의 의미적 가치를 활용하여 다수의 웹서비스를 군집화하는 프레임워크를 제안한다. 웹서비스 발견이라는 연구영역에 최초로 데이터마이닝 기법을 적용한 연구이다. 본 논문에서 제안하는 방식은 여러 흥미로운 요소들이 있다: (1) 서비스 사용자와 제공자들의 사전지식 요구를 최소화한다 (2) 특정 도메인에 과도하게 치중한 온톨로지를 피한다 (3) 웹서비스들 간의 의미론적 관계를 시각화할 수 있다. 이 논문에서 인공신경 정신망 네트워크를 기반으로 하여 프로토타입 시스템을 개발하였으며, 실제 운용되고 있는 웹서비스 저장소로부터 획득한 실제 웹서비스들을 사용하여 제안하는 웹서비스 조직화 프레임워크를 실증적으로 평가하였으며 제안하는 방식의 효용성을 보여주는 실험결과를 보고한다.

  • PDF