• 제목/요약/키워드: 추출 도구

검색결과 979건 처리시간 0.029초

러프 및 퍼지 데이터의 형식개념분석을 지원하기 위한 도구의 개발 (Development of tools to support Formal Concept Analysis for Rough and Fuzzy Data)

  • 강유경;황석형;김응희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.687-690
    • /
    • 2008
  • 실세계의 복잡하고 다양한 데이터에 내포된 유용한 정보들을 추출하여 활용하기 위해 다양한 데이터 마이닝 기법들이 제안되고 있다. 최근 각광받기 시작한 개념분석기법(Formal Concept Analysis)은, 주어진 데이터로부터 개념들을 추출하고 그들 사이의 관계를 파악하여 개념계층구조를 구축하기 위한 정형화된 데이터분석 기법이다. 본 논문에서는 개념분석기법을 기반으로 다종다양한 데이터를 분석할 수 있는 기법들(FFCA, RFCA)에 대해서 소개하고, 본 연구에서 개발하고 있는 지원도구와 그 도구를 이용한 실험 결과를 보고한다.

기술 지식 자동 추출을 위한 테스트 컬렉션 구축 (Construction of Test Collection for Automatically Extracting Technological Knowledge)

  • 신성호;최윤수;송사광;최성필;정한민
    • 한국콘텐츠학회논문지
    • /
    • 제12권7호
    • /
    • pp.463-472
    • /
    • 2012
  • 지난 10년간 인터넷과 컴퓨팅 기술의 발전, 모바일 기기와 센서들의 진화, 페이스북이나 트위터와 같은 소셜 네트워크의 출현 등으로 정보량은 급속도로 늘어나고 있다. 대용량의 데이터와 이로 인해 파생되는 방대한 정보는 그것을 얻고자 하는 사람들에게 한계를 느끼게 한다. 따라서 방대한 정보 속에서 의미있는 지식을 추출하기 위한 시스템 기반의 연구가 활발히 시도되고 있다. 이로 인해 지식 추출 시스템의 중요성이 날로 강조되고 있지만, 정확성과 효율성 측면에서 여전히 많은 과제가 있다. 지식 추출 시스템의 성능을 향상시키기 위해서는 시스템을 평가하기 위한 테스트 컬렉션이 중요하다. 본 논문에서는 기술 지식의 자동 추출을 위해 개발된 시스템을 평가하기 위한 테스트 컬렉션을 소개한다. KEEC/KREC(KISTI Entity Extraction Collection/KISTI Relation Extraction Collection)라 명명된 테스트 컬렉션에 대한 구축 절차 및 기준과 구축된 테스트 컬렉션의 특징을 제시한다. 특히 테스트 컬렉션의 주요한 평가 기준이 되는 정확도를 높이기 위해 태깅 지원 도구를 활용한 전문가 태깅 방식을 사용하는 것이 주요 특징이다. 태깅 지원 도구를 활용한 전문가 태깅은 시스템에 의한 자동 태깅 도구들 또는 사람이 태깅을 하되, 지원 도구 없이 태깅하는 방법보다 태깅의 정확도를 높여준다. 구축된 KEEC/KREC은 실제로 과학기술 문헌에 존재하는 PLOT(Person, Location, Organization, Technology) 간 연관관계 추출 성능 평가를 위해서 사용되었고, 의미있는 연구결과를 도출하는데 기여하였다.

데이터 마이닝 도구 XM-Tool/Miner 개발에 관한 연구 (A Study on the Development of Data Mining Tool named XM-Tool/Miner)

  • 이남근;이창호;김주용;이병엽;이승희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.23-26
    • /
    • 2000
  • 정보기술이 발달하면서 자료의 흔적들이 체계화된 데이터베이스에 저장이 되고, 더불어 데이터베이스의 규모는 점점 커지고 있다. 데이터 마이닝은 이런 방대한 자료의 분석을 통해, 그 속에 숨어있는 의미를 찾는 과정이라고 볼 수 있다. 본 논문에서는 대용량 데이터베이스에 존재하는 여러 유용한 지식을 추출하는 방법으로서 데이터 마이닝을 분류화, 클러스터링, 요약규칙, 시간에 따른 분석 및 예측등으로 분류하여 요약, 제시하였고, 이렇게 추출된 패턴, 정보, 지식들의 유용성을 측정하는 지표를 정리하였다. 개발된 XM-Tool/Miner은 문제 중심적 마이닝 도구를 목표로 하였으며, 대표적인 마이닝 알고리즘을 적용하였고, 또한 사용의 편이성에 초점을 맞추었다. 더 나아가 데이터 마이닝 기법뿐만 아니라 데이터의 샘플링과 성능향상을 통하여 방대한 데이터로부터 다양한 지식탐사가 가능해지고, 발견된 규칙 또는 지식의 유용성 측정을 통하여 업무 분야의 특성에 따라 효과적으로 반영되며 의사결정 및 CRM 마케팅, 동향분석 및 예측 등에 유용한 정보를 추출하는 도구로 사용할 수 있을 것이다.

  • PDF

개선된 모니터링 센서를 이용한 임베디드 모니터링 시스템의 설계 및 구현 (Design and Implementation of Embedded Monitoring System using Improvement of Monitoring Sensor)

  • 신원;김태완;장천현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.778-780
    • /
    • 2005
  • 최근 가정, 자동차, 사무실등 많은 장소에서 임베디드 장치를 쉽게 찾아볼 수가 있다. 이렇듯 많은 분야에서 임베디드 장치가 사용됨에 따라 임베디드 시스템 제조업자들은 보다 빠른 시간에 많은 분야에 적용 가능한 임베디드 소프트 웨어를 개발해야 하는 어려움이 생겼다. 이러한 어려움은 소프트웨어 개발시간을 줄일 수 있도록 도와주는 개발환경의 필요성을 증가시켰다. 개발도구 중 디버깅도구는 개발시간의 대부분을 차지하는 디버깅 과정을 도움으로써 개발시간 단축이 큰 역할을 한다. 기존 디버깅도구는 모든 변수에 대한 데이터 추출을 하기 위하여 자원사용량과 처리량을 증가 시킴으로써 많은 부하를 발생시킨다. 이에 모니터링에 의한 부하를 최소화하기 위하여 변수 값을 추출하기 위한 모니터링 센서 기법과 실행시간 중 모니터링 대상을 변경하기 위한 디버깅레벨기법을 사용하여 소프트웨어의 내부 변수가 동작하면서 발생되는 오류를 검출할 수 있는 임베디드 모니터링 시스템을 설계 및 개발하였다. 하지만 실행시간 모니터링 중에 센서의 동작과정에 따르는 부하로 인하여 정확하지 않은 데이터를 추출할 수 있는 문제점이 발생되었다. 이러한 문제를 해결하기 위해 본 논문에서는 센서의 수행과정을 최소화하도록 센서 처리 구조를 변경하고 최적화된 센서 구조의 실행시간을 줄이기 위해 비트마스킹 기법을 사용한다.

  • PDF

패킷 네트워크에서 지연과 버퍼 크기 한계를 추출할 수 있는 분석 도구 (An Analysis Tool for Deriving Bounds on Delay and Buffer Size in Packet Networks)

  • 편기현;송준화;이흥규
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권5호
    • /
    • pp.641-648
    • /
    • 2003
  • 본 논문은 가변 패킷을 사용하는 일반적인 망에서 실시간 세션이 이종의 여러 스케줄러들을 통과할 때 네트워크가 보장하는 지연의 한계를 추출하는 범용 도구를 제안한다. 이 도구는 이질적인 각 스케줄러를 동질적인 서비스 곡선 서버로 특성화한다. 우리는 서비스 곡선 서버가 LR 서버보다 엄격히 큰 범주의 스케줄러들을 특성화할 수 있음을 보인다 즉, 모든 LR 서버는 서비스 곡선 서버로 특성화할 수 있고, 또한 RC-EDF와 SC 알고리즘조차도 서비스 곡선 서버로 정확히 특성화할 수 있음을 보인다. 이와 같이 서비스 곡선 서버는 LR 서버에 비해서 범용성 관점에서 큰 장점이 있으면서도 분석 결과가 정확하다. 우리는 LR 서버들로 분석할 수 있는 네트워크의 경우도 서비스 곡선 서버로 분석했을 때, 두 경우 모두 동일한 지연의 한계를 추출함을 수학적으로 증명한다.

NIST의 디지털 포렌식 도구 검증 체계 소개

  • 박정흠
    • 정보보호학회지
    • /
    • 제26권5호
    • /
    • pp.54-61
    • /
    • 2016
  • 정보 통신 기술이 빠르게 발전하고 디지털 기기가 보급됨에 따라 다양한 유형의 사건을 해결하는데 있어서 디지털 증거가 핵심적인 요소로 활용되고 있다. 이에 잠재적인 디지털 증거를 수집, 추출, 복구, 분석하기 위한 디지털 포렌식(Digital Forensics) 기술의 연구 개발이 전 세계적으로 매우 활발하게 진행되어 왔다. 활발한 연구 개발의 결과, 보다 효율적인 디지털 포렌식 활동을 지원하기 위해서 여러 도구(S/W, H/W)들이 공개되고 있으며 현재 다양한 목적으로 널리 활용되고 있다. 이와 같이 디지털 포렌식 도구의 활용이 일반화되었고 특히 동일(또는 유사한) 기능을 제공하는 여러 도구가 존재함에 따라서 각각의 도구가 제공하는 기능의 범위와 구현의 정확성 등에 대한 검증의 필요성이 제기되었다. 이러한 요구에 맞춰 1999년 미국 국립표준기술연구소(NIST)에서 디지털 포렌식 도구 검증 체계를 구축하였고, 현재까지도 활발하게 진행되고 있다. 본 논문에서는 NIST에서 수행 중인 CFTT와 CFReDS 프로젝트를 소개하고, 진행 현황과 향후의 발전 방향을 설명한다.

OWL 온톨로지 합병도구의 설계 및 구현 (A Design and Implementation of Ontology Merging Tool Supporting OWL)

  • 김재홍;손주찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.115-117
    • /
    • 2003
  • 최근 시맨틱 웹의 중요성이 부각되면서 다양한 분야에서 이와 관련된 연구가 활발히 진행되고 있다. 시맨틱 웹과 관련된 연구 중 중요한 부분이 은톨로지와 규칙 및 추론이며, 이들 연구가 실용적인 측면에서 빠르게 진행되기 위해서는 연구를 위해 사용가능한 온톨로지가 많이 구축되어 있어야 한다. 그러나, 온톨로지의 구축은 많은 노력과 시간을 요하기 때문에 온톨로지 합병을 통한 기존 온톨로지의 재사용이 반드시 필요하다. 이미 온톨로지 합병을 위한 도구가 다수 존재하나 이들이 시멘틱 웹에서의 온톨로지 언어인 OWL을 직접적으로 지원하지 않는다는 단점이 있다. 본 논문에서는 기존 온톨로지 합병도구의 분석을 통해 OWL 온톨로지 합병도구 개발을 위해 필요한 기본적인 기능들을 추출하고, 이를 설계 및 구현하였다. 기존 온톨로지를 OWL로 변환해 주는 도구와 개발된 도구를 사용하여 현재 다수 존재하는 기존 온톨로지를 재활용함으로써 시맨틱 웹의 활용 촉진에 기여할 수 있을 것으로 기대된다.

  • PDF

PDA를 이용한 한국어 자동 색인 시스템 (Korean Automatic Indexing System Using the PDA)

  • 박평구;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.375-378
    • /
    • 2000
  • 인터넷의 급속한 발달로 사용자는 자신의 질의에 적합한 검색결과를 빠르고 정확하게 보장하는 검색도구를 요구하게 되었다. 이러한 사용자의 요구는 검색도구의 성능향상에 필수적인 문서의 내용을 대표하는 색인어를 추출하는 색인 시스템에 대한 관심을 가지게 되었다. 기존의 한국어에서의 자동 색인 방법에는 어절 중심 색인법, 형태소 중심 색인법과 최근에 n-gram 중심 색인법 등이 주류를 이루어 왔다. 그러나 한국어에서 색인어를 추출하는 기존의 방법은 복합명사의 색인과 복잡한 문법적 지식이 필요하고 잘못된 색인어를 추출하는 등의 검색효율에 문제점을 가지고 있다. 본 논문에서는 PDA를 이용한 정형화된 한국어와 영어문장의 자동 색인 방법을 제안한다. 제안하는 방법은 별도의 사전지식이 필요하지 않고 단일 명사와 복합명사의 색인이 가능하며 인터넷으로의 확장과 다양한 언어로 확장성이 좋은 장점 등을 갖는다. 성능 평가로써 한국통신의 KTSET으로 MS사의 IIS를 웹 서버로 ASP를 이용하여 인터넷 환경에서 테스트를 통하여 한국어 뿐 아니라 영어문장의 정형화되고 이용이 간편한 자동색인 결과를 보여준다.

  • PDF

마커인식을 통한 동영상 Tracking 데이터 추출에 관한 연구 (A Study on the video tracking data extracted by the marker recognition)

  • 박정근;한종성;이근호;이기정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.213-214
    • /
    • 2014
  • 본 논문에서는 증강현실 저작도구를 사용 할 때 마커인식을 통하여 동영상의 Tracking 데이터를 추출하는 방법을 제안한다. 실험에 이용한 마커는 직사각형모양의 특징점이 잘 나타나는 물체로서, 사각형 마커인식을 위해 CornerDetection과 Matching기법을 사용하였다. Tracking을 활용하는 방식에는 동영상의 기준프레임을 활용하여 Tracking하는 방법과 각 프레임을 순차적으로 Tracking하여 비교하는 방법, 그리고 마커를 사용하지 않고 동영상의 Tracking데이터를 추출하는 방법이 있는데 본 논문에서는 이 세 가지 방법을 비교하여, 증강현실 저작도구의 상용화를 위한 최적화된 알고리즘을 제안한다.

  • PDF

SINDI-WALKS: 과학기술지식발견 워크벤치 (SINDI-WALKS: A Workbench for Scientific Intelligence Discovery)

  • 최성필;최윤수;전홍우;정창후;송사광;정한민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.279-281
    • /
    • 2012
  • 본 논문은 과학 기술 분야 학술 정보에 내재된 기술 지식을 효과적으로 추출하기 위한 시스템인 SINDI-WALKS를 소개한다. 이 시스템은 학술 정보에 자주 등장하며 내용 전개에 핵심적인 역할을 수행하는 PLOT, 즉 인명, 지명, 기관명, 그리고 기술용어를 자동으로 인식하고 이들 간의 의미적 연관 관계를 추출할 수 있는 통합 지원 도구이다. 논문에서 소개하는 다양한 지원 도구들을 바탕으로 기술 지식추출의 성능을 특정 분야 혹은 자원에 최적화할 수 있는 기반을 마련할 수 있다.