• 제목/요약/키워드: 집합 기반 분석

검색결과 536건 처리시간 0.03초

텍스트 이해 모델에 기반한 정보 검색 시스템 (Text Undestanding System for Summarization)

  • 송인석;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.1-6
    • /
    • 1997
  • 본 논문에서는 인지적 텍스트 이해 모형을 제시하고 이에 기반한 자동 요약 시스템을 구현하였다. 문서는 정보의 단순한 집합체가 아닌 정형화된 언어 표현 양식으로서 단어의 의미적 정보와 함께 표현 양식, 문장의 구조와 문서의 구성을 통해 정보를 전달한다. 요약 목적의 텍스트 이해 및 분석 과정을 위해 경제 분야 기사 1000건에 대한 수동 요약문을 분석, 이해 모델을 정립하였고. 경제 분야 기사 1000건에 대한 테스트 결과를 토대로 문장간의 관계, 문서의 구조에서 요약 정보 추출에 사용되는 정보를 분석하였다. 본 텍스트 이해 모형은 단어 빈도수에 의존하는 통계적 모델과 비교해 볼 때, 단어 간의 관련성을 찾아내고, 문서구조정보에 기반한 주제문 추출 및 문장간의 관계를 효과적으로 사용함으로서 정보를 생성한다. 그리고 텍스트 이해 과정에서 사용되는 요약 지식과 구조 분석정보의 상관관계를 체계적으로 연결함으로서 자동정보 추출에서 야기되는 내용적 만족도 문제를 보완한다.

  • PDF

소셜 미디어 검색을 위한 Flickr Note의 분석 및 응용에 관한 연구 (A Study on Analysis of Flickr Note and Its Applications for Social Media Search)

  • 정진우;홍현기;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.49-52
    • /
    • 2011
  • 본 연구에서는 Flickr에서 제공하는 어노테이션 기법 중 Note 서비스에 대한 다양한 분석 결과를 제공하고, 이를 기반으로 소셜 미디어 검색을 위한 Flickr Note의 응용 방안을 제안한다. Flickr Note는 기존의 태그 기반 검색에서 활용되는 태그와는 달리 이미지의 특정 영역 위에 직접적으로 할당되는 텍스트들의 집합이다. Flickr Note는 보다 지능적인 소셜 이미지 공유 및 검색 서비스를 위하여 다양한 정보들을 제공할 수 있는 중요한 데이터지만, 이를, 이미지 검색에 효과적으로 활용하기 위한 연구는 미미한 수준이다. 따라서 본 연구에서는 Flickr Note에 대한 다양한 분석을 통하여 소설 이미지 검색에서 Note의 역할 및 활용 기능성을 제공하고자 하며, 이를 바탕으로 Flickr Note 기반의 이미지 분석 및 검색을 위한 다양한 연구들이 시도되기를 기대한다.

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

데이터 클러스터링을 위한 가우시안 혼합 모델을 이용할 퍼지 정보량 측정 (Gaussian Mixture Model for Data Clustering using Fuzzy Entropy Measures)

  • 임채주;최병인;이정훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.335-338
    • /
    • 2004
  • 본 논문에서는 기존의 정보량(Entropy) 기반 클러스터링 기법을 향상시키기 위한 방법으로서 퍼지 정보량을 이용하였다 가우시안 혼합 모델을 이용하면, 프로토타입의 목적 함수를 이용하는 클러스터링 기법보다 향상된 결과를 얻을 수 있고, Parameter의 조정이 요구되지 않는다. 그러나, 가우시안 혼합 모델의 사용은 주어진 패턴 집합을 클러스터링하는데 계산량의 증가를 초래하게 된다. 본 논문에서는 가우시안 혼합 모델의 정형화에 요구되는 계산량을 감소시키는 방법을 제시한다 또한 퍼지정보량(Fuzzy Entropy)을 적용하여 기존의 정보량 기반의 클러스터링 결과와 비교 분석하였다.

  • PDF

모바일 IPv6의 Alloy모델 해석 (Interpretation of Alloy Model for Mobile IPv6)

  • 박승순;배민오;김영인
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.115-117
    • /
    • 2002
  • 본 논문에서는 Mobile IPv6에 사이클이 있음을 Alloy로 명세(specification)하고 Alloy 분석기로 검증(verification)한 것을 해석해 보겠다. Acyclicity를 만족하지 못함으로 해서 모바일호스트는 이동을 하지 못하고 계속 사이클을 돌게 된다. Alloy는 Rational의 UML과 같은 객체모델링 언어인데, 일차논리와 집합에 기반을 둔 Z에서부터 파생되었다. Alloy는 작은 모델들을 위한 명세 언어로, Alloy 모델은 그래픽과 텍스트를 모두 지원한다. Alloy로 명세 된 것을 쉽게 분석 할 수 있는 검증도구로 Alloy 분석기가 있는데, 이러만 도구를 이용함으로써 손쉽고 빠르게 검증을 할 수 있다.

  • PDF

평면 데이터 분포에 영향을 끼치는 점 분포의 부분집합 추출 방법 - 소규모 소매점포의 매출자료를 이용한 상권 및 경쟁력 분석기법을 사례로 - (A Method for the Extraction of a Subset of Points from a Large Set of Points Affecting the Distribution of Surface Data - A Case Study of Market Area and Competitive Power Analysis by Sales Data of Micro Scale Retail Stores -)

  • 이정은;사다히로 유키오
    • 한국지리정보학회지
    • /
    • 제9권1호
    • /
    • pp.1-12
    • /
    • 2006
  • 공간분석에서는 사용되는 공간데이터 종류에 따라, 각각의 특징있는 분석법을 요구하므로, 다양한 접근법을 필요로 한다. 특히, 두 종류의 상이한 공간데이터 집합이 공존하는 경우, 어느 한 공간객체의 분포에 영향을 끼치는 다른 공간객체 집합에 대한 부분집합을 추출하여, 공간객체간의 관계성을 규명할 수가 있다. 지리정보시스템 등의 공간객체 분석기술의 발달로, 시각적으로도 간단히 공간객체간의 관계성을 파악할 수 있으나, 데이터의 양이 방대해지는 추세에서는, 지리정보시스템 (geographical information system)상에서 시각화된 공간객체 정보만으로는 서로 다른 공간객체간의 분포에서 상호관계성을 정량적으로 분석하기 어렵다. 따라서, 본 연구에서는 정량적 기준을 통해, 서로 다른 두 공간객체 간의 관계성 분석을 주목적으로 한다. 모델화된 정량적 기준의 평가를 위해 분석에 사용되는 실제 데이터는, 소규모 소매점포의 매출데이터를 사례로 들기로 한다. 데이터 수집에 제한이 있다는 특수환경으로 인해, 본 연구에서 사용되는 모델은 로짓모델을 기반으로 한 미지파라미터 추정이 가능하도록 구성되어있다. 제안된 모델을 사용하여, 대상점포의 매출분포에 큰 영향을 끼치는 것으로 판단되는 경쟁점포를 일련의 경쟁점포 집합에서 추출하며, 그 결과의 타당성을 검증하도록 한다.

  • PDF

Dynamic Time Warping 기반의 특징 강조형 제스처 인식 모델 (Feature-Strengthened Gesture Recognition Model based on Dynamic Time Warping)

  • 권혁태;이석균
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권3호
    • /
    • pp.143-150
    • /
    • 2015
  • 스마트 디바이스가 보편화되면서 이에 내장된 가속도 센서를 사용한 제스처의 인식에 관한 연구가 주목받고 있다. 최근 가속도 센서 데이터 시컨스를 통한 제스처 인식에 Dynamic Time Warping(DTW) 기법이 사용되는데, 본 논문에서는 DTW 사용 시 제스처의 인식률을 높이기 위한 특징 강조형 제스처 인식(FsGr) 모델을 제안한다. FsGr 모델은 잘못 인식될 가능성이 높은 유사 제스처들의 집합에 대해 특징이 강조되는 데이터 시컨스의 부분들을 정의하고 이들에 대해 추가적인 DTW를 실행하여 인식률을 높인다. FsGr 모델의 훈련 과정에서는 유사 제스처들의 집합들을 정의하고 유사 제스처들의 특징들을 분석한다. 인식 과정에서는 DTW를 사용한 1차 인식 시도의 결과 제스처가 유사 제스처 집합에 속한 경우, 특징 분석 결과를 기반으로 한 추가적인 인식을 시도하여 인식률을 높인다. 알파베트 소문자에 대한 인식 실험을 통해 FsGr 모델의 성능 평가 결과를 보인다.

KTDB 기반 노선배정의 예측오차 원인과 분석결과 해석 (Practical Interpretation and Source of Error in Traffic Assignment Based on Korea Transport Database(KTDB))

  • 김익기
    • 대한교통학회지
    • /
    • 제34권5호
    • /
    • pp.476-488
    • /
    • 2016
  • 이 연구에서는 교통수요예측의 신뢰성에 영향을 미치는 요소와 원인을 검토하였다. 통행의 다양성과 불규칙성, 입력자료 한계, 자료의 집합화, 모형의 단순화가 포괄적 의미에서 교통예측 오차원인이 된다. 또한 불가피하게 존재하는 예측 오차의 이론적 배경을 정확히 규명함으로써 예측결과를 실무적 정책결정에 활용할 시에 합리적 판단을 하는데 도움이 되도록 하였다. 본 연구에서는 특히 노선배정모형의 예측 오차의 요인에 초점을 두고, KTDB 자료기반 분석오차를 6개 항목으로 나누어 설명하였다. 즉, (1) 입력 자료의 오차, (2) 공간 집합화와 네트워크 표현방식에 따른 오차, (3) 교통패턴 변동에 대한 대푯값 설정에 따른 오차, (4) 교통류모형 단순화에 따른 오차, (5) 노선선택 행태 집합화에 따른 오차로 구분하여 설명하였다.

인지 무선 시스템을 위한 채널 집합 관리기의 개발 및 성능 분석 (Channel Set Manager Development and Performance Analysis for Cognitive Radio System)

  • 박창현;송명선
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.8-14
    • /
    • 2008
  • 인지 무선(Cognitive Radio : CR) 시스템의 개발은 Mitola 가 제안한 개념의 완전 인지 무선(Full Cognitive Radio)시스템과 현재 표준화 논의가 진행 중인 스펙트럼 인지무선 시스템의 두 가지 방향으로 이루어지고 있다. 본 논문은 스펙트럼 인지무선 시스템을 위한 인지 엔진(Cognitive Engine : CE)을 개발 하고 인지 엔진의 핵심 기능인 채널 집합 관리 알고리즘에 대한 가상 실험을 통해 성능 분석을 하였다. 채널 집합 관리는 과거의 채널 점유 기록을 기반으로 CR시스템의 이동 가능 채널들 중 채널 품질 및 유휴 가능성이 높은 채널을 평가하고 결정하는 기능을 수행한다. 이를 위한 핵심 기능이 채널 상태 예측이고 본 논문에서는 채널 상태 예측을 위해 은닉 마르코프 모델(HMM)의 활용을 제안하였으며 HMM기반의 채널 상태 예측 성능을 향상 시킬 방법을 제안 및 적용하여 가상 실험을 하였다. 가상 실험 결과 채널 상태 예측 성능의 향상을 확인하였고 난수 선택 방법(Random Selection), 통계적 선택 방법(Statistical Selection) 과의 성능 비교를 통해 본 논문에서 제안한 방법의 우월성을 검증하였다.

특징 공간상에서 의 확률적 해석에 기반한 부분 인식 기법에 관한 연구 (A partially occluded object recognition technique using a probabilistic analysis in the feature space)

  • 박보건;이경무;이상욱;이진학
    • 한국통신학회논문지
    • /
    • 제26권11A호
    • /
    • pp.1946-1956
    • /
    • 2001
  • 본 논문에서는 관계 벡터 공간상의 특징 대응에 관한 확률적 해석에 기반한 새로운 부분 인식 기법을 제안한다. 효과적인 인식을 위해 물체를 관계 속성 그래프(Attributed Relational Graph; ARG)와 관계 벡터 공간들의 집합으로 표현한다. 또한 잡음이나 특징 소실로 인한 왜곡을 관계 벡터 공간에서의 관계 벡터 분포에 대한 왜곡으로 확률적으로 모델링한다. 제안하는 부분 인식 기법은 두 단계로 이루어진다. 우선 지역적인 특징(local feature)과 구조적인 일관성(structural consistency)을 사용하여 후보집합을 추출한다. 이렇게 추출된 후보집합 각각에 대해 관계 벡터 공간상에서의 에러 분석과 반복적인 voting 알고리즘을 통해 특징 소실을 검출한다. 실제 영상에 대한 실험 결과를 통해 제안한 알고리즘이 잡음이나 가리어짐이 심한 경우에도 강건한 성능을 보임을 알 수 있으며, 릴렉세이션(relaxation) 기법과 수행 시간 비교 분석을 통해 계산량 측면에서의 성능 향상을 확인할 수 있다.

  • PDF