• 제목/요약/키워드: 자동 인덱싱

검색결과 51건 처리시간 0.021초

네트워크 상에서 동영상 검색을 위한 브라우징 시스템의 구현 (Implementation of Browsing System for Video Retrieval over Network)

  • 하명환;나윤정;이상길
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.33-38
    • /
    • 1997
  • 최근에 윈도 NT를 탑재한 고성능 PC의 등장, ATM 카드, 실시간 MPEG 인코더/디코더 보드의 개발 등, 컴퓨터 업계의 눈부신 발전으로 영상 데이터를 네트워크에 분산 저장하고, 브라우저를 사용하여 필요한 자료를 검색, 활용, 편집할 수 있는 멀티미디어 방송 제작 환경 구축이 가능하게 되었다. 본 연구에서는 실시간 영상 전송을 위해 ATM 망을 구성하고, 네트워크상에서 효율적인 검색을 위한 클라이언트/서버 모델을 제시하며, 자동 인덱싱 기능을 가진 동영상 검색 브라우저 시스템을 구현해 보고 앞으로의 연구방향을 검토하였다. 모든 사용자 인터페이스 편리한 윈도 GUI 환경을 사용하므로 사용자는 프로그램을 쉽게 사용할 수 있으며, 프로그램 전체는 C++를 사용하여 클래스 단위로 제작되어 향후 시스템 개발이 용이하게 설계되었다.

  • PDF

음절에 기반한 한국어 형태소 분석기 (Syllable-Based Korean Morphological Analyzer)

  • 장동수;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.331-339
    • /
    • 1993
  • 본 논문에서는 한국어의 음절 특성을 이용한 한국어 형태소 분석기를 제시하였다. 이 형태소 분석기는 품사별 음절 정보, 불규칙 음절 정보, 활용어절 음절 정보, 선어말 어미 음절 정보 등을 이용하여 음절 단위로 형태소 분석을 한다. 음절 단위의 형태소 분석 방법은 음소 단위의 방법보다 형태소 분석시에 생성될 수 있는 잘못된 중간 분석 결과를 크게 감소시켜, 사전 탐색 부담을 최소화한다. 시스템의 사전은 품사별 결합 특성과 사전 표제어의 길이별 분포 특성을 이용하여 구성하였으며, 그 규모는 약 16만 어휘이다. 이러한 사전 구성은 효율적인 사전검색을 제공하며, 특히 철자 검색기와 자동 인덱싱 등의 다양한 응용 시스템 요구를 곧바로 수용할 수 있는 유연성과 효율성을 갖고 있다.

  • PDF

규칙기반 단어 클러스터링에 의한 문서 분류의 성능 향상 (Performance Improvement of Document Classification by Rule-based Word Clustering)

  • 현우석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.196-198
    • /
    • 2006
  • 분류되지 않은 문서의 문서 분류는 현재까지 아주 중요한 문제로 대두되고 있다. 컴퓨터를 이용한 문서 검색 엔진인 Citeseer에서는 문서 인덱싱을 하기 위해서 자동문서 분류 방법을 사용하고 있다. 문서 분류는 원본 문서의 단어들을 제1의 속성 표현으로 사용한다. 그러나 이와 같은 표현은 고차원과 속성 부족을 초래하게 된다. 단어 클러스터링은 속성 차원과 속성 부족을 감소시키기 위한 효율적인 방법이며 문서 분류 성능을 향상시켜 준다. 본 연구에서는 클러스터 속성 표현을 위한 도메인 규칙기반 단어 클러스터링 방법을 사용한다. 클러스터는 다양한 도메인 데이터베이스들과 단어 철자 속성들로부터 생성되는데, 이와 같은 클러스터 속성 표현은 중요한 차원 감소뿐만 아니라 문서 헤더 라인의 평균 분류 성능에서 향상을 보여 주었고, 원본 문서 단어 기반 속성 표현과 비교해 보았을 때 도서목록 항목 추출의 정확도를 향상시켰다.

  • PDF

인덱싱 에이전트를 이용한 멀티미디어 데이터 검색시스템 (A Multimedia Data Search System using Indexing Agent)

  • 고재운
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.487-490
    • /
    • 2010
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

  • PDF

다중 특징을 이용한 인공/자연객체 영상의 자동 분류 방법 (Automatic classification of man-made/ natural object image using multiple features)

  • 구경모;박창민;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.656-659
    • /
    • 2004
  • 최근 많은 연구에서, 동일한 영상그룹들로부터 추출된 저수준의 특징들을 이용해서 고수준의 정보를 분석한 뒤, 이를 이용해서 영상을 분류하는 방법들을 소개하고 있다. 이러한 연구는 CBIR의 인덱싱에서 저수준의 특징만을 사용할 때 발생하는 의미적인 차이(semantic gap)문제를 해결하여, 검색의 효율을 높일 수 있게 한다. 하지만 이들 연구는 대부분 전경(scenery)영상만을 대상으로 하고 있다. 한편 영상을 객체 단위로 다루는 것은 CBIR의 성능을 크게 향상 시킬 수 있는 요인이 된다. 왜냐하면 대부분의 사용자는 관심있는 객체가 포함된 영상을 검색하기 원하기 때문이다. 본 논문에서는 영상의 객체를 인공객체와 자연객체로 분류하는 방법을 제안한다. 인공객체의 경우 자연객체에 비해 상대적으로 직선형태의 에지가 많이 발견되며 객체를 구성하는 패턴이 규칙적이고 방향성을 가진다. 또한 인공객체는 자연객체에 비해 객체영역의 경계가 직선에 의한 단순한 형태로 나타난다. 이러한 특징들을 EDH(edge Direction Histogram)의 에너지, EDAS(Energy Difference of Adjacent Sector)와 가버 필터를 통해 추출하여 분류에 이용한다. 실험을 통하여 각 특징들을 개별적으로 사용해서 76%에서 84% 사이의 분류 정확성을 얻었으며, 제안한 머징 방법을 이용하여 최종적으로 약 90%의 정확성으로 분류하였다.

  • PDF

그래프 중심성 분석에 의한 CQI 보고서 핵심어 추출 시스템의 설계 및 개발 (Design and Implementation of Keywords Extraction System from CQI Reports by the Analysis of Graph Centrality)

  • 테이퍼악떠라;임종범;이종혁;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.256-259
    • /
    • 2019
  • 최근 대학교는 CQI(Continuous Quality Improvement) 등의 방대한 교육 관련 데이터를 수집하고 있고 이를 분석하여 교육 및 경영에 활용하고 있다. 핵심어는 텍스트의 내용을 간결하게 표현할 수 있는 단어이다. 그래서 CQI 보고서의 의미를 파악하기 위해서는 먼저 핵심어 추출이 필요하다. CQI 보고서에서 핵심어를 추출하면 이후 정보 검색, 인덱싱, 분류, 클러스터링, 필터링 등과 같은 많은 응용 작업을 용이하게 수행할 수 있다. 따라서 방대한 양의 CQI 보고서로부터 핵심어 추출을 자동화한다면 이후 요약 및 의미 파악에 많은 도움이 될 것이다. 이 논문에서는 CQI 보고서 요약을 위해 자동적으로 핵심어를 추출하는 방법을 제안한다.

미디엄 숏 검출에 관한 연구 (A Study of Medium Shot Detection)

  • 이형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.93-95
    • /
    • 2023
  • 본 논문에서는 장편의 드라마나 영화에서 스토리 기반의 축약된 요약본을 자동으로 제작하기 위해 미디엄 숏(medium shot) 크기의 숏(shot)들을 추출하기 위한 방법을 고려한다. 미디엄 숏 정도의 크기는 보통 인물에 중심을 둔 숏들로 인물들 간의 관계에서 특히 대사나 표정으로 내용을 전달하기 위한 목적으로 적극 권장된다. 비디오 검색을 위한 인덱싱에서 신(scene) 전환 검출 및 숏 경계 검출, 그리고 이미지에서 심도와 초점기반의 화질 및 피사체 추출 등을 위해 전통적인 신호/영상처리 기법의 활용에서부터 최근의 기계학습 접목 등 다양한 연구들이 진행되고 있다. 영상문법에 근거하여 편집된 영상물에서 미디엄 숏 정도 크기의 숏들을 추출하여 배열한다면 어느 정도 원본 내용을 충실히 전달할 수 있는 축약된 요약본을 제작할 수 있다는 가정하에 해당 샷들을 블러(blur) 기반으로 검출하기 위해 이와 관련된 키워드들을 기반으로 기존 연구들을 살펴보고 적용 방법을 모색한다.

  • PDF

객체기반 비디오 편집 시스템을 위한 불확실 영역기반 사용자 지원 비디오 객체 분할 기법 (Uncertain Region Based User-Assisted Segmentation Technique for Object-Based Video Editing System)

  • 유홍연;홍성훈
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.529-541
    • /
    • 2006
  • 본 논문에서는 객체기반 비디오 부호화 또는 멀티미디어 편집을 위한 반지동 비디오 객체 분할방식을 제안한다. 반자동 객체분할은 사용자 지원에 의한 분할 방식으로, 비디오 시퀀스의 초기 프레임에서 사용자가 관심객체의 경계를 표시하고 이후의 영상 프레임의 객체를 배경으로부터 연속적으로 분리해 낸다. 제안된 방식은 부분적으로 사용자 조력에 의한 프레임내 분할과 완전 자동에 의한 프레임간 분할 처리과정으로 구성되는데, 영상 전체에 대해 연산을 수행하는 기존 방식과는 달리 객체 경계가 존재하는 영상영역 부분에서만 연산을 수행한다. 프레임내 분할은 사용자가 관심객체의 경계를 지정하고, 이 경계 주위 화소들의 유사성을 이용한 후처리에 의해 정확한 초기 객체를 구한다. 프레임간 분할에서는 이전 프레임에서 추출한 객체의 경계 정보에 근거하여 시간적 유사성을 구한 후 경계와 영역 추적에 의해 연속적으로 동영상 객체를 추출한다. 실험결과로부터 제안된 방식은 비디오 편집, 객체기반 비디오 압축 및 인덱싱 등의 멀미디어 응용에 사용 가능할 정도로 안정되고 정확한 객체추출을 수행함을 확인하였다. 이 결과를 바탕으로 다수의 편리한 기능을 포함한 비디오 편집시스템을 개발하였다.

  • PDF

형태와 칼러성분을 이용한 효율적인 내용 기반의 이미지 검색 방법 (Efficient Content-Based Image Retrieval Method using Shape and Color feature)

  • 염성주;김우생
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.733-744
    • /
    • 1996
  • 내용을 기반으로 한 이미지 데이타 검색은 이미지로부터 자동적으로 특징값들을 추출하여 사용자가 원하는 이미지를 검색하는 방법이다. 본 논문에서는 이미지 데이타 로부터 형태적 특징과 컬러 특징을 자동적으로 추출하여 내용을 기반으로 이미지 데이타를 검색할 수 있는 방법을 제안한다. 이를 위하여 필요한 일련의 이미지 처리 과정을 소개하고 추출된 특징값들을 빠르게 검색하기 위해 변형된 트라이와 R 트리를 사용한 인덱싱기법을 제안한다. 제안하는 검색 방법은 형태와 컬러에 대한 특징값들을 모두 취급하므로 보다 신뢰성 있는 검색을 할 수 있다. 또한 본 논문에서는 이를 바탕으로 구현된 이미지 데이타베이스와 약 200여개의 이미지 데이타를 대상으로한 검색 실험 결과를 보이며, 검색 결과를 통해 형태적 특징과 컬러 특징이 이미지가 데이타 검색에 미친 영향을 고찰해 본다.

  • PDF

사용자 질의를 이용한 XML 태그의 가중치 결정 (Weighting of XML Tag using User's Query)

  • 우선미;유춘식;김용성
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.439-446
    • /
    • 2005
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐만 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있다. 이러한 연구들 대부분이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하거나 HTML 문서 태그의 중요도를 결정하는 연구들이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그의 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자의 질의에 바탕을 둔 사용자의 검색 행위를 반영한다. 그리고 기존 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.