• 제목/요약/키워드: information retrieval.

검색결과 3,674건 처리시간 0.037초

B2V-Tree: 무선 데이타 스트림에서 부분 부합 질의를 위한 색인 기법 (B2V-Tree: An Indexing Scheme for Partial Match Queries on Wireless Data Streams)

  • 정연돈;이지연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.285-296
    • /
    • 2005
  • 이동 분산 환경에서는 무선 데이타 방송 기법을 통하여 서버의 데이타 레코드들을 이동 사용자들에게 전달하는 방식이 많이 사용된다. 그리고, 무선 방송 스트림에서 데이타를 에너지 효율적으로 접근하기 위해서는 색인 기법이 필요하다. 하지만, 기존의 색인 기법들은 데이타 레코드의 키 값을 이용한 트리 형태의 색인 구조를 사용하고 있다. 따라서 부분 부합 질의 등과 같은 내용 기반 검색 질의를 지원할 수 없었다. 본 논문에서는 무선 방송으로 이동 사용자들에게 전달되는 데이타 스트림에서 내용 기반 검색인 부분 부합 질의를 지원하기 위해 B2V-Tree라고 불리는 색인 기법을 제안한다. 본 논문에서 제안하는 B2V-Tree는 데이타 레코드들의 애트리뷰트 값을 다중 애트리뷰트 해싱을 통해 비트 벡터로 생성한 다음, 이들을 색인 트리로 구성하는 색인 기법이다.

VDCluster : 대용량 비디오 시퀀스를 위한 비디오 세그멘테이션 및 클러스터링 알고리즘 (VDCluster : A Video Segmentation and Clustering Algorithm for Large Video Sequences)

  • 이석룡;이주홍;김덕환;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.168-179
    • /
    • 2002
  • 본 논문에서는 비디오 저장이나 검색과 같은 비디오 정보 처리를 위한 중요한 기초 연구로써 비디오의 표현을 위한 효과적인 기법을 제안한다. 비디오 데이타 세트는 수초에서 수분 사이의 상연 시간을 갖는 비디오 클립들의 집합이며, 각 비디오 클립은 연속된 비디오 프레임들로 구성되어 있다. 이 비디오 클립은 다차원 데이타 시퀀스(multidimensional data sequence: MDS)로 표현될 수 있으며, 프레임 사이의 시간적인 정보를 고려하여 비디오 세그먼트로 나누어 지고, 한 클립 내에서 서로 유사한 세그먼트들은 다시 비디오 클러스터로 군집화된다. 따라서, 각 비디오 클립은 소수 개의 비디오 클러스터로 표현되어 진다. 본 논문에서 제안한 비디오 세그멘테이션 및 클러스터링 알고리즘 VDCLuster는 사전에 정의된 일정 수준의 클러스터링 품질을 보장하고 있으며, 다양한 비디오 시퀀스에 대한 실험을 통하여 알고리즘의 효과를 입증한다.

전자 도서관에서 문서의 메타데이타 관리를 위한 2 버전 래치 기법 (Two Version Latch Technique for Metadata Management of Documents in Digital Library)

  • 좌은희;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.159-167
    • /
    • 2002
  • 최근 메타데이타의 주요 논쟁점으로 메타데이타의 표준화 문제가 등장하고 있다. 새로운 표준화 방향으로 인한 메타데이타의 확장성은 기존 메타데이타 관리 기법의 변화를 요구하게 되었다. 즉, 동적인 자료의 일관성 있는 저장과 유지방안이 필요하게 되었다. 이에, 본 논문서는 새로운 표준화 형태의 메타데이타 특징들을 정의하고, 이러한 특징들을 만족하는 병행수행 제어 기법인 2 버전 래채 법(Two Version Latch : 2VL)을 제안한다. 2VL은 래치를 사용하여 2 버전을 유지한다. 이러한 기법은 판독과 기록 연산간의 충돌을 최소화하고, 불필요할 로크의 소유를 제거함으로써 리프레쉬 지연을 최소화한다. 따라서, 기존 메타데이타 관리 기법에 비해서 판독 연산에 있어서의 빠른 응답시간과 높은 최근성 반영률을 제공한다. 성능 평가를 통해, 2VL 알고리즘이 메타데이타 관리에 있어서 기존의 알고리즘에 비해 좋은 성능을 가짐을 보인다.

외국어 음차 표기의 음성적 유사도 비교 알고리즘 (Phonetic Similarity Meausre for the Korean Transliterations of Foreign Words)

  • 강병주;이재성;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1237-1246
    • /
    • 1999
  • 최근 모든 분야에서 외국과의 교류가 증대됨에 따라서 한국어 문서에는 점점 더 많은 외국어 음차 표기가 사용되는 경향이 있다. 하지만 같은 외국어에 대한 음차 표기에 개인차가 심하여 이들 음차 표기를 포함한 문서들에 대한 검색을 어렵게 만드는 원인이 되고 있다. 한 가지 해결 방법은 색인 시에 같은 외국어에서 온 음차 표기들을 등가부류로 묶어서 색인해 놓았다가 질의 시에 확장하는 방법이다. 본 논문에서는 외국어 음차 표기들의 등가부류를 만드는데 필요한 음차 표기의 음성적 유사도 비교 알고리즘인 Kodex를 제안한다. Kodex 방법은 기존의 스트링 비교 방법인 비음성적 방법에 비해 음차 표기들을 등가부류로 클러스터링하는데 있어 더 나은 성능을 보이면서도, 계산이 간단하여 훨씬 효율적으로 구현될 수 있는 장점이 있다.Abstract With the advent of digital communication technologies, as Koreans communicate with foreigners more frequently, more foreign word transliterations are being used in Korean documents more than ever before. The transliterations of foreign words are very various among individuals. This makes text retrieval tasks about these documents very difficult. In this paper we propose a new method, called Kodex, of measuring the phonetic similarity among foreign word transliterations. Kodex can be used to generate the equivalence classes of the transliterations while indexing and conflate the equivalent transliterations at the querying stage. We show that Kodex gives higher precision at the similar recall level and is more efficient in computation than non-phonetic methods based on string similarity measure.

유효시간 데이터 스트림에서의 스카이라인 질의 알고리즘 (Efficient Skyline Computation on Time-Interval Data Streams)

  • 박남훈;장중혁
    • 한국산학기술학회논문지
    • /
    • 제13권1호
    • /
    • pp.370-381
    • /
    • 2012
  • 다기준 의사결정 연구는 평가기준이 상이한 다수의 선호도로부터 최선의 대안을 찾는 방법으로 실시간 재난 탐지, 센서를 이용한 서식 모니터링 등의 응용환경에서 활용되어 왔다. 최근 유효시간 데이터 스트림 응용환경에서 각 객체들이 개개의 유효시간을 가지므로, 기존의 슬라이딩 윈도우보다 다기준 의사결정 방법, 즉 스카이라인 질의 수행에 더 많은 연산이 필요한다. 본 연구에서는 유효시간 데이터 스트림에서 스카이라인 질의를 수행하는 TI-Sky 알고리즘을 제시한다. 실시간 환경에서 새로운 객체가 생성되고 소멸되기까지 유효한 객체들을 관리하고 스카이라인 질의를 수행하기 위해 파티션단위의 시간 지배관계를 제시한다. 객체의 생성과 유효시간, 지배관계에 따라 시간지배관계를 갱신하며 다양한 방법으로 사멸객체를 제거하여 수행성능을 향상 시켰다. 실험을 통해 TI-Sky가 다양한 데이터 상에서 기존 연구보다 뛰어난 성능으로 스카이라인 질의를 수행하는 것을 증명하였다.

윤곽선 이미지 피라미드와 관심영역 검출을 이용한 SIFT 기반 이미지 유사성 검색 (SIFT based Image Similarity Search using an Edge Image Pyramid and an Interesting Region Detection)

  • 유승훈;김덕환;이석룡;정진완;김상희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.345-355
    • /
    • 2008
  • 다양한 형태 특징 추출 방법 중의 하나인 SIFT는 물체 인식, 모션 추적, 3차원 이미지 재구성과 같은 컴퓨터 비전 응용 분야에서 많이 사용된다. 하지만 SIFT 방법은 많은 특징점들과 고차원의 특징 벡터를 사용하기 때문에 이미지 유사성 검색에 그대로 적용하기에는 많은 어려움이 있다. 본 논문에서는 윤곽선 이미지 피라미드와 관심영역 검출을 이용한 SIFT 기반 이미지 유사성 검색 기법을 제안한다. 제안한 방법은 윤곽선 이미지 피라미드를 이용하여 이미지의 밝기 변화, 크기, 회전등에 불변한 특징을 추출하고, 타원 형태의 허프변환을 이용한 관심영역 검출을 통해 불필요한 많은 특징점들을 제거하여 검색성능을 높인다. 실험 결과에서 제안한 방법의 이미지 검색 성능이 기존의 SIFT의 방법에 비해 평균 재현율이 약 20%정도 좋은 성능을 보이고 있다.

미세 단위 소프트웨어 객체를 위한 연산 기반 버전 및 일관성 관리 모델 (An Operation-Based Model of Version Storage and Consistency Management for Fine-Grained Software Objects)

  • 노정규;우치수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권7호
    • /
    • pp.691-701
    • /
    • 2000
  • 소프트웨어 문서는 수많은 논리적인 객체와 객체간의 관계로 이루어진 구조를 가지고 있으며 그 구조가 빈번하게 변경될 수 있다. 본 논문에서는 소프트웨어 편집 과정에서 적용되는 연산에 기반한 미세 단위 소프트웨어 객체의 버전 및 일관성 관리 모델을 제안하였다. 모든 소프트웨어 객체는 연산으로 구성된 인터페이스를 가지고 객체의 편집은 연산을 통해서 이루어진다. 편집기를 통하여 객체에 적용된 연산은 연산 히스토리에 기록되고 버전 관리와 소프트웨어 구성 요소간의 일관성 관리에 이용된다. 객체의 버전은 연산 히스토리를 이용한 델타를 이용하여 저장되고 검색되므로 델타 추출을 위한 비교 과정이 필요 없으며 버전간의 변경 내용을 쉽게 파악하여 버전 전파 여부를 결정지을 수 있다는 장점이 있다. 일관성은 객체간의 종속성과 객체에 적용된 연산의 종류에 의해 관리되므로 불필요한 변경 전파를 피할 수 있다. 본 논문에서는 객체에 적용된 연산을 기반으로 하여 버전 검색 및 미세 단위 일관성에 대한 정형적인 모델을 제시하였다.

  • PDF

GPS 전파엄폐 탐측자료의 우주기상 활용방안 (Space Weather Research using GPS Radio Occultation Soundings)

  • 신대윤;디네시마난다르;이정덕;이종혁;김해연;이양원
    • 한국위성정보통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.14-22
    • /
    • 2013
  • GPS 전파엄폐는 GPS 전파가 대기에 의해 굴절 및 지연되는 현상에 기초하여 대기의 물리적 특성을 관측하기 위한 원격탐사 기법이다. 2006년 미국과 대만이 공동 개발한 FORMOSAT-3/COSMIC 위성은 하루 2500여건의 전파엄폐 자료를 준실시간으로 제공하고 있으며, 우리나라의 다목적실용위성 5호의 AOPOD(Atmosphere Occultation and Precision Orbit Determination) 시스템은 이중주파수 GPS 수신기 및 전파엄폐 자료수신용 안테나를 장착함으로써 전파엄폐 자료의 획득이 가능하도록 설계되어 대류권과 전리층 연구에 활용될 것으로 기대되고 있다. 본 연구에서는 GPS 전파엄폐의 신호처리와 지오메트리 분석기법을 검토하고, 대류권 온습도와 전리층 전자밀도 및 신틸레이션(scintillation) 산출기법을 분석하며, 이러한 전자엄폐 탐측자료를 활용하기 위한 방안으로서 전리층 총전자수 변화를 통한 지진감시와 효율적인 자료서비스를 위한 오픈 API(application programming interface) 구축에 대해 검토하고자 한다.

한국의 계절별 특성을 고려한 고정확도 GPS 수증기 추정 모델링 (GPS water vapor estimation modeling with high accuracy by consideration of seasonal characteristics on Korea)

  • 송동섭
    • 한국측량학회지
    • /
    • 제27권5호
    • /
    • pp.565-574
    • /
    • 2009
  • 본 연구에서는 GPS 관측 데이터로부터 가강수량을 복원하는 과정에 있어서 한국의 계절별 특성을 고려한 가중 평균 기온 모델(Tm)을 개발하고 4개소의 GPS 상시관측소에 대하여 이를 적용하였다. 가중 평균 기온은 지역의 수증기 압력과 기온 프로파일에 관계하기 때문에, GPS 대류권 습윤 지연으로부터 추정한 수증기 정보의 정확도는 가중 평균 기온 추정 정확도에 비례하게 된다. 다른 국가에서 제시한 모델들과 비교하여 한국의 계절별 가중 평균 기온 모델의 적용이 GPS 가강수량 추정 정확도를 개선시킬 수 있다는 결과를 제공하였다. 따라서 실제 습윤 지연량을 가강수량으로 환산하는 단계에서 계절적으로 적합한 가중 평균 기온 모델은 다른 모델들에 비하여 대류권에서의 GPS 신호 지연으로부터 가강수량 추정의 상대적 편의 제거 효과가 크기 때문에 고정확도 수증기량 추정에 유용하다고 판단된다.

피치 히스토그램과 MFCC-VQ 동적 패턴을 사용한 음악 검색 (Music Identification Using Pitch Histogram and MFCC-VQ Dynamic Pattern)

  • 박철의;박만수;김성탁;김회린
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.178-185
    • /
    • 2005
  • 본 논문에서는 내용기반 음악 정보 검색 방법으로써 멜로디의 시간 변화 특성과 통계적 특성을 모두 이용할 수 있는 hybrid 방법에 대해 제안하였다. 실제 방송 환경에의 적용을 위해 드라마 OST의 좁은 검색 범위뿐만 아니라 가요 1,005곡의 넓은 검색 범위에서도 제안한 방법을 이용하여 실험하였다. 제안된 방법은 특징 벡터로써 pitch와 MFCC(Mel Frequency Cepstral Coefficient)를 사용하여 음의 특성을 나타내었으며 멜로디를 표현하기 위해 피치 히스토그램과 VQ (Vector Quantization) 코드화한 MFCC의 템포럴 시퀀스를 이용함으로써 음악 검색 방법에 멜로디의 시간 변화 특성과 통계적 특성을 함께 적용할 수 있었다. 또한 pitch 히스토그램과 MFCC-VQ 템포럴 방법을 모두 사용한 hybrid 방식에 적절한 패턴 매칭 방법을 제안함으로써 기존의 각 단일 방식을 이용한 성능 결과 (MFCC-VQ 템포럴)와 비교하여 볼 때 드라마 OST 검색 범위에서는 평균 $9.9\%$, 가요 1,005곡의 검색 범위에서는 $10.2\%$의 오류 감소율을 나타내었다.