• 제목/요약/키워드: Query Index

검색결과 410건 처리시간 0.022초

내용 기반 음악 정보 검색에서 주제 선율의 변화 패턴을 이용한 색인 및 검색 기법 (Indexing and Retrieval Mechanism using Variation Patterns of Theme Melodies in Content-based Music Information Retrievals)

  • 구경이;신창환;김유성
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.507-520
    • /
    • 2003
  • 본 연구에서는 내용 기반 음악 정보 검색 시스템의 검색 속도를 증진하기 위해 음악의 대표 선율인 주제 선율을 추출하여 주제 선율 색인을 구성하고 이를 이용한 효율적인 내용 기반 음악 정보 검색 기법을 제안하였다. 추출된 주제 선율을 다차원 공간 색인 기법인 M-tree를 이용하여 주제 선율 색인으로 구성하기 위해 주제 선율의 평균 음 높이 변화량과 평균 음 길이 변화량을 이용하였으며 검색의 정확도를 증진하기 위해 음 높이 변화 패턴을 요약한 높이 시그니처와 음 길이 변화 패턴을 요약한 길이 시그니처를 이용하였다. 또한 제안된 내용 기반 음악 정보 검색 기법에서는 사용자의 질의 선율로부터 질의 선율의 패턴 정보를 구성하고 M-tree의 k-근접 검색 및 범위 검색 기법을 이용하여 사용자의 질의 선율과 유사한 주제 선율을 포함하고 있는 음악 정보를 검색한다. 검색된 결과로부터 순위 부여한 후 사용자 피드백을 하여 사용자의 만족도를 증진하기 위한 특성을 포함하도록 하였다. 또한, 본 논문에서 제안된 주제 선율 색인 기법 및 내용 기반 검색 기법을 포함한 내용 기반 음악 정보 검색 시스템의 프로토타입을 구현하여 제안된 기법의 실효성을 입증하였다.

고유성분 분석과 휘도성분 흐름 특성을 이용한 내용기반 비디오 검색 (Content-Based Video Search Using Eigen Component Analysis and Intensity Component Flow)

  • 전대홍;강대성
    • 융합신호처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.47-53
    • /
    • 2002
  • 본 논문은 동영상의 대표프레임에서 eigen value와 휘도 성분을 이용한 내용기반 검색 기법에 관한 연구이다. video를 shot단위로 분할하여 shot을 대표하는 대표프레임을 얻어내고, 그 대표프레임을 Eigen Component Analysis(ECA)를 이용하여 데이터베이스를 생성하여 shot들의 휘도값 분포를 구한다. 생성된 코드북과 각 대표 프레임에 대한 코드북 인덱스 값, 휘도값을 database화하여 질의 영상과 video database간의 저장된 비디오들의 코드북과 코드워드간의 유클리디안 거리를 이용하여 유사도 높은 비디오를 찾고, 검색되어진 video에 포함된 대표프레임들의 코드북 인덱스 값과 입력 영상의 코드북 인덱스 값을 비교하여 입력 영상의 특징과 가장 유사한 대표프레임을 얻어낸다. 실험결과 제안된 방법이 검색에 있어서 영상의 형태에 대한 전체적인 특징을 제공하는 대표프레임의 eigen value와 휘도 성분을 이용함으로서 보다 검색 결과가 우수하며, 영상의 통계적인 특성을 이용함으로서 시간과 메모리 공간을 줄일 수 있음을 확인하였다.

  • PDF

위치기반 서비스에서 개인 정보 보호를 위한 K-anonymity 및 L-diversity를 지원하는 Cloaking 기법 (Cloaking Method supporting K-anonymity and L-diversity for Privacy Protection in Location-Based Services)

  • 김지희;이아름;김용기;엄정호;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권4호
    • /
    • pp.1-10
    • /
    • 2008
  • 최근 무선 인터넷에서 사용자의 위치정보가 다양한 애플리케이션의 정보 요소로 활용되기 시작하였다. 이러한 애플리케이션의 하나로 위치기반 서비스(Location-Based Service)가 주목을 받고 있다. 그러나 위치기반 서비스에서는 서비스를 요청하는 사용자가 자신의 정확한 위치 정보를 데이터베이스 서버로 보내기 때문에 사용자의 개인 정보가 노출될 수 있는 취약성을 지니고 있다. 이에 모바일 사용자가 안전하고 편리하게 위치기반 서비스를 사용하기 위한 개인 정보 보호 방법이 요구된다. 이를 위해 본 논문에서는 K-anonymity 및 L-diversity를 고려한 cloaking 기법을 제안한다. 이 기법은 먼저 사용자가 요구하는 L개의 건물을 탐색하는 L-diversity를 수행한 뒤, K명의 사용자를 탐색하는 K-anonymity를 수행하여 최소한의 넓이는 가지는 cloaking 영역을 생성한다. 이를 위해, R*-트리 기반의 색인 구조를 사용하며, 특히 효율적인 cloaking 영역 생성을 위해 필터링 방법을 사용한다. 마지막으로 성능평가를 통해 본 논문에서 제안한 cloaking 기법이 기존의 그리드 기법보다 우수함을 보인다.

  • PDF

위치기반 서비스에서 개인 정보 보호를 위한 그리드를 이용한 Cloaking 영역 생성 알고리즘 (An Algorithm for generating Cloaking Region Using Grids for Privacy Protection in Location-Based Services)

  • 엄정호;김지희;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.151-161
    • /
    • 2009
  • 위치기반 서비스(Location-Based Service) 에서는 위치-기반 질의를 요청하는 사용자가 자신의 정확한 위치 정보를 데이터베이스 서버로 보내기 때문에, 사용자의 개인 정보가 상대방에게 노출될 수 있다. 따라서 사용자가 안전하게 위치기반 서비스를 사용할 수 있기 위해서는 개인 정보 보호 방법이 요구된다. 따라서 본 논문에서는 위치기반 서비스에서 개인정보 보호를 위한 새로운 클로킹(cloaking) 영역 생성 알고리즘을 제안한다. 제안하는 기법은 그리드를 이용하여 사용자가 요구하는 L개의 건물을 탐색한 후, K명의 사용자를 탐색하는 K-anonymity를 수행하여 최소 크기의 클로킹 영역을 생성한다. 이를 위해 그리드 기반의 색인 구조 및 효과적인 가지치기 방법을 사용한다. 마지막으로 성능평가를 통해 본 논문에서 제안하는 클로킹 영역 생성 알고리즘이 클로킹 영역의 크기 측면에서 기존의 연구보다 우수함을 보인다.

  • PDF

다이나믹 데이터 웨어하우스 환경에서 OLAP 영역-합 질의의 효율적인 처리 방법 (Efficient Processing method of OLAP Range-Sum Queries in a dynamic warehouse environment)

  • 전석주;이주홍
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.427-438
    • /
    • 2003
  • 데이터 웨어하우스에서 사용자는 전형적으로 상호작용적으로 질의를 부여함으로서 추세와 패턴 또는 예외적인 데이터의 행위를 검색한다. OLAP 영역-합 질의는 데이터 웨어하우스에서 추세를 발견하거나 또는 애트리뷰트들간의 관계를 발견하는데 폭 넓게 사용되고 있다. 최근의 기업환경은 데이터 큐브의 데이터 요소들이 자주 바뀌게 된다. 문제는 프리픽스 섬 큐브를 업데이트하는 비용이 매우 크다는 것이다. 이 논문에서는Δ-트리로 불리는 인덱싱 구조를 사용하여 업데이트 비용을 상당히 줄이는 참신한 알고리즘을 제안한다. 또한, 근사 또는 정확한 해를 제공하므로 질의의 전체비용을 줄일 수 있는 하이브리드 방법을 제안한다. 이는 의사 결정 지원 시스템과 같이 시간을 많이 소비하는 정확한 해보다는 빠른 근사 해를 필요로 하는 다양한 응용들에 큰 장점이 있다. 폭 넓은 실험은 우리의 방법이 다른 방법들과 비교하여 다양한 차원에서 매우 효율적으로 수행됨을 보여준다.

GORank: Gene Ontology를 이용한 유전자 산물의 의미적 유사성 검색 (GORank: Semantic Similarity Search for Gene Products using Gene Ontology)

  • 김기성;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.682-692
    • /
    • 2006
  • 유사한 생물학적 특성을 가진 유전자 산물을 검색하는 것은 생물정보학 연구에 필수적인 기술이다. 현재 대부분의 생물학 데이타베이스에서 Gene Ontology의 용어를 사용하여 유전자 산물의 생물학적 특성을 기술하고 있다. 본 논문에서는 이런 유전자 산물의 주석 정보를 사용해 의미적으로 유사한 유전자 산물을 검색하는 방법을 제안한다. 이를 위해 우선 정보 이론에 기반한 유전자 산물간의 의미적 유사도를 정의하였다. 그리고 이 유사도를 이용한 의미적 유사성 검색 알고리즘을 제안하였다. 의미적 유사성 검색을 처리하기 위해 Fagin의 문턱값 알고리즘(threshold algorithm)을 다음과 같이 변형한 기법을 사용하였다. 우선 사용하는 유사도 함수가 단조 증가 성질을 갖지 않기 때문에 유사도 함수에 맞는 문턱값을 재정의 하였다. 또 역색인 리스트의 구조를 사용하여 중간 검색을 생략할 수 있는 클러스터 스키핑 기법과 역색인 리스트 액세스 순서를 제안하였다. 실제 GO와 주석 정보를 이용하여 성능 평가를 했으며 제안한 알고리즘은 효율적인 알고리즘임을 보였다.

메타정보 인터페이스를 이용한 이질 구조 분석 XML문서 통합 검색 (Integrated Information Retrieval with Metadata Interface for Heterogeneous Distributed XML Documents)

  • 류성준;황재문;김태훈;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1505-1518
    • /
    • 2004
  • 본 논문은 구조적, 의미론적 이질성을 가진 분산 XML 문서의 통합 검색을 위해 반자동으로 생성된 인터페이스를 통해 각 지역 문서에 대한 질의를 생성하여 검색하는 방법을 제안한다. 본 시스템에서는 데이타 통합을 위한 메타데이타 인터페이스인 DDXMI(Distributed Documents XML Metadata Interface)를 정의하고, 분산 데이타에 대한 DTD를 입력으로 받아 사용자로 하여금 전역 DTD와 각 지역 DTD 간의 의미 차이를 극복하기 위한 사용자 인터페이스 생성 방법을 제안하였다. 전역 DTD와 지역 DTD의 특성을 고려하여 인덱스 매핑과 그에 필요한 함수 이름의 매핑 정보를 기반으로 DDXMI가 자동으로 생성된다. XML 질의 언어인 Quilt를 사용하여 생성된 DDXMI를 통해 각 지역 문서에 적합한 질의를 생성, 수행한다 사용자는 검색 대상 문서의 스키마와 통합스키마의 구조를 잘 알고 있다고 가정하였다. XML로 만들어진 석박사 논문, 논문지, 연구보고서에 대한 소규모, 중규모 전역 DTD를 만들어 실제로 질의를 생성하여 검색 결과를 검증할 수 있도록 하였다. 본 시스템은 JavaCC와 Java 서블릿을 이용하여 개발하였다.

의미 기반의 질의 분석 및 확장 (Question Analysis and Expansion based on Semantics)

  • 신승은;박희근;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.50-59
    • /
    • 2007
  • 본 논문에서는 효율적인 정보검색을 위한 의미 기반의 질의 분석 및 확장을 제안한다. 기존의 정보검색 시스템들은 사용자 질의로 자연언어 질의를 허용하고 있지만 단순히 명사 단어의 색인어를 사용자 질의로부터 추출하여 정보검색에 활용하기 때문에 사용자의 질의 의도를 반영한 정보검색을 하지 못한다. 이러한 문제점을 해결하기 위해서 의미 기반 질의 분석 및 확장은 사용자의 질의를 의미적으로 분석하여, 질의유형을 결정하고 의미 자질들을 추출한다. 추출된 의미 자질들과 정답을 표현하기 위해 사용되는 구문구조를 이용하여 사용자 질의를 확장한다. 또한 확장된 질의를 이용하여 정답을 포함하는 관련문서들을 정보검색 결과의 상위에 랭크시킬 수 있는 방법을 제시한다. 비교적 짧지만 사용자의 질의 의도를 충분히 표현하고 있는 자연언어 질의에 대한 의미 기반의 질의 분석 및 확장을 통해 정보검색의 정확률을 향상시킬 수 있음을 보였다.

퍼지 k-Nearest Neighbors 와 Reconstruction Error 기반 Lazy Classifier 설계 (Design of Lazy Classifier based on Fuzzy k-Nearest Neighbors and Reconstruction Error)

  • 노석범;안태천
    • 한국지능시스템학회논문지
    • /
    • 제20권1호
    • /
    • pp.101-108
    • /
    • 2010
  • 본 논문에서는 퍼지 k-NN과 reconstruction error에 기반을 둔 feature selection을 이용한 lazy 분류기 설계를 제안하였다. Reconstruction error는 locally linear reconstruction의 평가 지수이다. 새로운 입력이 주어지면, 퍼지 k-NN은 local 분류기가 유효한 로컬 영역을 정의하고, 로컬 영역 안에 포함된 데이터 패턴에 하중 값을 할당한다. 로컬 영역과 하중 값을 정의한 우에, feature space의 차원을 감소시키기 위하여 feature selection이 수행된다. Reconstruction error 관점에서 우수한 성능을 가진 여러 개의 feature들이 선택 되어 지면, 다항식의 일종인 분류기가 하중 최소자승법에 의해 결정된다. 실험 결과는 기존의 분류기인 standard neural networks, support vector machine, linear discriminant analysis, and C4.5 trees와 비교 결과를 보인다.

로렌츠 커브를 이용한 하둡 플랫폼의 최적화 지수 (Measuring Hadoop Optimality by Lorenz Curve)

  • 김우철;백창룡
    • 응용통계연구
    • /
    • 제27권2호
    • /
    • pp.249-261
    • /
    • 2014
  • 최근 큰 관심을 받는 빅데이터는 분산처리를 통해서만 효과적으로 처리할 수 있다. 분산처리란 주어진 쿼리를 여러 대의 컴퓨터로 분할하고 각 분할된 데이터의 계산 결과를 취합하는 과정으로, 주어진 하드웨어 리소스를 효과적으로 최대한 사용하는 것이 중요하다. 하둡은 이러한 분산처리를 가능하게 하는 플랫폼 중의 하나로 분산처리에 사용된 컴퓨터의 개수만큼 성능 향상을 기대할 수 있는 확장성을 최대한 보장하는 매우 성공적인 플랫폼이다. 이 논문에서는 하둡 플랫폼이 얼마나 최적화 되어있는지에 대한 객관적이고 계량적인 지수를 제공함으로써 주어진 하둡 플랫폼의 효율성을 측정한다. 방법론적으로는 로렌츠 커브를 이용하여 하드웨어 리소스들이 얼마나 잘 균등히 배분되어 있는지 살펴보고 CPU, 디스크 일기/쓰기 및 네트워크 병목현상에 따른 비용을 감안한 최적화된 로렌츠 커브를 찾음으로써 최적화 지수를 산출한다. 바꾸어 말하면, 이러한 최적화 지수는 주어진 하둡 플랫폼이 얼마만큼의 성능 향상이 가능한지 알려주는 척도로 오랜 시간을 필요로 하는 빅테이터의 처리 속도 개선을 위한 중요한 정보를 제공한다. 실험 자료 및 모의실험을 통해 본 논문에서 제안된 방법을 검증하였다.