• 제목/요약/키워드: 검색기

검색결과 1,067건 처리시간 0.025초

QCELP에서 중첩된 코드북 검색의 개선 (Improvement of Overlapped Codebook Search in QCELP)

  • 박광철;한승진;이정현
    • 정보처리학회논문지C
    • /
    • 제8C권1호
    • /
    • pp.105-112
    • /
    • 2001
  • 본 논문에서는 이동통신 시스템에서 사용할 수 있는 잡음에 강인하면서 음질이 개선된 QCELP 코드북 검색을 제안한다. 기존 QCELP는 고정 코드 북을 한 번 검색하지만, 본 논문에서는 두 번에서 다섯 번까지 검색을 하고 이를 실험해 본 결과 두 번 검색이 전송률에 따른 음질향상이 최적임을 알게 되었다. 따라서 본 논문에서는 두 번의 정밀 양자화를 통해 여기신호를 상세히 나타내므로써 음질을 향상시키는 개선된 QCELP 부호화기를 제안한다. 실험에서 잡음을 고려하지 않은 환경(강의실, 가정집, 거리, 연구실 등)에서 얻은 음성을 입력자료로 사용하고, 음질은 SNR과 segSNR을 이용하여 측정하였다. 실험 결과, 개선된 QCELP는 기존 QCELP 보다 SNR, segSNR에서 각각 38.35%, 65.51% 향상되었다.

  • PDF

대용량 한글 텍스트 검색 엔진 HMG의 구현 (Implementation of Very Large Hangul Text Retrieval Engine HMG)

  • 박미란;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제1권2호
    • /
    • pp.162-172
    • /
    • 1998
  • 본 논문에서는 영문 텍스트 검색 엔진인 MG(Managing Gigabytes) 시스템과 한글 형태소 분석기 HAM (Hangul Analysis Module)을 이용하여 기가바이트 크기의 텍스트 데이타 처리가 가능한 한글 텍스트 검색 엔진 HMG(Hangul MG)를 구현하였다. 한글 처리를 위해 KSC 5601 완성형 코드를 사용하여 데이타베이스 구축 단계와 질의 처리 단계에서 사용하였다. HMG의 개발을 위해 MG 시스템의 렉시칼 분석기와 파서, 인텍스 구성 모률을 수정하였다. HMG 시스템의 유용성을 보이기 위해 웹에서 한글 소설을 검색할 수 있도록 하는 N NOD (Novel On Demand) 시스템올 구현하였다. HMG 시스템은 한글이 포함된 대규모 전문 검색 시스템의 구축에 활용될 수 있다.

  • PDF

MIRAGE-III 디지털도서관에서 가상문서 검색 서버의 설계 및 구현 (Design and Implementation of a Retrieval Server for Virtual Documents in the MIRAGE-III Digital Library)

  • 이용배;맹성현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권2호
    • /
    • pp.219-230
    • /
    • 2002
  • 인터넷이용의 급증에 따라 지식정보화사회 전반의 작업들이 분산환경의 디지털도서관에 저장되어 있는 멀티미디어 컨텐츠를 쉽고 신속하게 찾아 새로운 정보를 생성 또는 공유하는 작업을 통해 이루어진다. 이를 위해 핵심적으로 연구해야 할 부분은 원격지에 흩어져 있는 정보를 효과적으로 연결시켜서 의미있고 일관된 형태로 보여지도록 하는 것이다. 이 목적을 달성하기 위해 디지털도서관에서는 물리적으로 홑어져 있는 정보들이 논리적으로 일관되게 표현될 수 있는 가상공간을 제공해야 하며 가상공간에서 정보가 표현되었을 때 사용자가 원하는 정보를 신속하게 수집하여 제시할 수 있어야 한다. 가상문서(Virtual Document)란 특정 저장장소에 저장되어 존재하던 물리적 문서(Physical Document)들을 대상으로 사용자에게 필요한 일부분 또는 전체를 동적으로 연결하여 통합한 문서를 의미한다. MIRAGE-III 디지털도서관에서는 일반 텍스트문서와 XML로 기술된 구조화된 가상문서를 대상으로 내용기반 검색을 수행한다. 이 시스템에서는 XML 문서구조를 기반으로 부분문서의 검색이 가능하며 문서의 속성 및 계층구조에 대한 검색과 문서간의 링크관계를 이용한 검색도 가능하다. 본 논문에서는 MIRAGE-III 디지털도서관에서의 질의어처리기 및 검색기를 설계하고 구현한 방법론에 대하여 기술한다.

언어학자를 위한 말뭉치 분석기 (Corpus Analyzer for Linguists)

  • 정석팔;임성현;전진형;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.95-98
    • /
    • 2012
  • 말뭉치는 언어를 연구하기 위한 중요한 재료이다. 본 논문에서는 말뭉치에서 나타나는 언어 현상을 보다 효율적으로 분석하기 위한 언어학자를 위한 말뭉치 분석기를 제안하고 그 구현 방법을 설명한다. 제안하는 말뭉치 분석기는 기본적인 통계 정보와 함께, 형태소 분석된 파일을 대상으로 위치 색인을 포함하는 역파일 색인을 구성하여 빠른 형태소 검색과 다앙한 수준의 연어 검색을 제공한다. 분석기는 세종말뭉치를 기본 말뭉치로 하며, 다앙한 말뭉치에 대한 통계자료와 검색 기능을 제공하기 위해 사용자 말뭉치 파일에 대한 처리도 지원한다. 시스템은 사용자가 업로드한 말뭉치 파일에 대하여 자동 형태소 분석을 제공하며 형태소 분석 결과 수정을 가능하게 하여 다앙한 말뭉치에서 언어학자들의 우리말 연구를 지원한다.

  • PDF

고객 상품 추천을 위한 온톨로지 자동 생성 (Automatic Ontology Generation for Item Recommendation to Customer)

  • 구미숙;황정희;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.235-237
    • /
    • 2004
  • 최근 인터넷 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보자원을 효과적으로 검색하기 위한 방법으로 메타데이터를 이용하여 필요한 정보 자원에 정확하게 접근하는 방법이 다양한 분야에서 제안되고 있다. 메타데이터는 정보자원을 효과적으로 검색하고 데이터를 재가공하여 다양한 각종 정보자원에 대한 정보 및 기록 관리를 할 수 있다. 이 논문에서는 정보를 효율적으로 검색하기 위하여 XML을 이용한 온톨로지 기반의 메타데이터를 이용한다. 홈쇼핑 사이트의 고객인 소비자를 대상으로 효율적인 정보 추천 및 검색을 위해, 상품 토픽맵 온톨로지를 구축하고 소비자에게 알맞은 쇼핑 정보를 전달하기 위한 정보검색 시스템을 설계 구축한다. 온톨로지의 자동적 구축은 데이터 마이닝 기법인 COBWEB의 개념 계층적 클러스터링 알고리즘을 이용하였다. 기존의 전문가에 의한 수동적인 온톨로지 구축을 자동화 시키므로써, 대량의 온톤로지를 구축하여 정보검색에 효율을 기할 수 있다.

  • PDF

XML 문서의 구조 검색을 위한 저장 시스템 설계 및 구현 (A Design and Implementation of an XML Document Storage System for Structural Query)

  • 정병인;김희준;이재완
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 춘계종합학술대회
    • /
    • pp.284-287
    • /
    • 2000
  • 정보 통신 기술의 발전에 따라 복잡하고 다양한 정보들을 컴퓨터를 이용한 합리적인 방법을 통해 저장, 관리, 검색하여 활용해야 할 필요성이 높아지고 있다. 이러한 환경에서 많이 이용되고 있는 문서 포맷 중의 하나가 XML 이다. XML은 SGML과 HTML의 단점을 해결 및 보완한 것이기 때문에 인터넷을 기반으로 하여 많은 분야에서 활용이 될 전망이다. 따라서 증가하는 XML 문서들을 저장하고 관리하는 기능은 필연적으로 필요하게 된다 또 한 많은 양의 저장된 문서들에 대해서 원하는 문서를 찾을 수 있는 효율적인 검색 기능이 필요로 하게 된다. 따라서 제안한 XML 저장관리 시스템은 XML이 지닌 다양한 문서 정의들에 대한 손실이 없이 저장할 수 있는 모델과 데이터베이스에 최소한의 부하만을 주어 구조기반 검색을 수행할 수 있는 검색기 등을 설계 및 구현하였다.

  • PDF

복합명사의 통계적 처리에 대한 평가 (The evaluation of statistic processing on korean compound nouns)

  • 남세진;이지연;신동욱;채미옥
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.36-41
    • /
    • 1996
  • 한글을 대상으로 하는 검색 시스템의 강우 문서의 대부분을 차지하는 복합명사는 원칙적으로 단어와 단어 사이를 띄어 써야 하지만 붙여쓰기 또한 허용하므로 정보 검색 시스템에서는 이를 고려하여야 한다. 본 논문에서는 MIDAS/IR 정보검색 시스템에서 통계적인 정보를 이용하여 복합명사를 처리하는 방법을 구현하고 이를 실험을 통하여 평가하고자 한다. MIDAS/IR은 크게 복합명사의 통계적인 정보를 이용하는 색인 부분과 확장 불리한 모델 및 벡터 공간 모델을 제공하는 검색 부분으로 이루어져 있다. 색인기에서는 복합명사를 처리할 뿐 아니라 고유명사와 같이 사전에 등록되지 않은 명사를 처리하는 작업을 하게 되며 검색 부분은 클래스 라이브러리로 구현되어 있어 임의의 검색 모델도 쉽게 추가 될 수 있도록 설계하였다. 본 연구에서는 KTSET을 이용하여 불리한 모델 및 벡타 공간 모델에서의 성능을 실험을 통하여 평가하였으며, n-그램을 사용한 시스템과 비교 분석하였다.

  • PDF

Wavelet Templates를 이용한 영상 검색 (Image Retrieval Using Wavelet Templates)

  • 서덕원;김종훈;김대중;이성기;곽훈성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.117-120
    • /
    • 2002
  • 본 논문에서는 정지 영상에서 물체를 검출하는 방법을 제안한다 제안하는 방법은 먼저 정지 영상 내에서 찾을 물체에 대해서 웨이블렛 변환을 통해서 템플릿을 만든다. 만들어진 템플릿은 웨이블렛 변환의 특징을 토대로 중요한 특징 벡터만 한곳에 모이게 된다. 그 중요한 특징 벡터를 모아놓은 템플릿을 토대로 영상 검색을 하는 것이다. 예를 들어 영상 내에서 보행자를 찾는다면, 보행자 영상을 웨이블렛 변환을 통해서 템플릿을 만든다. 만들어진 템플릿을 토대로 영상 내에서 보행자를 검색할 수 있는 분류자를 만든다. 검색한 영상 내에서 보행자랑 유사한 Positives를 이미 만들어진 분류자를 통해서 찾으면 찾은 결과를 가지고 만들어진 템플릿에 비교를 한 후 최종적으로 보행자를 찾아내는 시스템이다. 이 시스템은 꼭 보행자뿐만 아니라 사용자가 검색하기 원하는 물체를 웨이블렛을 통해서 템플릿화 해 놓으면 물체를 효과적으로 검색 할 수 있다.

  • PDF

시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현 (Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data)

  • 김점숙;안동언;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이의 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여 할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

특징 정보를 이용한 다단계 내용기반 영상 검색 기법 (Multi-Level Content-Based Image Retrieval Technique Using Feature Information)

  • 김봉기;오해석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.395-405
    • /
    • 1998
  • 최근 멀티미디어 기술의 발전으로 인해 영상을 효율적으로 검색할 수 있는 영상 데이터베이스 시스템이 정보화 사회의 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용기반 영상 데이터 검색을 위한 영상 특징 추출 방법으로 색상 정보와 모양 정보를 고려하는 다단계 영상 검색 시스템을 제안하였다. 1단계에서는 색상 정보론 얻기 위해서는 Striker 등이 제시한 색상 분포 특성을 이용한 색인 방법의 문제점을 보완하고 확장해서 지역 색상 분포 특성을 고려한 색인 방법을 사용하여 1차로 영상을 대분류한다. 2단계에서는 1단계에서 대분류된 집단 영상들에 대하여 2차로 모양 정보를 이용하여 사용자가 질의한 영상과 유사한 영상을 최종적으로 검색한다. 모양 정보를 얻기 위해서는 기존 불변 모멘트의 문제점인 많은 연산량과, Jain 등이 제시한 방향 히스토그램 인터섹션 방법에서 제기된 회전에 민감하다는 문제점을 해결하기 위해 물체의 윤곽선에 해당하는 화소들만을 대상으로 연산을 수행하는 향상된 불변 모멘트(Improved Moment Invariants : IMI)를 이용한다. 실험 영상으로 300개의 자동차 영상을 사용하여 기존 방법들과의 비교 실험을 통해 향상된 검색 결과를 얻을 수 있었다.

  • PDF