• 제목/요약/키워드: 데이터 검색

검색결과 3,727건 처리시간 0.032초

XMDR을 이용한 멀티데이터베이스 통합 검색 시스템 (Multi-Database Integration Retrieval System using XMDR)

  • 허욱;문석재;엄영현;정계동;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.121-126
    • /
    • 2008
  • 한 도메인 내의 통합검색시스템에서 메타데이터를 이용하여 분산되어있는 데이터를 공유하고 표준화하여 정보를 통합검색 할 수 있다. 하지만 메타데이터를 특정 도메인에 맞게 설계하여 메타데이터 레포지스토리로 구축되어진 조직 간에 데이터요소 의미, 구조, 형식상의 이질적인 문제들이 발생하여 통합 검색하기 어렵다. 따라서 본 눈문에서는 XMDR(eXtended Metadata Registry)을 이용한 멀티데이터베이스 통합 검색 시스템을 제안한다. 제안된 시스템은 레거시 데이터 시스템들 간의 협업에 필요한 데이터를 공유 및 교환하는데 실시간으로 변화하는 데이터를 일관성 있게 유지할 수 있으며 통합 검색시 단일 인터페이스를 제공하여 각 시스템의 독립성을 유지하면서 데이터의 투명성과 가용성을 향상 시킬 수 있다.

  • PDF

규칙기반 데이터 증강기법을 활용한 한국어 증상발화 데이터 구축 (Construction of Korean symptom articulation data using rule-based data augmentation technique)

  • 전성원;이동준;이동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.360-362
    • /
    • 2023
  • 건강정보 검색 요구가 증가하면서 다양한 건강정보 검색 서비스가 제공되고 있다. 하지만 최근의 건강정보 검색 서비스는 정형화 된 전문적인 의료정보와 그 해석을 제공하기 때문에 사용자는 이러한 정보를 스스로 이해하여 원하는 건강정보를 검색해야 한다. 사용자의 검색 피로를 줄이고 원하는 정보를 정확하게 얻을 수 있는 건강정보 검색 시스템 개발을 위하여 사용자의 비의료적 표현인 한국어 증상발화 데이터 구축이 선행되어야 한다. 이러한 데이터 구축은 많은 시간과 비용이 필요하기 때문에 이를 줄이기 위한 규칙기반 데이터 증강기법을 제시하고, 이를 활용하여 한국어 증상발화 데이터를 증강하였다. 증강된 데이터의 유효성을 보이기 위하여 KoBERT 기반의 증상분류 실험을 진행하였으며, 증강된 데이터가 그 전의 데이터보다 F1 스코어가 더 높음을 확인할 수 있었다.

DBMS을 활용한 파일 검색엔진 연구 (A Study on File Search Engine Based on DBMS)

  • 김형석;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.548-551
    • /
    • 2016
  • 기존 그리드 기반의 전통적인 RDBMS는 비구조적 데이터에 대한 색인이 지원되지 않았다. 이러한 제약 조건들로 인해 파일 문서 및 비 구조화된 데이터의 검색 엔진으로는 부적합하였다. 최근에 다양한 검색 오픈소스(Solr, Lucene)등으로 검색 엔진이 개발되어 활용되고 있지만, 검색한 결과와 기존 데이터의 연동이 쉽지 않고 구조 변경이 어려우며, 사용자의 다양한 요구 사항 수용이 쉽지 않은 단점을 가지고 있다. 따라서 본 연구에서는 빠른 검색을 위한 색인 (index) 최적화와 대용량 데이터 처리를 위한 파티션 기반 데이터의 분할 및 정복 (divide and conquer) 처리, 이중화된 검색어 색인 기능을 구현하였다. 또한 동의어 사전을 구축하여 연관 관계 분석이 가능하도록 DB를 구축하여 검색어와 동의어의 상호 관계성을 유지하였으며 오픈 소스보다 발전한 형태의 검색 엔진을 개발하는 것을 목표로 하였다. 본 연구를 위해 약 400만건 이상의 다양한 포맷 (Ms-office, Hwp, Pdf, Text)등의 파일 문서를 샘플로 실험을 진행하였다.

트리기반 멀티미디어 데이터의 의미적 검색을 위한 프레임워크 설계 (Design of the Framework for Tree-based Semantic Retrieval of Multimedia Data)

  • 안형근;고재진;양상석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.133-135
    • /
    • 2005
  • 현재 웹을 사용하는 사람, 디지털 컨텐츠, 정보의 생성이 계속적으로 증가하여 오고 있다. 최근 웹 데이터는 멀티미디어 데이터(비디오, 오디오, 웹TV, 이미지 등)라고 말해도 무방할 것이다. 이런 방대한 멀티미디어 데이터의 검색은 사용자들에게는 아주 중요한 작업이 되었으며, 효과적인 멀티미디어 검색 시스템의 필요성이 대두되고 있다. 최근까지의 멀티미디어 데이터 검색은 내용${\cdot}$주석기반의 검색이 주를 이루고 있다. 하지만 내용${\cdot}$주석 기반 검색은 의미${\cdot}$추론적 검색에서는 부족함을 보여주고 있는 실정이다. 따라서 본 논문에서는 검색 방법 중에서도 주석 기반 검색에서 가지는 문제점을 살펴보고 그에 대한 해결 알고리즘과 프레임워크를 제안한다.

  • PDF

원격 저장소 환경을 고려한 공개키 검색 가능 암호 시스템 (Public-key Searchable Encryption System: Considering Remote Storage Environment)

  • 이선호;박성욱;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.869-870
    • /
    • 2011
  • 통신이 발달로 인터넷 망을 이용해 고용량의 데이터를 빠르게 주고받을 수 있게 되었으며, 이로 인하여 데이터를 원격 저장소에 저장하여 언제 어디서든 빠르게 접근할 수 있는 서비스가 발전하게 되었다. 하지만 데이터를 저장하는 서버의 보안 및 서버관리자의 신뢰 문재가 발생하게 되었고, 이를 해결하기위해 서버에 저장되는 데이터의 암호화 및 이를 검색할 수 있는 기술이 필요하게 되었다. 기존의 검색 가능 암호의 경우 이메일 서비스를 기반으로 구성이 되어 하나의 데이터에 많은 키워드를 저장하게 되는 원격 저장소 서비스에 적용하기 어렵다. 또한 필드 기반 검색기능을 제공해 검색이 유연하지 않고 결합 키워드 검색 시 연산의 효율성이 떨어지는 문제점이 존재한다. 따라서 본 논문은 블룸필터를 사용하여 대량의 키워드를 효율적으로 저장 및 검색 할 수 있으며 필드 프리한 결합키워드 검색을 지원하는 공개키 검색 가능 암호 시스템을 제안한다.

대규모 이미지 데이터베이스에서 고차원 색인 구조를 이용한 효율적인 내용 기반 검색 시스템 (An Efficient Content-based Retrieval System using High-Dimensional Index Structure Image Database)

  • 이동호;박주홍;정진완;김형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권1호
    • /
    • pp.52-65
    • /
    • 1999
  • 이미지나 비디오, 오디오와 같이 멀티미디어 데이터들은 기존의 단순한 텍스트 기반의 데이터에 비하여 대용량적인 특성과 비정형적인 특성을 가지고 있어서 검색시 많은 어려움이 따른다. 본 논문에서는 대규모의 이미지 데이터베이스에서 효율적이고 신속하게 사용자가 원하는 이미지를 검색할수 있는 내용 기반 검색 시스템을 제시한다. 이를 위해서 본 논문에서는 최근 여러 장점으로 인하여 신호 분석이나 이미지 압축 분야에 많이 사용되는 웨이브릿 변환을 이용하여 이미지 데이터로부터 내용 기반 검색에 사용되는 특징 벡터를 효율적으로 추출하는 기법과 유사성 측정 방법을 제안한다. 그리고, 이러한 특징 추출방법과 유사성 측정 방법을 이용하여 내용 기반 질의 및 검색을 수행할 경우, 검색 조건을 만족하는 객체인데 실수로 검색해내지 못하는 경우인 false dismissals 이 발생하지 않음을 보인다. 또한 대규모 이미지 데이터베이스에서 신속한 내용 기반 검색을 지원하기 위하여 고차원 데이터에 대한 효율적인 색인을 제공하는 X-tree를 이용한 이미지 색인 방법을 보이며 이것이 기존의 순차 검색이나 R*-tree를 이용한 색인 방법보다 신속하게 이미지 데이터들을 검색할 수 있다는 것을 다양한 실험을 통해 보인다. 마지막으로 QBIC에서 제안한 검색 적합성 측정 방법을 이용하여 본 논문에서 제안하는 내용 기반 이미지 검색시스템의 검색 적합성을 보인다.

XML 기반 멀티미디어 데이터의 효율적인 구조 정보 검색 (Effective Structure Information Retrieval of Multimedia Data Based on XML)

  • 임정윤;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.129-132
    • /
    • 2001
  • 웹의 대중화와 컴퓨터 기술의 발달로 멀티미디어 데이터의 사용이 크게 증가하고 있지만, 사용자가 원하는 멀티미디어 데이터의 일부분과 해당 데이터의 구조정보를 검색하는 기능은 제공되고 있지 않다. 본 논문에서는 사용자가 원하는 내용을 포함하고 있는 멀티미디어 데이터를 검색하고, 그 데이터의 구조정보를 XML 문서 형태로 보여주기 위하여, 객체지향 데이터베이스 시스템을 이용하여 대용량의 멀티미디어 데이터와 해당 데이터를 표현한 XML 문서를 저장하고, 사용자의 질의를 처리하기 위한 효율적인 구조정보 검색 방법을 제안한다.

  • PDF

XMDR을 이용한 지능형 검색 온톨로지 서버 구축에 관한 연구 (A Study of Ontology Server based Intelligent Retrieval using XMDR)

  • 황치곤;이민노;정계동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2005
  • 인터넷 및 분산 환경에서 XML은 애플리케이션 간의 자료 저장 및 자료 교환을 위한 표준으로써, XML 문에 대한 연구가 활발히 진행되고 있다. 따라서 이기종 관계형 데이터베이스 시스템들 간의 메타데이터 및 데이터 교환을 위해 W3C에서 제안한 XML Schema를 사용한다. XML Schema는 평면적 구조인 관계형 데이터베이스 시스템의 메타데이터 및 데이터를 계층적 구조인 XML 문서형식으로 나타낼 수 있는 메커니즘을 가지고 있으며, 다양한 원시 데이터 형식을 지원하여 관계형 데이터베이스 시스템이 제공하는 데이터형식을 충분히 반영할 수 있는 구조를 가지고 있다. 또한 기존의 이질적인 전자상거래 플랫폼을 사용하므로 인해 발생하는 시스템간의 상호 호환 및 운영의 어려움이 있다. 그러나 분산 환경에서 이질적인 특성을 해결하기 위해서 XML을 기반으로 하는 쇼핑몰들의 통합된 정보를 검색할 수 있는 사이트가 등장하고 있어 고객들이 구매하고자 하는 상품에 대한 정보를 보다 쉽게 검색할 수 있도록 각종 쇼핑몰 사이트를 연결하여 통합하는 과정이 진행 중이다. 따라서 상품을 검색할 때 메타데이터를 이용하여 선택에 필요한 정보를 고객에게 제공함으로서 상품을 효율적으로 검색할 수 있다. 따라서 XML기반으로 분산된 이 기증의 시스템들을 온톨로지(Ontology)기반의 메타데이터를 이용하여 상품을 검색할 수 있는 시스템을 제안하고, 온톨로지 기반의 메타데이터 XMDR(eXtended MetaData Registry)을 이용한 상품 검색 시스템을 효율적으로 검색하기 위한 온톨로지 서버 구축에 관한 방법을 제안한다.

  • PDF

색상과 모양 특징을 이용한 효율적인 이미지 검색기법 (Efficient Image Search Technique Using Color and Shape Feature)

  • 조범석;박영배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2000
  • 내용기반 이미지 검색을 위한 기존의 대부분의 기법들은 이미지 데이터에 효과적으로 적용할 수 있는 고차원의 색인구조를 고려하지 않았다. 이 연구에서는 이미지 데이터베이스에서 보다 효율적이며 정확도가 높은 검색결과를 기대할 수 있는 색상 특징 데이터 표현방법인 ECCV기법, 모양 특징 데이터 표현방법인 EPA기법을 소개한다. 또한 고차원 데이터에 대해서도 검색속도를 향상시킬 수 있는 새로운 다차원 공간 인덱스 구조인 XS-트리를 제안한다. 이 방법을 이용하면 특징표현단계에서는 차원의 수가 증가되어 저장에 필요한 공간을 많이 요구하지만 인덱싱 단계를 거치면 이미지 검색 속도가 향상되며 정확한 이미지를 검색 할 수 있는 장점이 있다.

  • PDF

시퀀스 데이터웨어하우스에서 이산푸리에변환과 비트맵을 이용한 시퀀스 스트림 색인 기법 (Sequence Stream Indexing Method using DFT and Bitmap in Sequence Data Warehouse)

  • 손동원;홍동권
    • 한국지능시스템학회논문지
    • /
    • 제22권2호
    • /
    • pp.181-186
    • /
    • 2012
  • 최근 시간적으로 변화된 데이터에서 유사한 값의 움직임 즉 유사 패턴을 검색하는 연구가 활발히 진행되고 있다. 시간적으로 변화된 데이터는 시계열 데이터 (time series data) 또는 시퀀스 데이터(sequence data)로 분류되며 기존의 스칼라 값을 가지는 데이터와는 매우 다른 의미를 가진다. 본 논문에서 유사 시퀀스 검색은 시퀀스 데이터웨어하우스에서 값의 변화가 유사한 형태를 가지는 시퀀스들을 검색한다. 유사 시퀀스를 검색하기 위하여 본 논문에서는 먼저 시퀀스 원시 데이터에 이 산 푸리에 변환(DFT, Discrete Fourier Transform)을 적용하여 데이터를 변환한다. 변환된 데이터는 그 특성으로 인하여 유사 패턴의 검색에 적합하며 또 유사도를 비교할 때 일부분만 사용되므로 색인에 사용되는 속성의 개수를 줄이는 장점이 있다. 또 데이터웨어하우스 환경이므로 더 좋은 성능을 보일 수 있는 비트맵 색인 기법을 적용하였다. 시퀀스 데이터의 효율적인 검색을 위하여 영역 지정 검색 방법을 제안하고 효율적인 실행을 위한 비트맵을 활용한 다양한 조합의 색인을 생성하고, 질의 최적화기의 연산 비용을 비교하면서 효율적인 검색 연산을 위한 최저 비용의 색인을 선택하는 기법을 연구하였다.