• 제목/요약/키워드: 데이터베이스 탐색

검색결과 407건 처리시간 0.025초

조상-자손 관계 탐색을 지원하기 위한 XML 타입상속 색인구조의 계층적 구성기법 (XML Type Inheritance Index Hierarchies for Supporting Ancestor-descendant Exploration)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1133-1148
    • /
    • 2012
  • 본 논문에서는 XML 데이터베이스에서 XML 질의처리를 효율적으로 지원하기 위한 다차원 타입상속 색인구조(MD-TIX)들의 계층적 구성기법을 제시한다. MD-TIX는 중첩요소와 여러 타입상속 계층으로 이루어진 중첩술어의 조상-자손 관계 탐색을 효율적으로 지원하기 위하여 다차원 색인구조를 이용하는 색인기법이다. 그러나 이러한 MD-TIX는 질의에 주어진 Xpath의 길이가 긴 경우에 색인 엔트리의 구성문제 때문에 색인구조의 구축과 유지관리에 어려움이 있다. 이를 극복하기 위해서, 본 논문에서는 먼저 주어진 Xpath에서 인접한 두 타입 사이의 직접 관계 탐색을 지원하는 기본 색인구조들을 구축하고, 이들을 바탕으로 Xpath상의 임의의 두 타입 사이의 간접 관계 탐색을 지원하는 유도 색인구조들을 구축한다. 이러한 과정을 전체 길이의 Xpath를 지원하는 하나의 목표 색인구조를 구축하기까지 계층적으로 구성하는 방법을 제시한다. 또한 Xpath 상에 주어진 몇 개의 부경로 탐색만을 지원하기 위한 부분적인 색인계층을 효율적으로 구축하기 위한 알고리즘을 제안한다.

시퀀스 데이터베이스를 위한 서브시퀀스 탐색 : 세그먼트 기반 접근 방안 (Efficient Subsequence Searching in Sequence Databases : A Segment-based Approach)

  • 박상현;김상욱;노웅기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.344-356
    • /
    • 2001
  • 본 논문에서는 시퀀스 데이터베이스에서 시간왜곡 변환(time warping)을 지원하는 서브시퀀스 탐색 문제를 다룬다. 서브시퀀스 탐색은 데이터 시퀀스의 평균 길이의 이차 함수로 성능이 저하된다. 이러한 문제를 해결하기 위하여 본 논문에서는 세그먼트 기반 서브시퀀스 탐색 기법(Segment-Based Approach for Subsequence Searches : SBASS)을 제안한다. SBASS는 데이터와 질의 시퀀스를 연속된 세그먼트들로 분할하여 다음의 두가지 조건을 만족하는 모든 데이터 시퀀스를 검색한다. (1) 세그먼트의 개수가 질의 시퀀스의 세그먼트 개수와 같다. (2) 모든 세그먼트 쌍 간의 거리가 주어진 오차 한도 이내이다. 제안된 세그먼트 분할 기법에서는 세그먼트가 서로 다른 길이를 갖도록 허용하며, 세그먼트 쌀간의 유사성의 척도로서 시간왜곡 변환 거리를 이용한다. 효율적인 유사 서브시퀀스 탐색을 위하여, 각 데이터 세그먼트로부터 요서 값들이 단조적으로 변화하는 특성을 이용하여 특성 벡터를 추출하고, 추출된 특성 벡터를 이용하여 공간 인덱스를 생성한다. 질의는 이 인덱스를 이용하여 (1) R-트리 여과, (2) 특성 여과, (3) 순서 여과, (4) 후처리의 네 단계로 처리된다. 다양한 실험을 통하여 제안된 기법의 효율성을 입증한다.

  • PDF

서지 데이터베이스에서의 레코드 필드 선택이 검색 성능에 미치는 영향에 관한 연구 (A Study of the Influence of Choice of Record Fields on Retrieval Performance in the Bibliographic Database)

  • Heesop Kim
    • 한국문헌정보학회지
    • /
    • 제35권4호
    • /
    • pp.97-122
    • /
    • 2001
  • 본 연구에서는 레코드필드 선택이 대규모 서지 데이터베이스 탐색시 미치는 검색 성능에 대하여 관찰하였다. 실험의 구성 요소는 크게 (1) 대규모 상업용 데이터베이스 INSPEC. (2) 관련된 레코드들 (target sets이라고 정의함). (3) 4개의 키워드가 한 세트로 이루어진 4개의 서로 다른 형태의 질의어들 (CT_TF, CT_IDF, UT_TF, UT_IDF), (4) 최적의 질의를 위한 알고리즘, (5) 가능한 모든 경우의 탐색식을 생성해내는 블리언 탐색식 생성기, 그리고 (6) 실제 운영중인 웹 기반의 검색 시스템으로 이뤄졌다. 실험에서의 레코드 필드 선택은 (1) Abstract, (2) Descriptors, (3) Identifiers, (4) 'Subject'(Descriptors + Identifiers). (5) Title. (6) 'All fields'로 정의하여 독립변수로 채택하였다. 검색 성능은 재현율, 정도율을 모두 반영한 Heine의 D측정에 의하여 평가 되었다. 본 연구에서 얻은 주된 결과로는 (1) 필드선택은 검색성능에 중요한 영향을 미치며, (2) 각 검색 성능에서 보여준 순위는 질의어에 따라 민감한 결과를 보였고 (3) 제목(Title)필드 선택이 D측정에서 최적의 결과를 보였다.

  • PDF

공개데이터 기반 화장품산업의 중국 수출규모 영향 요인 연구 (Identifying factors for Cosmetic Export to China based on Open Data Source)

  • 박선영;김상국;김유일
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.229-248
    • /
    • 2017
  • 지속적으로 산업시장이 고도화되면서 산업시장분석 역시 빅데이터 수준의 데이터 증가에 따라 분석 업무의 효율성 재고가 더욱 요구되고 있으며, 분석 관점역시 차원이 증가하며 분석 방법론의 새로운 적용 필요성이 대두되고 있다. 본 연구에서는 활용 가능한 공개데이터베이스의 탐색, 공개데이터 베이스 기반의 산업분석 사례 연구의 분석, 이슈의 선정 및 이슈 관련 산업의 선정, 선정된 이슈와 선정된 산업의 시장분석 주요 주제 파악, 해당 산업의 선정된 분석주제 분석을 위한 영향요인 탐색을 수행하였다. 또한 비공개 데이터를 활용하여 실제 이슈와 관련된 산업의 영향요인을 심층적으로 분석하여 관련 결과를 비교하였다. 이러한 목적에 따라 최근 정치사회적으로 이슈가 되었던 국내 사드(THHAD, 종말고고도지역방어) 배치로 인한 중국의 정치경제적 보복조치로 국내 화장품 산업의 대(對) 중국 수출에 대한 영향을 파악하기 위해 공개 데이터베이스에 기반한 주요 요인을 탐색하고 관련 요인을 파악하였다. 분석 결과 중국의 GDP 대비 재화 및 서비스 수입 비중, 상품 수입액, 인구 15-64세 여성 비중, 도시인구 비중이 지표로써 유의한 것으로 확인되었으며, 이외에 상업서비스 수입 대비 여행서비스비율도 유의미한 지표로 추정되었다. 그러나 사드 보복에 따른 화장품 산업의 중국 수출 규모 심층 연구 결과 중국의 사드 보복에 따른 제도적 조치는 없었으며, 수출 실적 상에서 한국 화장품에 대한 일시적 기간에(2017년 4월, 5월) 수출이 급감하였으며, 이는 한국 화장품에 대한 중국 소비자의 구매의향 및 구매율이 실직적으로 낮아진 것으로 추정되나 6월 이후 중국 화장품 수출 실적은 전년대비 다시 10%이상 성장하면서 지속적인 성장을 이루고 있는 것으로 확인된다.

  • PDF

해양레저정보 데이터베이스 구축을 위한 웹 탐색 컴포넌트 설계 (Design of Web Retrieval Component for Marine Leisure Information Database)

  • 최홍석;정성훈;안성환;임재홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.142-145
    • /
    • 2005
  • 해양레저산업의 발달과 레저문화의 수요가 급증함에 따라 해양 안전 및 관련 정보를 제공하는 서비스에 대한 욕구가 증대하고 있다. 그러나 국내에서는 해양레저에 특화된 정보를 제공하는 서비스가 전무한 상황이다. WIPI 기반의 휴대 단말기 상에 디지털 화된 전자해도의 지리정보와 해양레저를 위한 각종 부가 정보를 제공하는 다운로드 형태의 콘텐츠를 개발하는 프로젝트의 일환으로 전자해도 및 부가 정보 DB를 구축하여 요구되는 콘텐츠를 제공하는 서버(CPS; Contents provider Server)가 필요하다. 본 논문에서는 수요자가 개인휴대단말기를 통해 해양레저정보를 요구했을 때 CPS가 정보를 제공할 수 있도록 예상되는 요구 정보를 데이터베이스화하는 웹 탐색 컴포넌트를 설계하여 각종 웹상에서 시시각각으로 변화하는 정보들을 실시간으로 파싱하고 분류하는 웹 에이전트의 컴포넌트를 개발하고자 한다.

  • PDF

빅데이터에 기반하여 농촌 지역 활성화를 위한 귀농.귀촌 지역 추천 (Recommendation of Farming and Rural Areas Based on Big Data)

  • 김예은;배민경;김서담;박소현;문유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.437-438
    • /
    • 2024
  • 인구가 감소하고 있는 농어촌의 지역경제를 살림과 동시에 지역 소멸을 예방하고, 정착 지역 탐색에 많은 시간을 할애하는 귀농희망자들을 위해 도움을 줄 수 있는 데이터베이스를 설계하고 구축하였다. 사용자는 이 데이터베이스를 활용하여 사용자가 원하는 조건에 맞는 상위 5개 지역을 추천받을 수 있다. 정부와 기업이 귀농 지역 추천 데이터베이스를 활용하여 귀농을 희망하는 사람들의 행태를 알아보면 농촌 지역과 지방 소도시 지역 개발 및 활성화를 긍정적으로 예상할 수 있고, 이러한 관심이 결과적으로는 우리나라의 국토 균형발전에 큰 도움이 될 것이다.

  • PDF

3계층 XML 문서 저장 시스템의 설계 (Design of a 3-Tiered XML Document Storage System)

  • 오준환;이병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.16-21
    • /
    • 2000
  • XML 문서와 같은 구조적 문서는 관계형 데이터베이스에 저장하는 것이 적합하다. 본 논문에서는 XML 문서의 각 엘리먼트를 관계형 데이터베이스에 검색을 위해 적정 노드까지만 깊이 우선 탐색 순서쌍에 의해 저장하고, 검색된 문서의 재생성 속도를 향상하기 위해 문서전체를 저장하는 방법을 제시하였다. 또 위에서 제시한 방법을 저장 시스템과 분석 검색하는 시스템을 서로 다른 사이트로 분리하는 것을 제안한다. 이를 통해 XML 문서를 서로 다른 사이트로 분리함으로써 서버의 부담을 줄여 저장 및 검색 성능을 향상한다.

  • PDF

MPEG 뉴스영상에서 효율적인 텍스트 프레임 추출에 관한 연구 (A Study on Efficient Extraction of Text frame in MPEG News Video Images)

  • 정하영;황보택근
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.234-237
    • /
    • 2000
  • 멀티미디어 데이터를 다루는 기술이 급격하게 발전함에 따라 멀티미디어 데이터베이스를 운용함에 있어서 사용자의 효율적인 검색을 지원하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 MPEG으로로 압축된 뉴스 영상에서 내용기반 검색을 위한 효율적인 텍스트 프레임 추출방법을 제시한다. 제시하는 방법은 문자가 있는 프레임을 탐색하는 데 있어서 압축된 데이터에 최소한의 복호화만을 함으로써 탐색시간을 줄이고, 뉴스 영상에서의 문자의 특성을 고려하여 중복 추출을 줄이고 시간을 단축한다.

  • PDF

고차원 데이터에서 점진적 프로젝션을 이용한 클러스터링 (A Clustering using Incremental Projection for High Dimensional Data)

  • 이혜명;박영배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.189-191
    • /
    • 2000
  • 데이터 마이닝의 방법론 중 클러스터링은 데이터베이스 객체들의 에트리뷰트 값에 근거하여 유사한 그룹으로 식별하는 기술적인 작업이다. 그러나 대부분 알고리즘들은 데이터의 차원이 증가할수록 형성된 전체 데이터 공간은 매우 방대하므로 의미있는 클러스터의 탐색이 더욱 어렵다. 따라서 효과적인 클러스터링을 위해서는 클러스터가 포함될 데이터 공간의 예측이 필요하다. 본 논문에서는 고차원 데이터에서 각 차원에 대한 점진적 프로젝션을 이용한 클러스터링 방법을 제안한다. 제안한 방법에서는 클러스터가 포함될 가능성이 있는 데이터공간의 후보영역을 결정하여, 이 영역에서 점들의 평균값을 중심으로 클러스터를 탐색한다.

  • PDF

TB-Tree 를 이용한 이동객체 조인 알고리즘 (Moving Objects Join Algorithms using TB-Tree)

  • 이재호;이성호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.125-128
    • /
    • 2005
  • 이동 객체 데이터베이스 시스템에서 시공간 조인 연산은 이동 객체들의 결합을 위한 중요한 연산이며 수행 시간은 이동 객체의 수가 증가함에 따라 기하급수적으로 증가한다. 그러므로 효과적인 시공간 조인 연산이 필수적이다. 본 논문에서는 기존의 공간 조인에서 활용되었던 기법들을 이동객체 조인에 적용하였다. 이동 객체의 궤적에 대한 정보를 잘 유지하고 있는 시공간 색인인 TB-Tree 를 이용한 깊이 우선 탐색 기반과 넓이 우선 탐색 기반 TB-Tree 조인에 대한 알고리즘들을 제시하고 구현한 알고리즘들의 성능 비교한 실험 결과를 제시한다.

  • PDF