• 제목/요약/키워드: 데이터베이스 탐색

검색결과 407건 처리시간 0.178초

학위논문의 전문색인시스템 설계 (A Study on the Design of a Full-Text Indexing System for Thesis)

  • 추윤미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.57-60
    • /
    • 1996
  • 전문데이터베이스는 원문의 접근가능성과 전문탐색의 장점으로 인해 최근 급속하게 발전하고 있다. 그러나 이제까지 대부분의 전문데이터베이스는 문헌의 구조를 고려하지 않고 본문의 문자열에서 자동추출한 색인어를 대상으로 비통제탐색방법을 사용하여 왔으므로 효율적이고 다양한 검색방법을 적용하기 어려웠다. 본 연구에서는 SGML을 이용하여 문헌을 구조화하고 이를 이용한 색인시스템을 설계함으로써, 문헌구조를 이용한 다양한 검색이 가능하도록 하였다. 이를 위해 논문을 대상으로 하여 문헌의 구조를 분석하고, 주요 문헌요소인 초록, 목차, 본문, 참고문헌의 특성을 색인에 반영하였다. 색인시스템은 문헌요소를 태그와 텍스트데이터로 분석하여 색인하는 일차색인과, 일차색인에 의해 만들어진 문헌요소테이블과 내용데이터파일을 이용하여 주요 문헌요소를 색인한 이차색인으로 구성된다.

  • PDF

시퀀스 데이터베이스를 위한 서브시퀀스 탐색의 효율적인 처리 (Efficient Processing of Subsequence Searching in Sequence Databases)

  • 박상현;김상욱;박정일
    • 산업기술연구
    • /
    • 제21권A호
    • /
    • pp.155-166
    • /
    • 2001
  • This paper deals with the subsequence searching problem under time-warping. Our work is motivated by the observation that subsequence searches slow down quadratically as the average length of data sequences increases. To resolve this problem, the Segment-Based Approach for Subsequence Searches (SBASS) is proposed. The SBASS divides data and query sequences into a series of segments, and retrieves all data subsequences. Our segmentation scheme allows segments to have different lengths; thus we employ the time warping distance as a similarity measure for each segment pair. For efficient retrieval of similar subsequences, we extract feature vectors from all data segments exploiting their monotonically changing properties, and build a spatial index using feature vectors. The effectiveness of our approach is verified through extensive experiments.

  • PDF

FP-Tree를 기반으로 한 웹 사용 패턴에 대한 순차적 연관성 탐색 기법 . (A Sequential Association Rules Searching Methods for Web-Usage Patterns Based On Frequent-Pattern Tree)

  • 김영희;강우준;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.25-27
    • /
    • 2004
  • 대용량 웹 데이터베이스로부터 필요한 관련 정보를 탐색하고, 다양한 형태의 정보로부터 지식을 창출하는 일은 매우 어려운 일이다. 본 논문은 복잡하고 다양한 형태의 패턴이 존재하고, 연속된 입력을 갖는 웹 데이터베이스에서 발생되는 빈발 패턴들을 효과적으로 저장할 수 있는 FP-Tree를 기반으로 하여 변화된 정보들을 능동적으로 유지하고 새로운 정보들에 U해 FP-Tree를 재구성하여 웹 페이지에 대한 유용한 패턴 정보와 사용자의 웹 사용 패턴 분석을 용이하게 한다. 그 결과 새로이 발견된 웹 사용 패턴들을 통해 웹 페이지의 구조적 정보와 구조적 연판 정보를 효과적으로 얻을 수 있다.

  • PDF

디클러스터링된 공간 데이터베이스에서의 다중 공간 질의 처리 (Multiple Spatial Query Processing in Declustered Spatial Databases)

  • 박영민;전봉기;서영덕;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.314-316
    • /
    • 1999
  • 다중 공간 질의는 동시에 2개 이상 수행되는 영역 질의로 정의되며 인터넷 기반 지도 보기 응용의 주요 연산이 되므로, 질의 처리 속도의 향상을 위해서 병렬로 처리되어야 하고 디스크 입출력 비용을 최대한 줄일 필요가 있다. 그런데 다중 공간 질의는 디스크 입출력 비용을 개선하기 위해 다중 CPU/다중 디스크 구조 상에서 디클러스터링을 수행하더라도 디스크 임의 탐색이 발생하는 문제점이 있다. 이 논문에서는 디클러스터링 된 공간 데이터베이스에서 다중 공간 질의를 처리할 때 발생하는 문제점인 질의 간임의 탐색을 분석하고, 해결 방안으로 질의 간 위치 관련성과 질의 처리 이력을 이용한 질의 스케줄링 기법을 제안하고 구현하였다. 실험을 통한 성능 평가 결과, 질의 스케줄링을 수행 할 경우 디스크 입출력 비용을 줄일 수 있어 다중 공간 질의 처리시의 성능을 개선할 수 있는 것으로 나타났다.

  • PDF

유전적 알고리즘을 이용한 다목적 분산데이터베이스 설계 (Multiobjective Distributed Database System Design using Genetic Algorithms)

  • 이재욱;고석범;조정복
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2000-2007
    • /
    • 1999
  • 최근, 정보네트워크의 놀랄만한 확장과 함께 분산데이터베이스가 부가통신망(Value Added Network)상에서 구현되는 사례가 늘고 있다. 분산데이터베이스는 지역적으로 분산된 업무 환경에서 중앙 집중식 구조에 비해 비용과 응답시간 면에서 큰 장점을 가진다. 그러나, 부적절한 설계는 불필요한 비용과 늦은 응답시간을 초래하게 된다. 분산데이터베이스 설계에서의 주요한 문제는 각 노드에서의 1) 적합한 컴퓨터의 선택과 2) 단편화된 데이터를 적합하게 할당하는 것이다. 따라서, 본 논문은 부가통신망상에서의 최적인 컴퓨터의 선택과 데이터의 할당에 관하여 논한다. 또한, 공식화된 수학 모델은 1) 운용비용과 2) 투자비용으로서 두 개의 목적함수를 포함하고 경험적 탐색법 중의 하나인 유전적 알고리즘의 설계를 통해 최적인 분산데이터베이스 설계를 위한 해들을 탐색한다. 끝으로 수치 예를 통해 각 성능을 평가할 것이다.

  • PDF

한 번의 데이터베이스 탐색에 의한 빈발항목집합 탐색 (Frequent Patterns Mining using only one-time Database Scan)

  • 채덕진;김룡;이용미;황부현;류근호
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.15-22
    • /
    • 2008
  • 본 논문에서는 한 번의 데이터베이스 스캔으로 빈발항목집합들을 생성할 수 있는 효율적인 알고리즘을 제안한다. 제안하는 알고리즘은 빈발 항목과 그 빈발항목을 포함하고 있는 트랜잭션과의 관계를 나타내는 이분할 그래프(bipartite graph)를 생성한다. 그리고 생성된 이분할 그래프를 이용하여 후보 항목집합들을 생성하지 않고 빈발 항목집합들을 추출할 수 있다. 이분할 그래프는 빈발항목들을 추출하기위해 대용량의 트랜잭션 데이터베이스를 스캔할 때 생성된다. 이분할 그래프는 빈발항목들과 그들이 속한 트랜잭션들 간의 관계를 엣지(edge)로 연결한 그래프이다. 즉, 본 논문에서의 이분할 그래프는 대용량의 데이터베이스에서 쉽게 발견할 수 없는 빈발항목과 트랜잭션의 관계를 검색하기 쉽게 색인(index)화한 그래프이다. 본 논문에서 제안하는 방법은 한 번의 데이터베이스 스캔만을 수행하고 후보 항목집합들을 생성하지 않기 때문에 기존의 방법들보다 빠른 시간에 빈발 항목집합들을 찾을 수 있다.

동양의학 데이터베이스를 이용한 당뇨병에 효능을 가진 생약재의 탐색 (Investigation of Antidiabetic Medicinal Plants using an Oriental Medicinal Database)

  • 김동현;강영구;김홍;채희정
    • KSBB Journal
    • /
    • 제19권2호
    • /
    • pp.125-131
    • /
    • 2004
  • 당뇨병에 효능을 보이는 생리활성소재의 탐색원을 발굴하기 위한 방법의 하나로 동양의학 데이터베이스의 처방정보를 활용 하였다. 신동의약보감에 포함되어 있는 131건의 당뇨병 처방천연 약재의 처방 빈도와 처방분량을 분석하였다. 처방 순위와 처방 분량에 따라 마련된 점수표 (score table)를 기준으로 총 처방점수 (total prescription score)를 작성하였다. 선행 연구 결과들을 조사 한 결과 총 처방점수가 높은 약재들을 소재로 한 관련 보고들이 많은 것으로 나타났다. 결과적으로 당귀, 황련, 맥문동, 인삼, 칡, 생지황, 오미자, 복령, 지모, 천화분 등이 당뇨병에 효과가 있으며 이들 약재를 이용한 항당뇨 소재의 탐색 방법 이 제안되었다.

포인트 / 콘텐츠 소비 행태의 정확한 분석이 필요

  • 송민정
    • 디지털콘텐츠
    • /
    • 1호통권92호
    • /
    • pp.74-81
    • /
    • 2001
  • 본고의 목적은 통신,방송,IT부문 융합현상의 결정체로서 더욱 발전할 것으로 기대되는 인터넷 콘텐츠 사업의 성공전략을 수립하는 것이다. 먼저 콘텐츠 중심의 경쟁모델을 제시하고, 경제적 재화로서 중요해지고 있는 인터넷 콘텐츠의 사업 성공요인을 탐색하기로 한다.

  • PDF

Data Mining for CRM

  • 조성준
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.85-105
    • /
    • 2001
  • o 대량의 데이터베이스로부터 탐색과 분석을 통하여 의미 있는 패턴이나 규칙을 찾아내는 과정 o 분류, 추정, 예측, 유사통합, 군집화, 기술 o 가설검정, 지식발견 (중략)

  • PDF

에이전트를 이용한 사용자 중심의 개인용 생물학 검색시스템 (User-Centric Personal Biological Retrieval System Using Agents)

  • 김영억;정광수;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2005
  • 생명정보 분야의 발전과 더불어 과거 축적되어 온 방대한 양의 생물학 데이터들이 이질적인 형태로 데이터베이스화 되어있다 특히, 인간게놈프로젝트의 완료 후에 유전자 및 단백질의 기능을 밝히기 위한 지노믹스 및 프로테오믹스 연구가 활발해졌다. 새로운 생물학적 과정을 탐색하기 위해서는 기존에 존재하는 생물학 데이터베이스의 데이터를 수집하기 위한 기술적인 검색 능력이 필요하다. 전산지식이 부족한 대부분의 생물학자들은 공개용 데이터베이스로부터 필요한 정보를 획득하는데 어려움을 격고 있다. 각 분야의 생물학자들이 공개용 데이터베이스로부터 자신의 분야에 관련된 데이터를 검색?추출하는 작업을 수월하게 해 줄 검색 시스템이 필요하다. 따라서, 에이전트를 이용하여 공개용 데이터베이스로부터 정보를 수집하는 사용자 중심의 개인용 검색시스템을 제안하고자 한다. 또한, 검색시스템을 이용하여 생물학자가 지노믹스와 프로테오믹스의 실험적인 접근을 위해 원하는 많은 양의 특정 도메인의 데이터를 검색하고 질의된 결과를 개인 컴퓨터에 2차 데이터베이스를 만들어 저장한다. 사용자에 의해 생성된 특정 분야의 도메인인 2차 데이터베이스를 통해 데이터의 접근의 편리성과 생물학 정보의 분석의 용이성을 얻을 수 있다.

  • PDF