• Title/Summary/Keyword: 학술 논문 데이터베이스

Search Result 2,657, Processing Time 0.029 seconds

Query Processing Techniques for Data Warehouses using Path Indices (경로 인덱스를 이용한 데이터 웨어하우스의 질의 처리 기법)

  • 이정남;조완섭;이충세;김홍기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.281-283
    • /
    • 1999
  • 본 논문에서는 객체-관계형 데이터베이스 관리 시스템(Object-Relational DBMS: ORDBMS) 기반의 데이터 웨어하우스(Data Warehouse)에서 성능 향상을 위한 인덱싱 기법과 이를 이용한 질의 처리 기법을 제안한다. 지금까지 관계형 DBMS를 기반으로 한 데이터 웨어하우스의 성능향상에 관한 연구는 활발히 이루어져 왔으나, ORDBMS에 기반한 데이터 웨어하우스의 구축 및 질의 처리 성능에 관한 연구는 거의 이루어지지 않고 있다. 데이터 웨어하우스는 기존의 데이터베이스와는 비교할 수 없을 만큼의 대용량 데이터를 가정하므로 ORDBMS를 이용하여 데이터 웨어하우스를 구축하는 경우에도 적절한 성능의 보장이 필수적으로 요구된다. 제안된 인덱싱 기법을 사용함으로써 데이터 웨어하우스 분석용 질의에 포함된 비용이 큰 조인과 그루핑 연산은 비용이 저렴한 인덱스 액세스 연산으로 대치되며, 데이터의 량과 거의 무관하게 질의 처리 비용이 고정되는 효과를 얻을 수 있다.

  • PDF

Approximate Aggregation and Effective Error Estimation using Histogram (히스토그램을 이용한 근사적 집단 연산과 효과적인 오차 추정)

  • 안성준;배진욱;심마로;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.18-20
    • /
    • 1999
  • 히스토그램은 데이터베이스 질의 최적기가 사용하는 통게정보 중의 하나이다. 최근에는 데이터베이스의 크기가 기하급수적으로 커짐에 따라, 데이터의 전체적인 성향을 빠르게 파악할 수 있는 방법의 하나로 히스토그램으로 활용하는 방안이 고려되고 있다. 그를 위해서, 히스토그램에서 얻어진 근사값의 오차를 추정할 수 있는 방법이 요구되었다. 기존의 기법에서는 히스토그램의 각 버켓에 실제 빈도와 평균 빈도의 최대차를 추가하고, 이 값을 이용하여 오차추정을 하였다. 그러나, 이 값이 히스토그램 버켓의 전체적인 데이터 분포를 잘 반영하지 못하기 때문에 실제 오차에 근접한 오차 추정을 할 수가 없는 단점이 있었다. 본 논문에서는 이를 극복하기 위해, 히스토그램에 데이터의 분포를 잘 반영하는 정보 즉, 평균값, COUNT/SUM 연산에 대한 최대 오차를 추가하였다. 이 정보들을 이용하여 실제 오차에 보다 근접한 오차 추정을 할 수 있었으며, 부가적으로 SUM/AVG 연산에 대한 보다 정확한 근사값을 얻을 수 있었다.

  • PDF

Simulation-driven Performance Estimation of Software Function Blocks for System Level Design (시스템 레벨 설계를 위한 소프트웨어 기능 블록의 시뮬레이션 기반 성능 예측 방법)

  • 권성남;오현옥;하순회
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.385-387
    • /
    • 2002
  • 이 논문에서 우리는 각 기능 블록의 성능 분석 방법을 제안하고 어떻게 하드웨어와 소프트웨어의 합성을 위한 기능 블록의 성능을 기록한 데이터베이스를 구축하는지를 설명하겠다. 기능 블록의 성능을 예측하는 것은 초기 설계 단계에서 주어진 제약을 만족시키기 위해 어떤 기능 블록이 개선되어야 할지 결정하는 기준을 제시하기 때문에 내장형 시스템의 합성에 있어서 중요하다. 예측하는 도구로 측정에 시간이 많이 걸리지만 정확한 명령어 수준 시뮬레이터(ISS : instruction set simulator)를 사용하였다. 데이터베이스를 구축하는데 있어선 각 기능 블록을 요소(factor)라 부르는 다른 상태를 두어서 차별화 하였다. 제안한 예측 방법은 개발중인 통합설계 환경에 구현되었으며 H.263 인코더에 적용하여 0.03% 이내의 오차를 얻었다.

  • PDF

Gene Sequence Analysis and Management System based on web (웹 기반의 유전자 서열 분석 및 관리 시스템)

  • Heo, Jin-Seok;Kim, Hyun-Sik;Ye, Hyung-Seok;Jin, Hoon;Kim, In-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.166-168
    • /
    • 2002
  • 본 논문에서는 하나의 시스템 안에서 효율적인 유전자 데이터의 관리와 다양한 서열 분석작업이 가능한 왱 기반의 서열 분석 및 관리 시스템인 GWB(Gene Workbench)를 설계하고 구현하였다. GWB는 로컬 데이터베이스 관리뿐만 아니라 GenBank, EMBL, SWISSPROT와 같은 외부 공공 데이터베이스에 대한 접근 기능도 제공하며, 권한을 가진 내부 이용자와 그렇지 못한 외부 이용자들을 구분하여 일부 유용한 기능들은 외부 사용자들도 이용할 수 있도록 설계되었다. 또 GWB는 유전자에 관한 문헌정보 검색과 관련 유전자 탐색 기능 둥 일부 유전자 기능 연구를 지원하는 기능을 제공하고 있다.

  • PDF

A Sequential Association Rules Searching Methods for Web-Usage Patterns Based On Frequent-Pattern Tree (FP-Tree를 기반으로 한 웹 사용 패턴에 대한 순차적 연관성 탐색 기법 .)

  • 김영희;강우준;김응모
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.25-27
    • /
    • 2004
  • 대용량 웹 데이터베이스로부터 필요한 관련 정보를 탐색하고, 다양한 형태의 정보로부터 지식을 창출하는 일은 매우 어려운 일이다. 본 논문은 복잡하고 다양한 형태의 패턴이 존재하고, 연속된 입력을 갖는 웹 데이터베이스에서 발생되는 빈발 패턴들을 효과적으로 저장할 수 있는 FP-Tree를 기반으로 하여 변화된 정보들을 능동적으로 유지하고 새로운 정보들에 U해 FP-Tree를 재구성하여 웹 페이지에 대한 유용한 패턴 정보와 사용자의 웹 사용 패턴 분석을 용이하게 한다. 그 결과 새로이 발견된 웹 사용 패턴들을 통해 웹 페이지의 구조적 정보와 구조적 연판 정보를 효과적으로 얻을 수 있다.

  • PDF

Design of Virtual Schema using Information Integeration Search System based on XML (XML기반의 가상 스키마를 이용한 정보 통합 검색시스템 설계)

  • 문석재;정계동;국윤규;최영근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.187-189
    • /
    • 2004
  • XML을 기반으로 한 시스템간의 통합하는 과정에서 발생하는 데이터 정의 이질성 문제, 데이터 표현의 이질성 문제, 유사표준의 중복 개발 등이 야기되므로, 이에 대한 대비책이 필요하다. 따라서 분산된 이 기종 시스템들마다 각기 구조화된 데이터베이스틀 통합하는 과정에 발생하는 시스템간의 불일치 문제를 해결할 수 있는 방법이 메타데이터를 이용하는 것이다. 본 논문에서는 이질적이면서도 분산되어 있는 정보 저장소로부터 메타데이터틀 수집하고. 이를 통합된 메타데이터 베이스로 구축하여, 분산된 데이터베이스에 대한 검색정보 및 데이터 트랜잭션을 할 수 있도록 제안한다. 정보 통합 방법으로는 메타데이터를 기반으로 한 가상 스키마를 이용한다. 스키마 이질성과 데이터 이질성 해결하기 위한 방법으로 메타데이터 가상 스키마를 설계하였다. 메타데이터 가상 스키마 기반으로 한 정보 통합은 XML 뷰어 어인 XDR을 기반으로 한다. 이는 XMVS 템플릿으로 분해하여, 통합 처리 할 수 있는 XML기반의 가상 스키마를 이용한 정보 통합 검색시스템을 설계 제안한다.

  • PDF

Building a Biological Genomic Database Management System in Laboratory Level (실험실 레벨의 유전체 생물학 데이터베이스 관리시스템 구축)

  • 차효성;정광수;박성희;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.28-30
    • /
    • 2004
  • 대부분의 생물학 실험실에서는 스퀸싱 실험으로 얻어진 서열조각에 대해 어셈블리 과정을 통해 획득된 일치된 서열을 서열 실험파일 형태로 저장한다. 이러한 서열 파일형태로 서열 데이터를 저장하면 사용자의 임의로 서열 정보 수정 및 서열 정보의 중복 등 서열 데이터에 대한 일관성 있고 무결성 있는 저장 관리가 어렵다 또한 이질적 데이터 및 포맷을 통한 다양한 생물학적 분석이 요구된다. 따라서 이 논문에서는 시퀸싱을 통해 생성된 유전체 및 단백질 서열 데이터의 자장관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포멧 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 서열 저장시 서열 버전의 생성 및 검출을 위해 능동 데이터베이스의 트리거를 이용하여 시스템의 성능을 향상시킨다. 또한 서열정보 분석을 위해 이질적인 서열 포맷간의 포맷 변환은 서열 및 관련된 정보를 XML로 표현하고 포맷간의 매핑정보를 XML의 스타일 언어인 XSL을 적용하여 수행한다. 그러므로 원시 소스 변경시 영향을 적게 받으므로 이질적인 포맷간의 파서를 이용한 포맷 변환 보다 효율적이다.

  • PDF

MAG : Mobile Application Generator Supporting WAP Push Services (MAG : WAP 푸쉬 서비스를 제공하는 모바일 응용 생성기)

  • 강이지;박은희;음두헌
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.463-465
    • /
    • 2004
  • 최근 무선 인터넷 사용자가 급증하고 있다. 이에 따라 무선 상거래, 무선 광고와 같은 응용의 신속한 지원을 위해 WAP 푸쉬 서비스를 제공하는 모바일 응용의 생산성 향상이 요구되고 있다. 본 논문에서 소개하는 MAG은 데이터베이스부터 구축해야 하는 WAP 응용과 기존 데이터베이스를 사용하는 WAP 응용의 신속한 작성을 위해 필요한 EJB 컴포넌트들과 질의 처리 및 푸쉬 서비스를 위한 관리자음 JSP 웹 컴포넌트를 생성하고 처리된 결과를 보여주는 HTML 폼을 생성한다. 또한, MAG온 질의 처리를 위한 고객용 JSP 웹 컴포넌트와 무선 응용의 사용자 인터페이스로 사용되는 WML 데크들과 함께 이 데크를 구성하는 카드들을 자동 생성한다. MAG온 EJB와 JSP 등의 컴포넌트 기술을 도입함으로써 3-계층 구조를 갖는 WAP 응용의 확장성, 재사용성, 이식성 등도 지원한다 WAP 푸쉬는 고객이 원하는 시점과 장소에서 정보를 제공받을 수 있다는 점에서 서비스를 향상시킬 수 있다. 또한 비슷한 기능을 지원하는 타 상응 도구들과 달리 MAG이 생성하는 응용은 질의의 대상인 개체와 연관된 모든 개체들의 집합을 한 단위로 검색 할 수 있어 연관된 정보들을 신속하게 제공할 수 있다.

  • PDF

Two-level Classification for Large-scale Fingerprint Identification System (대규모 지문식별시스템을 위한 2단계 분류)

  • 민준기;윤은경;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.730-732
    • /
    • 2004
  • 지문인식시스템은 크게 지문의 특징 추출단계, 입력지문과 유사한 후보지문을 찾는 검색단계, 마지막으로 입력지문과 후보지문들 간의 동일성을 판단하는 검증단계의 세 부분으로 나뉠 수 있다. 그리고 대규모 지문 데이터베이스를 기반으로 인식시스템을 구축하는 경우, 지문인식의 정확성과 더불어 신속성도 함께 고려해야 한다. 본 논문에서는 지문인식시스템의 전체 성능 향상을 위해 분류 단계에서의 개선방안으로 유전자알고리즘 기반의 특징 선택과 이의 조합을 다중분류기로 구축하는 2단계분류방법을 제안한다. NIST 데이터베이스 4에 대하여 실험한 결과 기존연구의 결과에 필적하는 분류율을 나타냈으며, 유전자알고리즘을 통해 적합한 방향성 조합을 제시할 수 있었다.

  • PDF

Unicode based Classics Archive Management System (Unicode 기반 고전문서 편찬 관리시스템)

  • 최윤수;진두석;안성수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.115-117
    • /
    • 2002
  • 고전문서는 우리 가 상상할 수 없을 만큼의 문화와 지식의 깊이를 지니고 있다. 이러한 문화와 지식을 바탕으로 새로운 지식을 창출해내기 위한 고전문서의 전산화 작업은 필수적인 과제이다. 따라서, 최근 대규모의 고전문서 전산화 작업이 많이 진행되고 있다. 이러한 수백만 혹은 수천만 페이지에 달하는 대규모 고전문서 전산화 작업에서 가장 어렵고 비용이 많이 소요되는 분야는 고전문서의 의미적 특징을 최대한 손상시키지 않고 데이터베이스를 구축하는 일이다. 그러므로 본 논문에서는 고전문서의 특성을 고려하여 데이터베이스를 구축하고 관리할 수 있는 고전문서 편찬 관리시스템에 대하여 소개한다. 특히 고전문서 전산화에 반드시 필요한 확장 한자의 입력 및 검색기능과 문서의 전후관계를 고러만 문서 구조정보의 처리, 그리고 이러한 모든 기능을 효율적으로 수행하기 위한 정보검색 시스템에 대하여 소개한다.

  • PDF