• Title/Summary/Keyword: 데이타

Search Result 4,094, Processing Time 0.023 seconds

효율적인 유전자 서열 비고를 위한 데이타베이스 검색 모델 (A Database Retrieval Model for Efficient Gene Sequence Alignment)

  • 김민준;임성화;김재훈;이원태;정진원
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.243-251
    • /
    • 2004
  • 대부분의 생물정보학의 프로그램들은 데이타베이스로부터 유전자 등의 데이타를 검색하고 처리하여 생화학자와 생물학자에게 서비스를 제공한다. 이때 각각 클라이언트의 요청마다 데이타베이스의 검색을 수행한다면 많은 디스크 접근 시간이 소요된다. 또한 서버에 과부하를 초래하여 응답시간이 길어질 수 있다. 본 논문에서는 생물정보학에서 서열 검색 프로그램의 데이타베이스 사용 패턴을 이용하여 많은 데이타베이스 요청에 대하여 데이타베이스의 검색을 위한 디스크 접근을 공유하는 그룹핑 기법을 제안한다. 또한, 사용자 요청을 대기 시간 없이 처리중인 작업과 동시에 데이타베이스의 검색을 위한 디스크 접근을 공유하여 시스템 처리율을 높이고 빠른 응답시간을 가지는 카플 방식을 제안한다. 제안된 기법은 수학적 분석과 시뮬레이션을 통하여 성능을 검증하였다.

혼합 데이타 전송에서 효율적인 트랜잭션 처리 (Efficient Transaction Processing in Hybrid Data Delivery)

  • SangKeun Lee
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.297-306
    • /
    • 2004
  • 무선 정보 서비스에서 푸쉬-기반 브로드캐스팅은 데이타 항목의 개수가 작은 경우 많은 수의 클라이언트에게 정보를 확산시키는 매우 효과적인 기술이다. 그렇지만, 데이타베이스 용량이 큰 경우에는 풀-기반의 (클라이언트에서 서버로의) 역채널을 푸쉬-기반의 브로드캐스트와 결합한 이른바 혼합 데이터 전송이 유리할 수 있다. 본 논문은 순수 푸쉬-기반 데이타 브로드캐스트 환경에서 제시되었던 기선언-기반 트랜잭션 처리 기법을 혼합 데이타 전송에 적용하고, 시뮬레이션을 통해 그 성능을 분석한다. 시뮬레이션 결과를 통해, 기선언-기반 트랜잭션 처리 기법이 순수 푸쉬 데이타 전송뿐만 아니라 혼합 데이타 전송에서도 우수한 성능을 나타냄을 알 수 있다.

관계형 데이타베이스를 위한 응용 프로그램 독립적인 스키마 진화 (Application Program Independent Schema Evolution in Relational Databases)

  • 나영국
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.445-456
    • /
    • 2004
  • 데이타베이스 스키마는 모델링 되는 환경이 변화할 때에도 여전히 유효한 상태로 남을 만큼 안정적이라고 가정되어 왔다. 그러나 실제로는, 데이타 모델은 데이타베이스 설계자들이 공통으로 가정하는 만큼 안정적이지 않다. 현재 데이타베이스 시스템에서 풍부한 스키마 변화 연산들이 제공되지만은 사용자들은 스키마 변화가 스키마에 쓰여진 기존의 응용 프로그램에 영향을 미치는 문제로 곤란을 겪어왔다. 이 논문은 응용 프로그램에 영향을 주는 문제를 탐구한다. 옛 스키마에 기존의 프로그램을 지속적으로 지원하기 위하여 옛 스키마가 이전처럼 변경과 질의를 계속 허락해야 한다. 더 나아가, 관련 데이타는 최신상태로 유지되어야 한다 이것을 스키마 변화 도구의 프로그램 독립 성질이라 부른다. 이 성질을 달성하기 위하여, 이 논문은 프로그램 독립적인 스키마 진화 (Program Independency Schema Evolution: PISE) 방법론을 제안한다. 더 나아가, 각각의 관계형 스키마의 변화 연산들에 대하여 PISE 방법론에 기초한 구현 알고리즘을 도식적으로 설명함으로써 PISE 방법론의 포괄성과 견고성을 증명한다.

시공간 데이타베이스에서 다차원 시퀀스 데이타의 선택도추정 (Selectivity Estimation for Multidimensional Sequence Data in Spatio-Temporal Databases)

  • 신병철;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.84-97
    • /
    • 2007
  • 선택도 추정 기법은 질의 최적화를 위해 현재 상용 데이터 베이스에서 많이 사용되고 있고 히스토그램은 가장 많이 사용되는 선택도 추정 기법중의 하나이다. 최근에 시공간 데이터 베이스 관련 연구들에서 이러한 선택도 추정 기법이 기존의 시간 공간 데이타베이스 선택도 추정 기법을 확장하여 활발하게 연구되었다. 하지만 기존의 시공간 데이타베이스 선택도 추정 연구는 주로 이동 객체와 같은 시계열 데이타만 고려하였다. 또한 기존의 연구는 과거시점부터 현재 시점까지 시간적 범위 질의에 대한 선택도 추정은 불가능하였다. 따라서 본 논문에서는 시공간 데이타베이스에서 과거 시점에서 현재시점까지 시퀀스 데이타의 시간적 범위 질의를 위한 히스토그램을 구축하고 이를 이용한 효과적인 선택도 추정 기법을 제안한다. 제안한 히스토그램을 이용하면 과거부터 현재까지 시퀀스 데이타의 선택도 추정이 가능하고, 범위시간 선택도 추정 기법이 가능하며 효과적인 히스토그램 유지 기법의 적용이 가능하다.

XML Schema기반 시맨틱 데이타 통합 (An XML Schema-based Semantic Data Integration)

  • 김동광;정갑주;신효섭;황선태
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권9호
    • /
    • pp.563-573
    • /
    • 2006
  • 과학 공학 분야의 사이버 인프라스트럭쳐는 다양한 도메인에서 수행되는 연구 활동을 통해서 얻어지는 다양한 형식의 데이타들뿐만 아니라 이런 데이타를 저장 관리하기 위한 이질적인 저장소들의 통합이 요구되고 있다. 데이타 통합 작업의 어려움은 다음과 같다: (1) 시스템 독립적인 다중 데이타 스키마 지원, (2) 다양하게 변화하는 스키마들의 쉬운 관리, (3) 직관적인 스키마 맵핑. 이 같은 문제를 해결하기 위해서, 우리는 XML Schema를 이용해서 과학 분야의 데이타 모델을 정의하고 RDF기반의 스키마 맵핑을 이용해서 의미적으로 통합할 수 있는 새로운 방법을 제안한다. XML Schema기반의 데이타 모델 정의 방법은 실험 데이타들을 과학자들이 직관적이고 간편하게 표현 할 수 있게 해주며, 이 데이타 모델은 많은 시스템에서 사용중인 XML DBMS를 그대로 이용할 수 있는 장점이 있다. 또한, 스키마 맵핑을 위해서 RDF로 구축된 온톨로지를 이용해서 XML Schema로 정의되어 있는 스키마의 구조적인 관계를 정의하고, 맵핑 정보를 이용해서 통합 질의를 수행한다. 우리는 제안 시스템의 프로토타입을 토목 공학 분야 프로젝트인 KOCED에 적용하였다.

이동 컴퓨팅 환경에서 위치종속 데이타를 위한 영역 구성 (Organizing Data Regions for Location Dependent Data in Mobile Computing Environments)

  • 유제혁;황종선
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권2호
    • /
    • pp.167-178
    • /
    • 2003
  • 이동 컴퓨팅 환경에서는 이동 클라이언트의 위치에 따라서 질의에 대한 결과 값이 달라지는 상황이 발생하는데 그러한 결과의 데이타를 위치종속 데이타(LDD: Location Dependent Data)라 한다. 따라서 그러한 질의는 지리적인 거리를 고려하여 처리되어야 하며 또한 데이타의 관계성 등을 함께 고려하여 처리 효율을 높일 수 있다. 그러나 위치종속 질의에 나타나는 거리를 평가하고 영역별 위치종속 데이타를 구성할 때의 모호성으로 인해 정확히 평가하고 표현하기 어려운 점이 존재한다. 본 논문은 질의에 거리 정보를 사용함에 있어서 발생할 수 있는 문제점을 고려하고 위치종속 데이타간의 관련성 및 질의되는 이동 글라이언트의 위치 그리고 요구되는 지형물에 대한 거리간의 관계를 정량화하여 위치종속 데이타를 위한 데이타 영역인 LDD 영역을 제안한다. 모의 실험에서는 이동 클라이언트가 요청하는 위치종속질의 및 위치의 성향들 그리고 영역의 두 가지 조밀도 설정하여 제안하는 LDD 영역에서 질의 처리가 지리적인 지역만을 고려한 데이타 영역에서보다 데이타베이스 접근 수를 줄일 수 있음을 보인다.

캘린더 패턴 기반의 시간 연관적 분류 기법 (Temporal Associative Classification based on Calendar Patterns)

  • 이헌규;노기용;서성보;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.567-584
    • /
    • 2005
  • 시간 데이타마이닝은 기존 데이타마이닝에 시간 개념을 추가하여 시간 속성을 가진 데이타로부터 이전에 잘 알려지지는 않았지만 묵시적이고 잠재적으로 유용한 시간 지식을 탐사하는 기술이다. 대표적 데이타마이닝 기법인 연관규칙과 분류기법은 실세계의 여러 응용분야에서 사용된다. 그러나 대부분의 데이타가 시간 속성을 포함함에도 불구하고 기존의 기법들은 시간 속성을 고려하지 않고 주로 정적인 데이타에 대한 지식 탐사만이 진행되었다. 그리고 시간 데이타에 대한 데이타마이닝 연구들은 데이타의 발생시점과 시간 제약조건을 추가한 지식 탐사에 중점을 두고 있어 데이타가 포함한 시간 의미나 시간 관계를 탐사하는데 부족하였다. 이 논문에서는 시간 클래스 연관규칙에 기반한 시간 연관적 분류기법을 제안한다. 이 기법은 분류규칙 생성을 위해서 연관적 분류에 시간 차원을 포함하여 확장한 시간 클래스 연관규칙에 의해 탐사된 규칙들을 적용하는 것이다. 그러므로 이 기법은 기존의 분류 기법들에 비해 더 유용한 지식탐사가 가능하다.

분산 공간데이타베이스의 위치 불일치 해결을 위한 공간질의영역 변형 (Transformation of Spatial Query Region for Resolving Mismatchs in Distributed Spatial Databases)

  • 황정래;강혜영;이기준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권4호
    • /
    • pp.362-372
    • /
    • 2004
  • 분산 지리정보시스템을 구현하는데 가장 어려운 점 중의 하나는 공간데이타베이스의 불일치이다. 특히, 여러 가지 이유로 발생하는 분산 공간 데이타베이스 사이의 위치 불일치는 공간 질의의 결과를 부정확하게 만든다. 하나의 간단한 해결책은 가장 중요한 사이트에 따라 각 사이트의 공간데이타베이스에 있는 위치 데이타를 보정하는 것이다. 그러나, 이러한 방법은 각 사이트의 자율성이 중시되어야 하는 경우에는 실용적이지 않다. 본 논문에서는 위치 데이타가 불일치하는 여러 개의 공간데이타베이스에 대하여 공간질의를 처리하는 방법을 제시한다. 본 논문에서 제시하는 방법은 각 지역 공간데이타베이스를 수정하지 않고 자율성을 보장하는 방식으로 공간질의를 처리할 수 있도록 한다. 본 논문에서 제안하는 방법은 탄성변형방법을 이용하면서, 각 질의의 위치를 동적으로 변환하는 방법에 기초하고 있다. 이 방법의 정확성은 수학적으로 증명이 되었으며, 실험으로도 확인하였다. 더욱이, 이 방법의 유용성 검증을 위하여 상용 데이타베이스시스템을 이용하여 구현하였다.

웹상의 이질적 이미지 데이터베이스를 선택하기 위한 복합 추정 방법 (Hybrid Estimation Method for Selecting Heterogeneous Image Databases on the Web)

  • 김덕환;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.464-475
    • /
    • 2003
  • 웹상의 이미지 데이타베이스들은 자치성과 이질성이라는 두 가지 다른 특성을 갖고 있다. 즉 독립적으로 만들어지고 유지되며 질의 처리 방법이 서로 다르다. 분산된 이미지 데이타베이스들에 대한 내용기반 검색에서, 메타 서버의 유사성 측정함수에 대하여 서로 다른 지역 유사성 측정 함수를 갖는 데이터베이스들로부터 주어진 질의 객체와 유사한 객체들을 찾는 능력을 갖는 것은 중요하다. 현재까지, 동일한 유사성 측정 함수들을 사용하는 이미지 데이타베이스들을 선택하는 방법에 대하여 많은 연구가 진행되었으나 이미지 데이타베이스들이 다른 유사성 측정함수를 사용하는 경우에 대한 연구는 없었다. 본 논문에서는 웹상의 많은 이질적인 이미지 데이타베이스들 중 질의에 유사한 객체들을 보다 많이 가지고 있는 데이타베이스들을 찾는 문제를 다룬다. 데이타베이스들의 순위는 이미지 데이타베이스들의 압축된 히스토그램 정보와 적은 수의 표본 객체들을 사용하는 복합 추정에 기반을 두고 있다. 구형 영역 질의에 대한 선택률을 추정하기 위하여 히스토그램 정보를 사용하며, 유사성 측정 함수의 차이로 인한 선택률 오차를 보정하기 위하여 표본 객체들을 이용한다. 많은 수의 이미지 데이타에 대한 상세한 실험은 제안된 방법이 이질적인 분산 환경에서 효율적임을 보여준다.

변형된 팩터 분석 모델을 이용한 생체데이타 분류 시스템 (Bio-data Classification using Modified Additive Factor Model)

  • 조민국;박혜영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권7호
    • /
    • pp.667-680
    • /
    • 2007
  • 생체데이타 프로세싱이란 인간개체로부터 얻을 수 있는 고유의 생체 신호를 이용하여 다양한 목적으로 사용하는 것으로, 최근 이에 대한 요구가 높아지고 있다. 생체데이타는 도메인의 특성상, 클래스의 수는 많고 해당 클래스 내의 데이타는 상당히 제한적일 수 있어서 그만큼 데이타 내에 포함된 노이즈에 민감하게 된다. 따라서 기존의 패턴 인식과 분류 방법을 그대로 적용하여 개발된 시스템의 경우는 높은 일반화 성능을 기대하기 힘들다. 이를 해결하기 위해 본 논문에서는 생체데이타가 가지는 특성을 고려하여 각 클래스 고유의 특성에 영향을 미치는 클래스 요인과 노이즈와 같이 전체 데이타에 영향을 미치는 환경 요인으로 구성된 변형된 팩터 분석 모델로 생체데이타 생성 모델을 정의한다. 이를 바탕으로 분류에 필요한 데이타간 이격(inter-data discrepancy) 정보를 추출하고 새로운 유사도 함수를 정의하여 분류기에 적용한다. 제안하는 방법은 분류 대상이 되는 클래스의 정보 팔용을 극대화 하여 적은 수의 데이터로부터 노이즈에 강인한 결과를 얻을 수 있다. 실제 생체데이타를 적용한 실험에서 제안하는 방법이 기존의 방법 보다 우수한 분류 성능을 보임을 확인할 수 있었다.