• 제목/요약/키워드: 서브 트리

검색결과 94건 처리시간 0.024초

이동체 데이터베이스를 위한 통합 색인의 성능 평가 (Evaluation of Unified Index for Moving Object Databases)

  • 정지원;안경환;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2004년도 국내 LBS 기술개발 및 표준화 동향세미나
    • /
    • pp.98-104
    • /
    • 2004
  • 이동체 데이터베이스에서 이동체의 과거 궤적을 저장하기 위해 메인 메모리 기반 색인을 이용하면 시간이 지남에 따라 데이터의 방대함으로 인해 주어진 메모리 용량이 부족하게 될 수 도 있다. 이를 해결하기 위해서는 메인 메모리에 상주하는 색인의 일부를 계속해서 디스크로 이주하는 정책이 필요하다. 이런 이주 정책을 지원하는 메인 메모리 이동체 색인이 통합 색인이다. 기존 통합 색인의 색인 이주 정책인 이동 서브트리 정책은 시간 축으로 가장 오래된 엔트리를 seed 노드로 선정하여 이동 서브트리를 구성한다. 이때 항상 시간적으로 가장 오래된 노드만을 디스크로 옮김으로써 과거에 대한 질의 시 비효율적이라는 문제점을 가진다. 본 논문에서는 이주를 위한 서브트리 구성에 필요한 seed 노드를 선택하기 위해, 질의 및 삽입 시에 참조되는 단말 노드들을 유지하는 LRU 버퍼를 이용한 색인 이주 정책을 제시한다. 이를 바탕으로 메인 메모리 기반 색인의 장점과 메모리 용량 부족의 문제를 해결한 통합색인을 구현하고, 다양한 성능 평가를 통하여 제시된 이주 정책이 기존의 이주 정책에 비해 삽입 성능뿐만 아니라 영역 질의에서도 우수함을 보인다.

  • PDF

DNA시퀀스 데이터베이스를 위한 저장-효율적인 Trie 인덱싱 기법 (A Storage-Efficient Trie Indexing Method . for DNA Sequence Databases)

  • 김강모;서남호;원정임;윤지희;박상현;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.31-33
    • /
    • 2004
  • 대규모 DNA 시퀀스를 대상으로 하여 서브시퀀스를 고속으로 검색하기 위한 인덱싱 방법으로서 접미어 트리가 유용하다. 그러나 접미어 트리는 데이터 크기의 약 100배에 해당하는 방대한 저장 공간을 필요로 한파. 본 논문에서는 기존 접미어 트리의 검색 성능을 유지하며, 저장 공간을 획기적으로 감소시킬 수 있는 새로운 인덱스 구조를 제안한다. 제안된 인덱싱 방안에서는 DNA 시퀀스 내의 모든 염기 위치에 고정 길이의 슬라이딩 윈도우를 위치시켜, 윈도우 크기에 해당하는 연속된 서브시퀀스를 추출한 후, 이들을 대상으로 트라이를 구성한다. 트라이는 저장 공간 감소를 위하여 각 문자를 최소 비트 정보로 표현하며, 저장 구조로서 포인터를 사용하지 않는 디스크 기반의 이진 트라이 구조를 사용한다. DNA 서브시퀀스 검색을 효율적으로 처리하기 위한 인덱스 기반의 질의 처리 알고리즘을 제안하고 실험을 통하여 그 유용성을 보인다. 제안된 인덱스는 접미어 트리의 약 10분의 1의 저장 공간을 필요로 하며, 데이터 크기 증가에 거의 영향을 받지 않는 안정된 고속 검색 성능을 지원한다.

  • PDF

이원성 기반 시계열 서브시퀀스 매칭의 인덱스 검색을 위한 최적의 기법 (An Optimal Way to Index Searching of Duality-Based Time-Series Subsequence Matching)

  • 김상욱;박대현;이헌길
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1003-1010
    • /
    • 2004
  • 본 논문에서는 시계열 데이터베이스에서 서브시퀀스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 본 논문에서는 서브시퀀스 매칭을 위한 기존 기법의 인덱스 검색에서 발생하는 성능상의 문제점들을 지적하고, 이들을 해결할 수 있는 새로운 방법을 제시한다. 제안된 기법은 서브시퀀스 매칭의 인덱스 검색 문제를 윈도우-조인이라는 일종의 공간 조인 문제로 새롭게 해석하는 것에서 출발한다. 윈도우-조인의 빠른 처리를 위하여 제안된 기법에서는 서브시퀀스 매칭을 시작할 때 질의 시퀀스를 위한 R*-트리를 주기억장치 내에 구성한다. 또한, 제안된 기법은 데이터 시퀀스들을 위한 디스크 상의 R*-트리와 질의 시퀀스를 위한 주기억장치 상의 R*-트리를 효과적으로 조인할 수 있는 새로운 알고리즘을 포함한다. 이 알고리즘은 데이터 시퀀스들을 위한 R*-트리 페이지들을 인덱스 단계의 착오 채택 없이 단 한번만 디스크로부터 액세스하므로 디스크 액세스 측면에서 최적의 기법임이 증명된다. 또한, 다양한 실험을 통한 성능 평가를 통하여 제안된 기법의 우수성을 정량적으로 규명한다.

DNA 시퀀스 검색을 위한 효율적인 인덱스 기법 (An Efficient Index Structure for DNA Sequence Retrieval)

  • 홍상균;원정임;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.118-123
    • /
    • 2006
  • DNA 시퀀스 데이터베이스 규모의 급격한 증가 추세를 고려할 때, DNA 시퀀스 검색 연산을 보다 효과적으로 지원할 수 있는 인덱싱 및 질의 처리 기술이 요구 된다. 접미어 트리는 DNA 시퀀스 검색을 위한 좋은 인덱스 구조로 알려져 왔다. 그러나 접미어 트리는 그 구조적 특성으로 인하여 저장공간, 검색 성능, DBMS와의 통합 등의 문제점을 갖는다. 본 논문에서는 이와 같은 접미어 트리의 문제점들을 해결하는 DNA 시퀀스 검색을 위한 새로운 인덱스 구조를 제안하고, 이를 기반으로 하는 효율적인 질의 처리 방식을 제안한다. 제안된 인덱스 기법은 이진 트라이를 기본 구조로 채택하며 DNA 시퀀스의 윈도우 서브 시퀀스를 인덱싱 대상으로 한다. 유사 서브 시퀀스 검색을 위한 질의 처리 알고리즘은 기본적으로 다이나믹 프로그래밍 기법에 근거하여 이진 트라이를 루트로부터 너비 우선(breadth-first) 방식으로 운행하며, 경로 상에 존재하는 모든 유사 서브 시퀀스를 검색해 낸다. 제안된 기법의 우수성을 검증하기 위하여, 기존의 접미어 트리와의 비교 실험을 통한 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 인덱스 기법은 접미어 트리에 비하여 약 30%의 작은 저장 공간을 가지고도 수배에서 수십배의 검색 성능의 개선 효과를 나타낸다.

  • PDF

무선 애드 혹 네트워크에서 잔여 에너지를 고려한 다중 트리 비디오 멀티캐스트 기법 (An Energy-Aware Multi-tree Video Multicast Scheme in Wireless Ad Hoc Networks)

  • 박재영;강경란;조영종
    • 한국통신학회논문지
    • /
    • 제34권12B호
    • /
    • pp.1336-1348
    • /
    • 2009
  • 본 논문에서는 무선 애드 혹 네트워크에서 비디오 스트리밍 세션을 위한 무선 단말의 에너지를 고려한 다중 트리 멀티캐스트 기법인 MVM-MAODV를 제안한다. 기존의 단일 트리 멀티캐스트 기법인 MAODV를 기반으로 하여 무선 단말의 잔여 에너지와 사용자의 요구에 따라 차등화된 품질의 비디오를 전달하는 다중 멀티캐스트 트리를 구성한다. 데이터 송신자는 MDC (Multiple Description Coding)로 비디오 데이터를 인코딩하여 두 개 이상의 서브 스트림을 생성한다. 각 멤버 단말은 예상되는 스트림별 패킷 수에 근거하여 자신의 잔여 에너지로 수신 할 수 있는 서브 스트림의 개수를 결정한다. 중간 전달자 역할을 담당하는 무선 단말들도 자신의 잔여 에너지를 고려하여 전송을 지원할 수 있는 서브 스트림을 선택한다. 결과적으로 서브 스트림 별로 멀티캐스트 트리가 구성되게 되고, 데이터 송신자는 이 트리들을 사용해서 서브 스트림들을 분리하여 전송한다. 각 멤버 단말은 참여한 트리의 개수에 따라 다른 품질의 비디오를 수신하게 된다. 시뮬레이션을 통한 성능 분석에서, 단일 멀티캐스트 기법인 MAODV, 기존의 다중 멀티캐스트 트리 기법인 MT-MAODV에 비해 보다 우수한 비디오 품질을 제공할 수 있으며 네트워크 내의 무선 단말들의 에너지를 보존할 수 있음을 보였다.

하이퍼큐브에서의 효과적인 프로세서할당 기법 (An Efficient Processor Allocation Scheme for Hypercube)

  • 손유익;남재일
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.781-790
    • /
    • 1996
  • 프로세서는 이용율의 최대한와 시스템 단편화의 최소화를 고려하여 들어오는 각 작업에 할당되어진다. 따라서 하이퍼큐브에서 프로세서를 효율적으로 할당하는 방법은 시스템 성능에 중요한 요인이 된다. 효율적이 프로세서 할당을 위해서는 필요한 크기의 서브큐브가 유용한지를 찾는 것과, 여러 개의 사용되지 않는 작은 서브큐브를 하나의 큰 서브큐브로 만들어 주는 것이 필요하다. 본 논문에서는, 사용가능한 서브큐 브를 표현하는 이진트리를 얻기 위해 교환이 수행될 레벨과 파트너를 직접 결정하는 트리교환 알고리즘과 이를 이용한 할당방법에 관하여 언급한다. 제안된 알고리즘의 트리 탐색시간에 대한 복잡도는 $O\ulcorner$n/2$\lrcorner$$\times$2n)으로서 기존의 다른 방법들 과 비교하여 좋은 성능을 보인다.

  • PDF

다중 소오스를 가진 네트의 최적 배선에 관한 연구 (Optimal Wiresizing of nets with Multiple Sources)

  • 김현기
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1998년도 추계학술대회 및 정기총회
    • /
    • pp.86-89
    • /
    • 1998
  • 본 논문은 발표된 Elmore 지연 모델에 속하는 다중 소오스를 가진 네트의 최적화 배선 크기 문제를 연구했다. 소오스 서브트리(SST)에 있는 네트와 로딩 서브트리의 세트(LSTs)로 분석한다. 그리고 LST 분리성, LST 단순한 특성, SST 국부적으로 단순한 특성과 일반적으로 우월한 특성을 포함하는 특성의 수를 만족하는 최적 배선 크기 해를 보여준다. 더구나 모든 이전의 연구와 번들로 개선된 특성의 안정된 것보다도 다양한 에지 분할을 사용해 최적의 배선크기 문제를 연구하였으며 이들 특성은 최적의 해를 계산하는데 효과적인 알고리즘을 유도한다.

  • PDF

인터넷 주소체계 분포도와 문제점 분석 (Distribution Characteristics and Analysis of Backbone Router’s Forwarding Prefixes)

  • 김지훈;이주민;인정석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.610-612
    • /
    • 2002
  • 현재 인터넷은 IPv4주소 고갈로 인해 종래의 클래스(class)별 주소의 분배와 사용을 지양하고 클래스 없는 CIDR(Classless InterDomain Routing)〔1〕방식을 채택하고 있다. 본 논문에서는 라우터의 개발 및 성능에 영향을 미치는 라우팅 엔트리의 분포와 특성을 다음의 세가지 관점에서 분석하였다. 그리고 분석에 사용된 데이터는 백본용 라우터의 라우팅 테이블이다. 첫째, 현재 인터넷에서 CIDR 방식에 따른 서브넷팅(Subnetting)과 슈퍼넷팅(Supernetting)〔2〕〔3〕정도를 분석하였으며 둘째, 현재 포워딩 테이블(Forwarding Table)내의 불필요한 포워딩 엔트리(Forwarding Entry)들이 차지하는 구성비를 조사하였다. 마지막으로는 멀티홈밍(Multi-homing)이 포워딩 테이블의 크기에 미치는 영향을 분석하였다. 조사에 의하면 MAE-East와 MAE-West〔4〕와 같은 백본(Backbon) 라우터의 경우에 A클래스는 8에서 26비트까지, B클래스는 14비트에서 27비트까지 그리고 C클래스는 17비트에서32비트까지 서브넷팅과 슈퍼넷팅이 되어있다. 또한 불필요한 포워딩 엔트리는 전체 엔트리의약 1%를 차지하고 있으며, 멀티홈밍 엔트리는 약 5%를 차지하는 것으로 확인되었다.

  • PDF

이미지 시퀀스 데이터베이스에서의 유사성 기반 서브시퀀스 검색 (Similarity-Based Subsequence Search in Image Sequence Databases)

  • 김인범;박상현
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.501-512
    • /
    • 2003
  • 본 논문은 다차원 타임 워핑 거리 함수를 이용하여 유사한 이미지 서브시퀀스를 신속하게 검색할 수 있는 색인 방법을 제안한다. 타임 워핑 거리는 시퀀스들의 길이가 다르거나 샘플링 비율이 다른 많은 응용에서 Lp 거리보다 더욱 적합하다. 우리가 제안한 색인 방법은 디스크 기반의 접미어 트리를 색인 구조체로 채택하고, 유사하지 않은 서브시퀀스를 잘못된 누락 없이 잘 여과하기 위해 하한 거리 함수를 사용한다. 이 방법은 특정 차원의 상대적 가중치를 손쉽게 부여하기 위해 정규화를 적용하고 색인 트리를 압축하기 위해 이산화 과정을 수행한다. 메디컬 이미지와 합성 이미지 시퀀스를 대상으로 한 실험은 본 논문에서 제안한 방법이 naive한 방법보다 우수한 성능을 보이고 대용량의 이미지 시퀸스 데이터베이스로의 확장이 용이함을 입증한다.

뉴스 기사의 문장 요약 (Sentence Summarization of News Articles)

  • 최동현;신지애;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.269-275
    • /
    • 2007
  • 텔레비전 뉴스에서 부제목을 만들거나, 문장을 PDA나 휴대폰과 같은 작은 화면에 출력하고 싶은 경우, 가능한 방법은 두 가지가 있다. 첫번째는 사람에 의해 직접 만드는 방식이다. 두번째는 자동화된 문장 요약 시스템을 사용하는 방법이다. 따라서 문장 요약 알고리즘은 그 중요성이 계속해서 커지고 있다. 본 논문에서는 구문 트리의 서브 트리가 변화할 수 있는 규칙을 제시하는 방법에 (1)공기 정보와 (2) 문법적으로 올바른 구조를 유지하기 위해 핵심적인 부분(주요 문법 구조) 및 같이 요약되어야 할 절을 표시하는 휴리스틱, (3)주어진 문장이 포함된 글의 제목 정보를 추가로 사용하여 문장 요약을 실행하였다. 본 시스템의 결과와 기존의 요약 방식을 비교하는 실험을 분야 전공자들에 의한 주관적 평가로 수행한 결과, 본 시스템의 알고리즘이 기존에 사용되던 구문서브트리 변환 방법보다 중요한 부분 및 문법적으로 올바른 부분을 많이 유지하는 요약임을 확인하였다.

  • PDF