• 제목/요약/키워드: 베이스

검색결과 4,382건 처리시간 0.027초

관계형 XML 가지 패턴 질의를 위한 비트맵 인덱스와 질의 처리 기법 (Bitmap Indexes and Query Processing Strategies for Relational XML Twig Queries)

  • 이경하;문봉기;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.146-164
    • /
    • 2010
  • XML 데이터 량의 증가에 따라 DBMS를 이용한 XML 데이터의 저장 관리 기법들이 고안되었다. 하지만, 현재의 가지 패턴 질의 처리 알고리즘들은 XML 데이터를 태그 또는 임의 단위로 분할되고, 각 항목들이 특정 순서로 정렬된 역 리스트들을 입력으로 한다. 이러한 저장 기법의 불일치는 관계형 테이블에 나뉘어 저장되는 XML 데이터의 질의 처리에 이 알고리즘들의 적용을 어렵게 한다. 이 논문에서는 관계형 테이블에 저장된 XML 데이터에 대한 홀리스틱 가지 조인을 지원하기 위한 비트맵 인덱스와 이를 이용한 질의 처리 기법을 제안한다. 비트맵 인덱스는 많은 데이터베이스 시스템에서 지원하므로, 제안하는 인덱스와 가지 질의 처리 기법은 관계형 질의 처리 프레임워크에서 보다 이식이 용이하다. 제안하는 인덱스 기법은 압축을 통해 인덱스 크기를 줄이면서도 질의 처리시 압축해제가 불필요해 시간과 공간 효율적이다. 또한, 이 논문에서는 비트맵 인덱스만을 이용해 XML 노드들 간의 관계성을 식별함으로써, 가지 패턴 질의 처리를 레코드에 저장된 XML 데이터의 접근 없이 수행할 수 있는 혼합 인덱스를 제시한다.

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.

센서 네트워크에서 저장 공간의 활용성과 에너지 효율성을 위한 시간 매개변수 기반의 데이타 중심 저장 기법 (A Time-Parameterized Data-Centric Storage Method for Storage Utilization and Energy Efficiency in Sensor Networks)

  • 박용훈;윤종현;서동민;김준;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.99-111
    • /
    • 2009
  • 최근 무선 센서 네트워크 환경에서 감지되는 데이타를 네트워크상에 효과적으로 저장하고 처리하기 위한 다양한 기법들이 제안되었다. 데이타 중심 저장(Data-Centric Storage : DCS) 기법은 분할된 데이타 영역을 센서들에게 할당하고, 수집된 데이타를 해당 데이타 영역을 담당하는 센서에 저장하는 기법이다. 기존 연구된 DCS 기반 기법들은 데이타 전송을 위한 통신비용의 감소와 정합 질의(Exact Query) 및 영역 질의(Range Query)의 효과적인 처리를 위해 제안되었다. 하지만 방대한 데이타가 발생하는 데이타 영역을 담당하는 센서의 저장 부하 문제는 고려되지 않았다. 최근 이와 같은 저장 부하 문제를 해결하기 위해 K-D 트리를 기반으로 동적 분할 데이타 영역을 사용하는 KDDCS가 제안되었다. 하지만 KDDCS를 포함한 모든 기존 DCS 기반 기법들은 인기 있는(많은 질의 요청을 받는) 데이타 영역에 대한 질의 부하가 고려되지 않았기 때문에, 결과적으로 전체 센서 네트워크의 수명이 단축된다. 그래서 본 논문에서는 저장 부하뿐만 아니라 질의 부하도 효과적으로 해결할 수 있는 새로운 DCS 기반 기법인 TPDCS(Time parameterized DCS)를 제안한다. 제안하는 기법은 데이타 차원뿐만 아니라 시간 차원을 함께 고려하여 센서에 할당되는 데이타 영역을 분할한다. 제안하는 방법은 데이타 저장과 질의 처리 분산을 통해 전체 센서 네트워크의 수명을 크게 연장시킨다. 또한 본 논문에서는 대표적인 기존 DES기반 기범들과 다양한 성능 비교 평가를 통해 제안하는 기법의 우수성을 보인다.

RFID 스트리밍 데이타의 연속질의를 위한 영역 스태빙 기법 (Range Stabbing Technique for Continuous Queries on RFID Streaming Data))

  • 박재관;홍봉희;이기한
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.112-122
    • /
    • 2009
  • RFID 표준 개발을 주도하고 있는 EPCglobal은 RFID 미들웨어에 관한 표준 인터페이스로써 ECSpec(Event Cycle Specification)과 ECReports(Event Cycle Reports)를 제시하였다. ECSpec은 애플리케이션이 원하는 태그 데이타에 대한 명세로써 일정 시간 동안 태그 이벤트에 대한 여과 및 수집을 반복적으로 처리하기 위한 연속질의(Continuous Query, CQ)이며 ECReports는 처리 결과에 대한 명세이다. 따라서 연속 질의 수행에 적합하도록 설계된 질의 색인(Query Index) 기법을 적용하여 ECSpec을 질의 색인의 데이타로써, 태그 이벤트를 질의 색인의 질의로써 수행하면 효율적이다. 하지만 RFID 물류환경에서는 유사한 또는 동일 상품군이 대량으로 이동하게 되고, 이때 상품에 부착된 태그가 RFID 리더에서 인식될 때 발생하는 이벤트가 짧은 기간 동안 다수 발생하게 되는데. 이를 개별적으로 처리하는 것은 비효율적이다. 이 논문에서는 ECSpec에서 지정하는 보고주기 기간 동안 태그 이벤트에 의한 질의를 수집하여 그룹을 구성하고 질의 색인에 영역 질의로써 수행하여 유사 검색 과정을 제거하는 기법을 제안한다. 이러한 질의 그룹 처리 기법을 위해, 일정기간 연속된 태그 이벤트를 효과적으로 수집하기 위한 큐의 구성 방법과 수집된 태그 이벤트로부터 영역 질의를 생성하기 위한 방법을 제안한다. 또한 실험을 통해 이러한 기법의 효율성을 확인한다.

잉여 없는 웹 서비스 조합을 위한 2단계 탐색 알고리즘 (Two-phase Search Algorithm for Web Services Composition Redundanty)

  • 김현지;권준호;이대욱;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.123-138
    • /
    • 2009
  • 최근 웹 서비스 관련 기술들이 많은 관심을 받고 있다. 그 중 하나인 웹 서비스 컴포지션에 대한 연구도 활발히 진행되고 있다. 웹 서비스 컴포지션은 기존에 존재하던 웹 서비스들을 조합하여 마치 하나의 서비스처럼 보여 주는 것이다. 웹 서비스 컴포지션을 사용하면 기존에 존재하지 않던 웹 서비스의 기능도 제공할 수 있으며 사용자에게 더 많은 질의 결과를 줄 수도 있다. 기존의 많은 웹 서비스 컴포지션 관련 연구들은 전향 혹은 후향 체인 방식을 사용하였다. 그러나 전향 체인 방식이나 후향 체인 방식은 질의와 상관없는 방향을 탐색하는 경우가 많기 때문에 많은 시간이 걸린다는 단점이 있다. 전향과 후향을 모두 사용하여 2단계로 컴포지션을 찾는 방식도 있으나, 이 방식은 컴포지션에 포함되지 않아도 되는 웹 서비스를 포함한 결과를 낸다는 문제점이 있다. 본 논문에서는 전향 단계와 후향 단계를 거쳐 웹 서비스 컴포지션을 찾는 2단계 웹 서비스 컴포지션 탐색 방법을 제안하였다. 전향 단계에서는 미리 구축한 연결 인덱스를 사용하여 좀 더 빠르게 후보 컴포지션을 찾는다. 후향 단계에서는 토큰을 사용하여 후보 컴포지션을 잉여 웹 서비스가 포함되지 않은 컴포지션으로 분해한다. 실험을 통해 2단계 웹 서비스 컴포지션이 기존의 한 방향으로 진행하는 방식보다 더 효율적이라는 것을 보였다. 또한 기존의 2단계 방식보다 더 많은 컴포지션 결과를 사용자에게 돌려주면서도 실행 시간 면에서 기존의 2단계 방식에 필적한다는 것을 보였다.

도심환경에서 위치의존 질의를 위한 방송과 캐싱 기법 (Broadcasting and Caching Schemes for Location-dependent Queries in Urban Areas)

  • 정일동;유영호;이종환;김경석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권1호
    • /
    • pp.56-70
    • /
    • 2005
  • 무선 통신 기술과 휴대형 정보 장치의 발달로 등장한 이동 컴퓨팅 환경(Mobile Computing Environment)은 사용자가 랩탑이나 PDA와 같은 휴대 가능한 장비를 이용해서 사용자의 물리적인 위치나 이동에 상관없이 무선 통신을 이용해서 서버 혹은 다른 컴퓨터의 자원과 함께 작업하는 것을 말한다. 최근 이동 컴퓨팅 환경에서 보편적인 형태가 되고 있는 위치 의존 질의(Location Dependent Query)는 위치에 의존하는 데이타를 처리하는 질의이다 위치 의존 질의는 질의의 결과를 만들어 내는 중요한 척도가 위치이다. 위치 의존 질의를 효과적으로 지원하기 위해서는 이동 호스트의 캐싱 정책과 셀을 담당하는 지구국의 브로드캐스팅 정책이 중요하다. 적절한 캐싱 정책과 브로드캐스팅 정책을 정하기 위해서는 사용자의 이동과 데이타의 공간 속성을 고려해야 한다. 도심에서는 사용자가 도로를 따라서 이동하고 데이타가 도로에 인접해서 위치한다 이런 특징을 가지는 도심에서 이동 호스트의 현재 위치에서 가장 가까운 곳은 직선 거리로 가장 가까운 곳이 아니라 이동 거리가 가장 짧은 곳이다. 따라서, 이전에 행해졌던 연구에서 사용한 직선거리는 도심에 적합하지 않다. 직선 거리(Euclidean Distance)를 사용하면 이동 호스트의 이동 거리를 계산하기 위해서 피타고라스 정리를 이용해서 비슷하게 예상할 수 있지만, 실제 이동거리는 다양한 값이 나을 수 있기 때문에 적합하지 않다 본 논문에서는 도심의 특성을 반영한 브로드캐스팅/캐싱 정책을 제안한다. 본 논문에서 제안하는 이동 호스트가 도심의 위치 정보를 효과적으로 캐싱할 수 있도록 인접한 데이터를 클러스터링해서 브로드캐스팅하여 이동 호스트의 구성 시간(setup time)을 최소화하였다. 그리고, 맨하탄거리(Manhattan Distance)를 사용해서 위치 의존 질의에서 사용하는 데이타를 캐싱하고 질의를 처리하는 방법을 제안한다. 맨하탄 거리를 이용해서 캐싱하면 도로에 인접해서 위치한 데이타를 효과적으로 캐싱할 수 있다. 또한, 거리 계산 방법으로 맨하탄 거리를 사용하면 도심에서 실제 이동 거리와 비슷한 값을 알 수 있고, 직선 거리 계산식에 비해서 계산식도 간단하기 때문에 시스템 계산량도 줄일 수 있다.

2급/ 5급 와동 복합레진 수복 술식에 대한 남녀 치과 의사의 비교 (COMPARISON OF OPERATIVE TECHNIQUES BETWEEN FEMALE AND MALE DENTISTS IN CLASS 2 AND CLASS 5 RESIN COMPOSITE RESTORATIONS)

  • 장주혜;김혜영;손호현
    • Restorative Dentistry and Endodontics
    • /
    • 제35권2호
    • /
    • pp.116-124
    • /
    • 2010
  • 본 연구에서는 복합 레진을 이용한 2급/5급 와동의 직접수복에 있어서 치과의사의 성별에 따른 술식의 차이를 비교하였다. 2008년 대한치과의사협회에 등록된 치과의사 12,193명을 대상으로 이 메일을 통한 설문조사를 실시하였다. 이 메일 수신이 확인된 2,632명 중 840명이 응답하였으며 응답자의 남녀 비율은(남 78.9%, 여 21.1%) 전체 치과의사의 남녀 비율과 유의한 차이를 보이지 않았다(p > 0.05). Chi-square test 와 multiple logistic regression analysis 를 이용하여 남녀간 술식의 차 이를 검증하였다. 2급 와동 수복에서 여자치과의사는 4회 이상의 적층 분할 수복을 하는 경향이 남자치과의사에 비해 1.87배 높았으며, 술식 당 30분 이상 소요하는 경향은 2.72배 높았다(p < 0.05). 5급 와동 수복에서 여자치과의사는 베이스를 사용하는 경향이 1.83배 높았으며, 술식 당 20분 이상 소요하는 경향은 1.63배 높았다(p < 0.05). 본 설문조사에 따르면 남녀 성별에 따라 복합 레진 수복 술식의 차이가 존재하는 것으로 나타났다.

영역-그룹화 질의 계산 알고리즘 (An Algorithm for Computing Range-Groupby Queries)

  • 이영구;문양세;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.247-261
    • /
    • 2002
  • 온라인 분석처리(On-Line Analytical Processing: OLAP)에서 집계 연산은 중요한 기본 연산이다. 본 논문에서는 OLAP에서의 집계 질의 중 영역-그룹화(range-groupby)라는 새로운 클래스의 질의를 정의하고, 이 질의의 처리 방법을 제시한다. 영역-그룹화 질의는 n-차원 데이타 큐브의 임의의 영역에 속한 셀들에 대하여 주어진 그룹화 속성들의 조합에 따라 집계 값을 구하는 질의이다. 이 질의는 관심의 대상이 되는 임의의 영역 내에서의 경향을 다각적인 측면에서 분석하기 위해서 OLAP에서 자주 사용되는 질의이다. 일반적으로, OLAP에서는 질의를 빠르게 처리하기 위하여 전방-합 배열(prefix-sum array)이라 불리는 집계 결과를 미리 계산하여 유지하는 선계산 기법이 실제적으로 널리 사용되고 있다. 그런데, 영역-그룹화 질의의 경우에는, 그룹화 속성들의 모든 조합에 대하여 집계 결과를 저장해야 하기 때문에, 저장 공간 오버헤드가 너무 크다. 본 논문에서는 가능한 적은 공간 오버헤드를 가지고 영역-그룹화 질의를 빠르게 처리할 수 있는 방법을 제안한다. 제안한 방법은 단지 하나의 전방-합 배열만을 유지하면서도, 가능한 모든 그룹화 속성의 조합에 대하여 영역-그룹화 질의를 효율적으로 처리한다. 이 방법은 가능한 모든 그룹화 속성들의 조합에 대하여, 전방-합 배열을 선계산하여 유지하는 방법과 비교할 때 액세스되는 셀의 개수는 비슷하면 서 공간 오버헤드는 (equation omitted)(n은 디멘젼의 개수)로 줄인다.

데이타 웨어하우스에서 데이타 큐브를 위한 효율적인 점진적 관리 기법 (An Efficient Incremental Maintenance Method for Data Cubes in Data Warehouses)

  • 이기용;박창섭;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.175-187
    • /
    • 2006
  • 데이타 큐브는 차원 애트리뷰트의 모든 가능한 조합에 대해 데이타를 집단화하는 연산자이다. 차원 애트리뷰트의 수가 n일 때, 데이타 큐브는 $2^n$개의 group-by를 계산한다. 데이타 큐브에 포함된 각각의 group-by를 큐보이드(cuboid)라 부른다. 데이타 큐브는 흔히 미리 계산되어 형태 뷰(materialized view)의 형태로 데이타 웨어하우스에 저장된다. 이러한 데이타 큐브는 소스 릴레이션이 변경되면 이를 반영하기 위해 갱신되어야 한다. 데이타 큐브의 점진적 관리는 데이타 큐브의 변경될 내용만을 계산하여 이를 데이타 큐브에 반영하는 방법을 의미한다. $2^n$개의 큐보이드로 이루어진 큐브의 변경될 내용을 계산하기 위하여, 기존의 방법들은 데이타 큐브와 동일한 개수의 큐보이드를 가지는 변경 큐브를 계산한다. 따라서, 차원 애트리뷰트의 수가 증가할수록 변경 큐브를 계산하는 비용이 매우 커지게 된다. 변경 큐브에 포함된 각 큐보이드들을 변경 큐보이드(delta cuboid)라 부른다. 본 논문에서는 $2^n$개의 변경 큐보이드 대신 $_nC_{{\lceil}n/2{\rceil}}$개의 변경 큐보이드만을 사용하여 데이타 큐브를 갱신하는 방법을 제안한다. 이에 따라 제안하는 방법은 변경 큐브를 계산하는 비용을 크게 줄일 수 있다. 성능 평가 결과는 제안하는 방법이 기존의 방법에 비해 더 좋은 성능을 가지고 있음을 보여준다.

HL7 표준임상문서구조를 사용한 전자퇴원요약의 생성, 저장, 관리 시스템 (Generation, Storing and Management System for Electronic Discharge Summaries Using HL7 Clinical Document Architecture)

  • 김화선;김일곤;조훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.239-249
    • /
    • 2006
  • 병원정보시스템(Hospital Information System)은 다른 병원정보시스템과 서로 독립적으로 운영되므로 상호운영성(Interoperability)이 배제되어 왔다. 이 연구는 HL7 표준임상문서구조(Health Level 7, Clinical Document Architecture)와 XML 스키마의 분석과 설계를 통하여 새로운 패러다임의 병원정보시스템을 제안한다. 퇴원요약지로부터 필수 항목을 규정하여 템플릿을 정의한 후 임상문서구조를 설계하여 자동적으로 임상문서를 생성되도록 하였다. XML 스키마는 HL7에서 정의한 참조정보모델(Reference Information Model)을 기반으로 분석하였고, 전송 프로토콜은 HL7 V2.4를 사용하였다. 본 연구가 가지는 의의는 첫째, 국제 표준인 HL7 표준임상문서구조를 사용하기 위한 확장과 정제과정의 연구를 했으며, 둘째, 표준임상문서구조를 사용할 수 있는 웹 기반의 차세대 병원정보시스템의 구조를 제안하였다. 결론적으로, 한국의 퇴원요약 표준임상문서구조에 대한 본 연구로 말미암아 평생전자의무기록(Electronic Health Record)과 임상데이타저장소(Clinical Data Repository)를 포함하여 다양한 보건의료기관 간 의료정보 공유의 기반이 될 것이다.