• 제목/요약/키워드: Query process

검색결과 526건 처리시간 0.022초

공간 데이터베이스 시스템에서 근사 k-최대근접질의의 처리방법 (The Method to Process Approximate k-Nearest Neighbor Queries in Spatial Database Systems)

  • 선휘준;김홍기
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.443-448
    • /
    • 2003
  • 공간 데이터베이스 시스템에서는 주어진 위치에서 가장 근접한 k개의 객체를 찾는 근사 k-최대 근접질의가 자주 발생한다. 근사 k-최대 근접 질의의 성능을 높이기 위해서는 색인에서 검색되는 노드의 수를 최소화할 수 있어야 한다. 본 논문에서는 기존의 알고리즘을 확장하여 동적인 공간 데이터베이스 환경에서 R-트리 유형의 색인 구조를 이용한 근사 k-최대 근접 질의 처리방법을 제안하고 그 성능을 평가 한다. 실험결과에 의하면, 제안된 방법은 객체의 분포 형태, 질의 크기 그리고 근사율에 관계없이 항상 낮은 디스크 접근 횟수를 보였다.

  • PDF

스트림 데이터에서 회귀분석에 기반한 빈발항목 예측 (Frequent Items Mining based on Regression Model in Data Streams)

  • 이욱현
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.147-158
    • /
    • 2009
  • 최근 스트림데이터 환경의 데이터 모델은 데이터의 양이 아주 크고 연속적이며 무한하다. 이에 반해 제한된 용량의 디스크나 메모리 등을 이용해서 질의 처리나 데이터 분석을 처리한다. 이러한 환경에서 트랜잭션 데이터베이스에 대한 전통적인 빈발패턴탐사는 불가능하다고 할 수 있다. 왜냐하면, 연속적으로 들어오는 스트림 데이터에 대해 어떤 항목집합이 빈발항목인지 아닌지에 대한 정보를 계속적으로 유지 관리하기가 어렵기 때문이다. 본 논문에서는 연속적으로 들어오는 스트림 데이터에 회귀모델을 적용하여 빈발 항목들을 예측할 수 있는 방법을 제안한다. 스트림 데이터로부터 회귀모델을 생성함으로써 불확실한 항목들에 대한 예측 모델로 사용할 수 있다. 다양한 실험을 통하여 제안하는 방법이 스트림 데이터 환경의 데이터에 효율적으로 사용될 수 있음을 보인다.

퍼지추론을 적용한 웹 음란문서 검출 (Detection of Porno Sites on the Web using Fuzzy Inference)

  • 김병만;최상필;노순억;김종완
    • 한국지능시스템학회논문지
    • /
    • 제11권5호
    • /
    • pp.419-425
    • /
    • 2001
  • 본 논문은 인터넷 상에서 무수히 많은 음란 문서를 검출하는 방법을 제시한다. 제시된 방법은 정보검색 기술에 퍼지추론을 적용시킨 것이다. 먼저 음란 사이트 주소를 몇 개 선정하고 이 문서들로부터 어휘분석과 스테밍과정을 통하여 음란 사이트를 대표하는 후보단어들을 추출한다. 추출된 후보단어가 음란문서를 대표할 중요도를 계산하기 위해, 각 후보 단어별로 용어 빈도수(DF), 휴리스틱 정보(HI)를 계산하고 이 값들을 이용하여 퍼지추론을 수행한다. 이렇게 계산 된 후보용어의 중요도들이 주어진 사이트가 음란사이트인지 아닌지를 판별하는데 최종적으로 사용된다. 소규모 테스트 데이터를 갖고 실험한 결과, 본 논문에서 제시한 방법이 음란 사이트 자동 검출시 유용함을 알 수 있었다.

  • PDF

HDF: Hybrid Debugging Framework for Distributed Network Environments

  • Kim, Young-Joo;Song, Sejun;Kim, Daeyoung
    • ETRI Journal
    • /
    • 제39권2호
    • /
    • pp.222-233
    • /
    • 2017
  • Debugging in distributed environments, such as wireless sensor networks (WSNs), which consist of sensor nodes with limited resources, is an iterative and occasionally laborious process for programmers. In sensor networks, it is not easy to find unintended bugs that arise during development and deployment, and that are due to a lack of visibility into the nodes and a dearth of effective debugging tools. Most sensor network debugging tools are not provided with effective facilities such as real-time tracing, remote debugging, or a GUI environment. In this paper, we present a hybrid debugging framework (HDF) that works on WSNs. This framework supports query-based monitoring and real-time tracing on sensor nodes. The monitoring supports commands to manage/control the deployed nodes, and provides new debug commands. To do so, we devised a debugging device called a Docking Debug-Box (D2-Box), and two program agents. In addition, we provide a scalable node monitor to enable all deployed nodes for viewing. To transmit and collect their data or information reliably, all nodes are connected using a scalable node monitor applied through the Internet. Therefore, the suggested framework in theory does not increase the network traffic for debugging on WSNs, and the traffic complexity is nearly O(1).

MapReduce 환경에서의 실시간 LBS를 위한 이동궤적 데이터 색인 및 검색 시스템 설계 (Design of Trajectory Data Indexing and Query Processing for Real-Time LBS in MapReduce Environments)

  • 정재화
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권3호
    • /
    • pp.313-321
    • /
    • 2013
  • 최근 모바일 스마트 기기의 보급으로 스마트 기기에 탑재된 다양한 센서에서 수집되는 대량이 데이터를 분석하여 처리하는 빅 데이터의 시대는 위치기반 서비스(LBSs: Location-Based Services)에 까지 확대대고 있다. 이동궤적에 대한 데이터도 초 대용량으로 증가하고 있다. 초 대용량 이동궤적 데이터 처리를 위해서는 클라우드 컴퓨팅 기술 및 맵리듀스와 같은 병행처리 플랫폼에 대한 연구가 필요하다. 최근 대용량 데이터의 병렬처리를 위해 맵리듀스 기반의 연구는 진행되고 있으나, 일괄처리 및 키-값 데이터 구조에 적합한 맵리듀스는 실시간 LBS에 적용에 적합하지 않다. 따라서 본 연구는 맵리듀스 특성을 면밀히 분석하고 실시간적 서비스에 적합하도록 모듈 단위로 효율적인 색인 기법 및 검색에 대한 시스템 설계를 제시한다.

부하테스트를 이용한 금융 시스템의 성능개선 사례 (A Case Study for Improving Performance of A Banking System Using Load Test)

  • 김태석;이종윤;김종수
    • 한국멀티미디어학회논문지
    • /
    • 제18권12호
    • /
    • pp.1501-1508
    • /
    • 2015
  • In this paper, we describe a case study to improve performance through the load testing of multi-tired system for financial accounts before the system opening. The load test was conducted after the data collection tools(Performance Monitor, DB PSSDiag) were installed. By analyzing the collected log, we were able to identify the main sector requiring performance improvements among the presentation tier, web tier, business logic tier and data tier. The ASP.NET server-down on the web tier could be improved by modifying the parameter values in the configuration file. Some server downs occurred on the business logic tier when a large number of users access at the same time, were more difficult to be solved. By analyzing the hang-dump at the server-down time, we were able to find a process that caused the problem. and we had to modify the relevant codes. For major performance improvements of the data-tier, indices of some queries was optimized by using the built-in DBMS query analyzer, after analyzing the log of long-response-time queries. The problems and solutions considered in this case study will be a reference for the performance improvement of a multi-layer system with the similar structure.

함수적 종속성을 반영향 XML 문서의 관계형 스키마 매핑 기법 (A Mapping Technique of XML Documents into Relational Schema based on the functional dependencies)

  • 조정길
    • 인터넷정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.95-103
    • /
    • 2007
  • 많은 기법들이 XML을 릴레이션으로 매핑(mopping) 하기 위해 제안되었다. 그러나 대부분의 기법들은 XML 데이터의 의미(semantic)들을 고려하지 않았다. 이러한 의미들은 스키마를 설계하는 과정에 저장, 질의 최적화, 변경 이상 등을 체크하는 데에 매우 중요하다. 특히 함수적 종속성은 데이터베이스 이론의 중요한 부분이고, BCNF에서 관계형 테이블을 정규화하기 위한 기초를 형성한다. 이 논문은 XML 스키마 기반의 XML을 매핑하여 릴레이션으로 저장하기 위하여 함수적 종속성을 반영한 기법을 제공한다. 내용, 구조와 함께 함수적 종속성에 의해 기술된 제약조건들은 동시에 유지되며, 저장 중복성을 줄일 수 있다.

  • PDF

XML 데이타를 위한 효율적인 디스크 블록 할당 방법 (An Efficient Disk Block Allocation Method for XML Data)

  • 김정훈;손진현;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.465-472
    • /
    • 2007
  • XML과 같은 준구조적 데이타가 많이 사용됨에 따라 이를 효과적으로 저장하고 관리하는 것이 중요해지고 있다. XML 데이타는 트리 형태로 모델링이 가능하며, 기본적으로 질의 처리는 트리를 탐색하는 방식으로 이루어진다. 본 논문에서는 XML 데이타를 디스크 블록에 저장하는 알고리즘을 제안한다. 제안하는 알고리즘은 트리의 각 노드마다 아래쪽에서 위쪽으로 숫자를 할당하며 그 숫자를 이용하여 디스크 블록에 노드들을 매핑한다. 제안하는 알고리즘은 접근 패턴 정보를 필요로 하지 않으며 어떠한 접근 패턴에 대해서도 좋은 성능을 보인다. 제안하는 방법의 몇가지 특성을 증명하고, 실험을 통해서 성능을 평가한다.

탐색목적이 탐색형태에 미치는 영향에 관한 연구 (The Effect of the Search Goal Requirements on Online Searching Behavior)

  • 유재옥
    • 정보관리학회지
    • /
    • 제13권1호
    • /
    • pp.65-82
    • /
    • 1996
  • 본 연구는 탐색자들이 탐색을 수행하는 과정에서 탐색질문에 내재하고 있는 탐색목적을 탐색과정에 반영하려고 노력하는지를 파악하고자 하였다. 54명 탐색자들을 선정하여 탐색질문을 제시하되 탐색목적을 정확률을 높이는 탐색과 재현율을 높이는 탐색으로 구분하여 두번 탐색하도록 요청하였다. 비록 동일한 탐색질문이라 할지라도 탐색목적이 다른 경우, 탐색자들은 탐색목적을 충족시키기 위해 노력하는지를 탐색자들이 투입하는 탐색노력 변수와 탐색결과 변수로 살펴보았다. DIALOG 정보 검색 시스템을 통해 ERIC ONTAP화일을 탐색한 결과 탐색자들은 정확률을 높이는 탐색과 재현율을 높이는 탐색에서 의미있게 재현율과 정확률로 측정했을 때 탐색자들은 두 종류의 탐색성취 요구수준을 의미있게 달성한 것으로 나타났다.

  • PDF

RDB-based Automatic Knowledge Acquisition and Forward Inference Mechanism for Self-Evolving Expert Systems

  • Kim, Jin-Sung
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.743-748
    • /
    • 2003
  • In this research, we propose a mechanism to develop an inference engine and expert systems based on relational database (RDB) and SQL (structured query language). Generally, former researchers had tried to develop an expert systems based on text-oriented knowledge base and backward/forward (chaining) inference engine. In these researches, however, the speed of inference was remained as a tackling point in the development of agile expert systems. Especially, the forward inference needs more times than backward inference. In addition, the size of knowledge base, complicate knowledge expression method, expansibility of knowledge base, and hierarchies among rules are the critical limitations to develop an expert system. To overcome the limitations in speed of inference and expansibility of knowledge base, we proposed a relational database-oriented knowledge base and forward inference engine. Therefore, our proposed mechanism could manipulate the huge size of knowledge base efficiently. and inference with the large scaled knowledge base in a short time. To this purpose, we designed and developed an SQL-based forward inference engine using relational database. In the implementation process, we also developed a prototype expert system and presented a real-world validation data set collected from medical diagnosis field.