• Title/Summary/Keyword: 근접성 데이터

Search Result 252, Processing Time 0.037 seconds

An Efficient Buffer Management Technique Using Spatial and Temporal Locality (공간 시간 근접성을 이용한 효율적인 버퍼 관리 기법)

  • Min, Jun-Ki
    • The KIPS Transactions:PartD
    • /
    • v.16D no.2
    • /
    • pp.153-160
    • /
    • 2009
  • Efficient buffer management is closely related to system performance. Thus, much research has been performed on various buffer management techniques. However, many of the proposed techniques utilize the temporal locality of access patterns. In spatial database environments, there exists not only the temporal locality but also spatial locality, where the objects in the recently accessed regions will be accessed again in the near future. Thus, in this paper, we present a buffer management technique, called BEAT, which utilizes both the temporal locality and spatial locality in spatial database environments. The experimental results with real-life and synthetic data demonstrate the efficiency of BEAT.

Creation and clustering of proximity data for text data analysis (텍스트 데이터 분석을 위한 근접성 데이터의 생성과 군집화)

  • Jung, Min-Ji;Shin, Sang Min;Choi, Yong-Seok
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.3
    • /
    • pp.451-462
    • /
    • 2019
  • Document-term frequency matrix is a type of data used in text mining. This matrix is often based on various documents provided by the objects to be analyzed. When analyzing objects using this matrix, researchers generally select only terms that are common in documents belonging to one object as keywords. Keywords are used to analyze the object. However, this method misses the unique information of the individual document as well as causes a problem of removing potential keywords that occur frequently in a specific document. In this study, we define data that can overcome this problem as proximity data. We introduce twelve methods that generate proximity data and cluster the objects through two clustering methods of multidimensional scaling and k-means cluster analysis. Finally, we choose the best method to be optimized for clustering the object.

디지털 미디어 검색 시스템 및 응용

  • 유성준
    • Proceedings of the Korea Database Society Conference
    • /
    • 1998.09a
    • /
    • pp.115-138
    • /
    • 1998
  • $\square$ 입력 및 색인 방법의 용이성 및 효율성 $\square$ 대상 미디어 타입 $\square$ 웹 데이터의 색인 및 검색 기능 $\square$ DBMS와의 결합성 $\square$ Total Solution에의 근접성 $\square$ 검색 방법의 종류 $\square$ 현재 시장 점유율 $\square$ 가격(중략)

  • PDF

Declustering Policies Using Spatial-Temporal Proximity in Moving Objects DataBases (이동체 데이터베이스에서 시공간 근접성을 고려한 디클러스터링 정책)

  • 홍은석;서영덕;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.118-120
    • /
    • 2003
  • 이동체 데이터베이스에서 이동체 궤적의 양은 엄청나게 많아서 기존의 단일 디스크 기반에서는 특정영역의 질의에 대한 빠른 응답과 처리율의 향상을 볼수 없다. 따라서 고성능 질의 처리를 위한 시스템의 성능 향상을 위해서는 병렬 처리 기법의 도입이 필요하다. 이런 병렬 처리 기법 중, 기존의 디클러스터링 방법에서는 시간이 지남에 따라 연속적으로 보고되는 이동체 특성을 고려하지 않고 있다. 그러므로 대용량 이동체 데이터에 대하여 고성능 질의 처리를 위한 새로운 디클러스터링 방법이 필요하다. 이 논문에서는 대용량 이동체 데이터베이스에 대한 고성능 질의 처리를 위한 새로운 디클러스터링 정책을 제시하였다. 이동체 데이터의 MBB중 공간 좌표의 근접성만을 고려하여 하나의 SemiAllocation Disk 값을 설정하고 그 값과 시간 도메인을 다시 고려하여 근접성을 계산함으로써 디클러스터링을 할 수 있다. 또한 디스크별 Load Balancing을 고려하여 보다 정확한 디클러스터링 효과를 가지도록 하였다. 이와 같이 이동체의 특성을 고려한 새로운 디클러스터링 정책으로 시스템의 성능을 향상 시킬 수 있다.

  • PDF

The Role of Political Ideology in the 2012 Korean Presidential Election: Evidence from Panel Data Analysis (제18대 대통령 선거에서 이념의 영향: 패널 데이터 분석 결과)

  • Kim, Sung-Youn
    • Korean Journal of Legislative Studies
    • /
    • v.23 no.2
    • /
    • pp.147-177
    • /
    • 2017
  • Although a number of empirical studies found that political ideology plays a significant role in Korean elections, they entirely rely on cross-sectional data analysis. In contrast to previous research, this study investigates the effects of ideology in the 2012 Korean presidential election through standard panel data analysis. Specifically, using "EAI Panel Study, 2012", the effects of ideology on both candidate evaluation and vote choice were examined via fixed effects, random effects, and pooled regression analysis. And the results from applying the two most popular models of ideological voting, the proximity model and the directional change model were also compared. The results show that candidate evaluations and vote choice during the election (April, 2012- December, 2012) were significantly influenced by the ideological difference between voters and candidates, independent from partisanship and other standard socio-demographic factors. And this ideological voting during the election seems better captured by the directional change model than by the proximity model.

An Efficient Buffer Management Strategy Using Spatial Locality and Temporal Locality (공간적 근접성과 시간적 근접성을 이용한 효율적인 버퍼관리법)

  • 안재용;민준기;정진완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.4-6
    • /
    • 2001
  • 데이터베이스 관리시스템에서 데이터를 디스크에서 읽어오는 작업은 많은 비용을 필요로 한다. 따라서 시스템의 성능을 향상시키기 위해서는 I/O의 횟수를 최소화는 것이 가장 중요한 문제이다. 특히 공간데이터베이스 환경에서는 클라이언트 버퍼의 크기가 데이터베이스의 크기에 비해 매우 작기 때문에 버퍼를 효율적으로 사용하여 I/O 회수를 줄이는 문제는 더욱 중요하게 고려하여야 한다. 지금까지 디스크 I/O 횟수를 줄이기 위해서 많은 버퍼관리 기법들이 제안되었지만, 그 기법들은 시간적 근접성만을 고려해왔기 때문에 공간적 근접성도 존재하는 공간데이터베이스 환경에서는 최적의 성능을 보여주지 못했다. 본 논문에서는 공간 데이터베이스의 시간적 근접성과 공간적 근접성을 동시에 고려하는 새로운 버퍼관리기법인 SLM-tree Buffer Management Strategy를 제안한다. 제안한 버퍼관리기법은 공간 데이터베이스 환경에서 디스크 I/O의 횟수를 현저하게 줄임으로서 기존의 방법들에 비해 월등한 성능을 보여준다.

  • PDF

An Efficient Spatial Data Cache Algorithm for a Map Service in Mobile Environment (모바일 환경에서 지도 서비스를 위한 효율적인 공간 데이터 캐시 알고리즘)

  • Moon, Jin-Yong
    • Journal of Digital Contents Society
    • /
    • v.16 no.2
    • /
    • pp.257-262
    • /
    • 2015
  • Recently, the interests of mobile GIS technology is increasing with the spread of wireless network, the improvement of mobile device's performances, and the growth of demands about mobile services. Providing services in a wireless environment with existing wired-based GIS solutions have many limitations such as slow communication, processing rates and screen size. In this paper, we propose a cache algorithm on client side to solve the above problems. The proposed algorithm demonstrates the performance improvement over known studies by utilizing unit time and spatial proximity. In addition, this paper conducts a performance evaluation to measure the improvement in algorithm efficiency and analyzes the results of the performance evaluation. When spatial data queries are conducted, according to our performance evaluation, hit rate has been improved over the existing algorithms.

A Study on the Preservation of Similarity of privated Data (비식별 데이터의 유사성 보존에 관한 연구)

  • Kang, Dong-Hyun;Oh, Hyun-Seok;Yong, Woo-Seok;Lee, Won-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.285-288
    • /
    • 2017
  • 비식별화 모델은 데이터 공유를 위한 모델로 원본데이터를 비식별화 변환 처리하여 개인정보를 보호함과 동시에 분석에 필요한 데이터를 외부에 제공하는 모델로 연구되어 왔다. 변환 방법으로는 삭제, 일반화, 범주화 기술 등이 주로 사용되며 변환 과정 중에는 재식별 가능성을 최소화하기 위해 k-익명성, l-다양성, t-근접성 혹은 differential privacy 등의 프라이버시 모델이 적용되고 있다. 하지만 변환된 비식별 데이터 세트는 필연적으로 원본 데이터 세트와 다른 값을 가지며 이는 결과적으로 최종 분석 결과에 영향을 주게 된다. 이를 위해 두 데이터 세트 간의 차이를 상이도(dissimilarity) 혹은 정보 손실율(information loss)이라는 지표로 측정 하고 있으며 본 지표는 비식별 데이터의 활용성을 평가 하는 데에 매우 중요한 역할을 한다. 본 연구에서는 비식별 데이터와 원본 데이터와 간의 차이를 도메인 기반의 절대적인 기준대비로 표현한 상이도 측정 방법을 제안하며, 그 유효성을 실데이터 기반의 실험을 통해 검증하였다.

Estimating Personal and Social Information for Mobile User (모바일 사용자의 개인 및 소셜 정보 추정)

  • Son, Jeong-Woo;Han, Yong-Jin;Song, Hyun-Je;Park, Seong-Bae;Lee, Sang-Jo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.9
    • /
    • pp.603-614
    • /
    • 2013
  • The popularity of mobile devices provides their users with a circumstance that services and information can be accessed wherever and whenever users need. Accordingly, various studies have been proposed personalized methods to improve accessibility of mobile users to information. However, since these personalized methods require users' private information, they gives rise to problems on security. An efficient way to resolve security problems is to estimate user information by using their online and offline behavior. In this paper, for this purpose, it is proposed a novel user information identification system that identifies users' personal and social information by using both his/her behavior on social network services and proximity patterns obtained from GPS data. In the proposed system, personal information of a user like age, gender, and so on is estimated by analyzing SNS texts and POI (Point of Interest) patterns, while social information between a pair of users like family and friend is predicted with proximity patterns between the users. Each identification module is efficiently designed to handle the characteristics of user data like much noise in SNS texts and missing signals in GPS data. In experiments to evaluate the proposed system, our system shows its superiority against ordinary identification methods. This result means that the proposed system can efficiently reflect the characteristics of user data.

An Efficient Algorithm of Data Anonymity based on Anonymity Groups (익명 그룹 기반의 효율적인 데이터 익명화 알고리즘)

  • Kwon, Ho Yeol
    • Journal of Industrial Technology
    • /
    • v.36
    • /
    • pp.89-92
    • /
    • 2016
  • In this paper, we propose an efficient anonymity algorithm for personal information protections in big data systems. Firstly, we briefly introduce fundamental algorithms of k-anonymity, l-diversity, t-closeness. And then we propose an anonymity algorithm using controlling the size of anonymity groups as well as exchanging the data tuple between anonymity groups. Finally, we demonstrate an example on which proposed algorithm applied. The proposed scheme gave an efficient and simple algorithms for the processing of a big amount of data.

  • PDF