• Title/Summary/Keyword: 레코드화

Search Result 96, Processing Time 0.032 seconds

참조파일 유지를 통한 분산 데이터베이스 통신량 감축에 대한 연구

  • 황영헌;이우기;강석호
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1997.10a
    • /
    • pp.216-219
    • /
    • 1997
  • 분산 데이터베이스에서의 통신량을 줄이기 위한 기법과 관련한 많은 연구가 수행되고 있으며, 이러한 연구는 주로 데이터베이스 설계 초기에 고려되는 파일의 배치에 대한 문제를 다루고 있다. 이러한 파일 배치 문제에서는 분산 데이터베이스 상황을 가정하고, 공식화(formulation)한 후 이에 대한 해법을 제시하는 방식을 취하는 것이 일반적이다. 본 연구에서는 하나의 파일이 다른 지점에 있는 파일을 참조하는 경우 두 파일에 대한 접근량을 줄이기 위한 방법을 제안함으로써 분산 데이터베이스의 물리적 설계의 최적화를 도모하였다. 본 연구에서는 기존의 방법과는 달리 참조정보를 요하는 참조 파일(referential file)을 추가함으로써 두 지점간의 통신량을 줄이고자 하는 방안을 제시하였으며, 이 때 참조 파일의 종류는 참조하는 레코드의 수를 유지하는 방법과 참조 여부에 관한 정보만 유지하는 두 가지 방법을 모두 고려하였다. 본 연구에서는 기존의 방식과 본 연구에서 제안한 두 가지 방법간의 통신비용을 계산함으로써 본 연구의 타당성을 검증하였다. 이때 참조 무결성을 유지하는 대표적인 세 가지 제약조건, 즉 Cascade delete, Restricted, Nullify를 대상으로 분석함으로써 이와 관련된 대다수의 프로토콜에서 본 연구에서 제안한 방법의 효용성을 입증코자 했다. 이를 위해 필요한 공식들을 유도해 내는 작업도 논문에서 중요하게 다루었다. 이 연구는 분산 데이터베이스 설계시 통신량을 줄이는 중요한 고려 요소로 활용될수 있을 것이다.

  • PDF

A data retrieval method for traffic information on the Jeju taxi telematics system (제주 택시 텔레매틱스 시스템에서의 교통정보 검색 방법)

  • Lee, Jung-Hoon;Park, Gyung-Leen
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.10a
    • /
    • pp.177-181
    • /
    • 2008
  • 본 논문은 제주 택시 텔레매틱스 시스템의 운영과정에서 축적되고 있는 각 택시들의 이동이력 데이터를 기반으로 관심구간의 통행속도에 관련된 필드들을 효율적으로 추출하는 기법을 설계하고 구현한다. 구현된 인터페이스는 도로네트워크 상에서 관심구간의 양끝점을 입력받아 $A^*$ 알고리즘을 수행하여 경로상에 포함된 각 링크를 결정한 후 해당 링크 아이디를 포함하는 질의문의 스켈리튼을 생성한다. 이 질의문을 수정하여 관심구간의 속도 레코드수, 속도 평균, 승객탑승시의 속도, 요일별 시간대별 평균 속도 등 다양한 정보를 체계적으로 검색할 수 있다. 제주시 연삼로 구간에 대한 시험적 검색 결과는 승객이 탑승한 경우 전체 경우 보다 $30{\sim}50%$ 정도의 보고수, $2{\sim}4$ kmh 빠른 통행 속도 등을 보이고 있으며 시간대별 통계는 요일별 통행속도 패턴의 변화를 정량화하고 있다.

  • PDF

A Study on CDC Analysis Using Redo-Log File (로그 파일을 이용한 CDC 분석에 관한 연구)

  • Kim, Young-Whan;Im, Yeung-Woon;Kim, Sang-Hyong;Kim, Ryong;Choi, Hyun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.692-695
    • /
    • 2014
  • 현재와 같이 처리해야 할 데이터가 폭주하는 상황에서 대부분의 시스템은 자료 저장을 위해 데이터베이스를 사용하지만, 누적되는 데이터 관리를 위해 빈번한 문제가 발생한다. 이때 대부분의 시스템들에서는 상용버전의 데이터 백업 시스템이나 이중화 시스템 등을 두어 여러 곳에 분산 배치함으로써 데이터 보관의 안전성을 도모한다. 실제 모든 데이터베이스 시스템들은 데이터를 레코드에 기록할 때 마다 고유의 로그기록을 남겨놓게 되어있다. 로그기록들은 결국 아카이브 형태로 저장되는데, 그전에 실시간으로 로그를 남기는 과정을 거치게 된다. 본 논문에서는 현재 많은 기관 및 단체에서 사용하는 오라클 데이터베이스를 기본으로 하여, 실시간으로 로그기록을 저장하게 되는 리두 로그(Redo-Log) 파일에 대하여 알아보고, 로그기록의 절차 및 응용 가능성에 대하여 보여준다.

Customer's Pattern Analysis System using Intelligent Weblog Server (지능형 웹로그 서버를 이용한 전자상거래 사용자 패턴 수집 시스템)

  • Han, Ji-Seon;Kang, Mi-Jung;Cho, Dong-Sub
    • Proceedings of the KIEE Conference
    • /
    • 2000.11d
    • /
    • pp.836-838
    • /
    • 2000
  • 전자상거래에서 쇼핑몰의 개인화된 서비스를 제공하기 위해서는 소비자의 구매 패턴을 분석하는 것이 필요하다. 이러한 패턴을 효과적으로 분석하기 위해 웹사이트 상에서 사용자 행동 패턴 정보를 수집해야 한다. 본 논문에서는 사용자 패턴 수집 시스템으로 쇼핑몰 서버에 기능을 추가하고 지능형 웹로그 서버를 정의하며 이를 설계, 구현하였다. 전자상거래 쇼핑몰 서버에는 사용자 행위 정보를 로그에 포함시켜 지능형 웹로그 서버에 전송하는 기능을 추가하였다. 그리고 지능형 웹로그 서버는 쇼핑몰 서버로부터 받은 로그 데이터를 분석하고 데이터베이스화하여 저장한다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO기술을 사용한다. 그리고 저장된 데이터베이스를 레코드셋 단위로 원격에서 제어 가능하게 한다. 또 생성된 데이터베이스에서 필요한 데이터를 선별하여 XML DB로 저장한다. 이와 같은 사용자 패턴 수집 시스템은 데이터베이스 접근 속도가 빠르고, 관계형이나 비관계형 둘 다의 데이터베이스 접근이 가능하다는 장정을 가지며, 원격 데이터 베이스 접근 시 서버의 부하를 줄일 수 있다는 장점이 있다.

  • PDF

An Effcient Two-Level Hybrid Signature File Method for Large Text Databases (대용량 텍스트 데이터베이스를 위한 효율적인 2단계 합성 요약 화일 방법)

  • Yoo, Jae-Soo;Gang, Hyeong-Il
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.4
    • /
    • pp.923-932
    • /
    • 1997
  • In this paper, we propose a two-level hybrid signature file method(THM) to dffciently deal with large txt databases that use a term discrimination concept.In addition, we apply Yoo's clustering scheme to the two-level hybeid signature file method. The clustering schme groups similar signatures together according to the similarity of the highly discriminatiory tems so that we may achive better performance on retrival. The space-time ana-lyhtical model of the proposed two-level hybrid method is provided. Based on the analytical model and experiments, we compare it with the exsting methods, i.e. the bit-sliced method(BM), the-level method(TM), and the hybrid method(HM). As a result, we show that THM achives the best retrival performance in a large database with 100,000 records when the mumber fo matching records is less than 160.

  • PDF

A Study on the Display Considerations of RDA Resource Type (RDA 자원유형 디스플레이를 위한 고려사항에 관한 연구)

  • Lee, Mihwa
    • Journal of the Korean Society for information Management
    • /
    • v.33 no.1
    • /
    • pp.33-52
    • /
    • 2016
  • This study was to find the display considerations of RDA resource type - content type, media type, and carrier type. The Literature review, the case study, and the survey were used as the research method. 5 display strategies were suggested in this study. First, content and carrier types were better displayed than all 3 types of RDA resources. Second, two kinds of algorithm should be considered for RDA resource icon display. One was the combination of the terms of carrier types plus content types icon. The other was the combination of carrier types icon and content types icon in which the terms reflecting types must be included. Third, the subfield of 33x must be used for the paired display of content type and carrier type of multi-types resources. Fourth, in brief display, resource type icon was better positioned on the left and upper side and in detailed display, resource types were better located in description area. Fifth, 'format' was used as display indication phrase. This study would contribute to the design for the resource display by suggesting the practical display considerations of RDA resource type.

Design of Open Gateway Framework for Personalized Healing Data Access (개인화된 힐링 데이터 접근을 위한 개방형 게이트웨이 프레임워크 설계)

  • Jeon, YoungJun;Im, SeokJin;Hwang, HeeJoung
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.15 no.1
    • /
    • pp.229-235
    • /
    • 2015
  • ICT healing platform is based on bio-signal and life habit information target to alarm early sickness concept prevention chronic pain. ICT(Information & Communication Technology) healing platform target on personal lead health management care of several health agencies and open of the (hospital, fitness center, health examination center, personal health device) personal health information together to personal device. Support Analysis Platform and Open API to vitalization optional services. In this paper proposal to access personality healing data Open Gateway Framework of Healing Platform Adaptor (HPAdaptor) ICT healing platform means Data relaying link to EMR(Electronic health record), korean medicine, life log, wellness, chronic pain, and fineness several personal health data provider and service provider personal healing data with software engine. After Design HPAdaptor can use for data and service provider record storage, mobile platform and analytics platform need data service or platform relying reference model.

Cross Compressed Replication Scheme for Large-Volume Column Storages (대용량 컬럼 저장소를 위한 교차 압축 이중화 기법)

  • Byun, Siwoo
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.14 no.5
    • /
    • pp.2449-2456
    • /
    • 2013
  • The column-oriented database storage is a very advanced model for large-volume data analysis systems because of its superior I/O performance. Traditional data storages exploit row-oriented storage where the attributes of a record are placed contiguously in hard disk for fast write operations. However, for search-mostly datawarehouse systems, column-oriented storage has become a more proper model because of its superior read performance. Recently, solid state drive using MLC flash memory is largely recognized as the preferred storage media for high-speed data analysis systems. In this paper, we introduce fast column-oriented data storage model and then propose a new storage management scheme using a cross compressed replication for the high-speed column-oriented datawarehouse system. Our storage management scheme which is based on two MLC SSD achieves superior performance and reliability by the cross replication of the uncompressed segment and the compressed segment under high workloads of CPU and I/O. Based on the results of the performance evaluation, we conclude that our storage management scheme outperforms the traditional scheme in the respect of update throughput and response time of the column segments.

Re-anonymization Technique for Dynamic Data Using Decision Tree Based Machine Learning (결정트리 기반의 기계학습을 이용한 동적 데이터에 대한 재익명화기법)

  • Kim, Young Ki;Hong, Choong Seon
    • Journal of KIISE
    • /
    • v.44 no.1
    • /
    • pp.21-26
    • /
    • 2017
  • In recent years, new technologies such as Internet of Things, Cloud Computing and Big Data are being widely used. And the type and amount of data is dramatically increasing. This makes security an important issue. In terms of leakage of sensitive personal information. In order to protect confidential information, a method called anonymization is used to remove personal identification elements or to substitute the data to some symbols before distributing and sharing the data. However, the existing method performs anonymization by generalizing the level of quasi-identifier hierarchical. It requires a higher level of generalization in case where k-anonymity is not satisfied since records in data table are either added or removed. Loss of information is inevitable from the process, which is one of the factors hindering the utility of data. In this paper, we propose a novel anonymization technique using decision tree based machine learning to improve the utility of data by minimizing the loss of information.

Clustering Analysis of Effective Health Spending Cost based on Kernel Filtering Techniques (커널필터링 기법을 이용한 건강비용의 효과적인 지출에 관한 군집화 분석)

  • Jung, Yong Gyu;Choi, Young Jin;Cha, Byeong Heon
    • Journal of Service Research and Studies
    • /
    • v.5 no.2
    • /
    • pp.25-33
    • /
    • 2015
  • As Data mining is a method of extracting the information based on the large data, the technique has been used in many application areas to deal with data in particular. However, the status of the algorithm that can deal with the healthcare data are not fully developed. In this paper, One of clustering algorithm, the EM and DBSCAN are used for performance comparison. It could be analyzed using by the same data. To do this, EM and DBSACN algorithm are changing performance according to the variables in Health expenditure database. Based on the results of the experimental data, We analyze more precise and accurate results using by Kernel Filtering. In this study, we tried comparison of the performance for the algorithm as well as attempt to improve the performance. Through this work, we were analyzed the comparison result of the application of the experimental data and of performance change according to expansion algorithm. Especially, Collects data from the various cluster using the medical record, it could be recommended the effective spending on medical services.