DOI QR코드

DOI QR Code

A Study on the Data Modeling decreasing the Data Obesity

데이터 비만도를 개선한 데이터 모델링에 관한 연구

  • Rhee, Hye Kyung (Dept. of Computer Game, Yongin Songdam College) ;
  • Kim, Hee Wan (Division of Computer Engineering, Shamyook University)
  • 이혜경 (용인송담대학교 컴퓨터게임과) ;
  • 김희완 (삼육대학교 컴퓨터학부)
  • Received : 2013.09.11
  • Accepted : 2013.11.20
  • Published : 2013.11.28

Abstract

In this paper, we studied how the data obesity can affect in which the response speed of database gradually slows down. Our research is performed by analyzing how the game data infrastructure is well-formed. Although there are a variety of ways to evaluate to measure the level of infrastructure, we performed with real information system. We analyzed data obesity by comparing the entity-relationship models between the products of real game information system and newly modeled databases. We could find data obesity is over 60% among overall average of game information system. It shows that 45% higher than standard obesity which is 15%. In this paper, data redundancy rate after performing the procedure of the data modeling was 41% resulting in an improvement of 23% compared to 64% of an existing model.

현업 데이터베이스 응답 속도가 점차 느려지는 원인을 찾기 위하여 데이터 비만도가 거기에 어떤 영향을 초래할 수 있는지에 대해 연구했다. 게임정보시스템을 대상으로 게임 데이터 인프라가 어느 정도 잘 갖추어져 있는지 분석함으로써 연구를 실행했다. 데이터 인프라 수준을 측정하는 다양한 방법이 있지만 본 논문에서는 정보시스템 데이터 설계 결과물을 놓고 실물 평가를 실시하였다. 데이터 모델링의 여러 단계 중 실존하는 게임정보시스템의 논리데이터모델 설계 산출물을 기준으로 새로 모델링 한 개체관계 모형도 비교 분석하였다. 데이터 인프라의 주요 지표가 되는 데이터 비만도가 게임정보시스템 전체 평균 60%에 달하여 기준치인 15%를 무려 45% 상회하는 것으로 나타났다. 본 논문에서 데이터모델링 절차를 수행한 후의 데이터 중복률은 41%로 나타나서 기존 모델의 64%에 비하여 23%의 개선효과를 가져왔다.

Keywords

References

  1. C. W. Fisher, B. R. Kingma, Criticality of data quality as exemplified in two disasters, Information Systems, 39, pp.109-116, 2010.
  2. [DB] Elements of a good data model, http://blog.daum.net/fmddn/1787002, 2012.12.17.
  3. C. B. Cinzia Cappiello, C. Francalanci, A. Maurino, Methodologies for data quality assessment and improvement, ACM Computing Surveys 41(3), p. 52, 2009.
  4. D. Katz, M. Bommaroti, J. Zelner, The data deluge, The Economist, Mar 1, 2010
  5. T. Shanker, M. Richtel, Data overload can be deadly, The New York Times, Jan 16, 2011.
  6. Noreen Kendle, The Enterprise Data Model, The Data Administration Newsletter, Jul 1, 2005.
  7. Min Kyu Lee, Data Performance Cases in relation to the Removal of Repetitive Data Connections, Graduate School of Information Science and Technology of Soongsil University, 2010.
  8. Richard Y. Wang, Henry B. Kon, Stuart E. Madnick, Data quality requirements analysis and modeling, Proceedings. IEEE Ninth International Conference on Data Engineering, pp.670-677, 1993.
  9. Yong Rak Choi, Data Modelling Practices, Munwoondang, 2010.
  10. Ki Won Jung, Data Modelling Practices, Brain Korea, 2004.
  11. Practical Project of Data Model Normalization / De-normalization, http://blog.naver.com/jooyong3/40035951092, Mar 29, 2007.
  12. I. Davies, P. Green, M. Rosemann, M. Indulska, S. Galo, How do practitioners use conceptual modeling in practice?, Data and Knowledge Engineering, 58, pp.358-380, 2006. https://doi.org/10.1016/j.datak.2005.07.007
  13. H. Rhee, Corporate data obesity: 50 percent redundant, Journal of Computer Science and Technology, 10(5), pp.7-11, 2010.
  14. H. Rhee, A rare example of pitfall in corporate data modeling practices, Journal of Computer Science and Technology, 10(5), pp.7-11, 2011.