Harmfulness of Denormalization Adopted for Database for Database Performance Enhancement

데이터베이스 성능향상용 역정규화의 무용성

  • Rhee Hae Kyung (Yong-In Songdam College Dept. of Computer Game Information)
  • 이혜경 (용인송담대학 컴퓨터게임정보과)
  • Published : 2005.05.01

Abstract

For designing the database more efficiently, normailzation can be enforced to minimize the degree of unnecessary data redundancy and contribute to enhance data integrity. However, deep normalization tends to provoke multiple way of schema join, which could then induces response time degradation. To mitigate this sort of side effect that the normalization could brought, a number of field studies we observed adopted the idea of denormalization. To measure whether denormalization contributes to response time improvement, we in this paper developed two different data models about customer service system, one with perfect normalization and the other with denormalization, and evaluated their query response time behaviors. Performance results show that normalization case consistently outperforms denormalization case in terms of response time. This study show that the idea of denormalization, quite rarely contributes to that sort of improvement due ironically to the unnecessary data redundancy.

정규화(normalization)는 데이터의 불필요한 중복의 정도를 최소화찰 뿐만 아니라 데이터의 무결성을 높이는데 기여하기 때문에 데이터베이스를 효율적으로 설계하기 위해 수행하고 있다. 그러나 정규화를 깊숙이 수행한 데이터베이스인 경우 자료 검색 시 필요에 따라 테이블 간의 조인을 해야 하기 때문에 자료 처리 속도의 저하 현상이 발생될 수도 있다. 이러한 정규화의 부작용을 다소나마 해소하기 위한 수단으로 기업에서는 궁여지책으로 역정규화를 함으로써 어느 정도 완화시킬 수 있다고 보는 견해가 있다. 본 논문에서는 정규화와 역정규화와의 성능 평가를 위해 고객관련업무 시스템에 대해 두 가지 방법을 적용하여 데이터베이스 시스템을 구축하고 분석하여 비교하였다. 실험 결과 데이터베이스 크기에 따른 응답 시간은 전체적으로 역정규화 모델이 정규화 모델보다 더 길게 나왔다. 역정규화가 데이터의 중복을 발생시키기 때문에 시스템 성능 향상에 기여하는 바가 거의 없는 것으로 나타났다.

Keywords

References

  1. S. Moon, 'Unclassified data is merely garbage: data modeling is more crucial than programming,' Hitech Information, vol. 14, pp. 50-51, 2003
  2. R. Y. Wang, V. C. Storey and C. P. Firth, 'A framework for analysis of data quality research,' IEEE transactions on Knowledge and Data Engineering, vol. 7, no. 7, pp. 623-640, 1995 https://doi.org/10.1109/69.404034
  3. G. L. Sanders and S. Shin, 'Denormalization Effects on Performance of RDBMS,' Proceedings of the 34th International Conference on System Sciences, Hawaii, pp. 1-9, 2001
  4. D. B. Bock and J. F. Schrage, 'Denormalization guidelines for base and transaction tables,' ACM Special Interest Group on Computer Science Education, vol. 34, no. 4, pp. 1, 2002 https://doi.org/10.1145/820127.820184
  5. M. Hanus, 'To normalize or denormalize, that is the question,' in Computer measurement Group (CMG) Proceedings, No.1, Chicago, IL, USA, 1994
  6. U. Rodgers, 'Denormalization: Why, What, and How?,' in database Programming & Design, Dec., 1989