DOI QR코드

DOI QR Code

Metadata Analysis of Open Government Data by Formal Concept Analysis

형식 개념 분석을 통한 공공데이터의 메타데이터 분석

  • Received : 2017.12.08
  • Accepted : 2018.01.19
  • Published : 2018.01.28

Abstract

Public open data is a database or electronic file produced by a public agency or government. The government is opening public data through the open data portals and individual agency websites. However, it is a reality that there is a limit to search and utilize desired public data from the perspective of data users. In particular, it takes a great deal of effort and time to understand the characteristics of data sets and to combine different data sets. This study suggests the possibility of interlinking between data sets by analyzing the common relationship of item names held by public data. The data sets are collected from the open data portal, and item names included in the data sets are extracted. The extracted item names consist of formal context and formal concept through formal concept analysis. The format concept has a list of data sets and a set of item name as extent and intent, respectively, and analyzes the common items of intent end to determine the possibility of data connection. The results derived from the formal concept analysis can be effectively applied to the semantic connection of the public data, and can be applied to data standard and quality improvement for public data release.

공공데이터는 공공기관이 만들어내는 자료나 정보를 국민에게 공개한 것이다. 정부는 공공데이터포털과 개별기관의 웹사이트를 통해 공공데이터를 개방하고 있다. 그러나 데이터 사용자 관점에서 원하는 공공데이터를 탐색하고 활용하는데 제약이 있는 것이 현실이다. 특히, 데이터 목록의 특성을 파악하고 서로 다른 데이터를 연계하는 과정에 많은 노력과 시간이 필요하다. 본 연구는 공공데이터로 개방된 데이터 목록이 갖고 있는 항목명의 공통 관계를 분석하여 데이터 목록사이의 연결 가능성을 제안한다. 공공데이터포털에서 제공하는 데이터 목록을 수집하고, 데이터 목록에 포함된 데이터 항목명을 추출한다. 추출된 항목명은 형식 개념 분석을 통해 형식 문맥 (formal context)과 형식 개념 (formal concept)으로 구성된다. 형식 개념은 데이터 목록과 항목명을 각각 외연과 내연으로 갖고 있고, 내연의 공통항목을 분석해 데이터 연결 가능성을 판별한다. 형식 개념 분석을 통해 도출한 결과는 데이터 목록의 의미적 연결에 효과적으로 활용될 수 있고, 공공데이터 개방을 위한 데이터 표준 및 품질개선에 적용할 수 있다.

Keywords

References

  1. 행정안전부, 공공데이터의 제공 및 이용 활성화에 관한 법률, 법률 제11956호, 2013.
  2. 서형준, 명승환, "지자체 공공데이터 개방 현황 및 정책 제언," 한국지역정보화학회지, 제18권, 제4호, pp.1-27, 2015.
  3. 김학래, "공공데이터포털 분석," https://brunch.co.kr/@haklaekim/6
  4. 이현정, 남영준, "우리나라 공공데이터의 이용활성화 방안에 관한 연구," 정보관리학회지, 제31권, 제4호, pp.249-266, 2014. https://doi.org/10.3743/KOSIM.2014.31.4.249
  5. R. Wille, "Formal Concept Analysis as Mathematical Theory of Concepts and Concept Hierarchies," Paper presented at the meeting of the Formal Concept Analysis, 2005.
  6. B. Ganter, G. Stumme, and R. Wille, Formal Concept Analysis, Foundations and Applications, Formal Concept Analysis, Springer, 2005.
  7. M. Alam, A. Buzmakov, V. Codocedo, and A. Napoli, "Mining Definitions from RDF Annotations Using Formal Concept Analysis," Paper presented at the meeting of the IJCAI, 2015.
  8. J. Poelmans, S. O. Kuznetsov, D. I. Ignatov, and G. Dedene, "Formal Concept Analysis in knowledge processing: A survey on models and techniques," Expert Systems with Applications, Vol.40, No.16, pp.6601-6623, 2013. https://doi.org/10.1016/j.eswa.2013.05.007
  9. 이희정, "정형적 개념 분석과 온톨로지를 활용한 제품계열 정보 설계," 산업결영시스템학회지, Vol.35, No.3, pp.110-117, 2012.
  10. M. Pierre, L. Mario, N. Amedeo, and C. Adrien, "Using formal concept analysis for checking the structure of an ontology in LOD: the example of DBpedia. 23rd International Symposium on Methodologies for Intelligent Systems," ISMIS 2017, Warsaw, Poland, 2017(6).
  11. 행정안전부, 공공데이터 개방 표준 - 행정자치부 고시 제 2016-46호, 2016.
  12. 윤소영, "공공데이터 활용을 위한 링크드 데이터 국가 연계체계 구축에 관한 연구," 정보관리학회지, 제30권, 제1호, pp.259-284, 2013. https://doi.org/10.3743/KOSIM.2013.30.1.259
  13. 이현정, 남영준, "국내 Linked Open Data 발행후 활용에 관한 연구," 한국정보관리학회 학술대회 논문집, pp.109-114, 2016.
  14. 서형준, 명승환, "수요자 중심의 공공 데이터 민간 활용 방안," 한국지역정보화학회지, 제17권, 제3호, pp.61-86, 2014.
  15. 김선호, 이창수, 이진우, "공공데이터 품질관리 성숙 수준에 대한 연구," 대한산업공학회 추계학술대회 논문집, pp.159-165, 2016.