DOI QR코드

DOI QR Code

토픽 모델링을 이용한 사운드스케이프 연구 주제어 분석

Analysis on Topics in Soundscape Research based on Topic Modeling

  • 최수환 (대구가톨릭대학교 디지털디자인과)
  • 투고 : 2019.04.08
  • 심사 : 2019.07.08
  • 발행 : 2019.07.28

초록

사운드스케이프(soundscape)는 소리를 통해 문화와 환경, 사회적 변화를 이해하는데 중요한 역할을 하는 자료이지만, 자료의 기록, 보존, 분류, 분석을 위한 체계적인 연구 프레임워크의 구축은 아직 초기 단계에 있다. 토픽 모델링(topic modeling)은 문서에 숨겨져 있는 테마 구조를 드러내주는 알고리즘으로 연구 동향 분석과 같이 대량의 문서에 내재된 주제어를 찾아내기에 적합한 기법이다. 본 연구에서는 사운드스케이프 연구 분야의 대표적 학술지인 의 논문을 토픽 모델링 기법으로 분석하여 사운드스케이프 연구 동향을 파악할 수 있는 주제어를 도출해 보고, 이를 사운드스케이프 온톨로지(Soundscape Ontology) 및 사운드 아카이브의 메타데이터 설계 시 활용할 수 있는 방안에 대해 살펴보고자 한다. 이는 향후 시맨틱 웹 기술인 링크드 데이터(Linked Data) 기반의 사운드스케이프 아카이브 구축을 위한 메타데이터 설계의 기초 연구가 될 것이다.

Soundscape provides important resources to understand social and cultural aspects of our society, however, it is still its infancy to study on the research framework to record, conserve, categorize, and analyze soundscapes. Topic modeling is an automatic approach to discover hidden themes that are disperse in unstructured documents, thus topic modeling is robust enough to find latent topics such as research trends behind a collection of documents. The purpose of this paper is to discover topics on current soundscape research based on topic modeling, furthermore, to discuss the possibilities to design a metadata system for sound archives and to improve Soundscape Ontology which is currently developing.

키워드

CCTHCV_2019_v19n7_427_f0001.png 이미지

그림 1. 서울사운드맵 프로젝트

CCTHCV_2019_v19n7_427_f0002.png 이미지

그림 2. 사운드스케이프 온톨로지

CCTHCV_2019_v19n7_427_f0003.png 이미지

그림 3. 토픽 모델링 과정

CCTHCV_2019_v19n7_427_f0004.png 이미지

그림 4. [표 1]의 토픽 거리맵(Intertopic Distance Map)과 상위 빈출 어휘

CCTHCV_2019_v19n7_427_f0005.png 이미지

그림 5. [표 2]의 토픽 거리맵과 상위 빈출 어휘

CCTHCV_2019_v19n7_427_f0006.png 이미지

그림 6. 토픽 개수에 따른 일관성 점수 변화

표 1. Gensim LDA 알고리즘을 사용한 토픽 모델링 결과

CCTHCV_2019_v19n7_427_t0001.png 이미지

표 2. 불용단어 추가 및 명사 만을 사용한 토픽 모델링 결과

CCTHCV_2019_v19n7_427_t0002.png 이미지

표 3. gensim LDA 알고리즘을 사용한 토픽 모델링 결과 (토픽 개수 = 14인 경우)

CCTHCV_2019_v19n7_427_t0003.png 이미지

표 4. 뉴럴 임베딩을 활용한 [표 3]의 토픽 라벨링 결과

CCTHCV_2019_v19n7_427_t0004.png 이미지

참고문헌

  1. S. H. Choe and Y. M. Ko, "Collective archiving of soundscapes in socio-cultural context," iConference 2015 Proceedings, 2015.
  2. B. Truax, Acoustic Communication , 2nd ed., Ablex Publishing, 2001.
  3. https://www.wfae.net/journal.html, 2019.7.9.
  4. R. M. Schafer, The Soundscape: Our Sonic Environment and the Tuning of the World, Destiny Books, 1993.
  5. B. C. Pijanowski, A. Farina, S. H. Gage, S. L. Dumyahn, and B. L. Krause, "What is soundscape ecology? An introduction and overview of an emerging new science," Landscape Ecology, Vol.26, No.9, pp.1213-1232, 2011. https://doi.org/10.1007/s10980-011-9600-8
  6. J. Sueur and A. Farina, "Ecoacoustics: the ecological investigation and interpretation of environmental sound," Biosemiotics, Vol.8, No.3, pp.493-502, 2015. https://doi.org/10.1007/s12304-015-9248-x
  7. Y. Raimond, S. Abdallah, M. Sandler, and F. Giasson, "The Music Ontology," Proceedings of the International Conference on Music Information Retrieval, pp.417-422, 2007.
  8. D. M. Blei, "Probabilistic Topic Models," Communications of the ACM, Vol.55, No.4, pp.77-84, 2012. https://doi.org/10.1145/2133806.2133826
  9. 박자현, 송민, "토픽모델링을 활용한 국내 문헌정보학연구 동향 분석," 정보관리학회지, 제3권, 제1호, pp.7-32, 2013.
  10. 정한조, "온톨로지와 토픽모델링 기반 다차원 연계 지식맵 서비스 연구," 지능정보연구, 제21권, 제4호, pp.79-92, 2015. https://doi.org/10.13088/jiis.2015.21.4.079
  11. 김태경, 최회련, 이홍철, "토픽모델링을 이용한 핀테크기술 동향 분석," 한국산학기술학회 논문지, 제17권, 제11호, pp.670-681, 2016.
  12. 박창걸, "토픽모델링 기법을 활용한 연구개발과제의 클러스터링과 평가에 관한 연구," 한국콘텐츠학회 2019 춘계종합학술대회 논문집, pp.105-106, 2019.
  13. J. Kang and F. Aletta. "The Impact and Outreach of Soundscape Research," Environments, Vol.5, No.5, p.58, 2018. https://doi.org/10.3390/environments5050058
  14. D. M. Blei, Y. N. Andrew, and I. J. Jordan, "Latent Dirichlet Allocation," Journal of Machine Learning Research, Vol.3, pp.993-1022, 2003.
  15. https://radimrehurek.com/gensim/, 2019.7.9.
  16. S. Bhatia, J. H. Lau, and T. Baldwin, "Automatic Labelling of Topics with Neural Embeddings," In Proceedings of the 26th International Conference on Computational Linguistics, pp.953-963, 2016.