DOI QR코드

DOI QR Code

CosmoScriBe 2.0: 한국어 전사 도구의 개발

CosmoScriBe 2.0 : The development of Korean transcription tools

  • 곽선동 (서경대학교 전자컴퓨터공학과) ;
  • 장문수 (서경대학교 컴퓨터과학과)
  • 투고 : 2013.10.02
  • 심사 : 2013.12.16
  • 발행 : 2014.06.25

초록

구어 연구에서는 음성 데이터를 문자로 옮기는 전사(Transcription)라는 과정이 필요하다. 전사 작업을 보조하는 프로그램을 전사도구라고 하는데, 발화 내용을 비롯하여, 발화 시간, 화자 정보 등의 많은 정보를 기록하는 다양한 기능을 제공한다. 이로 인하여 컴퓨터 사용에 익숙하지 않은 사용자는 숙지하는데 어려움이 있다. 또한 전사 도구는 국내에서 개발된 것이 거의 없어서 한국어 환경에 적합하지 않는 경우가 많다. 본 논문에서는 효율적인 한국어 전사를 지원하면서 비숙련자도 도구를 쉽고 빠르게 적응할 수 있는 전사 도구를 제안한다. 이를 위해 비숙련자를 위한 사용자 친화적인 인터페이스 환경을 제공한다. 또한 전사 과정에서 발생할 수 있는 실수를 최소화하기 위해 전사 지원 기능을 제공한다. 마지막으로 데이터 신뢰성을 위한 시스템 구조를 제공한다. 제안하는 도구에 대해 전사 경험의 유무에 따라 사용성 평가를 하였으며, 평가결과는 전체적으로 전사 속도 향상 및 전사 지원 기능이 편리한 것으로 나타났다.

In spoken language research, transcription process needs to be carried out to translate voice data into text. Transcription tool, support program of transcription, offers various information such as content and time of utterance and speaker information. For this reason, inexperienced computer users are having trouble familiarizing with the program. Moreover, since there are little transcription tools developed domestically in Korea, they are usually not suitable for Korean environment. In this paper, we propose a transcription tool which supports not only Korean transcription but easy-to-use interface environment for novice. The transcription supporting function is also provided to minimize mistake that might happen in the process of transcription. And a system structure will be provided for data reliability. Usability of the proposed tool is evaluated in accordance with transcription experience. The evaluation result shows that transcription process and transcription support function have become faster and more convenient respectively.

키워드

참고문헌

  1. Hetherington, L. & McCandless, M. "SAPPHIRE: an extensible speech analysis and recognition tool based on Tcl/Tk," In Proceedings of ICSLP'96, pp. 1942-1945, 1996.
  2. Claude Barras, Edouard Geoffrois, Zhibiao Wu, and Mark Liberman, "Transcriber: development and use of a tool for assisting speech corpora production," Speech Communication - Special issue on speech annotation and corpus tools, Vol. 33, No. 1-2, pp. 5-22, 2001.
  3. Thomas Schmidt, "EXMARaLDA and the FOLK tools - two toolsets for transcribing and annotating spoken language," Proceedings of LREC, pp. 236-240, 2012.
  4. Moon-Soo Chang, "Korean transcription support tools developed Ver.1.0", Proceedings of the 2nd KASA & KSHA joint conference, O-2, pp.32-34, 2011.
  5. Brian MacWhinney, "The CHILDES Project - Tools for analyzing talk, Part 1: The CHAT Transcription Format,", Available: http://childes.psy.cmu.edu/manuals/CHAT.pdf, 2013, [Accessed: September 10, 2013].
  6. Kim nam-don, "A Study on devices of Korean grammar in premodern era through using both the corpus of new novels and Kamchaksae program," Korean language and literature, Vol. 143, pp.123-157, 2006.

피인용 문헌

  1. Implement of Semi-automatic Labeling Using Transcripts Text vol.25, pp.6, 2015, https://doi.org/10.5391/JKIIS.2015.25.6.585