• 제목/요약/키워드: audio software

검색결과 152건 처리시간 0.022초

TVML (TV program Making Language) - Automatic TV Program Generation from Text-based Script -

  • Masaki-HAYASHI;Hirotada-UEDA;Tsuneya-KURIHARA;Michiaki-YASUMURA
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵 KOBA Broadcasting Technology Workshop
    • /
    • pp.151-158
    • /
    • 1999
  • This paper describes TVML (TV program Making Language) for automatically generating television programs from text-based script. This language describes the contents of a television program using expression with a high level of abstraction like“title #1”and“zoom-in”. The software used to read a script written in TVML and to automatically generate the program video and audio is called the TVML Player. The paper begins by describing TVML language specifications and the TVML Player. It then describes the“external control mode”of the TVML Player that can be used for applying TVML to interactive applications. Finally, it describes the TVML Editor, a user interface that we developed which enables users having no specialized knowledge of computer languages to make TVML scripts. In addition to its role as a television-program production tool. TVML is expected to have a wide range of applications in the network and multimedia fields.

DRM 수신기의 효율적인 수신을 위한 가변 프라임펙터 FFT 설계 (Design Method of Variable Point Prime Factor FFT For DRM Receiver)

  • 김현식;이연성;서정욱;백종호
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2008년도 정보통신설비 학술대회
    • /
    • pp.257-261
    • /
    • 2008
  • The Digital Radio Mondiale (DRM) system is a digital broadcasting standard designed for use in the LF, MF and HF bands of the broadcasting bands below 30 MHz. The system provides both superior audio quality and improved user services / operability compared with existing AM transmissions. In this paper, we propose a variable point Prime Factor FFT design method for Digital Radio Mondiale (DRM) system. Proposed method processes a various size IFFT/FFT of Robustness Mode on DRM standard efficiently by composing Radix-Prime Factor FFT Processing Unit of form similar to Radix-4 by insertion of a variable Prime Factor Twiddle Factor and Garbage data. So, we improved limitation that cannot process 112/176/256/288 FFT of each mode of DRM system with a existent Radix Processor and increase memory size and memory access time for IFFT/FFT processing by software processing in case of implementation with a existent high speed DSP.

  • PDF

홈 오디오 용 하이파이 스피커 시스템 개발 (Development of HiFi Speaker System for Home Audio)

  • 박석태
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2004년도 추계학술대회논문집
    • /
    • pp.317-322
    • /
    • 2004
  • In this paper, It was describe the processes of development of HiFi speaker system. Woofer and tweeter were fabricated by unskilled students and their 1.5 parameters were identified by known mass method. Based on T-S parameters port enclosure was designed and built by means of software. Acoustic radiation phenomena of port enclosure were simulated and compared to test result. Acoustic pressure difference between lower frequency and higher frequency was flattened by adopting optimal crossover network. Finally, built HiFi speaker system was showed good sound quality and sound pressure and electrical impedance was well agreed with test results each other.

  • PDF

Data Correction For Enhancing Classification Accuracy By Unknown Deep Neural Network Classifiers

  • Kwon, Hyun;Yoon, Hyunsoo;Choi, Daeseon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권9호
    • /
    • pp.3243-3257
    • /
    • 2021
  • Deep neural networks provide excellent performance in pattern recognition, audio classification, and image recognition. It is important that they accurately recognize input data, particularly when they are used in autonomous vehicles or for medical services. In this study, we propose a data correction method for increasing the accuracy of an unknown classifier by modifying the input data without changing the classifier. This method modifies the input data slightly so that the unknown classifier will correctly recognize the input data. It is an ensemble method that has the characteristic of transferability to an unknown classifier by generating corrected data that are correctly recognized by several classifiers that are known in advance. We tested our method using MNIST and CIFAR-10 as experimental data. The experimental results exhibit that the accuracy of the unknown classifier is a 100% correct recognition rate owing to the data correction generated by the proposed method, which minimizes data distortion to maintain the data's recognizability by humans.

Design and Implementation of Scent-Supported Educational Content using Arduino

  • Hye-kyung Kwon;Heesun Kim
    • International journal of advanced smart convergence
    • /
    • 제12권4호
    • /
    • pp.260-267
    • /
    • 2023
  • Due to the development of science and technology in the 4th Industrial Revolution, a variety of content is being developed and utilized through educational courses linked to digital textbooks. Students use smart devices to engage in realistic virtual learning experiences, interacting with the content in digital textbooks. However, while many realistic contents offer visual and auditory effects like 3D VR, AR, and holograms, olfactory content that evokes actual sensations has not yet been introduced. Therefore, in this paper, we designed and implemented 4D educational content by adding the sense of smell to existing content. This implemented content was tested in classrooms through a curriculum-based evaluation. Classes taught with olfactory-enhanced content showed a higher percentage of correct answers compared to those using traditional audio-visual materials, indicating improved understanding.

안드로이드 OS 기반 한국어 TTS 서비스의 설계 및 구현 (Implementation of Korean TTS Service on Android OS)

  • 김태권;김봉완;최대림;이용주
    • 한국콘텐츠학회논문지
    • /
    • 제12권1호
    • /
    • pp.9-16
    • /
    • 2012
  • 국내에서 출시된 안드로이드 기반의 스마트폰은 한국어 TTS 엔진이 내장되어 있지 않고, 구글에서도 공식적인 한국어 TTS 기술 개발을 발표하지 않고 있는 상황이다. 따라서 안드로이드 스마트폰을 사용하는 어플리케이션 개발자 및 사용자들의 불편이 갈수록 심해져 가고 있다. 본 논문은 안드로이드 기반의 스마트폰에서 서비스할 수 있는 TTS시스템의 설계 및 구현에 대해 기술하였다. 신속 명료한 TTS를 위해 안드로이드 NDK를 이용하여 텍스트 전처리와 합성음 생성 라이브러리를 구현하였다. 또한, 자바의 스레드 기법과 스트림을 적용한 AudioTrack 클래스 객체를 사용하여 TTS 응답시간을 최소화 하였다. 구현된 한국어 TTS 서비스를 테스트하기 위해 수신된 문자메시지를 읽어주는 어플리케이션을 설계 및 개발하였다. 평가 결과, 임의의 문장에 대해 자연스러운 합성음을 생성하였으며, 실시간 청취가 가능하였다. 또한, 어플리케이션 개발자들은 구현된 한국어 TTS 서비스를 이용하여 음성을 통한 정보 전달을 손쉽게 적용할 수 있다. 본 논문에서 구현한 한국어 TTS 서비스는 기존 제한적 음성합성 방식의 어플리케이션의 단점을 개선하였으며, 음성을 통한 정보전달 어플리케이션 개발자 및 사용자들에게 사용성과 편의성을 제공할 수 있다.

MP3Player의 변화에서 나타나는 재매개적 특성 I : 계보적 변화와 재매개성 (Remediation Characteristics that Appear in the Change of MP3Player I : Re-mediation and Genealogical Change)

  • 이진혁;이영천;구윤희
    • 한국콘텐츠학회논문지
    • /
    • 제13권11호
    • /
    • pp.59-68
    • /
    • 2013
  • iPod Touch는 초기의 음악 재생기능을 무색하게 할 만큼 다양한 응용소프트웨어가 제공되고, UI를 UX의 차원으로 한층 높임으로써 혁신적이라는 평을 받기도 하였다. 또한 인터넷을 통한 다양한 영상의 제공이 이루어 졌음에도 불구하고 일부에서는 여전히 MP3Player의 상품분류가 음향기기로 인식되고 있다. 어떻게 음향기기가 하루아침에 영상 장치가 되었는지, 그러기까지 어떠한 요인들이 작용했는지는 매체의 본질적 변화 외에도 사회적, 문화적, 그리고 기술적 변화의 요일들이 존재할 것이다. 이 연구는 MP3Player의 매체적 특성에 관한 연구이다. 즉 MP3Player의 계보적 변화를 4개의 지점으로 분류할 수 있었다. 그리고 분류에 따른 각 지점별 특성을 분석하였다. 그 결과 MP3Player의 계보적 변화에는 기술적 변화와 사회적 맥락성이 함께 관계하고 있음을 알 수 있었다. 하나의 장치가 변화하는 데에는 다양한 요소들이 존재하지만, MP3Player의 계보적 변화의 요인에는 사회적 요구와 맥락, 그리고 기술적 변화의 총체성을 보이고 있다고 하겠다.

오픈 소스 소프트웨어를 활용한 인터넷 전화 녹취 시스템 (An Internet Telephony Recording System using Open Source Softwares)

  • 하은용
    • 디지털융복합연구
    • /
    • 제9권5호
    • /
    • pp.225-233
    • /
    • 2011
  • 인터넷 전화는 IP 기반 인터넷에서 VoIP(Voice over IP) 기술을 이용해서 음성 전화를 지원하는 인터넷 서비스다. 인터넷 전화는 영상통화, 메시징과 같은 인터넷 멀티미디어 서비스를 융합한 음성전화 서비스를 지원할 수 있는 장점을 갖고 있다. 특히 스마트폰을 통한 인터넷 소셜 네트워크 서비스가 보급되면서 기존의 전화망을 대체하는 서비스로써 인터넷 전화에 대한 연구와 개발이 활발히 진행되고 있다. 본 논문에서는 SIP(Session Initiation Protocol) 기반 인터넷 전화의 음성 통화 내용을 녹취하는 시스템의 설계 및 구현에 대해 설명한다. 인터넷 전화 녹취 시스템은 리눅스 기반으로 양방향 음성 스트림을 믹싱하는 기능, 라이브 패킷 스니핑 기능, 녹취 음성 파일 송신 기능은 공개 소프트웨어를 사용해서 구현하였다. 향후 개발된 시스템은 VoIP 기반 콜센터 시스템 등과 같은 복합 시스템을 구축하는데 있어 기반 기술로 활용될 계획이다.

스마트폰 미디어 서버 데몬에 대한 파일 포맷 인식 기반의 퍼징 연구 (A Study of File Format-Aware Fuzzing against Smartphone Media Server Daemons)

  • 신민식;유정빈;권태경
    • 정보보호학회논문지
    • /
    • 제27권3호
    • /
    • pp.541-548
    • /
    • 2017
  • 스마트폰은 오디오 서비스를 처리하기 위해 미디어 서버 데몬을 운용한다. 백그라운드에서 높은 권한으로 실행되고 있는 미디어 서버 데몬은 스마트폰을 포함한 스마트 기기에서 가장 많이 사용하는 기능인만큼 관련 취약점이 많이 발생하고 있다. 소프트웨어 취약점을 찾기 위해 널리 사용되는 기존의 퍼징 기법은 미디어 서버 데몬과 같이 입력 파일 포맷 요구사항이 엄격한 환경에서 효과적이지 않다. 본 연구에서는 미디어 서버 데몬의 취약점을 효율적으로 찾기 위해 파일 포맷 인식 기반의 퍼징 기법을 제안한다. 실험을 통해 iOS/tvOS/MacOS/watchOS에서 원격 임의코드 실행 취약점을 발견하였으며 상용 퍼징 도구 FileFuzz, ZZUF와 비교하여 본 논문의 효율성을 검증하였다.

Design of 8K Broadcasting System based on MMT over Heterogeneous Networks

  • Sohn, Yejin;Cho, Minju;Paik, Jongho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권8호
    • /
    • pp.4077-4091
    • /
    • 2017
  • This paper presents the design of a broadcasting scenario and system for an 8K-resolution content. Due to an 8K content is four times larger than the 4K content in terms of size, many technologies such as content acquisition, video coding, and transmission are required to deal with it. Therefore, high-quality video and audio for 8K (ultra-high definition television) service is not possible to be transmitted only using the current terrestrial broadcasting system. The proposed broadcasting system divides the 8K content into four 4K contents by area, and each area is hierarchically encoded by Scalable High-efficiency Video Coding (SHVC) into three layers: L0, L1, and L2. Every part of the 8K video content divided into areas and hierarchy is independently treated. These parts are transmitted over heterogeneous networks such as digital broadcasting and broadband networks after going through several processes of generating signal messages, encapsulation, and packetization based on MPEG media transport. We propose three methods of generating streams at the sending entity to merge the divided streams into the original content at the receiving entity. First, we design the composition information, which defines the presentation structure for displays. Second, a descriptor for content synchronization is included in the signal message. Finally, we define the rules for generating "packet_id" among the packet header fields and design the transmission scheduler to acquire the divided streams quickly. We implement the 8K broadcasting system by adapting the proposed methods and show that the 8K-resolution contents are stably received and serviced with a low delay.