• 제목/요약/키워드: Real-time Audio Processing

Search Result 76, Processing Time 0.118 seconds

리얼 서버의 실시간 서버 모니터에 의한 최적 로드 밸런싱 알고리즘에 관한 연구 (A Study for an Optimal Load Balancing Algorithm based on the Real-Time Server Monitor of a Real Server)

  • 한일석;김완용;김학배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.201-204
    • /
    • 2003
  • At a consequence of WWW large popularity, the internet has suffered from various performance problems, such as network congestion and overloaded servers. These days, it is not uncommon to find servers refusing connections because they are overloaded. Web server performance has always been a key issue in the design and operation of on-line systems. With regard to Internet, performance is also critical, because users want fast and easy access to all objects (e.g., documents, graphics, audio, and video) available on the net. To solve this problem, a number of companies are exploring the benefits of having multiple geographically or locally distributed Internet sites. This requires a comprehensive scheme for traffic management, which includes the principle of an optimal load balancing of client requests across multiple clusters of real servers. This paper focuses on the performance analysis of Web server and we apply these results to load balancing in clustering web server. It also discusses the mam steps needed to carry out a WWW performance analysis effort and shows relations between the workload characteristics and system resource usage. Also, we will introduce an optimal load balancing algorithm base on the RTSM (Real-Time Server Monitor) and Fuzzy Inference Engine for the local status of a real server, and the benefits is provided with of the suggested method.

  • PDF

서브밴드 적응신호처리를 이용한 음향 에코제거기의 모델링 (Modeling of Acoustic Echo Canceller Using Subband Adaptive Signal Processing)

  • 김천덕;심동연;정호문;이준구;차경환
    • 한국음향학회지
    • /
    • 제16권5호
    • /
    • pp.43-49
    • /
    • 1997
  • TV 회의 시스템 또는 확성회의 시스템에 응용되는 반향제거기에 있어서, 긴 잔향시간을 갖는 실내 공간에서는 환경변화에 따른 필터계수의 갱신에 많은 시간이 필요하며 실시간 처리에 장애요인이 되고 있다. 따라서 본 논문에서는 MPEG 오디오 시스템에서 이용하고 있는 폴리페이즈 필터 뱅크를 사용한 서브밴드 적응 신호처리법을 제안한다. 이 방법은 입력과 출력의 스펙트럼을 몇 개의 주파수 밴드로 분할하여, 각 밴드를 ES-NLMS 알고리즘을 이용하여 적응처리하는 것이다. 계산기상의 시뮬레이션을 통하여 최적의 서브밴드 수를 구하였으며, 기존의 풀밴드 방식에 대하여 수렴속도 및 제특성이 약 2dB 정도 작을때 서브밴드로 분할하는 방법이 연산량에 있어서 약 88% 정도 감소하여 풀밴드보다 우수한 것으로 나타났다.

  • PDF

인터넷을 위한 음성 통신 플랫폼 라이브러리 개발 (Platform Library Development for Real-time Audio Communications in the Internet)

  • 서동원;김동현;이명진
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.260-263
    • /
    • 2005
  • 본 논문에서는 차세대 유무선 광대역 통합망에서 실시간 멀티미디어의 응용 계층 품질을 평가하기 위한 실시간 음성 전송 플랫폼 라이브러리를 개발하였다. 개발된 라이브러리는 실시간 음성 통신시 사용자가 요구할 수 있는 다양한 품질을 제공하기 위해 전송률과 압축 방식에 따른 음성 코덱들을 포함하고 있다. 본 라이브러리는 다양한 환경에도 동일 입출력, 다중스레드, 인터넷 통신 등이 가능한 PWLIB를 기반으로 한다. 음성 데이터는 RTP/UDP/IP를 이용하여 패킷화되고 RTCP를 이용하여 전송 품질이 모니터링된다. 개발된 음성 통신 라이브러리를 이용하여 간단한 음성 통신 시스템을 구현하였으며, 음성 코덱별로 네트워크 상에서 송수신 테스트를 진행하였다. 본 라이브러리는 비디오 코덱 및 시그널링 및 네트웍 자원 예약 프로토콜과 결합되어 멀티미디어 통신 단말 개발에 사용 될 수 있다.

  • PDF

마이크로컴퓨터를 이용한 FFT 분석기의 설계 및 제작 (Design and Construction of a FFT Analyzer Using a Microcomputer)

  • 이현태;김중규;이상배
    • 대한전자공학회논문지
    • /
    • 제23권6호
    • /
    • pp.944-949
    • /
    • 1986
  • By improving the ability of arithmatic processing with an arithmatic processor in a microcomputer and realizing the data input system for real time analysis, an FFT analyzer that is usable within the range of audio frequency is designed and constructed. The input signal passes through a gain programmable pre-amplifier and anti-aliasing lowpass filter into an analogditital converter to be converted into digital form. The converted input data is processed by an Apple II microcomputer. The results of the processing are displayed using a microcomputer display unit and can be copied on a printer or stored in a floppy disk.

  • PDF

실시간 음성 모니터링을 위한 오토인코더 기반 FTAE 설계 및 구현 (The Design and Implementation of Autoencoder-Based FTAE for Real-Time Audio Monitoring)

  • 양진환;최혁순;박정현;김성식;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.741-744
    • /
    • 2024
  • 본 연구에서는 음성 전처리 기법인 푸리에 변환의 높은 시간 복잡도로 인해 많은 계산 자원을 요구한다는 단점을 보완하기 위한 FTAE(Fourier Transform Auto Encoder)를 설계하고 구현한다. FTAE는 음성 데이터를 입력으로 받아 Early Fusion 특징맵을 출력하도록 설계된 오토인코더 기반 신경망이다. 학습 결과 FTAE의 최종 Training Loss는 0.1479를 나타냈다. 기존 푸리에 변환 기반 Early Fusion 방법과의 성능 비교 실험 결과 FTAE 방법은 Accuracy 0.905, F1-Score 0.905, 탐지 소요 시간 17초의 성능을 보였다. FTAE 방법은 Early Fusion 방법에 비해 Accuracy와 F1-Score는 0.065 하락했지만, 탐지 소요 시간은 약 72배 빠른 결과를 보여주었다.

The Efficacy of Zoom Technology as an Educational Tool for English Reading Comprehension Achievement in EFL Classroom

  • Kim, HyeJeong
    • International Journal of Advanced Culture Technology
    • /
    • 제8권3호
    • /
    • pp.198-205
    • /
    • 2020
  • The purpose of this study is to investigate the effect of real-time remote video instruction using zoom on learners' English reading achievement. The study also sought to identify the efficiency of zoom video lectures and consider supplementing them by surveying learners' opinions and satisfaction regarding zoom video lectures. To this end, control and experimental groups were set up, and two achievement tests and a questionnaire were conducted. The study's results demonstrated that zoom video lectures have a positive effect on learners' English reading achievement. The questionnaire found that learners are satisfied with zoom video lectures for the following reasons: 'increased interest in and motivation towards learning', 'self-directed learning', 'active interaction', 'ease of access', 'ease of information retrieval'. At the same time, the questionnaire also found that some learners are dissatisfied with zoom video lectures due to 'mechanical errors or defects', 'poor audio quality', and 'the need to add customized functions for efficient classes'. In practice, zoom video lectures must be supplemented with automatic attendance processing, convenient data upload and download, and more efficient video screen management. Given the recent increase in online classes, we, as instructors, must develop teaching activities and/or strategies for video lectures that can encourage active participation by learners.

광대역 ISDN용 MPEG 오디오-비쥬열 대화형 통신단말의 설계 및 구현 (A MPEG Audio-Visual Conversational Communication Terminal on the B-ISDN Environment)

  • 황대환;조규섭
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1960-1971
    • /
    • 1998
  • 광대역 ISDN에서 사용될 수 있는 멀티미디어 통신서비스로서 Video on Demand(V0D)와 같은 검색형 분배서비스와 영상전화, 다지점 영상회의와 같은 실시간 대화형 서비스를 대상으로 활발한 연구, 개발이 이루어지고 있다. V0D 서비스에 대한 연구는 Digital Audio-Visual Council(DAVIC)에서 V0D 서버, 전달 망, 그리고 Set-Top Box(STB) 등을 포함한 전체 시스템에 대한 규격을 확정하였고 대화형 멀티미디어 통신단말은 ITU-T SG16에서 H.300 계열 단말의 표준을 대부분 완료한 상태이다. 그러나 이들 기구에서 권고하고 있는 멀티미디어 통신단말의 구조는 주 연구대상의 차이로 인해, 검색형 분배서비스와 대화형 통신서비스를 모두 제공할 수 있는 효율적인 구성 형태를 갖고 있지 못하다. 본 논문은 ITU-T, DAVIC, ATM Forum 등의 권고 및 규격을 면밀히 분석한 후, 동일한 멀티미디어 통신단말에서 V0D 및 대화형 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안하고 설계, 구현하였다. 광대역 ISDN을 대상으로 한 통신단말은 범용 PC에 탑재되는 두 개의 add-on 카드로 구현하였으며, ATM 접속을 통한 V0D 및 일-대-일 대화형 멀티미디어 통신 세션 설정와 실험을 통해 기능의 검증을 완료하였다.

  • PDF

RELP 방식을 이용한 디지털 음성 응답기 (A Digital Audio Respose System Based on the RELP Algorithm)

  • 김상용;은종관
    • 대한전자공학회논문지
    • /
    • 제21권6호
    • /
    • pp.7-16
    • /
    • 1984
  • 본 논문에서는 디지탈 자동 음성 응답장치의 개발에 관하여 전반적인 사항을 기술하였다. 개발된 디지탈 음성 응답 장치는 전화국에서 가입자가 전화번호를 문의하였을 때 자동 응답할 구 있도록 특별히 구성된 시스템이다. 본 시스템의 구현 algorithm으로는 pitch predictive loop(PPL)을 가지는 RELP(residual excited linear pediction)방식을 사용하였는데 system memory는 비교적 적은 반면 음질은 아주 좋은 것이 개발된 자동 응답기의 큰 장점이라 하겠다. Hardware는 bit-slice microprocessor를 사용한 음성 합성기와 controller 및 I/O로 이루어져 있는데 이들은 실시간 신호처리와 시스템의 적응성 및 신뢰성을 고려하여 설계하였다.

  • PDF

사용자의 음장선호도에 따른 오디오 콘텐츠 적응 기술 (Audio Contents Adaptation Technology According to User′s Preference on Sound Fields)

  • 강경옥;홍재근;서정일
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.437-445
    • /
    • 2004
  • 본 논문에서는 사용자의 음장 선호도를 이용하여 오디오 콘텐츠를 사용자가 원하는 음장으로 변환하는 기술에 대하여 설명한다. 오디오 신호가 재생되는 공간의 음장을 사용자가 원하는 음장으로 변환시켜주는 음장효과 기술은 실감있고 현장감있는 음악재생에 필수적인 요소이다. 그러나, 음장효과를 실시간으로 처리하기 위해서는 막대한 연산량이 필요하므로 MP3 플레이어와 같은 휴대용 오디오 단말에서는 구현하기 힘들다. 본 논문에서는 사용자로부터 전달된 음장 선호도를 이용하여 서버에서 음장효과를 처리하도록 하여, 단말의 성능에 구애받지 않고 음장효과를 제공할 수 있는 기술을 제안한다. 사용자가 선호하는 음장을 표현하기 위하여 선호하는 음장을 실내응답신호의 URI 주소를 이용하여 표현하는 방법 뿐만 아니라 음향공간에 대한 심리적 파라미터를 이용할 수 있게 하였다. 또한, 실내응답신호와 복적분 연산을 통한 음장효과 처리 방법을 실시간 응용에 적용하기 위하여 고속 복적분 알고리즘을 제안하였으며, 실험을 통하여 실시간 응용에도 적용이 가능함을 확인하였다. 본 논문에서 제안한 음장 선호도 서술구조의 효용성을 검증하기 위하여, 일반인을 대상으로 음장을 구분하는 능력과 음장효과가 처리된 음악에 대한 선호도에 대한 주관듣기평가를 실시하여 제안된 음장 선호도가 일반인들에게 적용이 가능함을 확인하였다.

Speech Interactive Agent on Car Navigation System Using Embedded ASR/DSR/TTS

  • Lee, Heung-Kyu;Kwon, Oh-Il;Ko, Han-Seok
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.181-192
    • /
    • 2004
  • This paper presents an efficient speech interactive agent rendering smooth car navigation and Telematics services, by employing embedded automatic speech recognition (ASR), distributed speech recognition (DSR) and text-to-speech (ITS) modules, all while enabling safe driving. A speech interactive agent is essentially a conversational tool providing command and control functions to drivers such' as enabling navigation task, audio/video manipulation, and E-commerce services through natural voice/response interactions between user and interface. While the benefits of automatic speech recognition and speech synthesizer have become well known, involved hardware resources are often limited and internal communication protocols are complex to achieve real time responses. As a result, performance degradation always exists in the embedded H/W system. To implement the speech interactive agent to accommodate the demands of user commands in real time, we propose to optimize the hardware dependent architectural codes for speed-up. In particular, we propose to provide a composite solution through memory reconfiguration and efficient arithmetic operation conversion, as well as invoking an effective out-of-vocabulary rejection algorithm, all made suitable for system operation under limited resources.

  • PDF