• Title/Summary/Keyword: 음성압축

Search Result 218, Processing Time 0.024 seconds

Effects of Concrete Superplastizers on the Cement Wettability and the Strength Properties of Cocreate Mortar (콘크리트 유동화제가 시멘트 입자의 표면 젖음성 및 콘크리트 몰타르 경화물성에 미치는 영향)

  • Kim, Young-Ho
    • Applied Chemistry for Engineering
    • /
    • v.21 no.4
    • /
    • pp.457-462
    • /
    • 2010
  • In this research, the effects of the concrete superplastizers on the wettability of cement particle and concrete strength were studied. The wettability of the cement particles strongly depended on the type of the superplastizer. When the superplastizer had a higher wettability with the cement particles, it revealed a good fluidity of the concrete mortar and a higher concrete strength. Non-ionic superplastizers (polycarboxylic type) had a relatively good performance on the mortar fluidity and concrete strength properties compared to anionic superplastizers (lignosulfate, sulfonated naphthalene formaldehyde, sulfonated melamin formaldehyde). It was observed that the blending of the polycarboxylic and the lignosulfate type concrete superplastizers resulted in synergistic effects on the concrete mortar fluidity and concrete strength properties.

An Image Watermarking Method for Embedding Copyrighter's Audio Signal (저작권자의 음성 삽입을 위한 영상 워터마킹 방법)

  • Choi Jae-Seung;Kim Chung-Hwa;Koh Sung-Shik
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.4
    • /
    • pp.202-209
    • /
    • 2005
  • The rapid development of digital media and communication network urgently brings about the need of data certification technology to protect IPR (Intellectual property right). This paper proposed a new watermarking method for embedding owner's audio signal. Because this method uses an audio signal as a watermark to be embedded, it is very useful to claim the ownership aurally. And it has the advantage of restoring audio signal modified and especially removed by image removing attacks by applying our LBX(Linear Bit-expansion) interleaving. Three basic stages of our watermarking include: 1) Encode . analogue owner's audio signal by PCM and create new digital audio watermark, 2) Interleave an audio watermark by our LBX; and 3) Embed the interleaved audio watermark in the low frequency band on DTn (Discrete Haar Wavelet Transform) of image. The experimental results prove that this method is resistant to lossy JPEG compression as standard image compression and especially to cropping and rotation which remove a part of Image.

A Study on the Speech Packetized Coding by Zero Bit Reduction of 1'st Order Differences (1차 차분신호의 영비트 제거에 의한 음성신호의 패킷부호화에 관한 연구)

  • Shin, Dong-Jin;Lim, Un-Cheon;Bae, Myung-Jin;Ann, Sou-Guil
    • The Journal of the Acoustical Society of Korea
    • /
    • v.8 no.4
    • /
    • pp.74-82
    • /
    • 1989
  • In this paper, we have studied on the methodologies of implementation and the performance evaluations about the real-time packetized coding of multi-channel speech signals. Our suggested coding algorithm is very, simple and it has majorly the data handling operations rather than the numerical calculations. And it gives about $40\%$ of compression ratio with less than the conventional codings. Nevertheless, using this algorithm, we can save the memories for the speech signal and we can raise the efficiency of the channel transmission. Especially because of its simplicity of algorithm, we can easily obtain the merits of the multi-channel operations.

  • PDF

On a pitch alteraton of speech technique using the asymmetry weighting (비대칭 weighting을 사용한 음성 피치변경법)

  • 함명규;나덕수;정찬중;배명진
    • Proceedings of the IEEK Conference
    • /
    • 1998.06a
    • /
    • pp.615-618
    • /
    • 1998
  • 음성부호화의 주요목적은 대역 제한된 전송 대역폭에 전송을 하기위한 음성압축, 명료성과 자연성을 유지하는 고음질 음성합성, 그리고 처리 속도등의 요소에 따라 달라진다. 일반적으로 음성 부호화 방법은 파형 부호화범, 신호원 부화화법, 그리고 혼성 부호화법으로 나누어질 수 있다. 이러한 방법으로 전송되어진 음성은 다시 합성을 하게되는데, 이때 고음질을 유지할 수 있는 PSOLA법을 사용하였다. 본 논문에서 제안한 방법으로 전송되어진 음성은 다시 합성을 하게되는데, 이때 고음질에 유지 할 수 있는 PSOLA법을 사용하였다. 본 논문에서 제안한 방법은 기존의 PSOLA 합성법에서 사용되어지는 hanning 윈도우가 음성이 갖는 golttal wave shape의 특성에 적합하지 않다는 것을 이용하여 기존의 hanning 윈도우가 아닌 비대칭성을 가진 새로운 형태의 비대칭 윈도우(asymmetry window)를 제안하였다. 비대칭 윈도우의 형태는 위도우를 중심으로 왼쪽편은 기울기가 심하고, 오른쪽은 기울기가 완만하여 음성의 기울기에 적합한 웨이팅을 갖는 형태이다. 제안한 비대칭 윈도우를 사용하여 PSOLA 합성을 하였을 경우 SNR 2~3dB 정도 향상되었음을 알 수 있다.

  • PDF

Speech Coding Algorithms for Mobile Communication (이동통신을 위한 음성 부호화 방식)

  • 이황수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.3-11
    • /
    • 1998
  • 정보통신 문화가 발달함에 따라 디지털 이동통신이나, 멀티미디어, 음성우편 시스템 등 음성을 이용한 여러 가지 새로운 산업들이 급속히 성장하고 있다. 이 중에서도 특히 디지털 이동통신분야에 대한 연구가 활발한데, 이는 디지털 시스템에서는 부호화기를 사용하여 음성신호를 압축하기 때문에 아날로그 시스템에 비해 패널 증대를 가져올 수 있기 때문이다. 이처럼 음성 부호화기는 실질적인 상업화와 매우 밀접한 관계를 갖고 있기 때문에 그에 대한 연구가 화발히 진행되고 있다. 본 논문에서는 먼저 일반적인 음성부호화 방법들에 대해 살펴본 다음에, 현재 디지털 셀룰라 시스템에서 사용하고 있는 full-rate 음성 부호화기 및 half-rate 음성 부호화기의 표준화 동향과 최근에 여러 응용분야에서 널리 사용되고 있는 음성 부호화기에 대해서 설명하기로 한다. 또한 ITU-T 의 표준화 동향 및 4kbps 이하의 전송률을 갖는 음성 부호화기의 연구추세에 대해서 살펴보기로 한다.

  • PDF

Implementation of The Audio for HiMCS System (지능형 고품질 서비스를 위한 오디오 개발)

  • 송재종;이석필;장세진
    • Proceedings of the IEEK Conference
    • /
    • 2003.11a
    • /
    • pp.77-80
    • /
    • 2003
  • 본 논문에서는 디지털방송과 인터넷의 융합에 따른 MPEG-2/4/7 방송 및 인터넷 콘텐츠를 비롯한 게임등과 같은 다양한 멀티미디어 서비스를 제공하기 위한 차세대 지능형 고품질 홈 엔터테인먼트 시스템 Platform 개발에서 사용될 MPEG-4 오디오를 개발한다. 인터넷 상에서의 스트리밍 서비스를 위해서는 저 전송률과 고 품질의 비디오/오디오 알고리즘이 필요하다. 이러한 서비스를 제공하기 위하여 MPEG-4 오디오는 음성에서 고품질의 다중 채널의 오디오까지, 그리고 자연음(Natural Sound)에서 합성음에 이르기까지 다양한 알고리즘을 제공한다. 본 논문에서는 지능형 고품질 미디어 에이전트 시스템에 적합한 MPEG-4 AAC, MPEG-1 Layer-3인 MP3, G.723.1을 구현하고, 이 시스템에 알맞은 7㎑ 대역폭을 가지는 광대역(Wideband) 음성신호를 16kbps로 압축하는 음성 압축기를 제안 및 개발한다.

  • PDF

Efficient TTS Database Compression Based on AMR-WB Speech Coder (AMR-WB 음성 부호화기를 이용한 TTS 데이터베이스의 효율적인 압축 기법)

  • Lim, jong-Wook;Kim, Ki-Chul;Kim, Kyeong-Sun;Lee, Hang-Seop;Park, Hae-Young;Kim, Moo-Young
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.3
    • /
    • pp.290-297
    • /
    • 2009
  • This paper presents an improved adaptive multi-rate wideband (AMR-WB) algorithm for the efficient Text-To-Speech (TTS) database compression. The proposed algorithm includes unnecessary common bit-stream (CBS) removal and parameter delta coding combined with speaker-dependent huffman coding to reduce the required bit-rate without any quality degradation. We also propose lossy coding schemes to produce the maximum bit-rate reduction with negligible quality degradation. The proposed lossless algorithm including CBS removal can reduce bit-rate by 12.40% without quality degradation compared with the 12.65 kbps AMR-WB mode. The proposed lossy algorithm can reduce bit-rate by 20.00% with 0.12 PESQ degradation.

Compression of the Rules of Producing Phonetic Values (음가 생성 규칙의 압축)

  • 이계영;임재걸;김경징
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.201-203
    • /
    • 1999
  • 음성합성에서 자연스러운 합성음을 생성하기 위하여 표준 발음법을 페트리넷 근저행렬로 모델링하는 방법으로 표준 발음법을 음가 생성 규칙으로 만들 수 있다. 본 논문은 페트리넷으로 모델링된 음가 생성 규칙의 크기를 줄이는 방법을 제안하고 구현하였다. 압축하기 전의 음가 생성 테이블의 크기는 719*107의 2차원 배열이었으며 구현된 시스템으로 압축한 결과 41*40의 2차원 구조체 배열로 압축되었다.

  • PDF

Mosaic Effect Applied to Moving Object in MPEG Compressed Domain (MPEG 압축영역에서 움직이는 오브젝트에 적용한 모자이크 효과)

  • 박동권;전우성;원치선
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.06b
    • /
    • pp.41-44
    • /
    • 1999
  • 최근, 방송기술의 발전이 날로 그 속도가 빨라지고 있다. 기존의 아날로그 방송에서 요즘은 디지털 방송으로 전환되는 것이 그 예이다. 방송의 디지털화는 영상 및 음성의 질을 높이고 방송 자료의 영구보존 및 검색에 뛰어난 장점을 가지고 있다. 반면 하드웨어의 복잡도가 높아지고 그 응용 소프트웨어가 부족한 형편이다. 본 논문에서는 MPEG-2로 압축된 영상 데이터에서 원영상 레벨의 복원과 재압축 없이 압축 비트열내 특징정보를 추출 및 간단하게 조작하여 간단하게 움직이는 오브젝트에 모자이크 효과를 적용하였다.

  • PDF

A LECTURE SEARCH SYSTEM USING RELEVANT INFORMATION AND SPEECH TRANSCRIPTION (보조 자료와 음성 전사를 사용한 강의 검색 시스템)

  • Lee, Donghyeon;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.140-144
    • /
    • 2008
  • 음성 오디오 검색 시스템을 구축하기 위해서는 몇 가지 과정이 필요하다. 첫 번째 과정이 음성 인식기를 이용하여 음성 오디오를 텍스트 형태로 표현하는 것이다. 하지만, 음성 인식기에서 수반되는 음성 인식 오류를 피할 수는 없다. 음성 인식 오류를 최소화하기 위해서 음성 인식 출력의 lattice를 색인(index)해야 하는데, 보다 효과적인 처리를 위하여 압축된 형태를 사용한다. 본 연구에서는 특별히 한국어 강의를 대상으로 검색 시스템을 구축했다. 강의에서는 특별히 관련된 자료를 쉽게 구할 수 있는 데, 이런 자료를 언어 모델에 이용하여 음성 인식 성능을 향상 시킬 수 있다. 또한, 강의 자료를 이용한 추가 색인 테이블(index table)을 생성하여 검색 성능 향상에 도움을 준다. 실험에서 고등학교 과정 수학 강의 동영상을 이용하여 자동화된 강의 검색 시스템을 구축하고, 보조 자료를 이용해 성능을 향상 시키는 것을 보인다.

  • PDF