• 제목/요약/키워드: 음성다중

검색결과 350건 처리시간 0.024초

다중펄스 방법을 이용한 디컨벌루션 (The Seismic Multipulse Deconvolution)

  • 손호웅
    • 자원환경지질
    • /
    • 제28권5호
    • /
    • pp.487-491
    • /
    • 1995
  • 음성신호를 임펄스 반응으로 압축시키는데 사용되는 선형예측코드의 다중펄스 방법을 다중반사파를 제거시킬수 있도록 개선시켰다. 다중반사파는 층사이에서 연속 반사에 의해 발생하는 것으로서 탄성파 해석을 어렵게 한다. 본 논문에서는 개선된 다중펄스방법을 이용하여 음원 파형요소를 스파이크로 압축시키고 다중반사파를 제거하도록 하였으며, 지하 정보를 갖고 있는 반사계수 함수의 크기와 위치를 연속 계산방식에 의해 이끌어 냈었다. 개선된 다중펄스 방법의 탄성파 자료에의 적용은 좋은 결과를 보여주고 있다.

  • PDF

정규화 지속시간 회귀트리를 기반으로 한 음운지속시가 모델화 (A Modelling of segmental Duration based on Regression Tree of the Normalized Duration)

  • 정지혜
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.278-281
    • /
    • 1998
  • 본 논문에서는 자연음성으로부터 통계적인 방법으로 일반적인 음성합성 규칙을 생성하기 위해, 남녀 각각 1명이 200문장에 대해 발성한 문음성 데이터를 음운 세그먼트, 음운 라벨링, 음운별 품사 태깅, 문법 정보 태깅하여 음성 데이터베이스를 구축하였다. 이 음성 데이터베이스로부터 휴지지속시간을 분석하여 긴 휴지와 짧은 휴지로 분류하였고, 이러한 휴지가 어느 경우에 나타나는가를 조사하였다. 음운지속시간을 보다 정교하게 예측하기 위하여, 각 음운의 고유 지속시간의 영향을 배제시킨 정규화 지속시간에 대해 2가지 class(장, 단)의 휴지시간을 고려한 회귀트리로 음운지속시간을 모델화하였다. 제안된 모델의 평가 결과 예측치와 관측치 간의 다중 상관 계수는 남성은 0.82, 여성은 0.84 정도로 평가되었다.

  • PDF

OpenPose를 활용한 음성인식기반 드론제어 촬영시스템 (Speech-Recognition Drone Camera System using OpenPose)

  • 조유진;김세현;권예림;정순호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1056-1059
    • /
    • 2020
  • 최근 드론과 1인 미디어 시장의 성장으로, 영상 촬영 분야에서의 드론 산업이 활발하게 발전되고 있다. 본 논문에서는 딥러닝 기반 다중 객체 인식 기술인 Openpose를 활용하여 인물촬영을 위한 음성인식 드론 제어 시스템을 제안한다. 해당 시스템은 자연어 처리된 음성명령어를 통해 드론이 각 촬영 객체에 대한 회전, 초점변화 등 실제 영상촬영기법에 사용되는 다수의 동작을 수행할 수 있도록 한다. 최종적으로 96.2%의 정확도로 음성명령에 따라 동작을 수행하는 것을 확인할 수 있다. 이는 누구나 전문적 지식이나 경험 없이 음성만으로 쉽게 드론을 제어할 수 있을 것으로 기대된다.

고정 타임슬롯 모드를 사용하는 PCM 시스템에서 디지털 음성 데이터 보안 기법 (Cipher method of digital voice data using fixed time slot mode in PCM system)

  • 임성렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.782-785
    • /
    • 2010
  • 본 논문은 연속된 음성 신호를 전송로 상에 전송하기 위해 음성 신호를 G.711 표준 권고인 PCM으로 다중화한 후 고정 타임슬롯을 배정하여 전송하는 시스템에서 PCM 화된 디지털 음성 데이터를 실시간으로 암호화하여 전송하는 스트림 암호화 기법에 관한 것이다. 실시간으로 처리되는 음성 데이터의 암호화 시에는 하드웨어 방식이 적합한 데, 본 논문에서는 고정 타임슬롯을 배정받는 음성 데이터의 실시간 암호화 기법에 관한 것이다. 일반적으로 아날로그 음성 신호 코딩 시에 국내에서는 북미 방식인 ${\mu}-law$ 코딩 기법을 적용하는 데 이는 표본화한 음성 데이터를 양자화전에 압축하고 복호화 후 신장하는 비선형 양자화 기법을 적용하는 것으로 표본화된 값을 8 비트의 PCM 데이터로 변화하여 E1(2.048Mbps) 급 속도로 전송한다. 본 논문에서는 PCM 전송로 상에 전송되기 전의 직렬 입력 데이터를 암호화 장치를 거쳐 해당 타임슬롯에 해당하는 8 비트의 데이터를 실시간으로 암호화하여 전송로 상으로 전송하고 역으로 수신 단에서는 PCM 전송로를 거친 직렬 입력 데이터를 암호화된 타임슬롯을 판별하여 해당 타임슬롯의 데이터를 복호화하여 원래 데이터를 복원한다. 본 논문에서는 고정 타임슬롯을 배정받은 PCM 데이터를 암호화하여 전송한 후 수신 단에서 복호화 과정을 거친 후 타임슬롯 단위로 데이터 암호화/복호화가 가능함을 보여준다.

UTRAN Iub 인터폐이스에서 QoS 기반의 AAL2/ATM 다중화 전송방안 (QoS Based AAL2/ATM Multiplexing Schemes in the UTRAN Iub Interface)

  • 정창용;정조운;황호영;성단근;정수성;방만원
    • 한국통신학회논문지
    • /
    • 제28권6A호
    • /
    • pp.386-396
    • /
    • 2003
  • 최근에 이동통신 시스템이 3세대로 진화하면서 음성 위주의 서비스에서 점차 인터넷 서비스 같은 여러 다양한 서비스들을 지원하게 되었다. 그리고 급증하는 사용자들을 수용하기 위해 무선 가입자망의 Iub 인터페이스에서AAL2 다중화 기술을 도입하여 한정된 링크의 효율을 높이고 있다. 그러나 무선 자원의 부족과 지원되는 다양한 서비스들의 요구조건이 다르기 때문에 무선 가입자망에서는 제대로 각 서비스 별로 QoS를 만족시켜 주지 못하고있다. 기존의 AAL2/ATM의 다중화 시스템에서는 음성과 데이터의 다중화 효과와 실시간성, 비실시간성 서비스에 대해 QoS를 분석해 왔다. 본 논문에서는 여러 다양한 서비스들을 QoS 요구조건에 따라 분류하고 그 요구조건에 맞도록 통계적 다중화와 간단한 구조로 스케쥴하는 AAL2/ATM 다중화 전송방안을 제안한다. 모의실험 결과 각 서비스의 QoS 요구조건을 맞출 수 있어 기존의 방법보다 더 좋은 성능이 나타남을 확인하였다.

가우시안 코드북을 갖는 다중대역 비균일 음성 표본화법 (On a Multiband Nonuniform Samping Technique with a Gaussian Noise Codebook for Speech Coding)

  • 정형교;배명진
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.110-114
    • /
    • 1997
  • 잡음 음성신호에 비균일 표본화 부호화법을 적용하면, PCM 균일표본화의 전송율 정도로 데이타 전송율이 높아진다. 이러한 문제점을 해결하기 위해 비균일 표본화법을 성분분리된 음성신호에 적용하는 방법으로서 다중대역 비균일 파형부호화(MNWC)법을 제안하였었다. 그렇지만, 고대역의 성분에 대해 가우시안 잡음의 평균레벨로 단순하게 모델링 하였기 때문에, 비균일 표본화법에 비해 음질의 열화가 초래되었었다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해 고대역의 성분을 중심주파수가 서로 다른 16가지의 가우시안 잡음으로 모델링하였다. 이렇게 하였을 때, 제안된 방법은 MOS평가가 평균 3.16 정도로 고음질을 유지하면서도 기존의 비균일 표본화법에 비해 1.5배 정도의 압축 율을 얻을 수 있었다.

  • PDF

무선 비동기 전송모드 매체 접근제어에서 음성서비스를 위한 예약 슬롯 할당 알고리즘 (Reserved Slot Allocation Scheme for Voice Service in WATM MAC)

  • 김관웅;배성환;전병실
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.101-108
    • /
    • 2001
  • 본 논문에서는 무선 비동기 전송모드에서 실시간 음성 서비스의 서비스 품질을 제공하기 위한동적 예약슬롯할당 알고리즘을 제안한다. 유음-무음 구간반복 특성을 가진 음성 트래픽이 요구하는 서비스 품질을 제공하기 위하여 휴지상태의 단말 수와 단말의 휴지상태 지속시간에 따라 동적으로 예약슬롯을 할당하여 부하에 관계없이 일정한 서비스 품질을 제공한다. 컴퓨터 시뮬레이션을 통하여 기존의 할당 알로하와 비충돌-패킷 예약다중접속방식과 성능을 비교 평가하였다. 할당 알로하 방식과 비교하면, 단말수가 적을 때는 프레임에서 오버헤드가 적었으며, 호 접근시간과 충돌률에서 좋은 성능을 보여준다. 제안한 알고리즘은 동적으로 예약슬롯을 할당하기 때문에 단말 당 하나의 예약슬롯을 할당하는 비충돌-패킷 예약다중접속보다는 대역폭 효율이 우수하며, 음성 트래픽이 요구하는 서비스 품질을 만족시킬 수 있다.

  • PDF

TMS320C6201을 이용한 적응 다중 전송율을 갖는 광대역 음성부호화기의 실시간 구현 (Real-Time Implementation of Wideband Adaptive Multi Rate (AMR-WB) Speech Codec Using TMS32OC6201)

  • 이승원;배건성
    • 한국통신학회논문지
    • /
    • 제29권9C호
    • /
    • pp.1337-1344
    • /
    • 2004
  • 본 논문에서는 적응 다중 전송율을 갖는 광대역 음성부호화기인 AMR-WB 의 알고리즘을 분석하고, TI사의 고정소수점 DSP인 TMS320C6201를 이용한 실시간 구현 결과를 제시한다. AMR-WB 음성부호화기는 두 가지 대 역으로 분리된 신호가 독립적으로 부호화되며, 저대역 신호는 ACELP 방식으로、 고대역 신호는 잡음 여기신호와 선형예측 합성필터를 사용하는 방식으로 각각 합성된다. 구현된 AMR-WB 음성부호화기는 프로그램 메모리와 데이터 메모리가 각각 218 kbytes, 92kbytes의 크기를 가지며 , 한 프레임인 20 ms를 처리하는데 평균 920,267 정도의 클릭 수가 사용되어 약 5.75 ms의 시간이 소요 되였다. 또한, DSP로 구현한 AMR-WB 음성부호화기의 결과와 PC에서 시뮬레이션 한 결과가 서로 일치함을 확인하였다.

인터넷을 통한 멀티미디어 자동 응답 시스템 (Multimedia Automatic Response System via Internet)

  • 이흥규;김준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.406-408
    • /
    • 1998
  • 본 논문에서는 인터넷을 이용한 멀티미디어 자동 응답 시스템을 설계 및 구현한다. 멀티미디어 자동 응답 시스템은 웹을 기반으로 한 클라이언트/서버 구조를 갖는다. 인터넷을 이용한 멀티미디어 자동 응답서버는 멀티미디어 자동응답안내 및 멀티미디어 디렉토리 서비스에 따라 상대방에게 전화를 걸고, 부재 시에는 음성 및 영상 메시지녹음을 통해 상대방에게 멀티미디어 메시지를 남긴다. 또한 다중 사용자의 계정 관리 및 다중 접속을 지원하며, 멀티미디어 자동 응답을 위한 멀티미디어 안내 정보 제작 도구를 제공한다. 멀티미디어 자동 응답 클라이언트는 멀티미디어 자동 응답 안내 상연 및 전화 걸기, 음성 및 영상 메시지 남기기 서비스, 수신된 메시지 확인 서비스를 제공한다.

  • PDF

생물학적 특징을 이용한 사용자 인증시스템 구현 (A study on the implementation of user identification system using bioinfomatics)

  • 문용선;정택준
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.346-355
    • /
    • 2002
  • 이 연구는 인식의 정확성을 향상시키기 위하여 단일생체 인식 대신에 얼굴, 입술, 음성을 이용하는 다중생체 인식방법을 제안한다. 각 생체 특징은 다음과 같은 방법으로 찾는다. 얼굴 특징은 웨이블렛 다중분해와 주성분 분석방법으로 계산하였고, 입술의 경우는 입술의 경계를 구한후 최소 자승법을 이용한 방정식의 계수를 구하였으며, 음성은 멜 주파수에 의한 MFCC를 사용하였으며, 역전파 학습 알고리즘으로 분류하여 실험하였다. 실험을 통해 본 방법의 유효성을 확인하였다.