• 제목/요약/키워드: Voice Processing

검색결과 561건 처리시간 0.021초

Implementation of Public Address System Using Anchor Technology

  • Seungwon Lee;Soonchul Kwon;Seunghyun Lee
    • International journal of advanced smart convergence
    • /
    • 제12권3호
    • /
    • pp.1-12
    • /
    • 2023
  • A public address (PA) system installed in a building is a system that delivers alerts, announcements, instructions, etc. in an emergency or disaster situation. As for the products used in PA systems, with the development of information and communication technology, PA products with various functions have been introduced to the market. PA systems recently launched in the market may be connected through a single network to enable efficient management and operation, or use voice recognition technology to deliver quick information in case of an emergency. In addition, a system capable of locating a user inside a building using a location-based service and guiding or responding to a safe area in the event of an emergency is being launched on the market. However, the new PA systems currently on the market add some functions to the existing PA system configuration to make system operation more convenient, but they do not change the complex PA system configuration to reduce facility costs, maintenance, and management costs. In this paper, we propose a novel PA system configuration for buildings using audio networks and control hierarchy over peer-to-peer (Anchor) technology based on audio over IP (AoIP), which simplifies the complex PA system configuration and enables convenient operation and management. As a result of the study, through the emergency signal processing algorithm, fire broadcasting was made possible according to the detection of the existence of a fire signal in the Anchor system. In addition, the control device of the PA system was replaced with software to reduce the equipment installation cost, and the PA system configuration was simplified. In the future, it is expected that the PA system using Anchor technology will become the standard for PA facilities.

The Implementation of a Lift Emergency Video Call System based on WebRTC using OpenAPI

  • Woon-Yong Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.155-161
    • /
    • 2023
  • 본 논문에서는 승강기 비상통화 장치의 활용성과 안정성을 높이기 위해 상시 모니터링 환경의 서비스 체계를 구축하는 WebRTC 기반의 비상 화상통화 시스템 구조를 제시한다. 제시된 시스템은 비상상황 시 승강기 내의 비상 호출 시스템과 유지보수 담당자들 간의 원활한 통화 환경을 제공하고 대상 승강기의 모니터링을 통해 승강기 비상 호출에 대한 신속한 응답 처리를 수행하고 승강기의 물리적 공간에서 발생할 수 있는 화상통화에 필요한 제약환경을 극복하여 음성과 영상의 저지연 실시간 화상통화 서비스를 구현할 수 있는 환경을 구축하고자 한다. 이를 위해 현재 다양한 분야에서 활용되고 그 성능이 검증된 OpenAPI를 기반으로 서비스 환경을 구축하고 실시간 화상통화 및 저지연 통화 품질 제공, 그리고 신속한 메시징 방식의 비상상황 전파 방식을 통해 비상 화상통화 장치의 성능 및 활용성을 높이고자 한다. 제시된 시스템 구조는 승강기 제어반 및 다양한 장치와의 결합을 통해 다양한 기능 확장 및 신뢰성 있는 서비스 환경을 통해 승강기 시스템에 대한 지능적 모델을 구성할 수 있는 기반을 제공할 수 있을 것이다.

영상처리 및 머신러닝 기술을 이용하는 운동 및 식단 보조 애플리케이션 (Application for Workout and Diet Assistant using Image Processing and Machine Learning Skills)

  • 이치호;김동현;최승호;황인웅;한경숙
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.83-88
    • /
    • 2023
  • 본 논문에서는 홈 트레이닝 인구가 늘어나면서 증가한 운동과 식단 보조 서비스에 대한 수요를 충족시키기 위해 운동 및 식단 보조 애플리케이션을 개발하였다. 애플리케이션은 카메라를 통해 실시간으로 촬영되는 사용자의 운동 자세를 분석하여, 안내선과 음성을 이용해 올바른 자세를 유도하는 기능을 가진다. 또한, 사용자가 사진을 촬영하면 사진에 포함된 음식들을 분류하고 각 음식의 양을 추정하여, 칼로리 등의 영양 정보를 계산하여 제공하는 기능을 가진다. 영양 정보 계산은 외부의 서버에서 수행되도록 구성했다. 서버는 계산된 결과를 애플리케이션으로 전송하고, 애플리케이션은 결과를 받아 시각적으로 출력한다. 추가로, 운동 결과와 영양 정보는 날짜별로 저장하고 확인할 수 있도록 하였다.

인공지능 기술이 포함된 전자상거래(G06Q) 관련 특허의 기술 융복합 분석 (Technology convergence analysis of e-commerce(G06Q) related patents with Artificial Intelligence)

  • 심재륜
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.53-58
    • /
    • 2024
  • 본 연구는 우리나라에 출원된 인공지능 기술이 포함된 전자상거래 관련 특허의 기술 융복합 분석에 관한 것으로 사회 연결망 분석(Social Network Analysis)을 이용하여 핵심 기술간 관계를 분석하고 시각화하였다. 사회 연결망 분석을 실시한 결과 인공지능 기술이 포함된 전자상거래 관련 특허에서 상호 기술 네트워크를 구성하는 핵심 IPC 코드는 G06Q, G06F, G06N, G16H, G10L, H04N, G06T, A61B 등으로 조사되었다. 특히 [G06Q-G06F], [G06Q-G06N] 등 데이터 처리 관련 기술 융복합과 [G06Q-G10L], [G06Q-H04N], [G06Q-G06T] 등 음성과 이미지 신호가 중요하게 융합되어 있음을 확인할 수 있다. 본 연구 방법을 활용하면 전자상거래 관련 특허의 미래 기술 트렌드를 확인하고 새로운 비즈니스 모델을 창안할 수 있다.

연속음성신호의 SNR 추정기법에 관한 연구 (A Study on SNR Estimation of Continuous Speech Signal)

  • 송영환;박형우;배명진
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.383-391
    • /
    • 2009
  • 음성 신호처리 환경에서 잡음이 섞인 신호를 개선할 목적으로 음성향상 기법이 많이 이용되고 있다. 잡음추정 알고리즘은 변화하는 환경에 빠르게 적응할 수 있어야 하며 음성신호의 영향을 줄이기 위해 음성신호가 존재하지 않는 구간에서만 잡음의 파워를 갱신한다. 이러한 방법은 음성구간검출이 선행되어야 한다. 그러나 잡음에 열화된 음성신호에 묵음구간이 존재하지 않을 경우, 위와 같이 음성검출을 통한 묵음구간에서의 잡음 추정 방법 및 SNR 추정 방법이 적용될 수 없다. 본 논문에서는 묵음구간이 존재하지 않는 연속음성신호에서 SNR을 추정하는 기법을 제안한다. 유성음의 안정구간에서는 단구간 내 피치의 변화가 매우 작아 피치주기에 따른 음성신호의 파형이 유사하게 나타난다. 따라서 잡음이 음성에 부가되었을 때 피치주기에 따른 인접파형의 유사도를 통해 SNR을 추정한다. 무성음에서는 잡음의 영향이 수신신호의 성도성분 추정에 영향을 미치기 때문에 잡음환경에서 추정된 성도성분과 수신신호 스펙트럼 간의 거리를 이용하여 SNR을 추정한다. 마지막으로, 음성신호의 에너지가 유성음에 대부분 분포하기 때문에, 부가성 잡음 환경에서 유성음의 에너지를 음성신호의 에너지로 근사화하여 SNR을 추정할 수 있다.

영상처리용 프로세서를 위한 효율적인 이차원 어드레스 지정 기법 (An Efficient 2-dimensional Addressing Mode for Image Processor)

  • 고윤호;윤병주;김성대
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.486-497
    • /
    • 2001
  • 본 논문에서는 프로그램 가능한 하드웨어 장치에서 영상 처리를 효율적으로 수행하기 위한 새로운 메모리 어드레스 지정 방법(addressing mode)을 제안한다. 기존의 어드레스 지정 방법은 음성과 같은 일차원적인 형태의 데이터 처리에 적합한 반면, 제안된 메모리 어드레스 지정 기법은 영상 데이터의 이차원적인 특성을 고려한 새로운 메모리 어드레스 지정 기법이다. 제시된 기법은 기존의 메모리 구조를 바꾸지 않으면서도 이차원 데이터의 위치를 표시할 수 있는 두개의 오퍼랜드를 입력으로 메모리에 저장된 영상데이터 값을 처리는 명령어이다. 이차원적인 특성을 지니는 새로운 메모리 어드레스 지정 기법은 다음과 같은 장점을 지닌다. 먼저, 기존 하드웨어에서 여러 명령어에 걸쳐 수행해야 할 작업을 통합함으로써, 수행해야 할 프로그램의 코드 사이즈를 줄여 하드웨어의 성능을 높임과 동시에 근래 무선 응용 분야에서 요구되는 저전력 동작을 가능하게 한다. 아울러, 영상 데이터가 가지는 이차원적인 특성을 그대로 반영하므로, 사용자가 보다 쉽게 어셈블러를 통해 어플리케이션을 프로그램 할 수 있다. 이와 같은 이차원적인 메모리 어드레스 지정 기법은 각종 DSP, media processor, 그래픽 장치 등에 이용될 수 있다. 본 논문에서는 이러한 이차원 메모리 어드레스 지정 기법의 개념을 제안함과 동시에, 이를 효율적으로 구현하기 위한 하드웨어 구조를 제시한다.

  • PDF

실시간 멀티미디어 서비스를 위한 ATM/Internet 게이트웨이 시스템의 구현 (Implementation of ATM/Internet Gateway System for Real Time Multimedia Service)

  • 한태만;정유현;김동원
    • 정보처리학회논문지C
    • /
    • 제11C권6호
    • /
    • pp.799-806
    • /
    • 2004
  • 근래에 인터넷 등의 네트워크를 통해 어떤 정보에 접근할 수 있는 다양한 클라이언트 장치들이 널리 보급되고 있다. 하지만 통신능력이나 처리 및 저장능력, 화면표시 능력 등 여러 가지 제약을 가진 클라이언트 장치들로서는 방대한 양의 멀티미디어 콘텐츠를 쉽게 처리할 수 없는 문제가 있다. 또한 네트워크 측면에서도 음성, 데이터 및 비디오의 통합 서비스는 네트워크 기술의 목표를 수정하게 되어 네트워크가 다양한 서비스의 종합 제공 능력과 각 서비스에 필요한 QoS를 제공할 수 있는 능력을 가져야 하게 되었다. 이러한 이유로 ATM망과 인터넷 사이에 중단없는 멀티미디어 서비스를 제공할 수 있는 EAGIS(Efficient ATM Gateway for real time Internet Service)를 개발하게 되었다. EAGIS는 연동장치, 콘텐츠 서버, 트랜스코딩 서버, 서비스 브로커로 구성된다. 본 논문에서는 EAGIS의 구조 설계와 트랜스코딩 서비스 제공 방식을 설계하였다. RTP(Real Time Protocol)를 이용한 양방향 통신은 RTCP(Real Time Control Protocol)의 시각-소인(time-stamp)에 의하여 트랜스코딩 시간을 설정하며, HTTP를 이용한 단방향 통신은 셀프타이며(self-timer)를 이용한다. 이러한 기준 시간을 이용함으로써 네트워크 트래픽 부하와 프레임 전송률에 의한 표준화된 트랜스코딩 방법을 적용할 수 있었다. 또한 다중 사용자 유효 대역폭 확보 알고리즘을 통한 서비스의 품질을 보장할 수 있었다.

이기종 전술통신망 종단간 암호화 통신을 위한 메커니즘 (A mechanism for end-to-end secure communication in heterogeneous tactical networks)

  • 박철용;김기홍;류재철
    • 정보보호학회논문지
    • /
    • 제24권4호
    • /
    • pp.625-634
    • /
    • 2014
  • 전술통신망은 이기종 다양한 특성의 통신장비로 구성된 네트워크가 복합적으로 운용되고 있다. 이러한 구성으로 인해 종단간 통신을 위해 기종별 데이터 포맷으로 변환하기 위한 망연동 게이트웨이를 적용하고 통신 정보보호를 위해 네트워크별 암호기술이 적용되고 있다. 이는 이기종 망간 암호화된 데이터를 직접 전송할 수 없고 통신데이터의 재가공 및 처리지연의 문제점이 있다. 서로 다른 전술통신망 사이에 위치하는 망연동 게이트웨이에서 통신데이터에 대한 재가공과 암호화 데이터에 대한 복호화 및 재암호화가 요구된다. 본 논문에서는 전술통신망에서 이기종간 종단간 암호화 통신을 위한 통신방식을 제안한다. 제안한 방식을 이용하여 PSTN과 UHF 통신망간 게이트웨이에서 재가공, 재암호화, 전송 지연요소 등을 없애 실시간 음성 및 데이터 통신을 가능하게 한다. 또한, 종단간 정보보호를 위해 단대단 정보보호방식을 적용한다. 이를 통신망에 적용하여 기존 방식 대비 제안한 방식의 성능을 비교 분석한다. 제안한 방식은 기존방식의 문제점을 해결하고 이기종 전술통신망간 종단간 암호화 통신이 가능함을 확인하였다.

PoC BoX시스템이 적용된 모바일 환경에서 단말로의 효율적인 전송을 위한 RTSP 기반 미디어 표현 및 구조 생성 방법 (Media Expression and Structure Generation under RTSP for Effective Transmission on Mobile Environment with PoC Box system)

  • 이성준;김대원
    • 한국멀티미디어학회논문지
    • /
    • 제12권8호
    • /
    • pp.1142-1154
    • /
    • 2009
  • 이동통신 기술이 발전함에 따라 새로운 단말 서비스들이 계속 생겨나고 있다. 그 중 기존 무전기 개념을 이용한 그룹통화 및 인스턴트 메시징 서비스인 PoC (Push-to-talk over Cellular)는 표준 제정이 활발하게 논의되어 1.0을 지나 2.0 및 2.1 버전이 새로이 정의되고 있다. 이 중 기존의 음성사서함과 유사하며 PoC 클라이언트를 대체하는 기술인 PoC Box가 새롭게 논의되고 있으며, PoC Box 기술 중 가장 큰 이슈는 PoC Box에 저장되는 정보의 처리와 미디어를 전송하는 부분이 다. 본 논문에서는 PoC 클라이언트 사용자가 PoC Box에 저장된 미디어를 동적 제어하는 내용과 방법에 중점을 두고 있으며 이를 통해 저장된 미디어에 사용자가 원하는 특정의 재생위치나 재생범위를 둘 수 있게 하여 효율적 전송을 할 수 있음을 제시하고자 한다. 또한 이를 구현하여 PoC Box에 적합한, RTSP를 이용한 동적 제어의 방법과 각 미디어의 생성, 표현, 그리고 처리 방법에 대한 내용을 다루고 비교, 분석해 본다.

  • PDF

인공지능기술의 IoT 통합보안관제를 위한 데이터모델링 (Data Modeling for Cyber Security of IoT in Artificial Intelligence Technology)

  • 오영택;조인준
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.57-65
    • /
    • 2021
  • 산업 전 분야에 4차 산업혁명의 신기술인 IoT(Internet of Things), AI(Artificial Intelligence), Bigdata 등이 융합되어 새로운 가치를 창출하는 초연결 지능정보사회가 도래되고 있다. 모든 것이 네트워크에 연결되어 데이터가 폭발적으로 증가하고, 인공지능이 스스로 학습하여 지적 판단 기능까지도 가능하다. 특히 사물인터넷은 언제 어디서나 어느 것과도 연결될 수 있는 새로운 통신환경을 제공함에 따라 모든 것들이 연결되는 초 연결을 가능케 하고 있다. 인공지능 기술은 인간이 가진 지각, 학습, 추론, 자연어처리 등의 능력을 컴퓨터가 실행할 수 있도록 구현되고 있다. 인공지능은 기계학습, 딥러닝(Deep leearning), 자연어처리, 음성인식, 시각인식 등 첨단기술을 개발하는 방향으로 발전되고 있으며, 안전, 의료, 국방, 금융, 복지 등의 다양한 응용 분야에 특화된 소프트웨어와 머신러닝(Machine learning), 클라우드(Cloud) 기술을 포함하고 있다. 이를 통해 인간의 편의와 새로운 가치를 제공하기 위해 산업 전반의 다양한 분야에 활용된다. 하지만, 이와는 반대로 지능적이고 정교해진 사이버 위협들이 증가하고 신기술의 기술적 안전성 확보와 같은 잠재적 역기능들을 동반함에 따라 이에 대한 대응이 필요한 시점이다. 본 논문에서는 이러한 역기능을 해결하기 위한 하나의 방안으로 인공지능기술을 활용하여 IoT 통합보안관제 가능하도록 새로운 데이터모델링(Data modelling) 방안을 제안하였다.