• 제목/요약/키워드: 음성데이터

검색결과 1,782건 처리시간 0.027초

GPGPU 기반 Convolutional Neural Network의 효율적인 스레드 할당 기법 (Efficient Thread Allocation Method of Convolutional Neural Network based on GPGPU)

  • 김민철;이광엽
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권10호
    • /
    • pp.935-943
    • /
    • 2017
  • 많은 양의 데이터 기반으로 학습하는 neural network 중 이미지 분류나 음성 인식 등에 사용되어 지고 있는 CNN(Convolution neural network)는 현재까지도 우수한 성능을 가진 구조로 계속적으로 발전되고 있다. 제한된 자원을 가진 임베디드 시스템에서 활용하기에는 많은 어려움이 있다. 그래서 미리 학습된 가중치를 사용하지만 여전히 한계점이 있기 때문에 이를 해결하기 위해 GPU의 범용 연산을 위해서 사용하는 GP-GPU(General-Purpose computing on Graphics Processing Units)를 활용하는 추세다. CNN은 단순하고 반복적인 연산을 수행하기 때문에 SIMT(Single Instruction Multiple Thread)기반의 GPGPU에서 스레드 할당과 활용 방법에 따라 연산 속도가 많이 달라진다. 스레드로 Convolution 연산과 Pooling 연산을 수행할 때 쉬어야 하는 스레드가 발생하는 데 이러한 문제를 해결하기 위해 남은 스레드가 다음 피쳐맵과 커널 계산에 활용되는 방법을 사용함으로써 연산 속도를 증가시켰다.

인공지능 기술이 포함된 전자상거래(G06Q) 관련 특허의 기술 융복합 분석 (Technology convergence analysis of e-commerce(G06Q) related patents with Artificial Intelligence)

  • 심재륜
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.53-58
    • /
    • 2024
  • 본 연구는 우리나라에 출원된 인공지능 기술이 포함된 전자상거래 관련 특허의 기술 융복합 분석에 관한 것으로 사회 연결망 분석(Social Network Analysis)을 이용하여 핵심 기술간 관계를 분석하고 시각화하였다. 사회 연결망 분석을 실시한 결과 인공지능 기술이 포함된 전자상거래 관련 특허에서 상호 기술 네트워크를 구성하는 핵심 IPC 코드는 G06Q, G06F, G06N, G16H, G10L, H04N, G06T, A61B 등으로 조사되었다. 특히 [G06Q-G06F], [G06Q-G06N] 등 데이터 처리 관련 기술 융복합과 [G06Q-G10L], [G06Q-H04N], [G06Q-G06T] 등 음성과 이미지 신호가 중요하게 융합되어 있음을 확인할 수 있다. 본 연구 방법을 활용하면 전자상거래 관련 특허의 미래 기술 트렌드를 확인하고 새로운 비즈니스 모델을 창안할 수 있다.

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

UAM 초기 운영을 위한 통신 성능 요구도 도출 (Analysis of Communication Performance Requirements for Initial-Phase UAM Services)

  • 정영호;전향식
    • 한국항행학회논문지
    • /
    • 제28권1호
    • /
    • pp.109-115
    • /
    • 2024
  • 도심항공 모빌리티 (UAM; urban air mobility) 서비스를 위한 한국의 K-UAM 운용개념서에서는 초기 운용 과정에서 항공음성통신 뿐만 아니라 4G 및 5G 이동통신의 활용을 고려하고 있다. 본 논문은 UAM 교통관리를 위한 통신 성능 요구사항을 설정하기 위한 방법론을 연구하였으며, 초기 UAM 운항을 위한 통신 성능 요구 항목과 수준을 제시하였다. 이를 위해 K-UAM 운용개념서와 미국 FAA 운용개념서의 UAM 발전 단계별 운영 시나리오를 분석하고, 다양한 UAM 이해관계자 간에 UAM 운용을 위해 전달해야 할 메시지의 종류를 식별하였다. 또한, 이러한 메시지의 전송을 위해 필요한 통신 링크 종류, 데이터 크기, 전송 주기, 허용 가능 지연, 가용성 등을 고려하여 통신 성능 요구사항 초안을 도출하였다. 본 연구 결과는 UAM 서비스를 위한 통신 요구사항 설정 관련 최초 연구로서 향후 UAM 전용 통신망 설계 및 필요 주파수 소요량 산출과 같은 분야에서 유용하게 활용될 것으로 기대된다.

PoC Box 단말의 RTSP 운용을 위한 사용자 요구 중심의 효율적인 다중 수신 버퍼링 기법 및 패킷화 방법에 대한 성능 분석에 관한 연구 (A Study of Performance Analysis on Effective Multiple Buffering and Packetizing Method of Multimedia Data for User-Demand Oriented RTSP Based Transmissions Between the PoC Box and a Terminal)

  • 방지웅;김대원
    • 한국멀티미디어학회논문지
    • /
    • 제14권1호
    • /
    • pp.54-75
    • /
    • 2011
  • PoC(Push-to-talk Over Cellular)는 그룹 음성 및 영상 통화와 인터넷, 멀티미디어 서비스를 통합한 단말 기술이다. PoC는 부재, 긴급 상황, 배터리 방전 등과 같은 다양한 이유로 인해 PoC 세션에 참여하지 못하는 사용자에게 종래 MMS 서비스에서의 MM Box와 비슷한 기능을 가진 PoC Box를 사용하는 기능을 제공하고 있다. PoC 표준안에서는 PoC Box에서 PoC 단말로 미디어 전송 시 RTSP (Real-Time Streaming Protocol)를 사용하도록 권장하고 있다. 기존의 RTSP를 적용한 VOD 서비스의 경우는 빠른 유선 네트워크 망을 고려하여 패킷의 크기를 크게 구현하는 반면 PoC 서비스는 무선 통신 환경이기 때문에 이러한 특성을 고려한 RTSP 전송 방법이 필요하다. 무선 통신 환경에서는 패킷의 손실률이 비교적 유선 통신 환경에서보다 다소 높기 때문에 PoC 단말 측에서 미디어 재생 시 화면 끊김 현상, 영상과 음성의 비동기화 발생, 버퍼링 대기 시간 등이 발생한다. 따라서 PoC 단말 측에서의 이러한 문제점은 사용자가 미디어 콘텐츠를 재생하는데 있어 자신이 원하는 정보를 빠르게 습득하기 어렵게 만든다. 본 논문에서는 RTSP를 이용하여 사용자가 미디어 검색 시 단시간 내에 전송되는 미디어에서 효과적으로 중요한 정보를 습득하고 재생 지연 현상을 줄일 수 있는 "교차 이중 수신 버퍼링 기법", "사전 분할 다중 수신 버퍼링 기법", "On-Demand 다중 수신 버퍼링 기법"과 전송 시 미디어 데이터의 패킷화 방법인 "동일 순위 패킷화 전송 방식", "우선 순위 패킷화 전송 방식"을 제안하였고 실험을 통해 그 성능의 적정성 및 우수성을 검증하였다. 실시된 시뮬레이션 성능 평가에서 사용자의 미디어 검색 성향에 따라 제안된 다중 수신 버퍼링 및 패킷화 방식이 기존 단일 수신 버퍼링 방식과 비교하여 효율성 및 우수성 평가에서 6-9점 이상 우수한 결과를 보였다. 그 중 On-Demand 다중 수신 버퍼링 기법은 동일순위 패킷화 방법과 사용될 때 타 기법과 비교하여 3-24점 사이의 우수성을 보임으로써 사용자의 다양한 미디어 검색 성향에 대해 빠르게 대응할 수 있었다. 또한 단시간 내에 사용자가 집중적으로 미디어 검색이 이루어지는 재생 시간대에 대해 많은 미디어 데이터를 수신 받기 때문에 단말 사용자에게 빠른 정보를 제공할 수 있었다.

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.

5G 이동통신 서비스를 위한 효율적인 5G 망구축 방안에 관한 연구 (Study on Effective 5G Network Deployment Method for 5G Mobile Communication Services)

  • 정우기
    • 한국전자파학회논문지
    • /
    • 제29권5호
    • /
    • pp.353-358
    • /
    • 2018
  • 본 논문에서는 5G 이동통신의 서비스 트래픽 특성 및 주파수를 분석하고, 5G 이동통신 서비스를 효율적으로 제공할 수 있는 망구축 및 운용 방안을 제시하였다. 5G 이동통신 서비스는 수 kbps의 음성 및 사물인터넷 서비스부터 1 Gbps 이상의 홀로그램 영상 서비스까지 다양한 데이터 전송 속도를 나타내고 있다. 5G 이동통신 서비스는 다양한 데이터 전송 속도와 모바일 서비스 트래픽의 증가로 인한 다중 주파수 대역을 이용함으로써 다양한 셀 커버리지 환경을 나타낸다. 5G 이동통신 서비스를 효율적으로 제공하기 위해서는 새로운 서비스 환경에서 나타나는 서비스 커버리지와 다중 대역 주파수의 최적화된 망구축이 필요하다. 현재 논의되는 5G 주파수 블록을 고려하여 3.5 GHz 대역이 5G 서비스 100 Mbps를 셀 경계 200 m에서 제공한다고 가정하면, 28 GHz 대역은 1 Gbps의 홀로그램 서비스를 셀 경계 50 m에서 그리고 500 Mbps 4k UHD 서비스를 셀 경계 100 m에서 제공할 수 있음을 보여주고 있다. 따라서 다양한 5G 서비스를 다중 주파수 대역과 매칭하는 주파수 포트폴리오를 구성한 망구축 방안은 5G 이동통신 서비스를 효율적으로 제공할 수 있다.

국민안전 확보를 위한 긴급통신망시스템 통합구축 방안 (For Making an Efficient Disaster Emergency Communication System for Public Safety in South Korea)

  • 최관;김민지
    • 시큐리티연구
    • /
    • 제44호
    • /
    • pp.169-198
    • /
    • 2015
  • 이 연구의 목적은 범국가적 재난상황에 효과적으로 대비하고 대응하기 위해서는 고도화된 국가긴급통신망시스템 구축방안을 제시하기 위함이다. 긴급통신망시스템은 전 세계에서도 소위 VHF, UHF, TRS 등 다양한 통신기술을 기반으로 하여 긴급통신망시스템을 구축하여 운영하고 있었으나 기존 음성위주의 긴급통신망시스템에서 재해 및 재난 현장상황에 대한 정확한 자료를 전송할 수 있는 영상통신 및 고속데이터 전송이 가능한 광대역데이터 통신기술 필요성이 야기되었다. 한국은 그 동안 대구 지하철 화재, 삼풍백화점 사건, 세월호 사건과 같은 재난을 겪어왔지만 현장 중심의 적절한 긴급통신체계를 구축하지 못하고 있다가, 2014년 7월 한국정부는 소방, 경찰, 군, 철도 등 재난대응기관이 공동으로 사용하는 전국 단일 무선통신망을 첨단 LTE 방식으로 구축하는 사업을 'PS-LTE'로 정의하고 시스템구축을 위한 준비를 시작하였다. 하지만, 한국의 경우 긴급통신망시스템분야에 대한 연구는 초보단계인 실정이다. 그러므로 이 논문은 국민안전을 확보하기 위한 긴급통신망시스템 구축방안을 연구하였고 통합운용을 위해 3가지 시사점((1) PS-LTE를 기반으로한 통일된 지휘통신체계 확보, (2) 전물 내 음영지역에서도 통신이 가능한 700MHz 주파수 확보, (3) PS-LTE망 구축을 위한 자가망 및 상용망 활용 방안)을 제시하였다.

  • PDF

복압성 요실금의 정량적 평가를 위한 진단 알고리즘에 관한 연구 (The Study of a Diagnostic Algorithm for the Quantitative Evaluation of Stress Urinary Incontinence)

  • 민해기;김주영;노시철;최흥호
    • 한국방사선학회논문지
    • /
    • 제12권2호
    • /
    • pp.277-287
    • /
    • 2018
  • 골반저근은 골반기관을 지지하는 기능을 가지고 있으며 요자제를 유지하는 여성의 주요 하부조직이다. 골반저근의 약화는 복압성 요실금의 원인이 되는데, 이러한 골반저근의 기능 정도는 복압성 요실금의 병증정도를 평가하는 지표로 사용될 수 있다. 이에 본 연구에서는 골반저근의 수축 압력을 측정하여 복압성 요실금의 병적 진행정도를 정량적으로 진단할 수 있는 요실금 진단 알고리즘을 제안하였다. 이를 위하여 골반저근의 수축압력 정보를 측정할 수 있는 시스템을 제작하였으며, 측정된 데이터의 특징 분석을 위한 측정 프로토콜을 제안하였다. 복압성 요실금 환자로부터 획득한 데이터를 이용하여 5개의 진단 파라미터를 추출하였으며, 이를 이용한 진단 알고리즘을 구현하였다. 임상시험을 통하여 진단 알고리즘의 정확성을 평가한 결과 80%의 정확성을 보였으며, 20%의 위양성 진단 결과를 보였다. 반면에 위음성 진단 결과는 확인되지 않았다. 본 연구에서 제안한 요실금 진단 알고리즘은 복압성 요실금의 병적 진행 정도를 정량적으로 진단할 수 있으며, 요실금 진단 시스템 개발에 활용될 수 있을 것으로 판단된다.

철도통합무선망(LTE-R) 환경에서 무선통신 안정성과 가용성 향상을 위한 방안 연구 (A study on the reliability and availability improvement of wireless communication in the LTE-R)

  • 최민석;오상철;이숙진;윤병식;김동준;성동일
    • 한국정보통신학회논문지
    • /
    • 제24권9호
    • /
    • pp.1172-1179
    • /
    • 2020
  • 철도통합무선망(LTE-R) 환경이 구축되었고, 이를 활용한 무선통신 기반의 열차제어 데이터 및 음성, 영상 등 다양한 형태의 서비스 인프라 관련 연구개발이 진행되고 있다. 이러한 서비스가 원활하게 제공되기 위해서는 안정성 및 가용성 높은 무선통신 환경 구성이 중요하며, 지속적인 철도통합무선망의 성능 개선이 요구된다. 본 논문은 철도통합무선망 안정성 및 가용성 등의 무선통신 성능개선을 위해 철도통합무선망 무선통신 환경을 측정하여 결과를 분석하고 시뮬레이션을 위한 무선 환경 모델을 구축하였다. 또한, 구축된 모델을 기반으로 안정성 향상을 위해 열차를 제어하기 위한 향상된 무선접속 알고리즘을 제안하여 열차 운행 시 발생하는 핸드오버에 대해 안정성을 향상 시킬 수 있는 방법을 제안하였고 가용성 향상을 위해 주파수 자동천이 알고리즘을 제안하여 망 장애로 인한 패킷 손실을 줄이고자 한다. 시뮬레이션을 위해, 철도통합무선망 무선통신 환경의 실측 데이터를 측정할 수 있는 철도시설공단(대전), 만종역-강릉역 KTX 노선에서 다양한 무선 환경 파라메터를 수집하였으며 본 논문에서 제안한 알고리즘의 성능이 기존 방식보다 우수함을 시뮬레이션 결과를 통하여 확인하였다.