• 제목/요약/키워드: Korean speech

검색결과 5,300건 처리시간 0.032초

Association between systemic disease activity restriction and oral health

  • Jung, Yu Yeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.187-193
    • /
    • 2021
  • 연구의 목적은 전신질환의 활동제한과 구강건강의 연관성을 알아보고자 국민건강영양조사 제7기 원시자료를 활용하여 19세 이상 남자 2,574명, 여자 3,250명전체성인 5,824명의 응답을 분석하였다. 구강건강의 씹기와 말하기 문제가 있을 때 성인의 전신질환 활동제한이 많은 것으로 나타났으며, 치주질환 치료, 발치 및 구강 내 소수술, 보철물 제작·수리의 치과치료를 받았을 때 전신질환의 활동제한이 유의미하게 높았다(p<.001). 전신질환으로 인한 활동제한에 영향력을 주는 요인으로는 연령(1.03배), 남자(0.84배), 교육수준(0.57, 0.45, 0.31배), 음주(0.32배), 씹기(1.86배)와 말하기(1.84배)문제, 치주질환 치료(1.27배), 부러진 치아치료(2.1배)를 받았을 때 전신질환의 활동제한이 발생할 확률이 높았다. 또한 씹기와 말하기 문제가 있을 때 삶의 질이 낮아지는 것이 통계적으로 유의미하게 나타났다.

Signal Enhancement of a Variable Rate Vocoder with a Hybrid domain SNR Estimator

  • Park, Hyung Woo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.962-977
    • /
    • 2019
  • The human voice is a convenient method of information transfer between different objects such as between men, men and machine, between machines. The development of information and communication technology, the voice has been able to transfer farther than before. The way to communicate, it is to convert the voice to another form, transmit it, and then reconvert it back to sound. In such a communication process, a vocoder is a method of converting and re-converting a voice and sound. The CELP (Code-Excited Linear Prediction) type vocoder, one of the voice codecs, is adapted as a standard codec since it provides high quality sound even though its transmission speed is relatively low. The EVRC (Enhanced Variable Rate CODEC) and QCELP (Qualcomm Code-Excited Linear Prediction), variable bit rate vocoders, are used for mobile phones in 3G environment. For the real-time implementation of a vocoder, the reduction of sound quality is a typical problem. To improve the sound quality, that is important to know the size and shape of noise. In the existing sound quality improvement method, the voice activated is detected or used, or statistical methods are used by the large mount of data. However, there is a disadvantage in that no noise can be detected, when there is a continuous signal or when a change in noise is large.This paper focused on finding a better way to decrease the reduction of sound quality in lower bit transmission environments. Based on simulation results, this study proposed a preprocessor application that estimates the SNR (Signal to Noise Ratio) using the spectral SNR estimation method. The SNR estimation method adopted the IMBE (Improved Multi-Band Excitation) instead of using the SNR, which is a continuous speech signal. Finally, this application improves the quality of the vocoder by enhancing sound quality adaptively.

가정용 게임기 동향을 통해 본 IT 기술 분석 (Analysis of IT Technology through the Trends in Home Video Game Console)

  • 배정민;배유미;정성재;장래영;성경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.675-678
    • /
    • 2014
  • 가정용 게임기는 한 때 개인용 컴퓨터에 필적한 만큼의 높은 보급률을 자랑했지만 스마트폰, 태블릿과 같은 모바일 기기의 등장으로 성장세가 주춤하였다. 그러나, PC 게임이나 모바일 게임에서 제공되지 않는 다양한 IT 신기술을 적극적으로 도입하면서 여전히 관련 시장에서 위치를 굳건히 지키고 있다. 본 논문에서는 가정용 게임기의 역사, 시대적 동향, 업체 동향에 대해 알아보고, 게임기에 적용된 기술 및 주목할만한 IT 신기술에 대해 알아보았다. 가정용 게임기 시장은 동작 인식 기술, 음성 인식 기술, 미디어 파사드 기술, 가상 현실 기술 등의 IT 신기술을 적극적으로 도입하면서 새롭게 등장하는 IT 기술의 각축장이 될 것으로 사료된다.

  • PDF

지화인식 기반의 음성 및 SNS 공유 시스템 구현 (System implementation share of voice and sign language)

  • 강정훈;양대식;오민석;서정욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.644-646
    • /
    • 2016
  • 본 논문에서는 청각 장애인은 소리를 듣고 음성으로 표현하는 의사소통에 어려움이 있기 때문에 주로, 구화, 수화, 필담 등을 이용하여 의사소통을 진행한다. 청각 장애인과 건청인과의 의사소통을 위해서는 수화가 가장 좋은 방법이지만 수화 사용방법을 이해해야만 하는 어려움이 따른다. 청각 장애인과 건청인간의 의사소통을 위한 수단으로 지화번역 시스템을 설계 및 구현 하였다. 지화 입력 수단 으로는 손가락 모양과 손동작을 추적 할 수 있는 립 모션을 사용하였다. 입력된 정보를 처리하고 번역하기 위해서 저전력 싱글 보드 컴퓨터인 라즈베리 파이를 활용 하였다.

  • PDF

스마트 거울의 제작을 통해 이루어진 공학 교육 실천 방법론에 관한 연구 (A Study on the Practical Methodology of Engineering Education through the Making of Smart Mirror)

  • 서명덕;권지영;장은영
    • 실천공학교육논문지
    • /
    • 제10권1호
    • /
    • pp.9-15
    • /
    • 2018
  • 음성 인식 기반 API를 이용하여 디지털 사이니지(Digital Signage)를 구성하고, 상용화된 다른 제품들과 차별되도록 사용자의 음성 명령으로 날씨, 지도, 운동 정보, 일정, 영상 등의 정보를 얻는 VRSM(Voice Recognition Smart Mirror)을 제안하여, 독자적인 졸업인증제의 결과물로 평가받는 과정을 통해, 공학교육의 효과적인 실천 방안을 제시한다. 전공에서 2인 1조로 3학기동안 진행되는 작품 설계 및 제작 기회를 경험하였다. 종합설계를 통해 공학적 접근 방법과 창의적 사고 기회를 경험하였으며, 그 중간 결과에 대해 본 학회의 학술대회에 참가하여 우수 학술상을 수상하였고, 기타 학회의 논문 경진대회에서도 입상의 결과를 얻었다. 이 과정을 통해 얻어진 실무 능력의 향상이 자신감과 취업 기회 획득에 유리함을 실제 취업들을 통해 입증하였다.

인공지능 딥러링 학습 플랫폼에 관한 선행연구 고찰 (A Review on Deep Learning Platform for Artificial Intelligence)

  • 진찬용;신성윤;남수태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.169-170
    • /
    • 2019
  • 인공지능이 글로벌 경쟁력 원천 기술로 부각되면서 정부도 자율주행차, 드론, 로봇 등 미래 신산업의 기반 기술이 되는 인공지능을 전략적으로 육성하고 있다. 국내 인공지능 연구 및 서비스는 네이버와 카카오를 중심으로 출시되었으나 해외에 비하면 규모나 수준이 미약한 편이다. 최근, 딥러닝 (deep learning)은 최근 음성인식과 영상인식을 비롯한 다양한 패턴인식 분야에서 혁신적인 성능을 기록하면서 많은 연구가 진행되고 있다. 그 뿐만 아니라 딥러닝은 초창기부터 산업계의 큰 관심을 끌어 구글이나 마이크로소프트, 삼성전자 등 글로벌 정보기술 회사에서 상용제품에 딥러닝 기술을 성공적으로 적용하고 있고 계속 연구개발을 진행하고 있어 대중매체에서도 관심을 가지고 주목하고 있다. 이러한 선행연구를 바탕으로 주목 받고 있는 인공지능에 대해 살펴보도록 하겠다.

  • PDF

교차성(intersectionality)의 관점에서 바라본 실라 르브랑 드 브레트빌의 작품세계 (The Works of Sheila Levrant de Bretteville with Reference to Intersectionality)

  • 김린;박수진
    • 한국융합학회논문지
    • /
    • 제10권5호
    • /
    • pp.149-156
    • /
    • 2019
  • 본 연구는 실라 르브랑 드 브레트빌의 작품세계에 일관되게 등장하는 '교차성(intersectionality)'을 주요 개념으로 채택하고 그의 디자인에 나타난 교차성 개념을 구체적으로 밝히는 것이 목적이다. 연구의 주요 개념인 교차성의 정의를 흑인 페미니즘 사상으로부터 그 시원을 찾아보고, 디자인에 있어서 교차성 개념이 어떻게 실천되는지 개괄했다. 드브레트빌의 디자인 작업에 나타나는 공통적 특징을 조형성, 디자인 방법론, 표현 매체 등을 기준으로 분석한 결과, 1)발언의 타이포그래피 2)내러티브의 수집 3)장소특정적 설치와 같은 특징으로 수렴할 수 있었다. 디자인이 놓인 권력의 맥락을 전복하여 잊히거나 덜 조명된 입장들을 포용하는 교차성 개념을 근간으로 실라 르브랑 드 브레트빌의 디자인에 나타난 교차성을 살펴본 결과 1)비가시성의 가시화 2) 객체의 주체화 3)변방의 탈주변화와 같은 세 가지 시사점을 도출할 수 있었다. 본고가 탈중앙화, 다양화되는 한국 사회 동시대 가치 변화에 발맞춰 디자인 철학을 정립하고자 하는 연구자와 실무자에게 통찰을 제공할 수 있기를 기대한다.

딥러닝 기술을 활용한 차별 및 혐오 표현 탐지 : 어텐션 기반 다중 채널 CNN 모델링 (Bias & Hate Speech Detection Using Deep Learning: Multi-channel CNN Modeling with Attention)

  • 이원석;이현상
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1595-1603
    • /
    • 2020
  • 포털 사이트의 인터넷 뉴스 댓글, SNS, 커뮤니티 사이트 등의 온라인상에서 명예 훼손 사건이 최근 점점 증가하고 있다. 온라인상의 차별 및 혐오 표현은 명예 훼손 문제뿐만 아니라 사생활 침해, 인신 공격 등 다양한 형태로 온라인 서비스 이용자들을 위협하고 있다. 지난 몇 년간 산업계와 학계는 이러한 문제를 해결하고자 다양한 방법으로 연구해왔다. 하지만 한국어 대상으로 수행된 딥러닝 기반 혐오 표현 탐지 연구는 아직까지 부족한 상황이다. 본 연구의 목적은 혐오 표현뿐만 아니라 다양한 차별적 표현에 대한 탐지를 위해 데이터셋을 구축하고 이를 분류하기 위한 딥러닝 모델링을 실험하는 것이다. 데이터셋 구축은 10명의 인원이 교차적으로 검토를 하면서 7개 항목에 대한 라벨링 기준을 확립했다. 본 연구는 약 137,111개에 해당하는 한국어 인터넷 뉴스 댓글 데이터셋에 대해 7개의 항목을 각각 이진 분류하고, 이를 딥러닝 기법을 통해 분석한다. 본 연구에서 제안하는 기법은 어텐션 기반 다중 채널 CNN 모델링 기법이다. 실험 결과 7개 항목에 대해 가중 평균 f1 점수를 평가했을 때, 70.32%의 성능을 달성했다.

딥러닝 기반 음향 신호 대역 확장 시스템 (Deep Learning based Raw Audio Signal Bandwidth Extension System)

  • 김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1122-1128
    • /
    • 2020
  • 대역 확장(Bandwidth Extension)이란 채널 용량 부족 혹은 이동통신 기기에 탑재된 코덱의 특성으로 인해 부호화 및 복호화 과정에서 대역 제한(band limited)되거나 손상된 협대역 신호(NB, Narrow Band)를 복원, 확장하여 광대역 신호(WB, Wide Band)로 전환 시켜주는 것을 의미한다. 대역 확장 연구는 주로 음성 신호 위주로 대역 복제(SBR, Spectral Band Replication), IGF(Intelligent Gap Filling)과 같이 고대역을 주파수 영역으로 변환하여 복잡한 특징 추출 과정을 거쳐 이를 바탕으로 사라지거나 손상된 고대역을 복원한다. 본 논문에서는 딥러닝 모델 중 오토인코더(Autoencoder)를 바탕으로 1차원 합성곱 신경망(CNN, Convolutional Neural Network)들의 잔차 연결을 활용하여 복잡한 사전 전처리 과정 없이 일정한 길이의 시간 영역 신호를 입력시켜 대역 확장 시킨 음향 신호를 출력하는 모델을 제안한다. 또한 음성 영역에 제한되지 않는 음악을 포함한 여러 종류의 음원을 포함하는 데이터셋에 훈련시켜도 손상된 고대역을 복원할 수 있음을 확인하였다.

심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색 (Search for Optimal Data Augmentation Policy for Environmental Sound Classification with Deep Neural Networks)

  • 박진배;;배성호
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.854-860
    • /
    • 2020
  • 심층 신경망은 영상 분류 그리고 음성 인식 등 다양한 분야에서 뛰어난 성능을 보여주었다. 그 중에서 데이터 증대를 통해 생성된 다양한 데이터는 신경망의 성능을 향상하게 시키는 데 중요한 역할을 했다. 일반적으로 데이터의 변형을 통한 증대는 신경망이 다채로운 예시를 접하고 더 일반적으로 학습되는 것을 가능하게 했다. 기존의 영상 분야에서는 신경망 성능 향상을 위해 새로운 증대 방법을 제시할 뿐만 아니라 데이터와 신경망의 구조에 따라 변화할 수 있는 최적의 데이터 증대 방법의 탐색 방법을 제안해왔다. 본 논문은 이에 영감을 받아 음향 분야에서 최적의 데이터 증대 방법을 탐색하는 것을 목표로 한다. 잡음 추가, 음의 높낮이 변경 혹은 재생 속도를 조절하는 등의 증대 방법들을 다양하게 조합하는 실험을 통해 경험적으로 어떤 증대 방법이 가장 효과적인지 탐색했다. 결과적으로 자연 음향 데이터 세트 (ESC-50)에 최적화된 데이터 증대 방법을 적용함으로써 분류 정확도를 향상하게 시킬 수 있었다.