• 제목/요약/키워드: Voice classification

검색결과 155건 처리시간 0.022초

CSL을 통한 음향특성과 사상체질간의 상관성 연구 (An Study on the Correlation between Sound Characteristics and Sasang Constitution by CSL)

  • 신미란;김달래
    • 사상체질의학회지
    • /
    • 제11권1호
    • /
    • pp.137-157
    • /
    • 1999
  • 1. 연구배경 사상인은 생리 및 병리 현상에 차이를 나타낼 뿐만 아니라 섭생법 및 치료법에서도 각기 다른 방법을 적용하고 있다. 그러므로 사상의학에 있어서 체질변증분야가 매우 중요한 과제라 하겠다. 동무는 사상인변증의 진단지표를 외형 심성 병증 등을 제시하였고, 많은 의가들에 의해 여러 가지 새로운 체질변증의 방법이 모색되어 임상에 시도 활용되고 있는 추세이나 체질변증의 객관성유지에 어려운 점이 많아서 학문의 발전에 적지 않은 난관이 따랐다. 최근에는 음성과학의 발달에 힘입어 음성의 특성을 가시적 수치적으로 객관화 할 수 있는 가능성이 높아졌다. 본 연구는 이러한 음성과학을 바탕으로 여러 의가들에 의해 제시되어 온 사상인의 음성적 특정을 각 개인의 사상체질과 직접적으로 연관성이 있다고 판단되는 공명주파수와 기본주파수 등 여러 음성학적인 pattern자료들을 모집단으로부터 획득하여 체질별로 객관적인 수치로 비교 분석함으로써 음성과 체질과의 관계에 대하여 살펴보고 개인의 성문에 의한 사상체질 판단의 기본자료로 활용하고자 하였다. 2. 연구방법 상지대한의과대학 남학생 132명과 기타8명을 대상으로 하였다. 음향특성과 체질과의 상관성에 관하여 문헌조사를 하였다. 설문지와 체질전문가에 의하여 연구대상자를 체질 판별하였다. 연구대상자의 음성특성에 대한 설문조사를 하였고 CSL로 Pitch. Formant Frequency. Energy, Time of reading composition 등을 분석하고 통계 처리하여 체질 판별을 시도하였다. 3. 연구결과 1) 설문조사결과 소음인은 음성이 낮고 완만하며 조용한 편으로, 소양인은 음성이 높고 밝으며 급하고 함부로 말을 하는 것으로, 태음인은 음성이 낮고 무거우며 완만하고 굵고 성량이 풍부한 것으로 나타났다. 2) 문장의 평균 발음 시간에서 태양인은 다른 체질에 비하여 유의성 있게 길었다. 몸무게에서 태음인은 다른 체질에 비하여 유의성 있게 높았다. Formant frequency 1에서는 태양인이, Bandwidth 1에서는 소음인과 태양인이 다른 체질에 비하여 유의성 있게 낮았으며, Bandwidth 2와 Formant frequency 5에서는 태양인이 유의성 있게 높았다. Pitch Maximum과 Pitch Maximum-Pitch Minimum에서는 소음인과 태양인이 유의성 있는 차이를 나타내었다. Energy Mean에서는 태양인과 태음인에서 유의성 있는 차이를 나타내었다. 3) Multi-dimensional 4-class minimum-distance classifier 분석결과 모든 항목으로 분석한 것 보다 체질별로 특정 항목을 갖고 분석한 것이 높은 일치를 나타내었다. SPSS/PC+프로그램에서 일원분산분석과 판별분석결과 네 체질사이에서의 정판별력보다 소양인을 제외한 3체질 사이에서의 정판별력이 높았다. CART모형에서 앞에서 제시된 다른 방법들보다 높은 예측율을 보이고 있다. 연구수행과정 중에 표준화, 녹음기술, 적적한 문장의 선택, 음성분석 항목선택, 통계기법, 적절한 알고리즘의 개발 등의 많은 문제점이 나타나고 있으며 관련분야의 보완과 연구진행이 지속적으로 있어야 할 것으로 사려 된다. 다각도로 진행되고 있는 사상의학에서의 객관화 노력과 통계적인 방법론들이 적용되고 체질진단에 있어 가장 최적의 알고리즘을 찾아낼 수 있다면, 정확한 체질 진단과 더불어 그에 따른 환자들의 치료와 약물처방에 있어서도 많은 도움을 줄 수 있으리라 생각된다. 성문과 음성특성의 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다.

  • PDF

다단계 신경회로망을 이용한 후두질환 감별진단 시스템의 개발 (A Basic Study on the Differential Diagnostic System of Laryngeal Diseases using Hierarchical Neural Networks)

  • 전계록;김기련;권순복;예수영;이승진;왕수건
    • 대한의용생체공학회:의공학회지
    • /
    • 제23권3호
    • /
    • pp.197-205
    • /
    • 2002
  • 본 연구에서는 잡음이 존재하는 공간에서 획득한 음성신호로부터 후두질환을 감별진단 할 수 있는 분류기를 구현하였다. 이를 위해 후두질환 환자로부터 수집한 /아/ 모음에 잡음을 혼입하여 음성 신호를 획득하였고, 여러 가지 후두질환을 감별진단 할 수 있는 파라미터를 추출하였으며. 이를 입력으로 하는 계층적 신경회로망을 구성하여 후두질환을 감별진단 하도록 하였다. 감별진단용 분류기는 다섯 단계의 계층적 신경회로망으로 구성하였다 첫 번째 신경회로망은 정상 양성 후두질환과 악성 후두질환을. 두 번째 신경회로망은 정상과 양성 후두질환을 감별진단 하도록 하였다 그리고 세 번째 신경회로망은 양성 후두질환 중 후두용. 성대결절 후두마비를 감별진단 하도록 하였으며. 네 번째와 다섯 번째 신경회로망은 성문암 1-4기를 감별진단 하도록 구성하였다. 분류기에 적용된 신경회로망은 다층퍼셉트론 구조로써 역전파 알고리듬으로 학습시켰으며, 선형변환 표준점수변환 등 전처리과정을 적용하여 분류기의 성능을 개선하였다. 후두질환의 감별진단 결과 후두용 88.23%. 정상. 성대결절. 후두마비 100%. 성문암 1기 90%, 성문암 2-4기 100%의 감별진단율을 관찰할 수 있었다.

플랫폼 분류 기준 고찰 : 감각의 입·출력 (Classification standard of Communication Tool)

  • 김효은
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.189-190
    • /
    • 2018
  • 정보콘텐츠는 문자, 이미지, 음성에 플로우로 나타나는 인간 체험 방식 및 컴퓨터와 인간 사이의 언어까지 들여다 볼 수 있는 개념과 구조를 요구한다. 빌렘 플루서의 독창적인 학문인 코무니콜로기는 인간 인식의 경계를 재고하게 하면서, 경계를 재구성하는 지평을 열어 준다. 이를 통해 인간 소통의 근본 요소인 감각의 입출력을 도출할 수 있었으며, 이는 소통 도구를 분류하고 재구성하는 기준이 된다. 인간을 기준으로 외부 자극을 받아들이는 경계는 감각으로 볼 수 있으며, 소통이 이루어지는 방향은 입출력으로 표현할 수 있다. 콘텐츠를 향유한다는 것은 인간 소통의 경계인 감각이 방향을 통해 작동하는 것으로 볼 수 있다. 감각의 입출력을 소통 도구에 적용해 보면, 책은 시각의 입력으로, 텔레비전은 시청각의 입력으로, 데스크탑은 시청각의 입력과 촉각(손가락)의 출력으로, 모바일은 신청각의 입력과 촉각(손가락, 다리)의 출력으로 볼 수 있다. 기존의 다양한 플랫폼과 콘텐츠, 아직 드러나지 않은 플랫폼도 일관된 기준을 통해 좌표를 정해 줄 수 있다. 이를 통해 공학에서 접근할 수 없는 콘텐츠 기획과 전망이 가능하다.

  • PDF

후두암 감별진단에 있어 성문전도(Electroglottograph) 파라미터의 유용성 (The Effectiveness of Electroglottographic Parameters in Differential Diagnosis of Laryngeal Cancer)

  • 송인무;고의경;전경명;권순복;김기련;전계록;김광년;정동근;조철우
    • 대한후두음성언어의학회지
    • /
    • 제14권1호
    • /
    • pp.16-25
    • /
    • 2003
  • 후두암은 유병율이 높지만 조기에 발견하면 90% 이상의 치유율과 발성기능의 보존이 가능하며 현재 음성분석을 이용한 진단법이 시도되고 있으나 정립된 선별검사법은 없는 실정이다. 성문전도검사(electroglottography, EGG)는 성대의 진동양상을 알 수 있는 비침습적 검사로서 발성과 음성합성의 연구에 많이 사용되고 있다. 본 연구는 EGG에서 관찰되는 파라미터들을 다층 퍼셉트론(multilayer perceptron)구조의 신경회로망(artificial neural network)으로 감별하는 기법을 이용하여 후두암 감별법에 대한 연구로서 부산대학교병원을 내원한 후두암 환자 10명과 양성후두질환 26명을 대상으로 새로 고안한 Electroglottograph(v1.0)를 이용하여 검사하고 이의 임상적 유용성을 평가하였다. EGG 파라미터인 closed quotient(CQ), speed quotient(SQ), speed index(SI), fundamental frequency(F0), Jitter, Shimmer 등은 MATLAB 6.5 (Mathwork, Inc.)로 작성한 분석 프로그램을 이용하여 추출하였다. 각 환자에서 추출된 EGG 파라미터들을 다층 퍼셉트론 구조의 신경회로망으로 감별하였다. CQ는 각 질환군 간에 유의한 차이가 없었지만 SQ, SI, Jitter, Shimmer 등은 성대질환의 특성에 따라 유의한 차이를 보였다. 신경회로망에서 감별한 결과 CQ를 제외한 SQ, SI, Jitter, Shimmer 등에서 71.3-90%의 후두암의 감별율을 보였다. 또한 SQ, SI, Jitter, Shimmer를 3개씩 조합한 실험에서는 SQ-Jitter-Shimmer와 SQ-SI-Shimmer의 후두암의 감별율이 93%로 가장 높았고, SQ-SI-Jitter 90.9%, SI-Jitter-Shimmer 88.6%로 전체적으로 85% 이상의 높은 감별율을 나타내었다. 이러한 결과는 EGG검사와 신경회로망을 이용한 양성과 악성 후두질환의 감별이 가능함을 시사한다. 향후 성대 질환의 병태생리를 대변할 수 있는 파라미터가 추가로 개발되고 분류 알고리듬이 개선된다면 EGG를 이용한 성대질환의 감별 진단이 보다 정확해질 것으로 사료되었다.

  • PDF

성대신호 기반의 명령어인식기를 위한 특징벡터 연구 (Effective Feature Vector for Isolated-Word Recognizer using Vocal Cord Signal)

  • 정영규;한문성;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.226-234
    • /
    • 2007
  • 본 논문은 환경 노이즈를 원천적으로 차단하는 성대 마이크를 이용한 명령어 인식기를 개발한다. 성대마이크는 환경 노이즈의 효과를 최소화하는 장점이 있다. 그러나 고주파의 부재와 부분적인 포먼트 정보 손실 때문에, 성대마이크를 이용해서 개발된 ASR시스템은 표준마이크를 이용한 시스템에 비해 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로부터 입력되는 정보 보안하는데 주로 사용된다. 본 논문은 한국어의 음운적 특정과 신호 분석을 통해 성대마이크만을 사용한 높은 성능의 ASR 시스템을 개발 할 수 있음을 보인다. 주파수 대역내 에너지 합을 이용하는 MFCC 알고리즘이 갖는 성대신호 분석의 문제점을 제시하고, 성대신호를 대상으로 보다 높은 성능을 갖는 특정추출 알고리즘의 조건을 제시한다. 이러한 조건은 (1) 민감한 band-pass filter와 (2) 유/무성음 분리를 위해 사용하는 특정벡터의 사용이다 실험 결과 제안된 조건을 만족하는 ZCPA 알고리즘을 적용한 경우가 MFCC를 적용한 경우보다 약 16%정도의 높은 성능을 보인다. 그러고 CMS와 RASTA와 같은 channel normalization 알고리즘을 적용한 경우 약 2%의 성능 향상이 있다.

이진 분류문제에서의 딥러닝 알고리즘의 활용 가능성 평가 (Feasibility of Deep Learning Algorithms for Binary Classification Problems)

  • 김기태;이보미;김종우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.95-108
    • /
    • 2017
  • 최근 알파고의 등장으로 딥러닝 기술에 대한 관심이 고조되고 있다. 딥러닝은 향후 미래의 핵심 기술이 되어 일상생활의 많은 부분을 개선할 것이라는 기대를 받고 있지만, 주요한 성과들이 이미지 인식과 자연어처리 등에 국한되어 있고 전통적인 비즈니스 애널리틱스 문제에의 활용은 미비한 실정이다. 실제로 딥러닝 기술은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Boltzmann Machine (DBM) 등 알고리즘들의 선택, Dropout 기법의 활용여부, 활성 함수의 선정 등 다양한 네트워크 설계 이슈들을 가지고 있다. 따라서 비즈니스 문제에서의 딥러닝 알고리즘 활용은 아직 탐구가 필요한 영역으로 남아있으며, 특히 딥러닝을 현실에 적용했을 때 발생할 수 있는 여러 가지 문제들은 미지수이다. 이에 따라 본 연구에서는 다이렉트 마케팅 응답모델, 고객이탈분석, 대출 위험 분석 등의 주요한 분류 문제인 이진분류에 딥러닝을 적용할 수 있을 것인지 그 가능성을 실험을 통해 확인하였다. 실험에는 어느 포르투갈 은행의 텔레마케팅 응답여부에 대한 데이터 집합을 사용하였으며, 전통적인 인공신경망인 Multi-Layer Perceptron, 딥러닝 알고리즘인 CNN과 RNN을 변형한 Long Short-Term Memory, 딥러닝 모형에 많이 활용되는 Dropout 기법 등을 이진 분류 문제에 활용했을 때의 성능을 비교하였다. 실험을 수행한 결과 CNN 알고리즘은 비즈니스 데이터의 이진분류 문제에서도 MLP 모형에 비해 향상된 성능을 보였다. 또한 MLP와 CNN 모두 Dropout을 적용한 모형이 적용하지 않은 모형보다 더 좋은 분류 성능을 보여줌에 따라, Dropout을 적용한 CNN 알고리즘이 이진분류 문제에도 활용될 수 있는 가능성을 확인하였다.

사상인(四象人)의 용모(容貌)에 관한 문헌적 연구 (The Study of Sasangin's Face)

  • 손은혜;유정희;김종원;김규곤;고병희;송일병;이의주
    • 사상체질의학회지
    • /
    • 제17권3호
    • /
    • pp.55-68
    • /
    • 2005
  • 1. Objectives Recently there have been studied the trials to take out the characteristics of Sasangin's face. But there is not the report of the basis of Sasangin's face. So I want to exchange between Sasang Constitutional Medicine (SCM) and others ; metrology, technology, psychology, ete. 2. Methods I searched documents of Lee Jae-ma and one's junior. I maid a comparative study of each Sasangin's face through them. And I counted each item to find out the major review point of Sasangin's face. 3. Results and Conclusions We found out Sasangin's face has their own characteristics; first impression, forehead, eyes, nose, ears, mouth, voice. And 'First Impression' is the major factor to check the review point of the face for the classification of sasangin through the 9 documents. In the future we have to prove the contents of these clinically. And we have to research the measurement of the face.

  • PDF

필기 입력데이터에 대한 언어식별 시스템의 설계 및 구현 (Design and Implementation of a Language Identification System for Handwriting Input Data)

  • 임채균;김규호;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.63-68
    • /
    • 2010
  • 최근, 유비쿼터스 시대로의 도약을 위하여 모바일 기기의 입력 인터페이스에 대한 연구가 활발하게 진행되고 있으며, 기존의 마우스, 키보드뿐만 아니라 필기, 음성, 시각, 터치와 같이 다분야로 세분화되어 새로운 인터페이스가 연구되고 있다. 특히 소형 모바일 기기에서는 크기로 인하여 추가가능한 장치의 제약이 심하기 때문에, 작은 화면에서도 효율적인 입력 인터페이스로 필기 인식이 대두되고 있다. 필기 인식에 대한 이전 연구는 2차원 영상을 기반으로 하거나 벡터로 입력받은 필기데이터를 인식하는 알고리즘이 대부분이며, 필기 인식 알고리즘의 정확성을 향상시키는 연구에만 초점을 두고 있는 실정이다. 또한 실제 필기 입력하는 경우에는 현재 문자가 영문 대/소문자, 한글, 숫자 등의 어느 분류에 속하는지 선택해야하는 문제가 있다. 따라서 본 논문에서는 입력된 필기 데이터를 기반으로 형상 분석을 통하여, 영문이나 한글의 여부를 판단하고 언어식별이 가능한 시스템을 제안하였다. 제안 기법은 벡터 단위의 집합으로 필기 데이터를 취급하여 각 벡터 간의 상호관계와 방향성을 분석함으로써 효율적인 언어식별을 가능하도록 하였다.

Intelligent Intrusion Detection and Prevention System using Smart Multi-instance Multi-label Learning Protocol for Tactical Mobile Adhoc Networks

  • Roopa, M.;Raja, S. Selvakumar
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권6호
    • /
    • pp.2895-2921
    • /
    • 2018
  • Security has become one of the major concerns in mobile adhoc networks (MANETs). Data and voice communication amongst roaming battlefield entities (such as platoon of soldiers, inter-battlefield tanks and military aircrafts) served by MANETs throw several challenges. It requires complex securing strategy to address threats such as unauthorized network access, man in the middle attacks, denial of service etc., to provide highly reliable communication amongst the nodes. Intrusion Detection and Prevention System (IDPS) undoubtedly is a crucial ingredient to address these threats. IDPS in MANET is managed by Command Control Communication and Intelligence (C3I) system. It consists of networked computers in the tactical battle area that facilitates comprehensive situation awareness by the commanders for timely and optimum decision-making. Key issue in such IDPS mechanism is lack of Smart Learning Engine. We propose a novel behavioral based "Smart Multi-Instance Multi-Label Intrusion Detection and Prevention System (MIML-IDPS)" that follows a distributed and centralized architecture to support a Robust C3I System. This protocol is deployed in a virtually clustered non-uniform network topology with dynamic election of several virtual head nodes acting as a client Intrusion Detection agent connected to a centralized server IDPS located at Command and Control Center. Distributed virtual client nodes serve as the intelligent decision processing unit and centralized IDPS server act as a Smart MIML decision making unit. Simulation and experimental analysis shows the proposed protocol exhibits computational intelligence with counter attacks, efficient memory utilization, classification accuracy and decision convergence in securing C3I System in a Tactical Battlefield environment.

자연스러운 정서 반응의 범주 및 차원 분류에 적합한 음성 파라미터 (Acoustic parameters for induced emotion categorizing and dimensional approach)

  • 박지은;박정식;손진훈
    • 감성과학
    • /
    • 제16권1호
    • /
    • pp.117-124
    • /
    • 2013
  • 본 연구는 음성 인식기에서 일반적으로 사용되는 음향적 특징인 MFCC, LPC, 에너지, 피치 관련 파라미터들을 이용하여 자연스러운 음성의 정서를 범주 및 차원으로 얼마나 잘 인식할 수 있는지 살펴보았다. 자연스러운 정서 반응 데이터를 얻기 위해 선행 연구에서 이미 타당도와 효과성이 밝혀진 정서 유발 자극을 사용하였고, 110명의 대학생들에게 7가지 정서 유발 자극을 제시한 후 유발된 음성 반응을 녹음하여 분석에 사용하였다. 각 음성 데이터에서 추출한 파라미터들을 독립변인으로 하여 선형 판별 분석(LDA)으로 7가지 정서 범주를 분류하였고, 범주 분류의 한계를 극복하기 위해 단계별 다중회귀(stepwise multiple regression) 모형을 도출하여 4가지 정서 차원(valence, arousal, intensity, potency)을 가장 잘 예측하는 음성 특징 파라미터를 산출하였다. 7가지 정서 범주 판별율은 평균 62.7%이었고, 4 차원 예측 회귀모형들도 p<.001수준에서 통계적으로 유의하였다. 결론적으로, 본 연구 결과는 자연스러운 감정의 음성 반응을 분류하는데 유용한 파라미터들을 선정하여 정서의 범주와 차원적 접근으로 정서 분류 가능성을 보였으며 논의에 본 연구의 개선방향에 대해 기술하였다.

  • PDF