• 제목/요약/키워드: voice extract

검색결과 70건 처리시간 0.026초

CDMA 2000-1X를 기반으로한 차세대 이동망의 진화 (Evolution of Next Generation Mobile Network Based on CDMA2000-1X Network)

  • 손동철;김재원;류충상
    • 한국전자통신학회논문지
    • /
    • 제1권1호
    • /
    • pp.70-80
    • /
    • 2006
  • 통신 서비스 시장의 패러다임이 유선 음성통신에서 무선의 데이터 통신으로 급속히 확산되고 있다. 이러한 통신시장의 변화를 수용하기 위해서는 고속의 전송속도에 근거한 다양한 서비스 제공과 아울러 인터넷 응용에 기반한 다양한 서비스들이 제공되어 기존의 이동통신망의 제한성을 탈피한 고품질의 이동통신망들의 구성이 요구된다. 이러한 고속통신을 수용하기 위해서는 무선 신호처리 기술, 광대역 전송기술, 첨단 이동통신망 구축 기술이 필수적이며, 효율적인 운용 기술에 의한 가입자 서비스의 수용 또한 요구되어 진다. 디지털 이동통신 시스템의 기반 기술로 활용되어 온 CDMA 다중접속 방식은 음성, SMS, 회선 데이터 서비스를 제공하기 위한 IS-95A/B 시스템 과 3세대 이동통신 시스템의 규격으로 평가받고 있는 동기방식 CDMA2000, 비동기방식 WCDMA 기술 등이 개발되고 있다. 본 논문에서는 CDMA2000-1X 이동통신 시스템의 망 구조 및 특징을 분석하고, 각 서비스 제공 방안 분석을 통하여 차세대 이동통신망에서의 효율적인 망 구성방안의 기초자료로 도출하며, 3세대 이동통신망의 차세대 이동통신망으로의 진화 전략과 아울러 망 진화를 위하여 요구되는 핵심기술 등을 분석하였다.

  • PDF

생체 신호 분석을 이용한 감각형 신장 질환 진단 시스템 연구 (A Study on Kidney Diseases Diagnosis System for Sensation Type Using Physiological Signal Analysis)

  • 조동욱;김봉현;이세환
    • 한국통신학회논문지
    • /
    • 제31권10C호
    • /
    • pp.964-972
    • /
    • 2006
  • 신장은 간장과 가장 유기적인 관계가 깊은 장기로 혈액 중에서 체내 신진대사 결과 생긴 노폐물을 걸러내 오줌을 만들어 체외로 배출하는 기능을 한다. 그러나 신장은 문제가 발생할 경우 인체가 느끼는 자각증상이 크지 않기 때문에 장기 파손이 상당 부분 진행되어야 그 증상을 알게 된다. 따라서 사회적으로 신장 질환 진단에 대한 중요성이 증대되고 있다. 이를 위해 본 논문에서는 한방의 4대 진단법 중에서 망진과 청진 분야를 이용하여 신장질환에 대한 진단 방법을 제안하고자 한다. 본 논문에서 개발할 시스템은 크게 두 가지로 나누어진다. 하나는 입력 영상에 대한 보정을 통해 정확한 색상 값을 추출하고 최적화된 결과 영상을 통해 신장과 관련된 얼굴에서의 지각 부분의 색을 분석하고 그 값을 이용하여 신장 질환 진단을 하고자 한다. 또 하나는 신장과 음성 신호와의 관계론 비교, 분석하여 이를 입증하는 시스템을 설계하고자 한다. 끝으로 실험을 통해 제안한 방법의 유용성을 입증하고자 한다.

모바일 이미지 기반의 문자인식 시스템 (The Character Recognition System of Mobile Camera Based Image)

  • 박영현;이형진;백중환
    • 한국산학기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.1677-1684
    • /
    • 2010
  • 최근 모마일 폰의 발달과 스마트 폰의 보급으로 인해서 많은 콘텐츠들이 개발되어지고 있다. 특히, 모바일 휴대장치에 소형 카메라가 탑재되면서부터 카메라로부터 입력되어지는 영상 기반 콘텐츠 개발은 사람들의 흥미뿐만 아니라 활용 면에서도 중요한 부분을 차지하고 있다. 그중 문자인식 시스템은 시각 장애인 보행 보조 시스템, 로봇 자동 주행 시스템, 비디오 자동 검색 및 색인 시스템, 텍스트 자동 번역 시스템 등과 같은 활용영역에서 매우 광범위하게 쓰일 수 있다. 따라서 본 논문에서는 스마트 폰 카메라로 입력되는 자연 영상에 포함되어 있는 텍스트를 추출 및 인식하고 음성으로 출력해주는 시스템을 제안하였다. 텍스트 영역을 추출하기 위해 Adaboost 알고리즘을 이용하고 추출된 개별 텍스트 후보영역의 문자 인식에는 오류 역전파 신경망을 이용하였다.

OpenCV를 활용한 이미지 유사성 비교 시스템 (The Similarity of the Image Comparison System utilizing OpenCV)

  • 반태학;방진숙;육정수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.834-835
    • /
    • 2016
  • 최근 들어 IT기술의 발전은 급속도로 성장하고 있다. 이에 따라 실시간 이미지 프로세싱 및 여러 플랫폼의 호환성을 제공하는 OpenCV를 활용한 이미지 처리 기술들에 대한 연구도 활발히 진행 중에 있다. 현재, 서로 다른 이미지를 비교, 유사성을 판별하는 시스템은 일치율이 낮거나, 사람이 아날로그적인 수치를 이용하여 판별하는 시스템이 대부분이다. 본 논문에서는 OpenCV의 Template Matching과 Feature Matching을 활용하여 서로 다른 이미지 간 유사성을 디지털 값으로 판별하는 시스템에 대해 연구한다. 이미지 스크린 중 비교점을 특정하여 피처를 추출, 서로 상이한 크기에서도 동일한 피처로 인식하여 비교대상 이미지의 피처셋과 비교하여 유서성을 비교, 검증하게 된다. 이는 음성 및 영상 인식 및 분석, 처리기술에서 보다 정확인 일치율 판독이 가능하다. 향후 법의학 및 OpenCV외의 이미지 처리기술에 대한 연구가 필요할 것으로 사료된다.

  • PDF

베이지안 분류를 이용한 립 리딩 시스템 (Lip-reading System based on Bayesian Classifier)

  • 김성우;차경애;박세현
    • 한국산업정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.9-16
    • /
    • 2020
  • 음성 정보를 배제하고 영상 정보만을 이용한 발음 인식 시스템은 다양한 맞춤형 서비스에 적용될 수 있다. 본 논문에서는 베이지안 분류기를 기반으로 입술 모양을 인식하여 한글 모음을 구분하는 시스템을 개발한다. 얼굴 이미지의 입술 모양에서 특징 벡터를 추출하고 설계된 기계 학습모델을 적용하여 실험한 결과 'ㅏ' 발음의 경우 94%의 인식률을 보였으며, 평균 인식률은 약 84%를 나타내었다. 또한 비교군으로 실험한 CNN 환경에서의 인식률보다 높은 결과를 보였다. 이를 통해서 입술 영역의 랜드 마크로 설계된 특징 값을 사용하는 베이지안 분류 기법이 적은 수의 훈련 데이터에서 보다 효율적일 수 있음을 알 수 있다. 따라서 모바일 디바이스와 같은 제한적 하드웨어에서 응용 가능한 어플리케이션 개발에 활용할 수 있다.

Implementation of Speech Recognition and Flight Controller Based on Deep Learning for Control to Primary Control Surface of Aircraft

  • Hur, Hwa-La;Kim, Tae-Sun;Park, Myeong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.57-64
    • /
    • 2021
  • 본 논문에서는 음성 명령을 인식하여 비행기의 1차 조종면을 제어할 수 있는 장치를 제안한다. 음성 명령어는 19개의 명령어로 구성되며 총 2,500개의 데이터셋을 근간으로 학습 모델을 구성한다. 학습 모델은 TensorFlow 기반의 Keras 모델의 Sequential 라이브러리를 이용하여 CNN 모델로 구성되며, 학습에 사용되는 음성 파일은 MFCC 알고리즘을 이용하여 특징을 추출한다. 특징을 인식하기 위한 2단계의 Convolution layer 와 분류를 위한 Fully Connected layer는 2개의 dense 층으로 구성하였다. 검증 데이터셋의 정확도는 98.4%이며 테스트 데이터셋의 성능평가에서는 97.6%의 정확도를 보였다. 또한, 라즈베리 파이 기반의 제어장치를 설계 및 구현하여 동작이 정상적으로 이루어짐을 확인하였다. 향후, 음성인식 자동 비행 및 항공정비 분야의 가상 훈련환경으로 활용될 수 있을 것이다.

영화 장르 메타데이터 생성을 위한 오디오 활용 방법에 대한 연구 (A Research on the Audio Utilization Method for Generating Movie Genre Metadata)

  • 용성중;박효경;유연휘;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.284-286
    • /
    • 2021
  • 지속적으로 인터넷 및 디지털의 발전으로 많은 양의 미디어 데이터를 저장하고 온라인을 통해 개인에게 맞춤형 서비스를 제공하는 플랫폼이 등장하고 있다. 이러한 서비스를 제공하는 업체들은 미디어의 소비를 촉진 시키기 위해 개인 취향에 맞는 영화를 추천한다. 각 업체에서는 사용자가 선호할 미디어 추천을 위해 다양한 알고리즘에 대해 많은 연구를 하고 있다. 영화는 액션, 멜로, 공포, 드라마 등으로 장르를 구분하고 있으며, 영화의 오디오(음악,효과,음성)는 영화를 구성하는 중요한 제작 요소로 자리잡고 있다. 본 연구에서는 영화예고편을 바탕으로 장르별 오디오를 추출하고, 장르별 오디오의 공통점을 확인 후 인공지능의 지도학습을 통해 영화 장르를 구별하고 추후 메타데이터 생성을 위한 활용방안을 제안하고자 한다.

  • PDF

선형 판별분석과 공통벡터 추출방법을 이용한 음성인식 (Speech Recognition Using Linear Discriminant Analysis and Common Vector Extraction)

  • 남명우;노승용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.35-41
    • /
    • 2001
  • 본 논문에서는 선형 판별분석 (LDA: Linear Discriminant Analysis)과 공통벡터 추출방법을 이용한 음성인식방법을 제안하였다. 음성신호는 화자의 성별, 나이, 출생지, 주위 잡음, 정신적 상태, 발성기관의 구조 등과 같은 다양한 정보를 포함하고 있다. 이로 인해 같은 음성신호라 할지라도 서로 다른 화자가 발성하게 되면 서로 다른 특성을 보이게 된다. 음성신호의 이러한 성질은 같은 음성군 (class)에 포함된 공통된 특성벡터를 추출하는 일을 상당히 어렵게 한다. 음성신호에서 공통된 특징 벡터를 추출하는 방법은 KLT (Karhunen-Loeve Transformation)와 같이 선형 대수적인 접근방법이 많이 사용되어지고 있으나, 본 논문에서는 M. Bilginer et al.이 제안한 공통벡터 추출 방법을 사용하였다. M. Bilginer et al.이 제안한 방법은 주어진 훈련 음성신호들에 대하여 최적의 공통 벡터를 추출하여 주면서 공통벡터 추출에 사용된 훈련 데이터에 대해서는 100%의 인식결과를 보여준다. 그러나 공통벡터 추출을 위한 훈련 음성신호의 수를 무한히 늘릴 수 없다는 점과 공통벡터들간의 구별정보 (discriminant information)가 정의되지 않았다는 단점이 있다. 본 논문에서는 단어그룹간 (class) 구별정보를 추출된 공통벡터와 결합해 단어간의 오인식률 (error rate)을 감소시킬 수 있는 방법과 공통벡터 추출방법에 적합한 파라미터 가공 방법을 제안하였다. 공통벡터 추출방법은 음성신호의 시간 축 정규화 방법과 벡터의 차원 크기에 따라 인식시간과 인식률에 영향을 받는다. 따라서 부적절한 시간 축 정렬과 너무 큰 벡터의 차원 수는 인식률 저하 등과 같이 알고리즘의 효율성을 떨어뜨린다. 본 논문에서 제안한 방법을 사용하여 실험한 결과 알고리즘의 효율성이 증가되었으며, 기존방법보다 약 2%정도의 향상된 인식률을 얻을 수 있었다.낮추는 효과를 나타내었다.다. 이상의 결과를 통하여 추출 온도와 용매 농도에 따른 수율의 차이가 있었으며 free radical 소거 활성에서는 종자 에탄을 추출물이 과피 에탄올 추출물 보다 145배 이상의 현저히 높은 활성을 나타내었다.을 나타내었다.'Lian(연)' : repeatability, continuance, plenty and intercommunicate, 2. 'Lian(연)'-'Lian(염)': integrity, 3. 'He (하)'-'He(화)' : peace, harmony and combination, 4. 'He(하)'-'He(하)' : clear river, 5.'He(하)'-'He(하)' ; all work goes well. When the Chinese use lotus patterns in lucky omen patterns, same pronunciation and pitch of Chinese language more prominent than natural properties or the image of Buddhism. I guess that it cause praying individual's peace and happiness more serious than philosophical meaning or symbol that base in Buddhism for ordinary people.ML., -9.00~12.49 and -19.81~19.81%, respectively). Therefore, it is concluded that the two formulations are bioequivalent for both the extent and the rate of absorption after single dose administration.ation.ion.ion.ation.ion.n. fibrosis, collagen bundle) was

  • PDF

시민참여형 무미목 양서류 음성신호 수집 및 품질관리 방안 (Anura Call Monitoring Data Collection and Quality Management through Citizen Participation)

  • 김경태;이현정;송원경
    • 한국환경생태학회지
    • /
    • 제38권3호
    • /
    • pp.230-245
    • /
    • 2024
  • 외부 환경변화에 민감한 양서류는 지역 내 생태환경의 변화나 교란을 평가하는 생물지표종으로 활용되고 있다. 도시화로 인한 서식지 파괴, 단절과 같은 인위적인 위협으로 인해 무미목 양서류 종 3분의 1이 멸종 위험에 처한 것으로 알려져있다. 무미목 양서류의 적절한 보호 및 보전전략 마련을 위해서는 개체군의 특성을 고려한 생물종 조사가 요구된다. 본 연구는 무미목 양서류의 번식기 울음소리를 이용한 생태모니터링에 있어 시민들의 참여 가능성을 모색하고자 하였다. 또한 적절한 품질관리 방안을 제안하여 오류나 편향을 제거하고 신뢰도 높은 생물종 출현 자료를 추출하고자 하였다. 시민과학 프로젝트는 국내에 서식하는 무미목 양서류 12종을 대상으로 2022년 4월 1일부터 8월 31일까지 전국을 대상으로 수행되었다. 시민들의 자발적인 참여를 통해 무미목 양서류의 번식기 울음소리를 직접 청취하고 모바일 애플리케이션을 통해 녹음함으로써 음성신호 모니터링이 진행되었다. 또한 품질관리 프로세스를 구축하여 시민들로부터 수집된 데이터의 오류 및 편향을 누락, 허위, 잘못된 식별과 같이 3단계로 분류하여 신뢰도 높은 생물종 출현 자료를 추출하고자 하였다. 시민참여 무미목 양서류 음성신호 모니터링 결과 총 6,808건의 관찰 기록을 수집할 수 있었다. 품질관리 프로세스를 통해 6,808건의 데이터 중 1,944건(28.55%)에서 오류 및 편향이 발생하였다. 오류 및 편향 유형으로는 누락이 922건 (47.43%)으로 높은 빈도를 보였으며 잘못된 식별 540건(27.78%), 허위 482건(24.79%) 순서로 나타났다. 시민과학프로젝트를 통해 국내에 서식하는 12종의 무미목 양서류 중 두꺼비(Bufo gargarizans Cantor), 한국산개구리(Rana coreana)를 제외한 10종의 무미목 양서류의 번식기 울음소리를 관찰할 수 있었다. 주로 개체수 감소로 인하여 관찰이 어렵거나 비 출현 개체의 번식기와 시민과학 프로젝트 진행 시점과의 차이로 인해 번식기 울음소리를 수집하는데 어려움이 발생한 것으로 나타났다. 본 연구는 시민참여를 토대로 국내에 서식하는 무미목 양서류의 번식기 울음소리를 통해 분포현황과 생물종 출현 자료 수집을 처음으로 검토한 연구이다. 향후 시민과학을 접목한 생물음향 모니터링 설계와 시민과학 데이터 품질관리 방안에 대한 기초자료로 활용될 수 있을 것으로 판단된다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.