• 제목/요약/키워드: 음성 노력

검색결과 148건 처리시간 0.024초

XML기반 모바일 플랫폼에 관한 연구 (Studying of XML-based Mobile Flatform)

  • 신영호;천성광;권영직
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 추계공동학술대회
    • /
    • pp.207-210
    • /
    • 2003
  • 현재 무선 인터넷 환경은 음성 서비스 위주의 개인 사용자 시장이 한계에 도달하면서 이동 통신의 무선 단말기를 통하여 다양한 비즈니스를 할 수 있는 B2B 전자상거래 솔루션이 확대되고 있고, 모바일 데이터서비스 시장의 비중이 점차 확대되고 있다. 이러한 데이터 서비스 교환에 XML문서를 사용 할 경우, 데이터의 상호 처리 능력을 향상시키고 데이터의 공용성과 프로그램의 유용성을 향상시키는데 필요한 비용과 노력을 절감 할 수 있다. 따라서 본 논문에서는 모바일을 위한 M-commerce에 대한 현황을 살펴본 뒤, 모바일 환경에서 사용 할 수 있는 플랫폼에 대하여 살펴보았고, 향후 연구 방안으로는 모바일에서의 실시간 쇼핑몰 설계 및 구현과 분산 환경에서의 모바일 쇼핑몰을 설계 구현 할 예정이다.

  • PDF

웹 크롤링과 전이학습을 활용한 이미지 분류 모델 (Image Classification Model using web crawling and transfer learning)

  • 이주혁;김미희
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.639-646
    • /
    • 2022
  • 딥러닝의 발전으로 딥러닝 모델들이 이미지 인식, 음성 인식 등 여러 분야에서 활발하게 사용 중이다. 하지만 이 딥러닝을 효과적으로 사용하기 위해서는 대형 데이터 세트가 필요하지만 이를 구축하기에는 많은 시간과 노력 그리고 비용이 필요하다. 본 논문에서는 웹 크롤링이라는 이미지 수집 방법을 통해서 이미지를 수집하고 데이터 전처리 과정을 거쳐 이미지 분류 모델에 사용할 수 있게 데이터 세트를 구축한다. 더 나아가 전이학습을 이미지 분류 모델에 접목해 카테고리값을 넣어 자동으로 이미지를 분류할 수 있는 경량화된 모델과 적은 훈련 시간 및 높은 정확도를 얻을 수 있는 이미지 분류 모델을 제안한다.

국내 학교 교실의 실내음향성능 실태조사 (Analysis of the Acoustic Performance of Classrooms in Korea)

  • 박찬재;류다정;경주영;한찬훈
    • 한국음향학회지
    • /
    • 제33권5호
    • /
    • pp.316-325
    • /
    • 2014
  • 학교 공간의 핵심인 교실의 음환경은 학생의 학습효과와 학업 성취에 매우 중요한 요소이다. 따라서 교실에서의 높은 음향성능 제고를 위한 다양한 노력들이 국내외적으로 끊임없이 이어져오고 있다. 그 결과로써 미국 및 영국의 경우 학교 교실의 잔향시간 및 배경소음을 바탕으로 한 교실의 용도 및 크기 별로 음환경 기준이 성립되어 있다. 그러나 우리나라의 경우 교실에 대한 대부분의 연구가 건축계획상의 특정한 사용 목적을 위해 이루어지고 있으며 이에 기초가 되는 학교 교실의 실내음향성능에 대한 실태 조사가 부족한 실정이다. 본 연구에서는 학교 교실의 음환경 실태를 조사하기 위하여 국내 초등학교 및 중학교, 고등학교의 총 15개 교실을 선정하여 실내음향성능을 측정하였다. 각 학교 교실의 음환경 분석에 사용한 음향지표는 배경소음, 신호대잡음비, 잔향시간, 음명료도, 음성전달지수 등이 있다. 연구결과 배경소음의 경우 도로변에 위치한 학교에서 미국 및 영국의 기준인 35 dB(A)를 초과하는 것으로 나타났다. 특히 창문을 개방했을 때 신호대잡음비는 거의 모든 학교에서 기준을 초과하는 것으로 나타나 외부 소음에 의해 학생이 음성전달에 방해를 받을 수 있음을 알 수 있었다. 잔향시간의 경우 일부 초등학교와 중학교에서 미국의 기준인 0.6 s를 초과하는 것으로 나타났으며 명료도는 모든 학교에서 높게 나타났다.

Personal Credit Evaluation System through Telephone Voice Analysis: By Support Vector Machine

  • 박형우
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.63-72
    • /
    • 2018
  • 인간의 목소리는 사람간의 정보 전달을 위한 가장 쉬운 방법 중 하나이다. 음성의 특징은 사람마다 다를 수 있으며 발성 속도, 발성기관의 형태와 기능, 피치 톤, 언어 습관 및 성별에 따라 다르게 나타난다. 목소리는 사람의 의사소통 핵심 요소이다. 제 4 차 산업 혁명의 시대에 목소리는 사람과 사람, 사람과 기계, 기계 와 기계 사이의 주요한 의사소통 수단이 된다. 그 이유 때문에 사람들은 자신의 의도를 다른 사람들에게 명확하게 전달하려고 노력한다. 그리고 이 과정에서 목소리는 언어 정보와 함께 다양한 추가 정보가 포함되게 된다. 예를 들어 감정 상태, 건강 상태, 신뢰도와 관련되거나, 거짓말의 여부, 음주로 인한 목소리의 변화 등 다양한 언어 및 비언어 정보를 포함하며, 다양한 분석 파라미터로 나타나게 된다. 이를 활용하면 개인의 신용도를 평가하는 척도로 사용할 수 있다. 특히 성대의 기본 주파수의 특성과 성도의 공진 주파수 특성의 관계를 분석함으로써 얻을 수 있다. 이전의 연구에서 다양한 신용 상태의 변화에 따른 목소리 분석 및 특성 변화를 연구 하였다. 본 연구에서는 음성을 통해 추출 된 매개 변수를 통해 기계 학습을 통한 개인 신용 판별 기를 제안한다.

PL 사례에 대응한 제품안전성 제고방안

  • 임현교
    • 한국신뢰성학회:학술대회논문집
    • /
    • 한국신뢰성학회 2001년도 정기학술대회
    • /
    • pp.375-375
    • /
    • 2001
  • 금년 7월 1일부터 개정 시행되는 품질경영촉진 및 공산품안전관리범파, 2002 년 7 월 1 일부터 시행되는 제조물책임(Product Liability; PL)법으로 인하여 제품의 안전성을 제고하기 위한 노력이 정부와 기업. 학계에서 다각도로 진행중이다. 그러나, 그 추진방향들이 아직 제각각이어서 하나의 조직적인 체계를 갖추진 못하고 있다. 그 이유는 제조물책임에 대응하기 위한 제품안전성 향상이 어느 한 분야의 활동으로는 충족시킬 수 없기 때문이지만, 기본적으로는 제품안전이 담당하여야 하는 책임의 범위가 어디까지인지 기업을 비롯한 관계자들이 명확히 이해하고 있지 못하기 때문이다. 본 연구에서는 이와 관련하여, 기존에 이미 시행착오를 겪은 선진국들의 소송사례를 중심으로 제품결함 중 어느 부분에 문제가 제기되는가를 살펴보고, 그 대응책을 제시하고자 하였다. 먼저 제조물책임법의 제정 취지와 법에서 정하고 있는 책임범위가 어디까지인지를 살펴보고, 선진국의 소송사례를 중심으로 그 적용범위를 확인하였다 또한 제조물책임에 대응하기 위한 방법이 어떻게 진행되는지를 살펴보고, 그 중 제품 안전성 (Product Safety) 을 향상시키기 위하여 신뢰성이나 품질측면에서 경영상의 어떤 노력이 경주되어야 하는가를 검토하였다. 한편, 리스크 관리상의 리스크 분석과 위험성 분석과의 관계, 위험성 분석의 기법들, 위험성 분석기법의 선정요령, 제품의 안전성을 평가하기 위하여 기존의 위험성 분석기법을 어떻게 활용할 것인가, 적용상의 문제점은 없는가 검토하였다. 마지막으로, 현재 기업들이 가장 소홀하게 대응하고 있는 표시상의 결함에 대하여 소송 및 보상사례를 살펴보고, 그에 대한 대책으로서 픽토그램, 라벨, 경고문구, 그리고 사용설명서의 작성 및 표시 방안에 대하여 대응방안을 고찰하였다. 용융이 발생될 수 있다. 따라서, 이러한 현상을 방지하기 위해서는 진공 분위기 하에서 적절한 접합 틈새를 유지할 수 있는 공정 및 장비의 개발이 필요하다.(Icing화) 문제가 발생하기 때문에 배기가스의 Icing을 방지하기 위하여 압축기 끝단에서 공기를 추출하여 배기부분에 송출할 필요성이 있는 것으로 판단되었다. 출구가스의 기체 유동속도가 매우 빠르므로 (100-l10m.sec) 이를 완화하기 위한 디퓨저의 설계가 요구된다고 판단된다. 또 연소기 후방에 물을 주입하는 경우 열교환기 및 기타 부분품에 발생할 수 있는 부식 및 열교환 효율 저하도 간과할 수 없는 문제로 파악되었다. 이러한 기술적 문제가 적절히 해결되는 경우 비활성 가스 제너레이터는 민수용으로는 대형 빌딩, 산림, 유조선 등의 화재에 매우 적절히 사용되어 질 수 있을 뿐 아니라 군사적으로도 군사작전 중 및 공군 기지의 화재 그리고 지하벙커에 설치되어 있는 고급 첨단 군사 장비 등의 화재 뿐 아니라 대간첩작전 등에 효과적으로 활용될 수 있을 것으로 판단된다.가 작으며, 본 연소관에 충전된 RDX/AP계 추진제의 경우 추진제의 습기투과에 의한 추진제 물성 변화는 미미한 것으로 나타났다.의 향상으로, 음성개선에 효과적이라고 사료되었으며, 이 방법이 편측 성대마비 환자의 효과적인 음성개선의 치료방법의 하나로 응용될 수 있으리라 생각된다..7%), 혈액투석, 식도부분절제술 및 위루술·위회장문합술을 시행한 경우가 각 1례(2.9%)씩이었다. 13) 심각한 합병증은 9례(26.5%)에서 보였는데 그중 식도협착증이 6례(17.6%), 급성신부전증 1례(2.9%), 종격동기흉과 폐염이 병발한 경우와 폐염이 각 1례(2.9%)였다. 14) 식도경 시행회수는 1회가 17례(54.8%), 2회가 9례(29.0%), 3회 이상이

  • PDF

한국어의 정보이론적 연구 방향 (On Information Theoretical Research of the Korean Language)

  • 이재홍;이재학
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.367-375
    • /
    • 1992
  • 한국어는 다른 언어와는 달리 초성, 중성, 종성의 자소가 모여서 한 음절을 이룬다. 음절을 이루는 자소는 그 발생의 확률적 성질에 따라 확률변수로 간주된다. 음절 안에서 자소간의 발생의 상관관계는 자소간 조건부 확률 및 엔트로피로 표시된다. 음절이 모여서 단어를 이루고 단어를 이루는 음절은 그 발생의 확률적 성질에 따라 확률변수로 간주된다. 한국어 단어안에서 음절간의 발생의 상관관계는 음절간 조건부 확률 및 엔트로피로 표시된다. 수 있다. 그런데 가능한 음절의 종류가 매우 많기 때문에 음절 발생의 상관관계를 표시하는 지표로서 음절간 조건부 확률 대신 초성, 중성, 종성 단위의 조건부 확률을 사용하는 것이 음절간의 발생의 상관관계를 표시하는데 효과적이다. 이러한 한국어의 정보이론적 연구를 위하여서는 기초자료로서 한국어 단어의 빈도분포가 필요하다. 한국어 단어의 빈도분포의 포괄적인 조사는 1956년의 "우리말 말수 사용의 잦기 조사"가 유일한 실정이다. 시간 경과에 따른 한국어의 정보이론적 특성 변화의 분석을 위하여서는 한국어 단어 빈도의 주기적인 조사가 필요하다. 한국어에서 초성, 중성, 종성단위의 정보이론적 연구결과는 한국어 음성인식 및 함성, 자연언어처리, 암호법, 언어학, 음성학, 한국어부호 표준화 연구등에 이용될 것으로 기대된다. 남북한의 언어는 분단이 지속됨에 따라 상호 이질화가 진행되고 있다. 이러한 이질화를 극복하려는 부분적인 노력으로 남북한 언어의 한국어 영문표기의 단일화 등이 있었다. 이러한 노력에 병행하여 남한과 북한의 언어에 대한 정보이론적 비교 연구도 있어야 할 것이다. 정보를 효과적으로 캐싱할 수 있도록 인접한 데이터를 클러스터링해서 브로드캐스팅하여 이동 호스트의 구성 시간(setup time)을 최소화하였다. 그리고, 맨하탄거리(Manhattan Distance)를 사용해서 위치 의존 질의에서 사용하는 데이타를 캐싱하고 질의를 처리하는 방법을 제안한다. 맨하탄 거리를 이용해서 캐싱하면 도로에 인접해서 위치한 데이타를 효과적으로 캐싱할 수 있다. 또한, 거리 계산 방법으로 맨하탄 거리를 사용하면 도심에서 실제 이동 거리와 비슷한 값을 알 수 있고, 직선 거리 계산식에 비해서 계산식도 간단하기 때문에 시스템 계산량도 줄일 수 있다. 기준으로 라이신 부산물은 어분 단백질을 40%까지 대체가 가능하였으며, 아울러 높은 라이신 부산물의 대체 수준에 있어서 사료효율과 단백질 전환효율을 고려한다면 아미노산 첨가(라이신과 아르지닌)와 중화 효과에 좋은 결과가 있을 것으로 사료된다.의한 적정 양성수용밀도는 각고 5~6cm 크기의 경우 10~15개체가 적합하였다. 수증별 성장은 15~20 m 수층에서 빨랐으며, 성장촉진과 폐사를 줄이기 위해서는 고수온이 지속되는 7~10월에는 20~30m수층으로 채롱을 내려 양성하고 그 외 시기에는 15 m층 내외가 좋은 것으로 나타났다. 상품으로 출하 가능한 크기 인 각고 10 cm이상, 전중량 140 g 내외로 성장시 키기까지는 채묘후 22개월이 소요되었고, 출하시기는 전중량 증가가 최대에 이르는 3월에서 4월 중순이 경제적일 것으로 판단된다.er 90 % of good relative dynamic modulus of elasticity due

  • PDF

한국어 음운체계를 고려한 화자적응 실시간 단모음인식에 관한 연구 (Speaker Adapted Real-time Dialogue Speech Recognition Considering Korean Vocal Sound System)

  • 황선민;윤한경;송복희
    • 한국정보전자통신기술학회논문지
    • /
    • 제6권4호
    • /
    • pp.201-207
    • /
    • 2013
  • 음성인식에 관한 연구는 꾸준히 발전되어 다양한 분야에서 제품에 적용되고 있으며, 특히 스마트폰과 차량의 내비게이션 시스템과 같은 정보기기에서의 적용은 매우 활발히 이루어지고 있는 것이 현실임에도 불구하고 음성인식 연구에서 한국어의 음운 특성을 고려한 연구는 미흡한 것도 현실이다. 디지털 콘텐츠에서 일반적으로 립 싱크의 제작은 애니메이터의 수작업을 반드시 필요로 하며, 이는 시간의 투입을 요하는 지루한 작업이다. 립 싱크를 자동 생성하는 응용 소프트웨어를 사용하기도 하나 반드시 수작업으로 수정과 보정 단계가 요구될 뿐만 아니라 영어 기반으로 제작된 립 싱크 자동생성 소프트웨어를 적용하므로 한국어 음운체계가 달라 자연스러운 립 싱크를 얻기 위하여 많은 시간과 노력이 요구된다. 따라서 본 연구에서는 한국어 음운체계를 고려한 가상 오브젝트들의 립 싱크를 자동 생성하기 위한 화자 독립 기반 한국어 단모음 실시간 인식 알고리즘을 개발을 목표로 하며, 그 인식 결과는 립 싱크의 애니메이션 키로 활용하고자 한다.

통합 음성/오디오 부호화를 위한 새로운 MPEG 참조 모델 (A New MPEG Reference Model for Unified Speech and Audio Coding)

  • 송정욱;오현오;강홍구
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.74-80
    • /
    • 2010
  • 음성 및 오디오 코덱은 각 신호의 특성 및 응용 분야가 다르기 때문에 오랜 기간 동안 각기 다른 부호화 방법을 기반으로 개발되고 발전되어 왔다. 최근 방송 및 통신 시스템이 융합되는 흐름에 발맞추어 3GPP 및 ISO/IEC MPEG 등의 표준화 기관에서는 두 신호를 하나의 통합 코덱을 이용하여 압축 전송하기 위한 노력을 지속해 왔다. 그 일환으로 MPEG에서는 그 간의 표준화된 기술들을 통합하고, 다양한 주관적 음질 평가 결과를 기반으로 USAC (Unified speech and audio coding)이라고 불리는 코덱의 표준화를 진행 중이다. 그러나 USAC RM (Reference model) 소프트웨어의 구조적인 복잡성, 사용되지 않는 수많은 모듈로 인한 용량의 비대함, 그리고 부호화기의 열악한 성능 등으로 인하여 기존 RM을 개선하고자 하는 필요성이 지속적으로 제기되었다. 본 논문에서는 USAC에 포함된 주요 기술을 설명하고, 이러한 문제를 최소화하기 위해 오픈 소스 기반으로 새롭게 설계된 RM 소프트웨어를 제안한다. 이는 2010년 4월 MPEG 회의에서 발표되었으며, 6월 모든 참여 기관을 위해 소스코드가 공개되었다.

SOM과 LVQ에 의한 자음의 분류 (Classification of Consonants by SOM and LVQ)

  • 이채봉;이창영
    • 한국전자통신학회논문지
    • /
    • 제6권1호
    • /
    • pp.34-42
    • /
    • 2011
  • 음성타자기의 구현에 접근하려는 노력의 일환으로서, 우리는 본 논문에서 자음의 분류에 대해 연구한다. 많은 자음들은 시간에 따른 주기적 거동을 보이지 않고 따라서 그들에 대한 푸리에 해석의 타당성에 확신을 갖기 어렵다. 그러므로, 우선 음성 신호로부터 추출되는 MFCC와 LPCC 특징벡터들이 자음에 대해 어느 정도의 의미가 있는지를 파악하기 위하여 LBG 클러스터링을 통한 벡터양자화를 수행한다. VQ의 실험적 결과는 자음에 대한 푸리에 해석의 타당성에 관해 분명한 결론을 내리는 것이 쉽지 않음을 보여주었다. 자음의 분류를 위해 SOM과 LVQ의 두 가지 신경망이 사용되었다. SOM의 결과는 몇 쌍의 자음들이 나뉘어 분류되지 않음을 보여주었다. LVQ에서는 본질적으로 이 문제가 사라지지만 자음의 분류 정확도는 낮은 수준이었다. 이로부터, LVQ에 의한 자음 분류에 있어서는 MFCC 및 다른 특징 벡터들이 함께 사용되어야 함이 사료된다. 하지만 본 연구에서 도입한 MFCC/LVQ의 결합은 기존의 언어모델을 기반으로 하는 음소 분류에 비해 그 결과가 나쁘지 않은 것으로 나타났다. 모든 경우에 LPCC 특징벡터는 MFCC에 비해 그 결과가 좋지 않았다.

영상 매체 기반 재난대응 서비스 제공을 위한 재난정보 콘텐츠 연구 (A Study on Disaster Information Contents for Provision of Disaster Response Services based on Multimedia)

  • 조범준;김현철;김지원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.210-211
    • /
    • 2020
  • COVID-19으로 인해 국민들에게 전달되는 재난정보의 양상이 서서히 변화하고 있다. 이는 정보통신의 발전 양상과도 매우 깊은 관계를 가지고 있다고 볼 수 있다. 이전까지의 정부 및 지자체에서 제공되는 재난정보에 대한 형태는 문자와 음성으로만 제공하므로써 고령자와 외국인과 같은 재난 약자에게 명확한 상황인지를 하기에 어려움이 있었다. 이를 해결하기 위한 전방위적인 노력을 하고 있으며, 보다 정확하고 보다 다양한 정보를 제공하고자 관련 연구를 수행하고 있다. 이는 급속도로 발전하는 정보통신 매체(UHD 및 5G, 오픈스크린 등)를 기반으로 국민들로 하여금 신속.정확한 재난상황인지를 가능케 할 수 있다. 이로 인한 재난경보 관련 최근 이슈는 '내 위치 맞춤형 정보'와 '다매체 정보'가 아닐까 싶다. 정보통신 매체가 발달함에 따라 제공되는 재난경보의 범위가 내 위치를 기준으로 좁아지며, 시각적으로 직관적인 콘텐츠를 제공할 수 있다. 이는 각 매체의 고유 정보를 통해 위치가 확인 가능하면서 해당 지역에 맞는 정보만 선택적으로 취함으로써 불필요한 정보를 제공하지 않게 된다. 본 연구를 통해 이러한 부분을 해결하기 위해 TTA에서 표준으로 제정된 CAP (Common Alerting Protocol)을 활용하였으며, 'Area' 항목에 지역코드(전국~읍면동)를 함께 포함함으로써 가능해졌다. 또한 CAP을 활용함에 따라 텍스트부터 음성, 이미지, 웹 콘텐츠까지 최신의 영상 매체에 적용 가능한 재난정보 콘텐츠를 제공 가능해졌으며, 특히 UHD 및 5G, 오픈스크린과 같은 통신 네트워크 기반 영상 매체에 적합한 멀티미디어 재난정보 콘텐츠를 제공할 수 있다. 제공된 콘텐츠에는 각종 관련 정보를 확인 가능하도록 링크를 제공하여 필요에 따라 보다 자세한 재난정보를 확인할 수 있다. 이를 기반으로 재난경보에 대한 다변화를 통해 나에게 꼭 필요한 정보가 제공될 수 있도록 발령 체계 개편이 필요하다.

  • PDF