• 제목/요약/키워드: 음성영상융합

검색결과 84건 처리시간 0.026초

데이터 퓨전을 이용한 얼굴영상 인식 및 인증에 관한 연구 (2D Face Image Recognition and Authentication Based on Data Fusion)

  • 박성원;권지웅;최진영
    • 한국지능시스템학회논문지
    • /
    • 제11권4호
    • /
    • pp.302-306
    • /
    • 2001
  • 얼굴인식은 이미지의 많은 변동(표정, 조명, 얼굴의 방향 등)으로 인해 한 가지 인식 방법으로는 높은 인식률을 얻기 어렵다. 이러한 어려움을 해결하기 위해, 여러 가지 정보를 융합시키는 데이터 퓨전 방법이 연구되었다. 기존의 데이터 퓨전 방법은 보조적인 생체 정보(지문, 음성 등)를 융합하여 얼굴인식기를 보조하는 방식을 취하였다. 이 논문에서는 보조적인, 생체 정보를 사용하지 않고, 기존의 얼굴인식방법을 통해 얻어지는 상호보완적인 정보를 융합하여 사용하였다. 개별적인 얼굴인식기의 정보를 융합하기 위해, 전체적으로는 Dempster-Shafer의 퓨전이론에 근거하면서, 핵심이 되는 질량함수를 새로운 방식으로 재정의학 퓨전모델을 제안하였다. 제안된 퓨전모델을 사용하여 개별적인 얼굴인식기의 정보를 융합한 결과, 보조적인 생체정보 없이, 개별적인 얼굴인식기보다 나은 인식률을 얻을 수 있었다.

  • PDF

시각장애인 안전을 위한 영상 기반 저비용 보행 공간 인지 알고리즘 (Vision-based Low-cost Walking Spatial Recognition Algorithm for the Safety of Blind People)

  • 강성현;이세훈;안준호
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.81-89
    • /
    • 2023
  • 현대사회에서 시각장애인들은 도보, 승강기, 횡단보도 등 일반적인 환경에서 보행을 하는데 어려움이 있다. 시각장애인의 불편 해소를 위한 연구로 영상이나 음성을 이용한 연구가 있으며, 이런 연구는 고비용의 웨어러블 장치, 고성능 CCTV, 음성 센서 등을 사용하여 실생활에 적용하는 데는 한계가 있다. 본 논문에서 시각장애인이 보행 중에 안전한 이동을 위해서 스마트폰에 포함된 저비용의 영상 센서를 활용하여 주변 도보 공간을 인지하는 인공지능 융합 알고리즘을 제안한다. 제안된 알고리즘은 이동 중인 사람 탐지를 위해서 모션 캡처 알고리즘과 장애물 탐지를 위한 객체 탐지 알고리즘을 융합하여 개발하였다. 모션 캡처 알고리즘으로 mediapipe을 사용하여 이동 중에 있는 주변 보행자들을 모델링 및 탐지하였다. 객체 탐지 알고리즘을 사용했으며 도보 중에 발생하는 다양한 장애물을 모델링 하였다. 실험을 통하여 인공지능 융합 알고리즘을 검증했으며, 정확도 0.92, 정밀도 0.91, 재현율 0.99. F1 score 0.95로 결과를 얻어서 알고리즘의 성능을 확인하였다. 본 연구로 보행 중에 발생하는 볼라드, 공유 킥보드, 자동차 등의 주변 장애물 및 이동 중인 보행자 회피하여 시각장애인들의 통행에 도움을 줄 수 있다.

복합 생체 척도 거리를 이용한 사용자 인증시스템의 구현 (An Implementation of User Identification System Using Hrbrid Biomitic Distances)

  • 주동현;김두영
    • 융합신호처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.23-29
    • /
    • 2002
  • 본 논문에서는 정확도 향상을 위해 다중 생체 인식정보와 비접촉 IC카드를 사용하는 사용자 인증시스템을 제안하였다. 다중 생체 인식정보는 안면영상, 홍채영상, 4-digit 음성암호로 구성하였으며, 비접촉 IC-Card는 사용자의 기본정보를 제공한다. 만약 사용자의 기본정보화 부합되는 표본화된 다중생체 인식정보와 현장에서 측정된 생체정보와의 거리가 threshold보다 작은경우에 본인으로 인증하였고, 그외의 경우에는 기각시키는 방식을 사용하였다 본 논문에서는 실험을 통해, 기존의 인식방식보다 사용자의 인증률이 개선됨을 보였다.

  • PDF

지능형 오디오 및 비전 패턴 기반 1인 가구 이상 징후 탐지 알고리즘 (Intelligent Abnormal Event Detection Algorithm for Single Households at Home via Daily Audio and Vision Patterns)

  • 정주호;안준호
    • 인터넷정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.77-86
    • /
    • 2019
  • 1인 가구의 수가 증가함에 따라 1인 가구의 구성원이 집안에서 심각한 부상을 당할 경우 혼자 도움을 청하기 쉽지 않다. 본 연구는 집안에서 1인 가구의 구성원이 심각한 부상을 당했을 때 비일상적인 상태를 탐지한다. 홈 CCTV를 기반으로 수집된 영상을 통해 패턴을 분석 및 인식하는 영상 탐지 알고리즘을 제안한다. 또한, 스마트폰을 기반으로 집안에서 발생하는 소리의 패턴을 분석 및 인식하는 음성탐지 알고리즘도 제안한다. 각각의 알고리즘만 사용할 경우, 단점이 존재하여 넓은 영역에서 심각한 부상과 같은 상황을 탐지하기 어렵다. 그래서 두 알고리즘을 효율적으로 결합한 융합 방식을 제안한다. 각각 탐지 알고리즘의 성능과 제안된 융합 방식의 정확한 탐지성능을 평가했다.

딥러닝 감정 인식 기반 배경음악 매칭 설계 (Design for Mood-Matched Music Based on Deep Learning Emotion Recognition)

  • 정문식;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.834-836
    • /
    • 2021
  • 멀티모달 감정인식을 통해 사람의 감정을 정확하게 분류하고, 사람의 감정에 어울리는 음악을 매칭하는 시스템을 설계한다. 멀티모달 감정 인식 방법으로는 IEMOCAP(Interactive Emotional Dyadic Motion Capture) 데이터셋을 활용해 감정을 분류하고, 분류된 감정의 분위기에 맞는 음악을 매칭시키는 시스템을 구축하고자 한다. 유니모달 대비 멀티모달 감정인식의 정확도를 개선한 시스템을 통해 텍스트, 음성, 표정을 포함하고 있는 동영상의 감성 분위기에 적합한 음악 매칭 시스템을 연구한다.

유비쿼터스 휴대 단말용 SoC 기술 동향 (Trends in SoC Technology for Ubiquitous Mobile Terminals)

  • 여준기;양일석;김기철;노태문;김종대
    • 전자통신동향분석
    • /
    • 제22권5호
    • /
    • pp.12-23
    • /
    • 2007
  • 유비쿼터스 사회에서는 언제, 어디서나 네트워크에 연결하여 다양한 형태의 실감 정보를 제공 받아 더욱더 풍요로운 삶을 누릴 수 있을 것이다. 이것은 음성인식 및 영상합성 생성기술, 입체 영상/음향 입?출력기술, IT-NT-BT 기술융합의 가속화로 지능형 실감형 정보처리는 물론 휴먼정보 등의 다양한 정보처리가 가능한 유비쿼터스 휴대 단말기에 의해서 실현될 것이다. 휴대 단말기에서 반도체는 약 $40{\sim}50%$의 비중을 차지하는 가장 중요한 부품이며, 다양한 지능형 실감형 정보를 처리하기 위하여 막대한 양의 데이터를 처리할 수 있는 저전력 고성능 반도체 SoC 개발이 필수적이다. 본고에서는 휴대 단말기에 사용되는 SoC 기술 및 재구성형 프로세서 기술 동향을 파악함으로써, 유비쿼터스 단말기에서 필수적으로 사용될 반도체 SoC 기술의 발전 방향에 대해서 전망해 보았다.

디지털 TV방송 기술개발 전략

  • 안치득;김진웅;이수인
    • 전자공학회지
    • /
    • 제31권5호
    • /
    • pp.24-34
    • /
    • 2004
  • 디지털방송이란 방송 콘텐츠의 제작, 전송 및 재현에 이르는 모든 과정을 디지털화 함으로써, 고품질의 방송 프로그램 및 다채널 서비스를 실현하고 통신방송 융합형 서비스를 포함한 다양한 부가기능을 제공하는 방송 기술로 정의된다. 디지털방송의 주요 특징은 다음과 같다. ㆍ현재 아날로그TV보다 5∼6배 선명한 고선명(HD) 영상과 CD급 고음질의 음향을 제공함 ㆍ기존의 방송 프로그램뿐만 아니라, 영상, 음성, 음향, 문자, 그래픽 등 다양한 형태의 멀티미디어 정보를 TV수상기, 컴퓨터 모니터, 휴대전화 등 여러 가지 수신 단말을 통하여 받아볼 수 있음ㆍ방송 통신망 연동, 방송 단말의 지능화 기능 등을 통하여 시간, 공간적 제약없이 언제, 어디서나, 누구든지 시청자 개인 취향의 프로그램을 자유롭게 이용할 수 있으며, 시청자가 방송에 직접 참여하는 양방향 서비스가 가능함 ㆍ양방향 데이터 방송, TV전자상거래, T-Government 등 멀티미디어 부가서비스를 이용하여 디지털 인프라간 통합의 구심점 및 정보플랫폼(Home Gateway) 역할을 수행함.(중략)

  • PDF

음성, 영상, 먼지 센서를 활용한 1인 가구 이상 행동 패턴 탐지 (Abnormal Behavior Pattern Identifications of One-person Households using Audio, Vision, and Dust Sensors)

  • 김시원;안준호
    • 인터넷정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.95-103
    • /
    • 2019
  • 최근 1인 가구가 다양한 연령대에서 증가하고 있으며 무연고자의 사망도 점차 증가한다. 1인 가구의 무연고사의 경우 주위에 돌봐줄 사람이 없어 많이 발생하며 최근에는 노인뿐만 아니라 다양한 연령대에서 발생한다. 우리는 혼자 사는 사람의 이상 징후를 탐지하고자 홈 CCTV를 이용한 영상 패턴 알고리즘과 음성을 인식하는 음성 패턴 알고리즘, 움직임 및 요리 등에서 발생하는 먼지를 탐지하는 센서로 먼지 패턴 알고리즘을 연구 및 개발하였다. 개별적으로 제안된 패턴 알고리즘은 탐지 영역을 벗어나게 되면 탐지하지 못하는 단점이 존재한다. 개별 패턴 알고리즘의 성능을 향상시키기 위해 융합 방식을 연구했으며, 다수의 사용자 행동 패턴을 분석하여 그 성능을 검증하였다.

Abnormal Situation Detection Algorithm via Sensors Fusion from One Person Households

  • Kim, Da-Hyeon;Ahn, Jun-Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.111-118
    • /
    • 2022
  • 최근 1인 고령 가구가 증가하고 있지만 1인 가구의 경우 집 안에서 위험 상황이 발생했을 때, 이를 외부에 알리기 힘들다. 이와 같은 1인 가구의 위험 상황을 탐지하기 위해 다양한 스마트홈 솔루션이 제안되고 있지만, 프라이버시 영역에 문제가 있는 홈 CCTV와 같은 영상 매체는 활용 어렵다. 그리고 단일 센서만을 활용하여 집안 내 고령자의 위험 상황을 분석할 경우, 데이터양의 한계로 정확한 상황해석이 제한 된다. 따라서 본 논문에서는 프라이버시를 지킬 수 있으며 실생활에 밀접한 2DLiDAR, 먼지, 음성 센서 간의 상관관계 따른 융합을 통한 집 내부의 위험 상황 탐지 융합 알고리즘을 제안한다. 또한, 본 논문은 실제 환경에서 수집한 데이터를 통해 알고리즘의 신뢰성을 증명한다. 제안하는 알고리즘이 탐지 가능한 위험 상황과 불가능한 상황을 제시한다. 본 논문은 집 안에서 위험 상황을 탐지하는 연구로써 1인 가구 사용자의 생활에 도움이 될 것이다.

오픈 소스 소프트웨어를 활용한 인터넷 전화 녹취 시스템 (An Internet Telephony Recording System using Open Source Softwares)

  • 하은용
    • 디지털융복합연구
    • /
    • 제9권5호
    • /
    • pp.225-233
    • /
    • 2011
  • 인터넷 전화는 IP 기반 인터넷에서 VoIP(Voice over IP) 기술을 이용해서 음성 전화를 지원하는 인터넷 서비스다. 인터넷 전화는 영상통화, 메시징과 같은 인터넷 멀티미디어 서비스를 융합한 음성전화 서비스를 지원할 수 있는 장점을 갖고 있다. 특히 스마트폰을 통한 인터넷 소셜 네트워크 서비스가 보급되면서 기존의 전화망을 대체하는 서비스로써 인터넷 전화에 대한 연구와 개발이 활발히 진행되고 있다. 본 논문에서는 SIP(Session Initiation Protocol) 기반 인터넷 전화의 음성 통화 내용을 녹취하는 시스템의 설계 및 구현에 대해 설명한다. 인터넷 전화 녹취 시스템은 리눅스 기반으로 양방향 음성 스트림을 믹싱하는 기능, 라이브 패킷 스니핑 기능, 녹취 음성 파일 송신 기능은 공개 소프트웨어를 사용해서 구현하였다. 향후 개발된 시스템은 VoIP 기반 콜센터 시스템 등과 같은 복합 시스템을 구축하는데 있어 기반 기술로 활용될 계획이다.