• 제목/요약/키워드: 인식기능

검색결과 3,382건 처리시간 0.032초

적외선을 이용한 다기능 제스처 인식 포인터 (Multifunctional Gesture Recognition using Infrared Light Emitters)

  • 이규화;진윤석;이진규;최영규;박준
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.423-428
    • /
    • 2007
  • 본 연구는 기존의 프레젠터의 단순한 포인터 및 클릭 기능을 넘어선 다기능 제스처 인식 포인터의 구현이 주 목적이다. 주된 연구 내용으로는 적외선 발광 다이오드에서 나오는 빛을 인지하여 포인터의 궤적 인식을 하는 기술과 이를 응용한 어플리케이션의 개발에 있다. 본 하드웨어에는 기본적인 마우스 클릭 기능 외에도 적외선 발광 다이오드를 탑재하여 PC와 연결된 카메라가 이를 인지하도록 한다. 장점으로는 카메라가 항상 PC와 가까이 있을 필요가 없으므로 어느 장소이든 관계없이 적외선 투과 필터가 장착된 카메라 하나만 설치할 수 있는 곳이면 구현이 가능하며 적외선을 이용하므로 가시광선의 영향을 적게 받아 효율적으로 영상 처리를 할 수 있다는 데에 있다. 제스처 인식을 통하여 수많은 여러 가지 기능을 실행할 수 있으며, 보다 사용자와 인터랙티브한 작업이 가능해진다. 구현된 하드웨어와 소프트웨어 시스템은 프레젠테이션 및 게임 컨트롤에 사용되었다.

  • PDF

휴머노이드 로봇을 위한 스테레오 비전기반 자체 움직임 보정연구 (A study on the Stereo-Vision based Egomotion compensation for humanoid Robot)

  • 강태구;박귀태
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.1827-1828
    • /
    • 2008
  • 지능형 휴머노이드 로봇에서 환경에 따른 행동결정능력은 로봇이 필수적으로 갖추어야 할 기능이다. 특히 비전기반의 환경인식 기술은 로봇에서 가장 많은 보행 환경 정보를 제공한다. 따라서 보다 정확한 환경인식 성능을 위해서는 상체의 움직임이 많은 휴머노이드 로봇에서 비전기반의 높은 환경에 대한 인식 기능을 위해 전처리 단계로 로봇 자체의 움직임을 상쇄 시켜주는 기능이 필수적이다. 본 논문에서는 Gaussian 모델과 Wavelet Transform을 사용하여 추적하고자 하는 영역을 추출하고 PCA를 이용하여 로봇 자체의 움직임을 상쇄시키는 방법을 제안한다. 본 방법은 영상 전체를 분석함으로써 기존의 픽셀 단위로 움직임을 분석하는 방법에 비하여 간단하면서도 우수한 성능을 보인다. 본 시스템을 제작한 로봇에 적용한 결과 보다 높은 인식 성능을 얻을 수 있었다.

  • PDF

하이브리드 인식을 이용한 불법 콘텐츠 추적시스템 설계 및 구현 (Design and Implementation of Illegal Content Tracking System Using Hybrid Content Recognition)

  • 김원겸;박경수;김상진;유원영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1555-1558
    • /
    • 2011
  • 본 논문에서는 멀티미디어 데이터에 대한 내용기반 인식 기법을 이용하여 인터넷에 불법으로 배포되어 있는 콘텐츠를 추적하는 기법을 소개한다. 내용기반 인식 기법은 콘텐츠의 원신호에서 내용기반 해쉬나 혹은 축약된 형태의 특징벡터를 추출하여 콘텐츠를 인식하는 기술로 저작권보호 분야에서 불법 저작물을 필터링하는데 많이 활용되고 있다. 불법 콘텐츠 추적시스템은 인터넷에서 광범위하게 유포되어 있는 저작물을 검색하여 그 내용을 기반으로 인식하여 불법 여부를 판단한 후 삭제메일이나 재전송 중지 등의 후속 조치를 자동으로 수행하는 저작권보호 시스템이다. 본 논문에서는 오디오, 비디오, 어문, 게임 콘텐츠에 대해 내용을 기반으로 인식을 수행하고 불법 여부를 판단하여 재전송 중지 조치를 취하는 능동적 저작물 추적 시스템을 제안한다. 제안된 시스템에서는 검색모듈에 의해 수집된 다양한 저작물에 대해 저작물별 독립적으로 인식 기능을 수행하는 기능을 제공한다.

모션인식과 음성인식을 활용한 입력장치 구현 (Implementation of input device using motion and voice recognition)

  • 박양우;이우재;김민섭;정명진;강민재;염상호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.287-288
    • /
    • 2023
  • 본 논문에서는 실시간 영상 처리 라이브러리인 OpenCV와 미디어파이프(MediaPipe)를 사용하여 동작 인식 기반 키보드, 마우스 제어 프로그램을 개발하였다. Google의 미디어파이프(MediaPipe)에서 제공하는 손가락 마디 부분의 랜드마크를 인식하며, 실시간 영상 처리로 띄워진 사용자 인터페이스에서 제스처를 통해 키보드 입력과 마우스 제어를 할 수 있으며, Google에서 제공하는 오픈 소스와 결합하여 음성인식을 통한 키보드 입력이 가능하다. 또한, 각 기능끼리 제스처를 통해 기능 변경이 가능하여 다양한 산업 분야에서 원하는 키를 매핑할 수 있기 때문에 활용 가능성이 높으며, 의료 분야에서 감염 예방을 목적으로 사용할 수 있다. 특히 기존의 메타버스에서 사용되는 고가의 센서를 대체하여 비용 절감 부분에서 장점이 있다.

  • PDF

물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발 (Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model)

  • 임송원;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.162-164
    • /
    • 2019
  • 본 논문에서는 물체인식 딥러닝 모델 생성에 필요한 라벨링(Labeling)과정에서 사용자가 다양한 기능을 활용하여 효과적인 학습 데이터를 구성할 수 있는 GUI 프로그램을 구현했다. 프로그램의 인터페이스는 파이썬 기반의 GUI 모듈인 Tkinter 를 활용하여, 실시간으로 이미지 데이터를 수집할 수 있는 크롤링(Crawling)기능과 미리 학습된 Retinanet 을 통해 이미지 데이터를 인식함으로써 자동으로 주석(Annotation) 과정을 수행할 수 있는 기능을 구성했다. 또한, 수집한 이미지 데이터를 다양한 효과와 노이즈, 변형 등으로 Augmentation 기능을 추가함으로써, 사용자가 모델을 학습하기 위한 데이터 전처리 단계를 하나의 GUI 프로그램에서 수행할 수 있도록 했다. 또한 사용자가 직접 학습한 모델을 추정 모델(Inference Model)로 변환하여 프로그램에 입력할 수 있도록 설계한다.

  • PDF

기능성의류 인식에 따른 소비자 분류와 이에 따른 제품정보 및 행택 활용도 연구 (Consumer Categorization Based on Perception of Functional Jacket and their Utilization of Functional Information and Hang-tag)

  • 방기성;유신정
    • 감성과학
    • /
    • 제18권4호
    • /
    • pp.75-86
    • /
    • 2015
  • 본 연구는 기업과 소비자 간의 기능성 의류제품의 효과적인 정보소통을 목적으로 하는 일련의 연구 중 일부로 기능성 아웃도어 재킷에 대한 인식과 행동양식에 따라 응답자를 유형화하고 각 유형별 기능성 아웃도어 재킷 구매시 활용하는 정보원과 행택에 대한 행동의 차이를 고찰하였다. 설문조사는 기능성 아웃도어 재킷 구매 경험이 있는 20~60대 남, 녀 472명을 대상으로 실시하였다. 기능성 아웃도어 재킷에 대한 인식은 '기능성', '가격', '경험/지식', '브랜드/디자인' 요인으로 분류되었으며 요인에 따라 응답자들은 '비전문적/브랜드 및 디자인 추구집단', '전문적/기능성 중시집단', '고가제품 선호집단'으로 분류되었다. '비전문적/브랜드 및 디자인 추구집단'은 인터넷을 정보를 가장 많이 활용하는 20대, 30대의 회사원과 학생으로 구성되었으며 '전문적/기능성 중시집단'의 경우에는 행택(Hang-Tag)을 정보원으로 주로 사용하는 전문직의 40대, 50대가 주를 이루었다. '고가제품 선호집단'은 60대 이상, 주부의 비율이 가장 높은 집단으로 판매원을 정보원으로 주로 이용하는 것으로 나타났다. 기능성 정보제공에 사용된 용어에 대해 설명의 필요성을 가장 높게 인식하고 있는 집단은 '전문적/기능성 중시집단'이었으며 성능정보 관심도가 떨어지는 '비전문적/브랜드 및 디자인 추구집단'은 오히려 상대적 만족도가 높은 것으로 나타났다. 본 연구를 통해 기능성 재킷 소비자 유형의 특징과 성능 정보에 대한 반응의 차이를 고찰함으로써 기능성 의류제품의 성능 정보 제공을 위한 효과적인 방법과 내용에 대한 실질적이고 유용한 정보를 제공할 수 있을 것으로 기대한다.

삼중 보안 기능을 가지는 스마트 도어락 개발 (Development of the Smart Doorlock with Triple Security Function)

  • 문서영;민경원;서재섭;이선우;고윤석
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.115-124
    • /
    • 2020
  • 본 논문에서는 현대 사회에서 도어락의 보안성 취약으로 인한 범죄사건들에 대해 보완이 필요하다고 생각하여 보안능력을 강화한 3중 보안 시스템 스마트 도어락을 연구하였다. 앱 이클립스 프로그램을 기반으로 제작한 핸드폰 어플을 통해 도어락 ON&OFF시스템과 음성인식기능, 광학식 지문센서를 사용한 지문인식 기능을 최종으로 잠금과 잠금해제가 가능한 삼중 보안 도어락을 실험, 제작하였다. 끝으로, 실험 제작된 3중 도어락에 대한 앱 기반 동작 실험, 음성 인식 동작실험, 실험지문 인식 동작실험에 대한 평가결과를 통해 도어락의 보안성을 강화할 수 있음을 확인할 수 있었다.

생성형 AI 기술을 적용한 음성 및 모션 인식 기반 양방향 대화형 알고리즘 (Two-way Interactive Algorithms Based on Speech and Motion Recognition with Generative AI Technology)

  • 장대성;김종찬
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.397-402
    • /
    • 2024
  • 음성 인식과 모션 인식 기술은 다양한 스마트 디바이스에 적용되어 사용되고 있으나, 단순한 명령어 인식 형태로 구성되어 단순 기능으로 사용되고 있다. 인식 데이터에 대한 단순 기능에서 벗어나 다양한 분야에서 학습된 데이터를 기반으로 전문적인 명령어 수행 능력이 요구되고 있다. 현재 세계적으로 경쟁이 이루어지고 있는 생성형 AI를 활용하여 사용자에게 최적의 데이터를 제공하고, 음성 인식과 모션 인식을 통해 상호작용할 수 있는 시스템 플랫폼에 대한 연구가 진행되고 있다. 본 연구를 위해 설계한 주요 기술 프로세스는 음성 및 모션 인식 기능, AI 기술 적용, 양방향 커뮤니케이션 등 기술을 이용한 설계하였다. 본 논문에서는 AI 기술을 적용한 디바이스와 음성인식과 모션 인식 기술을 통해 디바이스와 사용자 간 양방향 커뮤니케이션을 다양한 입력방식에 의해 이루어질 수 있도록 하였다.

고립단어 인식 시스템에서의 거절기능 구현 (An Implementation of Rejection Capabilities in the Isolated Word Recognition System)

  • 김동화;김형순;김영호
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.106-109
    • /
    • 1997
  • 고립단어 음성인식 시스템이 실용적이 되려면 인식 대상 이외의 단어를 거절할 수 있는 기능이 요구된다. 본 논문에서는 집단화된 음소 모델과 likelihood ratio에 의한 후처리 방법을 사용하여 거절기능을 구현하는 방법을 제안하였다. 기본적인 음성인식 시스템은 단어 단위 연속 HMM을 사용하였고, 6개의 집단화된 음소 모델들은 음성학적으로 균형잡힌 음성 데이터베이스를 이용하여 훈련된 45개의 문맥독립 음소 모델들로부터 통계적 방법에 의하여 생성되었다. 22개의 부서 명칭을 대상으로 한 화자독립 고립단어 인식시스템에서 거절성능을 시험하여 본 결과, 가장 높은 확률값과 두 번째 높은 확률값을 가지는 후보단어들 간의 차이값에 의하여 거절기능을 수행하는 기존의 후처리 방법보다 성능이 향상됨을 알 수 있었다. 또한 이 집단화된 음소모델은 인식 대상 어휘가 다른 고립단어 인식 시스템에도 재훈련 없이 그대로 사용될 수 있다.

  • PDF

정원 기능에 대한 인식 비교 (Comparison of the Awareness of Garden Functions)

  • 박미옥;최자호;구본학
    • 한국조경학회지
    • /
    • 제48권2호
    • /
    • pp.34-44
    • /
    • 2020
  • 정원이 제도적 차원에서 공적영역으로 확대되며, 기능의 불명확성으로 인해 혼란이 발생하고 있다. 이에 본 연구에서는 정원 조성 및 이용자 관점, 즉 전문가와 일반인을 대상으로 정원 기능의 우선순위 인식을 규명하고, 정책적 방향성을 제시하고자 수행하였다. 연구방법론은 사회과학적 방법론인 AHP를 적용하였으며, 집단A 227명, 집단B 220명의 인식을 분석하고 비교고찰하였다. 먼저 정원의 대분류 기능에 대한 가중치 분석 결과, 집단A는 문화적 기능, 생태적 기능, 사회적 기능의 순으로 중요하게 인식하고 있다. 반면 집단B에서는 생태적 기능, 문화적 기능, 사회적 기능 순으로 나타나, 서로 간 인식 차이가 확인되었다. 둘째, 각 대분류별 중분류의 가중치 분석 결과에서는 문화적 기능에서 심미적 아름다움이 두 집단 모두 1순위로 나타났으며, 영적 종교적 영감, 문화유산과 고유성에서 순위 차이가 있었다. 생태적 기능에서는 생태환경 보호, 사회적 기능에서는 지역주민 삶의 질이 두 집단 모두 1순위로 평가되었으며, 나머지 중분류 우선순위도 모두 동일하였다. 셋째, 대분류 수준의 각 기능별 가중치를 곱셈한 중분류 기능의 종합적 분석 결과에서는 생태환경보호, 심미적 아름다움, 휴양치유, 물순환에 대해 두 집단 모두 제일 중요하게 인식하였다. 반면 두 집단 모두 산업화를 가장 후순위로 인식하고 있었다. 종합하여 보면 공적 영역으로 확대된 정원은 이용자 중심의 공간 기능이 우선되어야 하며, 산업적 혼란을 방지함과 동시에 전문성이 존중되어야 한다. 즉, 생태환경 보호와 물순환 등의 생태적 기능을 최우선으로 하여, 심미적 아름다움, 휴양치유 등의 문화적 기능을 보완하는 것이 효과적일 것으로 판단된다. 후속 연구로서 정원의 유형과 위계, 기타 다양한 정원에 대한 설계와 시공 및 모니터링 DB를 구축하여, 정원의 흐름을 체계적으로 관리하는 것이 중요하다.