• 제목/요약/키워드: 시각적 인식

검색결과 1,305건 처리시간 0.033초

스마트 감시 애플리케이션을 위해 Deep CNN을 이용한 폭력인식 (Violence Recognition using Deep CNN for Smart Surveillance Applications)

  • 파튜 유 민 울라;아민 울라;칸 무함마드;이미영;백성욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.53-59
    • /
    • 2018
  • 최근 컴퓨터 비전 기술의 발전으로 스마트도시에서는 합리적인 정확도로 복잡한 동작을 인식할 수 있다. 이와는 대조적으로, 싸움과 칼에 관련된 사건과 같은 폭력적인 인식은 관심을 덜 이끌었다. 시각적인 감시 능력은 거리나 교도소에서의 싸움을 감지하는데 사용될 수 있다. 이 논문에서 우리는 감시 카메라에 대한 심층 학습 기반의 폭력 인식 방법을 제안했다. 컨볼루션 뉴럴 네트워크(CNN) 모델은 폭력 인식을 위한 싸움과 칼의 벤치마크 데이터 셋에 대해 훈련하고 세부적으로 조정된다. 비정상적인 이벤트가 감지되면 가장 가까운 경찰서로 경보를 보내는 즉각적인 조치를 취할 수 있다. 제안된 방법의 실험 결과는 99.21%의 정확도를 달성함으로써 다른 최첨단 CNN모델을 능가했다.

어텐션 기반 엔드투엔드 음성인식 시각화 분석 (Visual analysis of attention-based end-to-end speech recognition)

  • 임성민;구자현;김회린
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.41-49
    • /
    • 2019
  • 전통적인 음성인식 모델은 주로 음향 모델과 언어 모델을 사용하여 구현된다. 이때 음향 모델을 학습시키기 위해서는 음성 데이터에 대한 정답 텍스트뿐만 아니라 음성인식에 사용되는 단어의 발음사전과 프레임 단위의 음소 정답 데이터가 필요하다. 이 때문에 모델을 훈련하기 위해서는 먼저 프레임 단위의 정답을 생성하는 등의 여러 과정이 필요하다. 그리고 음향 모델과 별도의 텍스트 데이터로 훈련한 언어 모델을 적용하여야 한다. 이러한 불편함을 해결하기 위하여 최근에는 하나의 통합 신경망 모델로 이루어진 종단간(end-to-end) 음성인식 모델이 연구되고 있다. 이 모델은 훈련에 여러 과정이 필요없고 모델의 구조를 이해하기 쉽다는 장점이 있다. 하지만 인식이 내부적으로 어떤 과정을 거쳐 이루어지는지 알기 어렵다는 문제가 있다. 본 논문에서는 어텐션 기반 종단간 모델을 시각화 분석하여 내부적인 작동 원리를 이해하고자 하였다. 이를 위하여 BLSTM-HMM 하이브리드 음성인식 모델의 음향 모델과 종단간 음성인식 모델의 인코더를 비교하고, 신경망 레이어 별로 어떠한 차이가 있는지 분석하기 위해 t-SNE를 사용하여 시각화하였다. 그 결과로 음향모델과 종단간 모델 인코더의 차이점을 알 수 있었다. 또한 종단간 음성인식 모델의 디코더의 역할을 언어모델 관점에서 분석하고, 종단간 모델 디코더의 개선이 성능 향상을 위해 필수적임을 알 수 있었다.

CSCW 환경에서의 사용자 상호작용이 집합적 창조성에 미치는 인지적 영향에 관한 연구 : 왜 Web 2.0 환경에서 시각적인 칭찬이 왜 더 중요할까? (Cognitive Influences of User Interaction to the Collective Creativity in CSCW Environment : Why visible praises are even more important in Web 2.0?)

  • 박정아;권희정;우서혜;김진우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.340-345
    • /
    • 2008
  • Web2.0 이라는 인터넷 환경의 변화 속에서 사용자들의 자발적인 참여를 통해 생산된 컨텐츠(UCC)가 화두가 되고 있다. 다수의 사용자 참여는 집단지성을 발휘하고 이렇게 생성된 UCC 는 새로운 가치를 창출한다는 믿음이 확산된 가운데, 사용자는 더 이상 정보수용자의 입장이 아닌 정보제공자의 입장에서 컨텐츠 생성에 대한 범위와 역할이 크게 향상되고 있다. 그렇다면 과연 무엇이 이러한 사용자 생성 컨텐츠의 창의성에 가장 큰 원동력이 될까 또한 무엇이 집단지성, 집단의 창의성을 창출하는데 가장 큰 영향을 미칠까? 본 연구는 이러한 의문에서 출발하였다. 이와 같은 연구 문제를 해결하기 위하여 피드백과 동기 그리고 창의성에 기반한 인지 평가 이론과 창의성에 관한 사회적 특성이론에 근거, 상호작용 즉 컨텐츠에 대한 피드백을 기반으로 연구모형을 세우게 되었다. 이러한 연구 모형을 설문을 통해 검증해 본 결과, 피드백이 사용자의 동기에 긍정적인 영향을 미치고, 결국 그러한 동기가 개인의 창의성 및 집단 창의성에 긍정적인 영향을 미친다는 결론을 얻을 수 있었다. 이러한 연구 결과는 이론적으로는 인지 평가 이론의 확장 적용 및 CSCW 환경에서 암묵적으로 인식된 피드백과 같은 상호작용의 중요성을 공고히 하는데 기여할 수 있으며, 실제로는 이러한 피드백 요소를 시각적으로 적절히 배치 및 노출하여 사용자의 내적 용기와 창의성을 촉진하여야 함을 밝힌다는데 의의를 가질 수 있겠다.

  • PDF

커피전문점의 시각이미지요소가 소비자 선호도에 미치는 영향 (Implications to Consumer Preferences on Visual Image Elements of Coffee Houses)

  • 이선희;우나리야
    • 벤처창업연구
    • /
    • 제10권3호
    • /
    • pp.147-159
    • /
    • 2015
  • 소비자들이 커피전문점을 선택 방문 하는 가장 중요한 요인 중 하나는 시각적 요인이다. 커피전문점 선호도에 대한 분석 결과, 직업, 거주지, 결혼여부와 같은 응답자의 일반적 특성에 따라서 유의적인 차이가 나타났으며, 모든 일반적 특성 범주에서 스타벅스의 선호도가 가장 높은 것으로 나타났다. 커피전문점 매장 내 색체의 영향에 대한 분석 결과에서는 모든 일반적 특성 변수에서 통계적으로 유의한 차이가 나타나지 않았다. 또한 시각적인 상징컬러가 가장 영향을 주는 아이템은, 제공용품과 실내 인테리어가 중요한 아이템으로 조사되었다. 시각적인 상징컬러만으로 커피전문점을 선택 한다면 가장 기억에 남거나 방문하고 싶은 곳은 스타벅스였으며, 응답자의 일반적 특성에 따라서 차이가 나타난 변수는 평균용돈이었다. 시각적 상징컬러가 강하여, 선택된 커피전문점으로써 가장 기억에 남거나 방문하고 싶은 곳으로서 스타벅스, 엔젤리너스, 카페베네이었으며, 이디야가 색상이 그 커피전문점의 특성을 잘 나타내고 있어서'이었고, 할리스는 다른 곳과 비교해서 색상이 개성이 있어서로 조사되었다. 즉 본 연구에서는 커피전문점마다 커피 맛은 다르지만, 소비자들이 커피전문점을 방문할 때 시각적 요소의 중요도와 상징컬러의 선호도가 커피전문점의 선택에 중요한 영향을 미치는 것으로 분석되었다. 일반 소비자를 대상으로 조사하여 시각적 요소들이 어떠한 영향을 미치는지 알아보는 연구를 진행하였으며, 시각적 요소와 컬러마케팅이 중요한 요소임을 인식하여 발전시킬 필요가 있는 것으로 파악되었다.

  • PDF

포인트 클라우드 형태의 인터랙티브 홀로그램 콘텐츠 (Point Cloud Content in Form of Interactive Holograms)

  • 김동현;김상욱
    • 한국콘텐츠학회논문지
    • /
    • 제12권9호
    • /
    • pp.40-47
    • /
    • 2012
  • 미디어 아트는 새로운 경로의 인식과 지각을 동반하고, 기존의 미술과는 다른 인간의 신체를 도구화 하여 상호작용을 만들어내는 새로운 감상방식을 제안한다. 시각적인 영상을 제작하는 방식 중 포인트 클라우드는 점으로 형태를 표현한다는 점에 있어 서양미술의 점묘법과 유사하며 이는 전통회화 기법을 디지털 기술을 활용해 재구성한다는 의미를 가진다. 본 논문에서는 미학적 요소와 디지털 기술을 융합한 새로운 감상방식으로 포인트 클라우드 형태의 영상을 제작하여 홀로그램 필름에 투사하고, 관람자의 손짓이 영상과 상호작용하는 콘텐츠를 제시한다. 콘텐츠 제작은 콘텐츠 제작 배경 의도를 기획하고 포인트 클라우드 형태의 이미지 제작, 상호작용을 위한 3D 제스처 디자인 과정을 거쳐 최종적으로 홀로그램 필름에 투사하는 과정을 거친다. 콘텐츠는 사람의 의식 속에서 일어나는 기억의 회상 과정을 시각적, 체감적으로 표현한다. 이를 위해 기억의 회상 과정을 불확실한 기억, 기억의 구체화, 완전한 회상으로 설정하였다. 불확실한 기억은 포인트 클라우드 형태의 이미지를 통해 모호한 형태의 이미지로 표현되고, 상호작용으로 이미지를 조작하는 행위를 통해 기억을 구체화 해 나가면서 완전한 회상을 하게 된다.

시선인식 집중도 기반의 영상 품질 측정 방법 (Video Quality Evaluation Method based on visual attention)

  • 고정곤;석주명;서덕영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.410-412
    • /
    • 2011
  • 영상 서비스에서 사용자가 시청하는 비디오 화질을 측정하는 것은 사용자의 QoE(Quality of Experience)를 추정할 수 있는 중요한 작업 중 하나이다. 이를 위해 가장 널리 쓰이는 측정 방법 중 PSNR이 있다. PSNR은 원본영상과 시청영상간의 각 픽셀 값의 차이를 계산하여 화질을 측정하는 객관적인 평가 방법이다. 본 논문에서는 객관적 평가 방법인 PSNR에 시청자가 영상 측정 시 느낄 수 있는 시선 인식 집중도를 접목시킨 품질 측정방법을 제안한다. 이는 사용자의 시각적 특성이 고려되기 때문에 보다 사용자에게 맞는 영상 품질을 측정할 수 있게 된다.

  • PDF

오프셋 격자 윤곽에서 특징 자극 추출 모델 (A Neural Network Model for Perceiving the induced stimuli from Illusions defined by Offset Gratings)

  • 정은화;홍경호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.683-686
    • /
    • 2002
  • 본 연구는 불연속선에 의해 생성된 시각적 착시에서 착시 윤곽의 특징들을 구하는 인식 모델을 제안한다. 착시 윤곽은 일상생환에서 흔히 접하는 현상으로서 외부 세계에 존재하는 동일한 강도의 물리적 에너지를 주변 자극의 영향 때문에 실제와 다르게 해석하는 현상이다. 착시 그림들로부터 착시 윤곽을 이루는 특징 자극을 추출하는 신경회로망 모델을 제안한다. 제안된 인식 모델은 윤곽 추출, 시파 특징 추출, 시파 특징 복원, 유도 자극 추출, 이미지 복원 및 이미지 연산 단계로 구성된다. 제안된 모델은 불연속적인 선에 의해 나타나는 오프셋 격자 윤곽에서 특징 자극들을 추출한다.

  • PDF

필기 문자의 확률 분포 유사성에 기반한 필기자 종속적 온라인 필기 한글 낱자 생성 (Writer Dependent Online Hangul Syllable Generation based on Similarity between Probabilistic Distributions of Handwritings)

  • 최현일;김자환;김진형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.871-873
    • /
    • 2005
  • 필기는 특정인의 정체성을 나타내는 매우 효과적인 매체이다. 이런 이유로 최근 개인의 필기를 디지털 환경에서 사용하기 위한 방법들이 제안되고 있다. 또한 필기 인식 분야에서는 높은 성능의 필기 인식 시스템을 개발하기 위해 많은 양의 필기 데이터를 필요로 한다. 이에 본 연구는 주어진 데이터내의 문자 조합을 바탕으로 한글 필기를 생성하는 것을 목적으로 한다. 특히 데이터에서 관측되지 않은 필기까지도 생성하는 것을 주요 문제로 다룬다. 실험 결과 생성된 필기는 실제 필기와 시각적으로 매우 유사함을 보인다.

  • PDF

허스키 렌즈를 이용한 얼굴인식 물품 보관함 (Face recognition locker using husky lens)

  • 김선옥;이가은;박유진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.130-132
    • /
    • 2022
  • 본 논문은 물품 보관함을 이용하는 사용자의 편의성을 얼굴인식 시스템을 통해 극대화 하는 시스템이다. 허스키 렌즈를 이용하여 사용자의 얼굴을 기억하고 본인의 얼굴을 통해 물품 보관함의 잠금을 해제할 수 있도록 구성하였다. 사용자의 얼굴을 등록할 때는 여러 번 등록하여 오작동할 확률을 줄이고, 보관함의 잠금이 해제됨을 알리기 위해 부저와 LED를 사용하여 청각적 시각적 알림을 더해 사용자들이 빠르고 간편하게 물품 보관함을 이용하게 하고자 한다.

게임의 긍정적 역할과 인식변화를 위한 기능성 게임의 개발에 관한 연구 (A Study on the Positive Impact of a Persuasive Game and Its Potential for Social Change Literacy)

  • 김영수;김나영;조성현
    • 한국게임학회 논문지
    • /
    • 제14권1호
    • /
    • pp.39-48
    • /
    • 2014
  • 기능성 게임은 개인과 사회에 긍정적인 변화를 유도할 수 있는 가능성이 높다. 그러나 아직까지 국내에서는 이 이슈에 대한 연구가 미흡한 것이 현실이다. 그래서 본 논문에서는 비장애인들에게 시각장애를 체험하게 함으로써 비장애인과 시각장애인이 서로 소통하고, 이해하며, 화합할 수 있도록 인식변화를 유도하기 위해 마르크 르블랑의 8가지 재미요소와 이안 보고스트의 설득게임을 참고하여 기능성 게임을 개발하였다. 본 논문에서는 개발한 게임을 플레이하기 전과 후에 게임 사용자들에게 설문조사를 하였고, 설문 결과의 분석에 기초하여 설득 게임이 게임 사용자의 인식변화를 유도할 수 있다는 사실을 부분적으로 검증하였다.