• 제목/요약/키워드: images of scientists

검색결과 503건 처리시간 0.024초

시청자 참여형 양방향 TV 방송을 위한 얼굴색 영역 및 모션맵 기반 포스처 인식 (Posture Recognition for a Bi-directional Participatory TV Program based on Face Color Region and Motion Map)

  • 황선희;임광용;이수웅;유호영;변혜란
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권8호
    • /
    • pp.549-554
    • /
    • 2015
  • 최근 자연스러운 인터페이스 하드웨어의 증가와 더불어 사용자의 자세를 인식하는 콘텐츠 산업이 부상하고 있다. 컴퓨터 비전 기술은 고가 하드웨어 장치의 대안으로 콘텐츠 산업의 발전에 효율적이다. 본 논문에서는 생방송으로 진행되는 시청자 참여형 양방향 TV 프로그램에 적합한 시청자의 포스처를 인식하는 방법을 제안한다. 제안하는 방법은 검출된 얼굴 위치에서 획득한 사용자 얼굴색과 모션맵을 사용하여 사용자의 손 위치를 안정적으로 검출하고, 위치 관계 분석을 통해 포스처를 인식한다. 제안하는 방법은 복잡한 배경에서도 생방송 양방향 TV 프로그램에서 사용되는 세 가지 자세를 인식하는데 90%의 인식 성능이 나타나는 것을 실험을 통해 확인하였다.

지지 벡터 데이터 기술을 이용한 가려진 얼굴 요소 복원 (Reconstructing Occluded Facial Components using Support Vector Data Description)

  • 김경호;정윤수;이상웅
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.457-461
    • /
    • 2010
  • 얼굴 인식 분야는 오래전부터 꾸준히 연구되어 왔지만, 아직도 실용적인 얼굴 인식은 이루어지지 않고 있다. 이는 실제 얼굴 인식 시스템의 입력 영상의 경우, 실험실에서 획득된 얼굴 영상과는 달리 안경이나 스카프, 헤어스타일 등에 의해서 가려진 얼굴 영상인 경우에 인식 성능이 매우 저하되는 것에 기인한다. 이러한 비 얼굴 요소를 처리하기 위해, 최근 수년간 다양한 방식의 비 얼굴 요소처리 방법이 있었으나, 만족할만한 성능을 보이지 못했다. 본 논문에서는, 최근 관련 방법 중에서 특징 공간에서 최소거리의 볼을 찾아 근사값을 추정하는 방식인 SVDD를 이용하는 비 얼굴 요소 복원 방법을 제안하고, 실험을 통해 성능을 평가한다. 제안 방법의 실효성을 검증하기 위해, 비얼굴 요소 부분을 점진적으로 증가시켜 복원하는 실험 등 을 통해 실험한 결과, 제안 방법은 상당한 수준의 실효성을지니고 있음을 확인하였다.

2차원 리샘플링에 기반한 광선추적법의 속도 향상 기법 (Speed Enhancement Technique for Ray Casting using 2D Resampling)

  • 이래경;임인성
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권8호
    • /
    • pp.691-700
    • /
    • 2000
  • 볼륨 데이타에 대한 팔진트리와 같은 계층 자료구조를 사용하는 광선 추적법은 모든 광선이 계층구조를 순회하는 것으로 인한 중복된 계산을 포함하고 있으며, 좋은 화질의 영상을 얻기 위한 3차원 보간으로 인하여 많은 계산 비용을 요구한다. 본 논문은 볼륨 데이타의 계층구조에 대한 중복된 방문을 피하고, 오직 한 번만 계층구조를 방문하면서 효과적으로 광선의 리샘플링 지점을 결정하여 색상과 투병도를 구하는 볼륨 렌더링 알고리듬을 제안한다. 이 방법은 물체 순서로 광선 추적법을 수행하면서, 각 복셀 주위에서의 리샘플링 지점을 점진적으로 찾아가면서 각 슬라이스 상에서의 2차원 보간에 기반을 둔 리샘플링을 수행한다. 또한 물체 순서 렌더링에서는 조기 광선 종결과 같은 최적화 기법을 구현하기 힘든데, 영상공간에서의 동적 자료구조를 이용하여 이를 효과적으로 해결하였다 본 논문이 제안한 방법은 구현하기 쉽고 속도 향상을 위하여 추가적으로 요구되는 메모리가 매우 적기 때문에 광선 추적법과 쉬어 와핑 방법 사이의 성능 차이를 메워주는 효과적인 방법으로 사용될 수 있을 것이다.

  • PDF

3차원 게임에서 객체들의 상호 작용을 디자인하기 위한 제어 기법 (A Control Method for designing Object Interactions in 3D Game)

  • 김기현;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.322-331
    • /
    • 2003
  • 3차원 게임은 게임 시나리오의 다양한 요소에 의한 복잡도가 증가함에 따라 게임 객체들의 상호 관계를 제어하기 위한 문제점을 가진다. 그러므로, 게임 시스템은 각 게임 객체들의 응답을 조정하는 방법의 필요성을 가진다. 또한, 게임 시나리오의 결과에 따라 게임 객체들의 행동 애니메이션을 제어하기 위한 개념들도 필요하다. 사실적 게임 시뮬레이션을 생성하기 위해 시스템은 게임 객체들의 상호작용을 디자인 할 수 있는 구조를 포함해야 한다. 본 논문에서 게임 시나리오상에 게임 객체들의 상호작용 설계를 위해 동적 제어를 디자인하는 기법을 소개한다. 이 방법을 위해 특정 규칙을 이용한 의사결정이 가능한 지능적 에이전트 기반 구조로써 게임 에이전트 시스템을 제안한다. 게임 에이전트 시스템은 환경 데이터 처리, 게임 객체 시뮬레이션, 게임 객체들간의 상호작용 제어, 게임 객체들의 다양한 상호 관계를 정의할수 있는 시각 저작 인터페이스를 제공하기 위해 이용되어진다. 이들 기술들은 게임 객체의 자율성과 연관된 충돌 회피 기법 등을 처리한다. 또한, 장면의 변경으로부터 게임 객체들의 일관된 의사 결정력을 가능하게 한다. 본 논문에서는 규칙기반 행동 제어가 게임 객체의 시뮬레이션을 안내하기 위해 디자인되어졌다. 시각적 요소들로 구성된 에이전트 상태 결정 네트워크는 정보전달과 게임 객체들 사이의 현상태를 추론할 수 있다. 이들 기법들은 실시간으로 게임 객체들간의 동작 상태 변이를 체크하고 모니터링 할 수 있다. 마지막으로 간단한 사례 연구 예와 함께 제어 기법의 타당성을 제시한다.

형태학과 문자의 모양을 이용한 뉴스 비디오에서의 자동 문자 추출 (Automatic Text Extraction from News Video using Morphology and Text Shape)

  • 장인영;고병철;김길천;변혜란
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권4호
    • /
    • pp.479-488
    • /
    • 2002
  • 최근 들어 인터넷 사용의 증가와 더불어 디지털 비디오의 수요 또한 급격히 증가하고 있는 추세이다. 따라서 디지털 비디오 데이타베이스의 인덱싱을 위한 자동화된 도구가 필요하게 되었다. 디지털비디오 영상에 인위적으로 삽입되어진 문자와 배경에 자연적으로 포함되어진 배경문자 등의 문자 정보는 이러한 비디오 인덱싱을 위한 중요한 단서가 되어질 수 있다. 본 논문에서는 뉴스 비디오의 정지 영상에서 뉴스 자막과 배경 문자를 추출하기 위한 새로운 방법을 제안한다. 제안된 알고리즘은 다음과 같이 세 단계로 구성된다. 첫 번째 전처리 단계에서는 입력된 컬러 영상을 명도 영상으로 변환하고, 히스토그램 스트레칭을 적용하여 영상의 수준을 향상시킨다. 이 영상에 적응적 임계값 추출에 의한 분할 방법을 수정 적용하여 영상을 분할한다. 두 번째 단계에서는 적응적 이진화가 적용된 결과 영상에 모폴로지 연산을 적절하게 사용하여, 우선 문자 영역은 아니면서 문자로 판단되기 쉬운 양의 오류(false-positive) 요소들이 강조되어 남아있는 영상을 만든다. 또한, 변형된 이진화 결과 영상에 모폴로지 연산과 본 논문에서 제안한 기하학적 보정(Geo-corrertion) 필터링 방법을 적용하여 문자와 문자로 판단되기 쉬운 요소들이 모두 강조되어 남아있는 영상을 만든다. 이 두 영상의 차를 구함으로서 찾고자 하는 문자 요소들이 주로 남고, 문자가 아닌 문자처럼 보이는 오류 요소들은 대부분 제거된 결과 영상을 만든다. 문자로 판단되는 양의 오류 영역들을 남기는데 사용된 모폴로지 연산은 3$\times$3 크기의 구조 요소를 갖는 열림과 (열림닫힘+닫힘열림)/2 이며, 문자 및 문자와 유사한 요소들을 남기는데 사용된 연산은 (열림닫힘+닫힘열림)/2와 기하학적 보정이다. 세 번째 검증 단계에서는 전체 영상 화소수 대비 각 후보 문자 영역의 화소수 비율, 각 후보 문자 영역의 전체 화소수 대비 외곽선의 화소수 비율, 각 외곽 사각형의 폭 대 높이간의 비율 등을 고려하여 비문자로 판단되는 요소들을 제거한다. 임의의 300개의 국내 뉴스 영상을 대상으로 실험한 결과 93.6%의 문자 추출률을 얻을 수 있었다. 또한, 본 논문에서 제안한 방법으로 국외 뉴스, 영화 비디오 등의 영상에서도 좋은 추출을 보임을 확인할 수 있었다.

2단계 신경망과 계층적 프레임 탐색 방법을 이용한 MPEG 비디오 분할 (MPEG Video Segmentation using Two-stage Neural Networks and Hierarchical Frame Search)

  • 김주민;최영우;정규식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.114-125
    • /
    • 2002
  • 본 논문에서는 MPEG 비디오 데이터의 컷(cut)과 디졸브(dissolve)를 검출하여 샷(shot) 단위로 분할하고 각 샷의 카메라 동작 또는 객체 움직임의 형태를 분류하는 방법을 제안하고자 한다. 정확한 샷의 위치와 카메라, 객체의 세분화된 동작을 구별하기 위한 전단계의 연구에서[1] 우선 MPEG 데이터의 I(Intra) 프레임의 DC(Direct Current) 계수를 분석하여 픽처 그룹을 Shot(장면이 바뀐 경우), Move(카메라 동작 또는 객체가 움직인 경우), Static(영상의 변화가 거의 없는 경우)으로 세분화하여 분류하였다. 이 과정에서 2단계 구조의 신경망을 구성하고 여러 종류의 특징을 서로 다른 해상도에서 추출하여 결합시키는 방법을 제안하였다. 다음 단계로 Shot 또는 Move로 분류된 픽처 그룹의 P(Predicted), B(Bi-directional) 프레임을 선별적, 계층적으로 탐색하여 컷의 정확한 발생 위치와 카메라 동작 또는 객체 움직임의 종류를 결정하는 방법을 제안한다. P, B 프레임의 매크로 블록의 종류별 분포를 통계적으로 이용하여 컷의 발생 위치를 검출하여, P, B 프레임의 매크로 블록 종류와 움직임 벡터를 동시에 사용하는 신경망을 구성하여 디졸브, 카메라 동작, 객체 움직임의 종류를 검출한다. 본 논문에서 제안하는 방법은 MPEG 데이터의 압축을 풀지 않은 상태에서 I 프레임의 DC 계수만을 사용하여 픽처 그룹을 분류하며, 분류된 픽처 그룹 내에서 일부의 P, B 프레임만을 계층적으로 선택하여 탐색함으로서 처리 시간을 감소시키고자 하였다. 세 종류의 서로 다른 비디오 데이터를 사용한 실험에서 93.9-100.0%로 픽처 그룹을, 96.1-100.0%로 컷을 검출하였다. 또한 두 종류의 비디오 데이터를 사용한 실험에서 90.13% 및 89.28%의 정확성으로 카메라 동작 또는 객체 움직임을 분류하였다.

얼굴 요소의 영역 추출 및 Snakes를 이용한 윤곽선 추출 (Facial Feature Detection and Facial Contour Extraction using Snakes)

  • 이경희;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권7호
    • /
    • pp.731-741
    • /
    • 2000
  • 본 논문은 얼굴 인식 또는 표정 인식 분야에 있어서 중요한 특징인 얼굴과 얼굴의 주요소인 눈과 입, 눈썹의 영역 추출 및 그의 윤곽선 추출에 관한 방법을 제시한다. 얼굴요소의 영역 추출은 엣지정보와 이진화 영상을 병합하여 이용한 프로젝션 분석을 통하여, 얼굴 및 각 얼굴요소를 포함하는 최소포함사각형(MER: Minimum Enclosing Rectangle)을 추출한다. 윤곽선 추출은 얼굴요소 모양의 개인차가 반영되고 빠른 수렴을 할 수 있는 스네이크 모델을 정의하여 수행한다. 스네이크는 초기 윤곽선의 설정이 윤곽선 추출 결과에 큰 영향을 미치므로, 초기 윤곽선의 설정 과정이 매우 중요하다. 본 논문에서는 얼굴 및 각 얼굴요소를 포함하는 각각의 최소포함사각형(MER)을 추출하고, 추출된 MER 내에서 얼굴 및 각 얼굴요소의 일반적인 모양을 초기 윤곽선으로 설정하는 방법을 사용한다. 실험결과 눈, 입, 얼굴의 MER 추출은 성능이 모두 우수하고, 눈썹이 흐린 사람들의 경우에만 눈썹의 MER 추출 결과가 좋지 않았다. 추출된 MER을 기반으로 하여 스네이크 모델을 적용한 결과, 눈, 입, 눈썹, 얼굴의 다양한 모양을 반영한 윤곽선 추출 결과를 보였다. 특히 눈의 경우는 1차 유도 엣지 연산자에 의한 엣지와 2차 유도 연산자를 이용한 영점 교차점(Zero Crossing)과 병합한 에너지 함수를 설정하여 보다 더 나은 윤곽선 추출 결과를 얻었다. 얼굴의 윤곽선의 경우도 엣지값과 밝기값을 병합한 에너지 함수에 의해 비교적 정확한 결과를 얻을수 있었다.

  • PDF

초·중·고등학생들의 극지에 대한 인식 (Elementary, Middle, and High School Students' Perception of Polar Region)

  • 정수임;최하늘;김민지;신동희
    • 한국지구과학회지
    • /
    • 제42권6호
    • /
    • pp.717-733
    • /
    • 2021
  • 이 연구는 극지 연구의 중요성을 확산하고자, 극지 소양 교육 방향을 설정하는 기초 자료를 제공하기 위해 수행되었다. 초·중·고등학생들의 극지 인식을 극지 정보 획득 현황, 극지에 대한 인상, 극지 문제 인식 측면에서 조사했다. 초·중·고 9개교 학생 975명이 선택형과 서답형이 포함된 16문항에 대한 설문 조사에 참여했다. 연구 결과, 학생들은 시청각 매체를 중심으로 한 극지 경험이 많았고, 학교 교육에서 극지에 대한 학습 경험이 상대적으로 적었다. 극지에 대한 인상은 지구 온난화로 빙하가 녹으면서 위기에 처한 북극곰과 같은 이미지가 대부분이었다. 학생들은 시청각 매체에서 본 장면을 정서와 결합하면서 이미지를 형성했다. 극지 문제 인식 측면에서 학생들은 공통적으로 생물과 자연 환경, 기후 변화에 관심이 많았지만, 학교급 및 진로 희망에 따라 관심 분야가 달랐다. 학생들은 극지 문제를 해결하는 주체로서 과학자의 위상을 높게 평가했으며, 극지 문제에 대해 실용적 가치보다는 세계 시민적 가치를 우선했다. 이상의 결과를 바탕으로 학교 교육과정에서 극지 내용 수용 및 체계화, 극지 과학자와 교육자의 협력에 의한 차별화된 학습 경험 마련, 여러 교과에 생성력 있는 빅아이디어 중심의 극지 소양 설정, 지구계 중심의 학습 접근법, 후속 연구의 방향 설정, 다양한 가치를 수용하는 과학 교육의 필요성 등을 시사점으로 제시했다.

선형모델을 이용한 방향성 조명하의 얼굴영상 정규화 (Normalization of Face Images Subject to Directional Illumination using Linear Model)

  • 고재필;김은주;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.54-60
    • /
    • 2004
  • 얼굴인식은 외관기반(appearance-based) 매칭기법으로 풀어야 할 문제 중의 하나이다. 그러나, 얼굴영상의 외관은 조명 변화에 매우 민감하다. 얼굴인식 성능을 향상시키기 위해서는 다양한 조명 아래에서 다양한 학습 데이타를 수집해야 하나, 실제로는 데이타 수집이 용이하지 않다. 따라서, 성능향상을 위해서 다양한 데이타를 학습시키는 것 보다 다양한 조건의 데이타를 정규화 하는 기법에 주목하는 것이 바람직하다. 본 논문에서는 방향성 조명 아래에서 취득한 얼굴영상을 정규화 할 수 있는 간단한 방법을 제안한다. 조명 문제는 얼굴인식 시스템에서 오류를 일으키는 가장 중요한 요인중 하나이다. 제안하는 방법을 ICR(illumination Compensation based on Multiple Linear Regression)이라 명명하였다. 본 방법에서는 다중회귀분석 모델을 사용하여 얼굴영상의 화소 밝기 갈 분포에 가장 잘 맞는 평면을 찾은 후 이 평면을 이용하여 얼굴영상을 정규화 한다. 제안하는 방법의 장점은 간단하고 실용적이며, 얼굴영상의 밝기 값 분포에 대한 평면 근사가 선형모델에 의해 수학적으로 정의된다는 점이다. 얼굴인식에서 제안하는 방법의 성능 향상을 보여주기 위해 공개 및 자체 구축 데이타 베이스에 대한 실험 결과를 제시한다. 실험 결과 두드러진 얼굴인식 성능 향상을 보여주었다.

은닉 마르코프 모델을 이용한 MPEG 압축 비디오에서의 점진적 변환의 검출 (Detection of Gradual Transitions in MPEG Compressed Video using Hidden Markov Model)

  • Choi, Sung-Min;Kim, Dai-Jin;Bang, Sung-Yang
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권3호
    • /
    • pp.379-386
    • /
    • 2004
  • 비디오 요약의 첫 걸음은 샷(shot) 변환의 검출이다. 이러한 샷 변환은 점진적인 변환과 급진적인 변환이 있다. 지금까지 급진적인 샷 변환은 이미 주어진 한계치나 연속된 두 프레임의 이미지에 기반을 둔 거리를 이용하여 검출하였고 점진적 변환 또한 일반적으로 한계치를 이용하여 검출하였다. 그러나 한계치에 따라 그 결과가 확연히 달라지고 또한 그 한계치를 정하는 것도 어려운 문제이다. 이 논문에서는 이런 문제의 해결과 MPEG 압축 비디오 상에서 점진적 변화의 검출뿐만 아니라 분류를 해결하는 방법을 제시하였다. 논문에서는 한계치를 사용하지 않은 은닉 마르코프 모델과 MPEG의 근사 DC 값을 이용하여 보다 빠르고 정확한 결과를 얻도록 하였다. 그리고 히스토그램의 차이뿐만 아니라 매크로 블록 (macro block)의 차이라 불리는 새로운 척도를 도입하여 보다 정확한 값을 얻도록 하였다. 은닉 마르코프 모델은 샷, 페이드(fade), 디졸브(dissolve), 컷(cut) 등의 4개의 상태를 갖게 하고 학습은 Baum-Welch 알고리즘으로 필요한 변수들을 추정하였다. 그리고 특정 벡터에 Viterbi 알고리즘을 적용하여 원하는 상태를 얻을 수 있다. 대부분의 실험 결과를 보면 새로 제안한 척도를 사용한 방법이 히스토그램의 차만을 이용한 방법보다 더 좋은 결과를 나타내었으며 이산적 마르코프 모델보다 연속적 마르코프 모델이 좋은 결과를 보여준다.