• 제목/요약/키워드: images of scientists

검색결과 503건 처리시간 0.029초

모멘트 정보와 표면거리 기반 다중 모달리티 의료영상 정합 (Multi-modality MEdical Image Registration based on Moment Information and Surface Distance)

  • 최유주;김민정;박지영;윤현주;정명진;홍승봉;김명희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권3_4호
    • /
    • pp.224-238
    • /
    • 2004
  • 다중 모달리티 영상정합은 서로 다른 성격의 두 영상의 중요정보를 결합하여 복합적 정보를 얻기 위해 널리 사용되는 영상처리 기법이다. 본 연구에서는 정합 대상 객체의 초기위치 및 방향에 종속적이지 않고, 낮은 정합오차 범위 내에서의 안정적인 정합을 지원하기 위하여 기존의 표면기반 정합 기법을 개선한 모멘트 정보 및 표면거리 기반의 정합 기법을 제시한다. 제안방법에서는 우선 정합대상객체의 표면 윤곽 점을 추출하고, 이를 기반으로 대상객체의 모멘트 정보를 추출하여, 표면거리 기반 상세 정합 이전에 모멘트 정보를 일치시키는 변환을 수행함으로써, 정합이전 대상객체의 위치 및 방향이 상이한 경우에 있어서도 정합이 안정적으로 수행되도록 한다. 또한 테스트 영상에 대한 표면 대표점 추출 시, 표면 코너추출법을 적용함으로써, 기존 표면 정보 기반 정합기법에서 일반적으로 사용하고 있는 무작위 샘플링 및 일정간격 샘플링에 의한 취약점을 보완한다. 본 논문에서 제안기법의 검증을 위하여 뇌 부위 자기공명단층영상(MRI)과 양자 방출 단층 촬영 영상(PET)을 적용하고, 정합오류율과 정합결과에 대한 2,3차원 가시화 영상의 육안평가를 통하여 정확성 및 안정성 측면을 검증한다.

컬러와 에지정보를 결합한 조명변화에 강인한 얼굴영역 검출방법 (A New Face Detection Method using Combined Features of Color and Edge under the illumination Variance)

  • 지은미;윤호섭;이상호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.809-817
    • /
    • 2002
  • 본 논문은 온라인 얼굴 인식에서 전처리에 해당하는 얼굴 검출방법을 다룬다. 기존의 얼굴 검출 방법에서 에지 정보만을 이용한 얼굴 검출 방법과 컬러 정보를 이용한 얼굴 검출 방법의 단점을 상호 보완하기 위해 본 연구에서는 에지 정보와 컬러 정보를 결합한 얼굴 검출 방법 및 중심 영역 컬러 샘플링을 이용한 얼굴 검출방법을 개발하였다. 즉, 사람의 얼굴 영역이 비슷한 컬러를 가진 배경 영역과 결합(Merge)되는 것을 막기 위해 먼저 적응형 에지 검출 알고리즘을 수행하여 배경과 얼굴 영역을 각각의 고립 영역으로 분할한다. 제안된 적응형 소벨(Sobel) 에지 검출기는 배경 영역과 얼굴 영역의 경계에서 항상 에지가 발생할 수 있도록 에지가 많이 검출되고 입력 영상의 밝기 변화에 강인하다. 이로 인해 얼굴 영역이 하나의 영역이 아닌 여러 영역으로 분할되어 나타날 수 있으므로, 각 영역들의 컬러 정보를 이용해 병합한 후, 최종 얼굴 영역을 MBR(minimum bounding rectangle) 형태로 검출하였다. 이때 병합된 최종 얼굴 영역 후보가 너무 크거나 혹은 너무 작으면, 중심 영역 샘플링 방법을 이용해 다시 얼굴 영역을 검출한다. 총 2100장의 얼굴 영상 데이터베이스를 통해 실험한 결과 본 연구에서 제안한 방법을 사용해 96.3%의 높은 얼굴 영역 검출 성공률을 얻을 수 있었다.

모빌의 디지털 재현 (Digital Reproduction of Mobiles)

  • 이동춘;이남경;정대현;김창태;이동규;배희정;백낙훈;이종원;유관우
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권9호
    • /
    • pp.415-423
    • /
    • 2001
  • 최근에는 회화과 같은 미술 작품들을 디지털 형태로 재현하려는 시도들이 활발해지고 있다. 디지털 형태로 재현된 회화 작품들은 저장하거나 전송하기에 편리한 장점을 가진다. 반면에 알렉산터 칼더(Alexander Calder)가 창시한 모빌, 즉 움직이는 조각은 그 특성상 기존의 방법으로는 컴퓨터에서 재현하기가 까다롭다. 모빌은 바람과 같은 외부의 힘에 의해 각각의 조각이 움직이도록 제작되어 있으므로, 사진이나, 정지 영상과 같은 고정된 형태로는 작가의 제작 의도를 충분히 전달하기에 미흡하다. 본 논문에서는 컴퓨터상에서 재현된 모빌을 사용자들이 사실적으로 감상할 수 있는 물리 기반의 가상 모빌 시스템을 제안한다. 실세계의 모빌을 3차원 모델로 구성한 후, 가상의 바람을 생성하여 그 모빌이 움직일 수 있도록 하였다. 모빌의 움직임을 운동학 방법들을 사용하여 사실적으로 표현한다. 기존의 제약조건을 가지는 동역학(Donstraint dynamics)방법과 충격역학(impulse dynamics)방법들을 모빌의 구조에 적합하도록 개선하여, 모빌의 움직임을 PC 환경에서 대화형으로 재현하였다. 본 논문에서는 제안하는 속도 향상 방법들을 모빌과 유사한 위상 구조를 가지는 3차원 모델에서도 적용 될 수 있다.

  • PDF

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

움직이는 평면거울을 이용한 3차원 물체 복원 (3D Reconstruction using a Moving Planar Mirror)

  • 장경호;이동훈;정순기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1543-1550
    • /
    • 2004
  • 영상 열을 이용한 3차원 구조 복원 기법은 기하학 기반의 전통적인 3차원 모델링 기법의 대안으로 복잡한 대규모 장면을 쉽고 빠르게 모델링 할 수 있는 효과적인 수단이다. 이러한 모델은 모션을 통한 구조 복원기법을 통해 주로 얻어진다. 그러나 모션을 통한 구조복원 기법은 매우 복잡한 기하학 구조와 현란한 컬러를 포함한 물체의 경우, 적용하기에 어려움이 있다. 이러한 어려움을 해결하기 위해, 본 논문에서는 움직이는 평면거울 기반의 새로운 물체 복원 기법을 제안한다. 본 기법은 장면에 포함된 기하구조의 암묵적인 단서를 이용하는 대신 장면 속에 기하학적 단서 즉, 거울의 위치 정보를 강제로 삽입하여 가상 카메라의 위치 정보를 추출한다 구해진 가상 카메라의 위치 정보를 통해 장면의 복잡도에 무관한 3차원 기하 구조를 복원할 수 있다. 이를 위해 먼저 복원하고자 하는 장면을 포함한 평면거울의 영상 열을 포착한다. 다음으로 거울의 위치 정보를 이용하여 가상 카메라의 내, 외부 파라미터를 추정한다. 구해진 카메라 파라미터는 거울의 위치 정보 추출 시 발생하는 에러를 포함하고 있기 때문에 영상 열에 존재하는 코너점들의 대응관계를 이용하여 재 보정한다 마지막으로 구해진 가상 카메라의 내부 및 외부 파라미터 정보를 통해 3차원의 구조를 복원한다 본 논문에서 제안한 알고리즘을 다양한 영상을 통해 실험한 결과 신뢰할만한 구조 복원이 가능하였다.

이동 프로젝터 투사영역의 폐회로 기반 위치추적에 의한 인터랙티브 투사 (Interactive Projection by Closed-loop based Position Tracking of Projected Area for Portable Projector)

  • 박지영;이선민;김명희
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.29-38
    • /
    • 2010
  • 본 연구에서는 영상을 대형으로 디스플레이 함과 동시에 사용자가 보다 세밀하게 관찰하고자하는 관심영역을 이동 프로젝터로 투사함으로써 개선된 해상도와 밝기로 디스플레이 하는 인터랙티브 투사 기법을 제안한다. 사용자는 이동 프로젝터를 들고 움직이며 관심영역의 위치를 변경하게 되는데 이 때 적절히 투사영상을 업데이트하기 위해 폐회로(closed-loop) 기반 추적 방법을 제안한다. 먼저 대형 디스플레이 영상에 이동 프로젝터의 위치를 나타내는 표시자를 삽입하고 이를 이동 프로젝터에 부착된 카메라로 획득한 연속영상에서 추출한다. 표시자의 중심이 항상 카메라 영상의 중심과 일치하도록 하는 제약조건 하에서 이를 만족시키기 위해 대형 디스플레이 상에서 표시자의 위치를 지속적으로 업데이트 한다. 이렇게 계산된 표시자의 위치에 해당하는 사각형 영역을 이동 프로젝터가 투사하게 되며 이때 카메라와 이동 프로젝터 사이의 투사변환을 적용하여 와핑한다. 표시자 분할은 총 네 단계로 이루어지며 카메라 영상에 대해 HSI 기반 전처리, 직선 탐지, 사각형 조건 검사, 교차비(cross-ratio) 검사를 거쳐 최종 네 개의 코너점이 결정된다. 제안된 투사 기법을 적용하여 구현한 인터랙티브 투사 시스템은 약 24fps의 처리속도를 지원하며 사용자 평가 결과 높은 유용성을 나타냈다.

멀티모달 개념계층모델을 이용한 만화비디오 컨텐츠 학습을 통한 등장인물 기반 비디오 자막 생성 (Character-based Subtitle Generation by Learning of Multimodal Concept Hierarchy from Cartoon Videos)

  • 김경민;하정우;이범진;장병탁
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.451-458
    • /
    • 2015
  • 기존 멀티모달 학습 기법의 대부분은 데이터에 포함된 컨텐츠 모델링을 통한 지식획득보다는 이미지나 비디오 검색 및 태깅 등 구체적 문제 해결에 집중되어 있었다. 본 논문에서는 멀티모달 개념계층모델을 이용하여 만화 비디오로부터 컨텐츠를 학습하는 기법을 제안하고 학습된 모델로부터 등장인물의 특성을 고려한 자막을 생성하는 방법을 제시한다. 멀티모달 개념계층 모델은 개념변수층과 단어와 이미지 패치의 고차 패턴을 표현하는 멀티모달 하이퍼네트워크층으로 구성되며 이러한 모델구조를 통해 각각의 개념변수는 단어와 이미지패치 변수들의 확률분포로 표현된다. 제안하는 모델은 비디오의 자막과 화면 이미지로부터 등장 인물의 특성을 개념으로서 학습하며 이는 순차적 베이지안 학습으로 설명된다. 그리고 학습된 개념을 기반으로 텍스트 질의가 주어질 때 등장인물의 특성을 고려한 비디오 자막을 생성한다. 실험을 위해 총 268분 상영시간의 유아용 비디오 '뽀로로'로부터 등장인물들의 개념이 학습되고 학습된 모델로부터 각각의 등장인물의 특성을 고려한 자막 문장을 생성했으며 이를 기존의 멀티모달 학습모델과 비교했다. 실험결과는 멀티모달 개념계층모델은 다른 모델들에 비해 더 정확한 자막 문장이 생성됨을 보여준다. 또한 동일한 질의어에 대해서도 등장인물의 특성을 반영하는 다양한 문장이 생성됨을 확인하였다.

평면대수곡선을 기반으로 한 스테레오 비젼 (Stereo Vision based on Planar Algebraic Curves)

  • 안민호;이정림
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.50-61
    • /
    • 2000
  • 최근 원추곡선에 기반한 스테레오 비젼에 대한 연구가 주목을 받고 있는데, 이는 원추곡선이 행렬표현, 대응관계설정의 용이성, 그리고 실세계에서 쉽게 찾을 수 있다는 좋은 성질을 갖는다는 점에서 당연한 현상이라 여겨진다. 하지만, 일반적인 고차의 대수곡선에 대한 확장은 아직 성공적으로 이루어지지 못하고 있는 실정이다. 기약인 대수곡선 (irreducible algebraic curve)은 실세계에서 많지 않지만, 직선과 원추곡선은 무수히 많고, 따라서 이들의 곱으로 주어지는 높은 차수의 대수곡선도 무수히 많다. 본고에서는 2이상의 임의의 차수를 가지는 대수곡선을 calibration된 두 대의 카메라를 가지고 스테레오 문제를 푼다. 대응관계설정과 복원, 두 가지 문제 모두에 대한 closed form solution을 제시한다. $f_1,\;f_2,\;{\pi}$를 각각 두 이미지 곡선, 공간상의 평면이라 하고, $VC_P(g)$를 평면곡선 g와 점 P로 만들어지는 원추곡선이라 하면, $VC_{O1}(f_1)\;=\;VC_{O1}(VC_{O2}(f_2)\;∩\;{\pi})$ 의 관계를 이용하여 미지수인 평면 ${\pi}$의 계수들, $d_1,\;d_2,\;d_3$에 대한 다항 방정식들을 얻을 수 있다. 약간의 변형을 통하여 $d_1$에 대한 다항 방정식을 얻을 수 있고, 이 방정식의 유일한 양수해는 나머지 과정에서 매우 중요한 역할을 한다. 그 이후에는 $O(n^2)$개의 일변수 다항식에 대한 계산만으로 모든 스테레오 문제를 해결한다. 이는 과거의 여러 개의 다변수 다항식의 공통근을 구해야 했던 방법에 비교된다. synthetic 데이터와 실제 이미지에 대한 실험은 우리의 알고리듬이 옳음을 보여준다.

  • PDF

시계열 이동평균 변환을 이용한 노이즈 제어 윤곽선 이미지 매칭 (Noise Control Boundary Image Matching Using Time-Series Moving Average Transform)

  • 김범수;문양세;김진호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.327-340
    • /
    • 2009
  • 본 논문에서는 윤곽선 이미지 매칭에서 노이즈 제거 정도를 제어하기 위해 시계열 매칭의 이동평균 변환을 이용한다. 이동평균 변환을 윤곽선 이미지 매칭에 적용하게 된 동기는 이동평균 변환이 시계열의 노이즈를 감소시키므로, 이를 사용하면 윤곽선 이미지 매칭에서도 노이즈 제어 효과를 얻을 수 있을 것이라는 직관에 기반한다. 본 논문에서는 우선 윤곽선 이미지 매칭에 이동평균 변환을 적용한 $\kappa$-계수 이미지 매칭($\kappa$-order image matching)을 제안한다. 제안한 $\kappa$-계수 이미지 매칭은 윤곽선 이미지가 변환된 시계열에 $\kappa$-이동평균 변환을 적용하여 시계열(이미지) 간의 유사성을 판단한다. 다음으로, 대용량 이미지 데이터베이스를 대상으로 $\kappa$-계수 이미지 매칭을 수행하기 위한 인덱스 기반 매칭 방법을 제안하고, 그 정확성을 정형적으로 증명한다. 또한, 계수 $\kappa$와 매칭 결과와의 관계를 정형적으로 분석하고, 이에 기반하여 계수 $\kappa$를 변화시키면서 노이즈 제거 정도를 제어하는 방안을 제시한다. 실험 결과, $\kappa$-계수 이미지 매칭이 노이즈 제거 효과를 가짐을 확인하였으며, 제안한 인덱스 기반 매칭 방법은 순차 스캔에 비해 수 배 에서 수십 배 빠른 성능을 보이는 것으로 나타났다.

모바일 멀티모달 센서 정보의 앙상블 학습을 이용한 장소 인식 (Place Recognition Using Ensemble Learning of Mobile Multimodal Sensory Information)

  • 이충연;이범진;온경운;하정우;김홍일;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.64-69
    • /
    • 2015
  • 본 논문에서는 시각, 음향, 위치 정보를 포함하는 멀티모달 센서 입력 정보로부터 사용자가 위치한 장소의 환경 정보를 학습하고 기계학습 추론을 통해 장소를 인식하는 방법을 제안한다. 이 방법은 음영 지역에서의 정확도 감소나 추가 하드웨어 필요 등 기존 위치 정보 인식 방법이 가지는 제약을 극복 가능하고, 지도상의 단순 좌표 인식이 아닌 논리적 위치 정보 인식을 수행 가능하다는 점에서 해당 위치와 관련된 특정 정보를 활용하여 다양한 생활편의를 제공하는 위치 기반 서비스를 수행하는데 보다 효과적인 방법이 될 수 있다. 제안하는 방법에서는 스마트폰에 내장된 카메라, 마이크로폰, GPS 센서 모듈로부터 획득한 시각, 음향, 위치 정보로부터 특징 벡터들을 추출하여 학습한다. 이때 서로 다른 특성을 가진 특징 벡터들을 학습하기 위해 각각의 특징 벡터들을 서로 다른 분류기를 통해 학습한 후, 그 결과를 기반으로 최종적인 하나의 분류 결과를 얻어내는 앙상블 기법을 사용한다. 실험 결과에서는 각각의 데이터를 따로 학습하여 분류한 결과와 비교하여 높은 성능을 보였다. 또한 사용자 상황인지 기반 서비스의 성능 향상을 위한 방법으로서 제안하는 모델의 스마트폰 앱 구현을 통한 활용 가능성에 대해 논의한다.