• 제목/요약/키워드: 다중 특징 결합

검색결과 125건 처리시간 0.023초

영화 비디오 자막 추출 및 추출된 자막 이미지 향상 방법 (Methods for Video Caption Extraction and Extracted Caption Image Enhancement)

  • 김소명;곽상신;최영우;정규식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.235-247
    • /
    • 2002
  • 디지털 비디오 영상을 효과적으로 색인하고 검색하기 위해서 비디오의 내용을 함축적으로 표현하고 있는 비디오 자막을 추출하여 인식하는 연구가 필요하다. 본 논문에서는 압축되지 않은 비디오 영화 영상에 인위적으로 삽입한 한글 및 영어 자막을 대상으로 자막 영역을 추출하고, 추출된 자막 이미지를 향상시키는 방법을 제안한다. 제안한 방법의 특징은 동일한 내용의 자막을 갖는 프레임들의 위치를 자동으로 찾아서 동일 자막 프레임들을 다중 결합하여 배경에 포함되어 있는 잡영의 일부 또는 전부를 우선 제거한다. 또한, 이 결과 이미지에 해상도 중대, 히스토그램 평활화, 획 기반 이진화, 스무딩의 이미지 향상 방법을 단계적으로 적용하여 인식 가능한 수준의 이미지로 향상시킨다. 제안한 방법을 비디오 영상에 적용하여 동일한 내용의 자막 그룹 단위로 자막 이미지를 추출하는 것이 가능해졌으며, 잡영이 제거되고 복잡한 자소의 획이 보존된 자막 이미지를 추출할 수 있었다. 동일한 내용의 자막 프레임의 시작 및 글위치를 파악하는 것은 비디오 영상의 색인과 검색에 유용하게 활용될 수 있다. 한글 및 영어 비디오 영화 자막에 제안한 방법을 적용하여 향상된 문자 인식 결과를 얻었다.

다중점 적합성 피드백방법을 이용한 영역기반 이미지 유사성 검색 (Region Based Image Similarity Search using Multi-point Relevance Feedback)

  • 김덕환;이주홍;송재원
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.857-866
    • /
    • 2006
  • 질의 이미지의 시각적 특징이 사용자의 상위 수준 개념을 잘 표현하지 못하기 때문에 이미지 검색 시스템의 성능은 보통 매우 낮다. 의미적으로 유사한 이미지들이 매우 다른 시각적 특징을 보일 수도 있으며 따라서 여러 개의 군집에 분산될 수 있다. 본 논문에서는 영역기반 이미지 검색과 군집-합병을 이용한 새로운 적합성 피드백 방법을 결합한 내용기반 이미지 검색 방법을 제안한다. 주요 목표는 의미적 차이를 줄이기 위해 의미적으로 관련된 군집들을 찾는 것이다. 제안된 방법은 영역기반 군집 과정과 군집-합병 과정으로 이루어진다. 적합한 이미지들의 모든 분할된 영역들을 의미적으로 관련된 계층적인 군집으로 구성한다. 잠재된 군집의 개수를 결정하고 근접한 군집들을 합병한 후 최종 군집의 대표점들로 다중 질의를 표현한다. 군집-합병 과정에서 군집의 개수를 찾고 고차원에서 특이점 문제를 해결하기 위하여 호텔링의 $T^2$ 대신에 v개의 주성분을 이용하는 $T_v^2$를 적용하였으며 $T^2$의 성능과 $T_v^2$의 성능의 차이가 없음을 보인다. 실험 결과는 제안된 방법이 내용기반 이미지 검색 시스템의 성능을 개선하는 데 효율적임을 보여준다.

모멘트 정보와 표면거리 기반 다중 모달리티 의료영상 정합 (Multi-modality MEdical Image Registration based on Moment Information and Surface Distance)

  • 최유주;김민정;박지영;윤현주;정명진;홍승봉;김명희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권3_4호
    • /
    • pp.224-238
    • /
    • 2004
  • 다중 모달리티 영상정합은 서로 다른 성격의 두 영상의 중요정보를 결합하여 복합적 정보를 얻기 위해 널리 사용되는 영상처리 기법이다. 본 연구에서는 정합 대상 객체의 초기위치 및 방향에 종속적이지 않고, 낮은 정합오차 범위 내에서의 안정적인 정합을 지원하기 위하여 기존의 표면기반 정합 기법을 개선한 모멘트 정보 및 표면거리 기반의 정합 기법을 제시한다. 제안방법에서는 우선 정합대상객체의 표면 윤곽 점을 추출하고, 이를 기반으로 대상객체의 모멘트 정보를 추출하여, 표면거리 기반 상세 정합 이전에 모멘트 정보를 일치시키는 변환을 수행함으로써, 정합이전 대상객체의 위치 및 방향이 상이한 경우에 있어서도 정합이 안정적으로 수행되도록 한다. 또한 테스트 영상에 대한 표면 대표점 추출 시, 표면 코너추출법을 적용함으로써, 기존 표면 정보 기반 정합기법에서 일반적으로 사용하고 있는 무작위 샘플링 및 일정간격 샘플링에 의한 취약점을 보완한다. 본 논문에서 제안기법의 검증을 위하여 뇌 부위 자기공명단층영상(MRI)과 양자 방출 단층 촬영 영상(PET)을 적용하고, 정합오류율과 정합결과에 대한 2,3차원 가시화 영상의 육안평가를 통하여 정확성 및 안정성 측면을 검증한다.

3차원 객체 탐지를 위한 어텐션 기반 특징 융합 네트워크 (Attention based Feature-Fusion Network for 3D Object Detection)

  • 유상현;강대열;황승준;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제27권2호
    • /
    • pp.190-196
    • /
    • 2023
  • 최근 들어, 라이다 기술의 발전에 따라 정확한 거리 측정이 가능해지면서 라이다 기반의 3차원 객체 탐지 네트워크에 대한 관심이 증가하고 있다. 기존의 네트워크는 복셀화 및 다운샘플링 과정에서 공간적인 정보 손실이 발생해 부정확한 위치 추정 결과를 발생시킨다. 본 연구에서는 고수준 특징과 높은 위치 정확도를 동시에 획득하기 위해 어텐션 기반 융합 방식과 카메라-라이다 융합 시스템을 제안한다. 먼저, 그리드 기반의 3차원 객체 탐지 네트워크인 Voxel-RCNN 구조에 어텐션 방식을 도입함으로써, 다중 스케일의 희소 3차원 합성곱 특징을 효과적으로 융합하여 3차원 객체 탐지의 성능을 높인다. 다음으로, 거짓 양성을 제거하기 위해 3차원 객체 탐지 네트워크의 탐지 결과와 이미지상의 2차원 객체 탐지 결과를 결합하는 카메라-라이다 융합 시스템을 제안한다. 제안 알고리즘의 성능평가를 위해 자율주행 분야의 KITTI 데이터 세트를 이용하여 기존 알고리즘과의 비교 실험을 수행한다. 결과적으로, 차량 클래스에 대해 BEV 상의 2차원 객체 탐지와 3차원 객체 탐지 부분에서 성능 향상을 보였으며 특히 Voxel-RCNN보다 차량 Moderate 클래스에 대하여 정확도가 약 0.47% 향상되었다.

공유 레이저 광원 및 LED 광원을 이용한 WDM-PON 시스템에 관한 연구 (A Study on the WDM-PON System Using Shared Laser and LED Light Sources)

  • 이용기;이영호;박봉근
    • 한국통신학회논문지
    • /
    • 제25권4A호
    • /
    • pp.573-578
    • /
    • 2000
  • 본 논문은 공유 레이저 광원 및 LED 광원을 이용하는 WDM-PON 구조의 새로운 광 가입자 전송시스템을 제안하고, 제안된 시스템의 타당성을 실험적 시뮬레이션을 통해 고찰하였다. 본 시스템은 고속의 하향전송을 위해서는 공유 레이저 광원을 외부변조하여 이용하는 방식을 채택하였고, 상향전송을 위해서는 LED광원을 직접변조하여 이용하는 구조로 되어 있다. 광 선로구간에서의 파장다중화를 위해서는 채널 결합 및 분기기능을 갖는 AWG(Arrayed Wave-guide Grating) 소자를 이용하였다. 본 연구에서 제안한 전송시스템의 특징은 저가로 시스템을 구현 할 수 있다는 것이다. 이는 하향전송에 대해서는 안정된 고가의 레이저 광원을 공유함으로써 가능하고, 상향전송에는 동일한 LED 광원을 이용함으로써 WDM-PON을 위한 광 송수신장치(ONU; Opticla Network Unit)의 광원 안정화 및 규격화가 쉬워짐에 따라 대량생산을 통한 저가 구현이 가능하다. 본 시스템의 기술적 타당성을 입증하기 위하여 전송속도가 2.5Gbps인 하향전송과 51.84, 155.52 및 622.08Mbps인 상향전송에 대한 시뮬레이션을 실시하였고, 상하향 각 전송속도에 있어서 잘 동작됨을 확인하였다.

  • PDF

오디오와 이미지의 다중 시구간 정보와 GAN을 이용한 영상의 하이라이트 예측 알고리즘 (Video Highlight Prediction Using GAN and Multiple Time-Interval Information of Audio and Image)

  • 이한솔;이계민
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.143-150
    • /
    • 2020
  • 최근 다양한 매체를 통해 폭발적인 양의 콘텐츠가 업로드 되고 있으며 그 가운데 게임과 스포츠 영상은 상당한 비율을 차지한다. 방송사에서는 시청자 편의를 위해 경기 영상 중 흥미를 끄는 장면을 모아 하이라이트 영상을 만들어 제공한다. 그러나 이는 시간과 비용이 많이 소요되는 문제가 있다. 본 논문에서는 게임과 스포츠 경기에서 자동으로 하이라이트를 예측하는 모델을 제안한다. 기존의 방법들이 이미지 정보만을 주로 이용하는데 반해 우리는 오디오와 이미지 정보를 함께 사용하며, 영상의 단기적 전후관계와 중장기적 흐름을 동시에 파악하는 방법을 제시한다. 또한 더 좋은 특징벡터를 찾아내기 위해 GAN을 결합한 모델을 설명한다. 제안하는 모델들은 e스포츠 경기 영상과 야구 경기 영상을 이용하여 평가한다.

프로파일기반의 FLD와 단계적 분류를 이용한 감성 인식 기법 (Emotion Recognition Method Using FLD and Staged Classification Based on Profile Data)

  • 김재협;오나래;전갑송;문영식
    • 전자공학회논문지CI
    • /
    • 제48권6호
    • /
    • pp.35-46
    • /
    • 2011
  • 본 논문에서는 피셔 선형 분리(FLD, Fisher's Linear Discriminant) 기반의 단계적 분류를 이용한 감성 인식 기법을 제안한다. 제안하는 기법은 2종 이상의 감성에 대한 다중 클래스 분류 문제에 대하여, 이진 분류 모델의 연속적인 결합을 통해 단계적 분류 모델을 구성함으로써 복잡도 높은 특징 공간상의 다수의 감성 클래스에 대한 분류 성능을 향상시킨다. 이를 위하여, 각 계층 단계의 학습에서는 감성 클래스들로 이루어진 두 개의 클래스 그룹에 따라 피셔 선형분리 공간을 구성하며, 구성된 공간상에서 Adaboost 방식을 이용하여 이진 분류 모델을 학습하여 생성한다. 각 계층 단계의 학습 과정은 모든 감성 클래스가 구분이 완료되는 시점까지 반복 수행된다. 본 논문에서는 MIT 생체 신호 프로파일을 이용하여 제안하는 기법을 실험하였다. 실험 결과, 8종의 감성에 대한 분류 실험을 통해 약 72%의 분류 성능을 확인하였고, 특정 3종의 감성에 대한 분류 실험을 통해 약 93% 분류 성능을 확인하였다.

UFMC 시스템에서 모바일 장치의 이동속도에 대한 성능평가 (Performance Evaluation for Speed of Mobile Devices in UFMC Systems)

  • 이규섭;최진규
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.53-58
    • /
    • 2017
  • UFMC(Universal Filtered Multi Carrier)는 새로운 종류의 다중 반송파 전송 기술로 OFDM을 대체하는 것을 목표로 하고 있는 5세대 무선 통신 시스템의 하나이다. 이것은 OFDM(Orthogonal Frequency Division Modulation)과 FBMC(Filter Bank Multi Carrier)의 장점을 결합하고 주요한 단점은 피한 두 시스템의 일반화된 모델이라 할 수 있다. UFMC는 기존의 CP-OFDM(Cyclic Prefix-OFDM)에 비해 시간-주파수 불일치와 같은 동기화 조건에 대하여 비교적 강인한 특징을 갖는다. 또한 5G 시스템 M2M(Machine to Machine) 전송과 같이 burst uplink 전송에 적합하다. 이 논문에서 우리는 다양한 채널 상황과 이동속도의 변화에 따른 UFMC의 BER(Bit Error Rate)성능 변화에 대하여 분석 하였다. 시뮬레이션 결과 모바일 장치의 이동 속도가 높을수록 낮은 BER성능을 확인 할 수 있었고 채널 상황이 좋을수록 속도에 대하여 민감하였다.

항공 카메라 검정을 위한 테스트 필드 구축방안 (Establishment of Test Field for Aerial Camera Calibration)

  • 이재원;윤종성;신진수;윤부열
    • 대한공간정보학회지
    • /
    • 제16권2호
    • /
    • pp.67-76
    • /
    • 2008
  • 최근 항공측량분야의 가장 큰 기술적 특징은 Camera 혹은 Lidar와 같은 주 센싱 장비에 GPS, IMU 등 다양한 위치결정 센서를 연계한 Direct Georeferencing 기술의 활용이다. 아울러 항측용 디지털 카메라의 기술적 우월성과 이의 활용성이 입증됨에 따라 다양한 종류의 항측용 디지털 카메라가 개발 및 보급되고 있다. 이에 부응하여 국내에서도 일반적인 항공촬영으로는 취득이 불가능한 건물측면과 비고가 큰 지형에서 발생하는 사각지역에 대하여도 3차원 정보취득과 Texture Mapping이 가능한 다각(Multi-looking)항공촬영시스템의 개발이 시도되고 있다. 하지만 다양한 센서 결합과 다중 카메라의 배열에 따른 센서들간의 시각동기화와 함께 정확한 기하 및 복사보정을 실시해야 하는 문제점이 따른다. 이를 해결하기 위해서는 항공측량 시스템의 센서검정(Sensor Calibration)에 필요한 테스트 필드가 절실히 요구되고 있다. 따라서 본 연구에서는 항공측량용 테스트 필드 구축과 관련한 국외 사례를 고찰하고 국내 테스트 필드 구축방안을 제시하고자 한다.

  • PDF

이동통신환경에서의 소규모 그룹통신을 위한 XMIP 프로토콜의 구현 (An Implementation of Explicit Multicast with Mobile IP for Small Group Communications in Mobile Networks)

  • 박인수;박용진
    • 정보처리학회논문지C
    • /
    • 제12C권2호
    • /
    • pp.267-280
    • /
    • 2005
  • 본 논문에서는 다세션 소규모 멀티캐스트 통신을 위해 제안된 Explicit Multicast 전송방식과 IETF Mobile W를 효과적으로 결합한 XMIP 프로토콜을 구현하고 검증한다. Xcast 패킷 헤더 내에 목적지 주소들을 소스 노드가 명시하여 Xcast 네트워크로 전송하면 각 Xcast 라우터는 멀티캐스트 트리의 지원없이도 유니캐스트 라우팅 정보만을 기초로 목적지를 향해 경로설정과 전송을 수행한다. XMIP 프로토콜은 이러한 Explicit Multicast 프로토콜의 특징을 상속받아 상태유지의 필요없이 유니캐스트 라우팅 테이블을 기반으로 하므로 전송방식이 명확하고 단순하다. 본 연구에서는 Xcast 네트워크와 IETF Mobile IP의 연동을 함께 고려해서 Mobile IP의 이동 에이젼트인 HA/FA를 수정 보완하여 HA+/FA+로 각각 확장한다. HA+로 전송된 Xcast 패킷은 Mobile IP 바인딩 테이블을 참조하여 각 FA+로 향하는 X-in-X 터널 인터페이스를 통해 전송된다. 이 메커니즘으로 IETF Mobile IP 멀티캐스트 트래픽 집중 문제를 효과적으로 해결할 수 있다. 마지막으로 무선랜기반 실험망을 구축하고, Xcast 응용으로서 다중 사용자를 위한 인스턴트 메신져를 개발하고 실험하므로써 최종 개발한 XMIP/Xcast 프로토콜의 실효성을 검증한다.