• 제목/요약/키워드: performance video

검색결과 2,476건 처리시간 0.034초

Research on Local and Global Infrared Image Pre-Processing Methods for Deep Learning Based Guided Weapon Target Detection

  • Jae-Yong Baek;Dae-Hyeon Park;Hyuk-Jin Shin;Yong-Sang Yoo;Deok-Woong Kim;Du-Hwan Hur;SeungHwan Bae;Jun-Ho Cheon;Seung-Hwan Bae
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권7호
    • /
    • pp.41-51
    • /
    • 2024
  • 본 논문에서는 적외선 이미지에서 딥러닝 물체 탐지를 사용하여 유도무기의 표적 탐지 정확도 향상 방법을 연구한다. 적외선 이미지의 특성은 시간, 온도 등의 요인에 의해 영향을 받기 때문에 모델을 학습할 때 다양한 환경에서 표적 객체의 특징을 일관되게 표현하는 것이 중요하다. 이러한 문제를 해결하는 간단한 방법은 적절한 전처리 기술을 통해 적외선 이미지 내 표적 객체의 특징을 강조하고 노이즈를 줄이는 것이다. 그러나, 기존 연구에서는 적외선 영상 기반 딥러닝 모델 학습에서 전처리기법에 관한 충분한 논의가 이루어지지 못했다. 이에, 본 논문에서는 표적 객체 검출을 위한 적외선 이미지 기반 훈련에 대한 이미지 전처리 기술의 영향을 조사하는 것을 목표로 한다. 이를 위해 영상과 이미지의 전역(global) 또는 지역(local) 정보를 활용한 적외선 영상에 대한 전처리인 Min-max normalization, Z-score normalization, Histogram equalization, CLAHE (Contrast Limited Adaptive Histogram Equalization)에 대한 결과를 분석한다. 또한, 각 전처리 기법으로 변환된 이미지들이 객체 검출기 훈련에 미치는 영향을 확인하기 위해 다양한 전처리 방법으로 처리된 이미지에 대해 YOLOX 표적 검출기를 학습하고, 이에 대한 분석을 진행한다. 실험과 분석을 통해 전처리 기법들이 객체 검출기 정확도에 영향을 미친다는 사실을 알게 되었다. 특히, 전처리 기법 중에서도 CLAHE 기법을 사용해 실험을 진행한 결과가 81.9%의 mAP (mean average precision)을 기록하며 가장 높은 검출 정확도를 보임을 확인하였다.

청소년 자녀와 부모간 의사소통 개선을 위한 교수학습 과정안과 실제 상황적 수행평가 개발 및 적용 - 부모자녀의 실제대화 UCC동영상을 활용한 대화분석을 토대로 - (Development and application of a Teaching and Learning Plan and Practical Performance Assessment Tools to Promote Communication Between Teenagers Children and Their Parents: focusing on conversation analysis of real conversation in UCC video projects)

  • 유혜정;조병은
    • 한국가정과교육학회지
    • /
    • 제23권3호
    • /
    • pp.139-160
    • /
    • 2011
  • 본 연구는 청소년 자녀와 부모가 함께 한 실제 상황의 의사소통 훈련이 실생활의 의사소통 능력에 미치는 효과를 알아보고자 하였다. 또한, 대화분석방법을 활용하여 이들의 대화구조와 과정을 밝히고 의사소통 문제점과 이를 개선한 사례를 제시하여 효과적인 의사소통 전략을 탐색하고자 했다. 이를 위해 중학교 기술 가정 교과 '가족의 의사소통' 단원에 적용할 수 있는 4차시의 교수학습 과정안 및 UCC제작을 활용한 실제 상황적 수행평가를 개발하고 실험집단과 비교집단으로 나누어 적용하였다. 실험집단에는 실제 가정생활에서의 부모-자녀 간 의사소통 훈련을 수행과제로 제시하고 비교집단에는 수업 중 학습활동을 통한 훈련만 제시하며, 수업 및 사전, 사후 수행과제를 동일하게 제시하였다. 연구 대상은 중학교 1학년으로 실험집단은 4학급 149명, 비교집단은 4학급 147명의 총 8학급 296명과 그의 부모이다. 실생활에서 부모자녀간 의사소통 능력과 관계정도를 알아보기 위해 사전과 사후의 설문지와 부모자녀간 실제대화를 분석한 연구 결과는 다음과 같다. 첫째, 양적연구 결과에서 부모님과 함께 의사소통 훈련을 실천하여 실제 상황적 수행평가를 수행한 실험집단이 학습상황에서 훈련한 비교집단보다 부/모에 대한 대화시간이 늘었고, 기능적 의사소통 능력이 향상되었으며, 관계 만족도가 증가한 결과를 보였다. 둘째, 대화분석한 결과, 부모자녀의 의사소통 걸림돌 사용은 실험집단이 비교집단보다 줄고, 긍정적 요소는 실험집단이 비교집단 보다 증가하여 실험집단의 의사소통 개선 효과가 유의미하게 높았다. 특히, 무패법(갈등해결법)을 통한 의사소통 문제 해결 사례는 실험집단이 70%, 비교집단이 43.3%로 갈등 해소에도 효과적이었다. 셋째, 두 집단 모두 부모가 자녀보다 약 3배 이상 많은 의사소통 걸림돌을 사용하고 있었으며, 부모는 훈계, 강의, 비난, 빈정대기, 명령 외에 다양했고, 자녀는 논쟁과 회피, 비난, 강요(떼쓰기) 순서로 나타났다. 대화과정에서의 의사소통 문제점은 자녀의 회피적, 반항적 말투가 부모의 역기능적 의사소통을 더욱 부추겨서 자녀 대 부모의 반응으로 회피 대 훈계 명령 캐묻기, 논쟁 대 비난 논쟁, 강요 대 명령, 비난 대 비난 빈정대기 등의 경향이 나타났다. 넷째, 학생들의 평가결과 실제 상황적 수행평가가 효과적인 의사소통 방법을 실생활에서 실천하도록 돕고 부모자녀의 의사소통 능력 및 관계를 향상시키는데 매우 효과적이라고 응답하였다. 본 수업 및 실제상황적 수행평가는 학습자가 자신의 대화 모습을 관찰하여 의사소통 문제점을 파악하고 개선함으로써 원만한 가족관계 형성을 돕는데 공헌하였다. 또한, 청소년 자녀와 부모를 대상으로 하였으며 부모자녀간 실제대화를 분석하여 대화구조를 심층적으로 밝히고 의사소통 문제점과 개선한 대화사례를 제공한 것에 의의가 있다.

  • PDF

연근해 소형 어선의 레이더 정보 수록 및 해석 시스템 개발 - CFAR에 의한 레이더 잡음 억제 - (Development of Acquisition and Analysis System of Radar Information for Small Inshore and Coastal Fishing Vessels - Suppression of Radar Clutter by CFAR -)

  • 이대재;김광식;신형일;변덕수
    • 수산해양기술연구
    • /
    • 제39권4호
    • /
    • pp.347-357
    • /
    • 2003
  • 연근해 소형 어선에 널리 탑재되어 있는 소형 레이더 장치에 radar target extractor를 인터페이스하여 레이더 선호를 수록, 처리 및 해석하기 위한 PC based radar system 을 구축하고, cell averaging CFAR 처리장치를 통해 실제의 레이더 echo 신호를 처리하여 오경보 확률의 설정치 변화에 따른 echo영상의 변화패턴을 레이더 스코프상에서 직접 비교, 분석한 결과 및 레이더 영상신호의 음영구역의 발생대역폭을 추정한 결과를 요약하면 다음과 같다. 1. 레이더 선호의 해석을 통해 추출된 표적의 운동벡터 및 방위, 거리, 속력, CPA, TCPA 등과 같은 ARPA 정보를 실시간으로 이동 궤적과 함께 PC 모니터상에 구현하고 있기 때문에 소형 레이더 시스템에 이 장치를 부착하면 저가의 비용으로써 ARPA 정보의 취득이 기능하다. 2. ideal threshold 에 의한 표적검출성능을 개선시키기 위해 cell averaging CFAR processor 의 CUT전후에 각각 3 개의 guard cell과 이 cell의 좌$.$우측에 각각 20개씩, 총 40개의의 reference cell를 설치하여 레이더의 video 신호를 입벽한 후, 오경보 확률 10$\^$-0.25/∼10$\^$-1.0/의 범위에 대하여 설정치를 점차증가시켜 갈 때, 레이더 영상신호는 10$\^$-0.75/ 의 설정치에서 가장 양호한 clutter 제거효과를 나타내었다. 3. 레이더 스코프상에서 영상신호를 관찰하면서 cell averaging CFAR 의 오경보 확률을 적정하게 제어하면 지금까지의 ideal threshold level 에 의한 잡음억제기법에서 나타나는 선박영상의 과도한 레벨약화현상을 보완할 수 있을 것으로 판단한다. 4. 부산 용호만에 정박중인 예인선의 레이더 신호를 해석하여 영상의 음영패턴과 음영 대역폭을 추정한 결과, 예인선의 유효높이는 약 1.2 m 이었고, 이들 음영효과의 정량적 해석을 통한 해상표적의 형상정보는 향후 3차원 레이더 영상을 구현하는 데 그 기초자료가 될 것으로 판단된다.

울산쇠부리소리의 전승 양상 (A Study on the Transmission of 'Soeburi-Song' in Ulsan)

  • 양영진
    • 공연문화연구
    • /
    • 제37호
    • /
    • pp.157-186
    • /
    • 2018
  • 울산 쇠부리소리는 1981년 8월 달천철장의 마지막 불매대장인 고(故) 최재만(1987년 별세)의 구술과 소리를 바탕으로 1980년대에 재연된 소리이다. 본 고는 1981년 영상 등 총 13종의 자료를 바탕으로 쇠부리소리를 음악적 측면에서 분석하고, 전승 과정에서의 변화 양상을 확인하는데 목적을 둔 논문이다. 도출된 결과를 정리하면 다음과 같다. 2017년 쇠부리소리 자료를 살펴본 결과, 풍물패는 상쇠, 부쇠, 징2, 북4, 장구4, 태평소1로 구성되어 있고, 장단은 질굿, 자진모리, 다드래기, 덧배기, 자진덧배기의 5종을 친다. 가창곡은 3소박 4박자의 덧배기 자진덧배기 장단에 맞추어, 또는 무장단으로 부른다. 구성음은 대부분 Mi-La-do의 3음 또는 Mi-La-do-re의 4음으로, 음역은 1옥타브를 넘지 않는다. 종지음은 모두 La로 동일하다. 1981년 발굴 이후 오늘날까지의 쇠부리소리 연행을 살펴본 결과, 크게 4가지의 변화를 발견할 수 있었다. 먼저 악곡의 구성이 '긴-자진'으로 분화되고, <금줄소리>, <애기 어르는 소리>, <성냥간 불매소리>가 첨가되었다. 둘째 가창 방식은 1980년대 재연 이후 '1인 선창자+다인 후창자'를 기본으로, 1인 후창자를 별도로 지정하기도 하였다. 더불어 2013년 연행된 <자진불매소리>는 <성냥간 불매소리>의 토대가 되었다. 셋째 <긴-자진 불매소리>의 선율적 변화가 관찰되었다. 박자구조는 모두 3소박 4박자이나, 속도가 느려지고, Mi-La-do의 3음을 골격으로 높은 re와 낮은 Sol이 첨삭되어 메나리토리의 특성이 명확히 드러난다. 마지막으로 풍물 악기는 꽹과리, 징, 장구, 북의 사물이 주로 쓰이며, 공연에 따라 소고, 태평소, 요령 등을 첨가하기도 한다. 장단은 자진모리, 다드래기, 덧배기, 자진덧배기 장단을 처음부터 연주했으며, 이후 질굿 장단이 추가되었다. 이와 같은 결과를 통하여 최초 발굴 당시, <애기 어르는 소리>와 같은 단순한 형태의 <불매소리>가 남성 노동요로 목적이 바뀌고 연희성이 강해지며 하나의 공연 예술로 변화되었음을 확인하였다.

H.264/SVC 공간 계위 부호화 기반 지상파 다채널 하이브리드 고화질 방송 서비스 프레임워크 및 H.264/SVC 부호화 성능 평가 (H.264/SVC Spatial Scalability Coding based Terrestrial Multi-channel Hybrid HD Broadcasting Service Framework and Performance Analysis on H.264/SVC)

  • 김대은;이범식;김문철;김병선;함상진;이근식
    • 방송공학회논문지
    • /
    • 제17권4호
    • /
    • pp.640-658
    • /
    • 2012
  • 기존의 다채널 지상파 디지털 TV 서비스인 KoreaView는 6MHz의 대역폭을 유지하면서 1개의 MPEG-2기반 HD 비디오와 3개의 H.264/AVC기반 SD 비디오, 총 4개의 채널을 제공하는 서비스이다. 그러나 KoreaView는 추가되는 3개의 SD급 비디오 채널이 작은 공간 해상도와 낮은 목표 비트율로 인한 화질 열화 때문에 높은 시청 만족도를 제공하지 못하는 단점을 가지고 있다. 본 논문에서는 이러한 KoreaView의 한계점을 극복하기 위한 공간 계위 스케일러블 비디오 부호화 기반 지상파 다채널 하이브리드 고화질 방송 서비스 프레임워크를 제안한다. 제안하는 지상파 다채널 하이브리드 고화질 방송 서비스 프레임워크는 H.264/AVC 기반 SD 비디오 3개를 H.264/SVC 공간 기본 계층 부호화를 통해 동일하게 서비스 하고, 공간 향상 계층 부호화로 추가된 3개의 HD 비디오를 광대역망을 통해 전송하여 고화질의 다채널 방송을 서비스를 가능하게 한다. 이같이 기존의 3개의 SD 채널에 공간 향상 계층을 추가적으로 전송하면 고화질 채널을 통해 높은 시청 만족도를 갖는 여러 개의 채널을 확보하게 된다. 제안하는 프레임워크의 성능을 검증하기 위하여 실제로 방송에서 사용되는 다양한 영상을 이용하여 실험을 수행하였다. 먼저 H.264/SVC를 이용하여 SD 입력 비디오가 공간 기본 계층에서 1.5Mbps 목표 비트율로 부호화될 때, 34.5-42.9dB의 화질을 제공하여 상용 서비스가 가능한 수준의 객관적 화질을 제공 할 수 있음을 확인할 수 있었다. 또한 12Mbps 목표 비트율로 부호화된 MPEG-2 기반 HD 복원 영상과 제안하는 서비스 프레임워크의 H.264/SVC 공간 향상 계층의 HD 복원 영상을 비교하여 부호화 성능을 분석하였다. MPEG-2 기반 HD 복원 영상과 유사한 객관적 화질 수준을 제공하기 위하여 제안하는 서비스 프레임워크에서 사용된 H.264/SVC 공간 계위 부호화를 수행한 결과 실험 영상의 종류와 특성에 따라 약 690kbps에서 8,200kbps의 비트율이 발생함을 실험을 통하여 확인하였다.

장르 드라마에서의 표정연기연구 - 드라마 '보이스2'를 중심으로 - (A Study on Facial Expression Acting in Genre Drama - with Focus on K-Drama Voice2 -)

  • 오윤홍
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권8호
    • /
    • pp.313-323
    • /
    • 2019
  • 영상연기자들에게 표정연기는 '억지표정'이나 '오버액팅'이 되기 쉽고, 또 지나치게 절제를 강조하면 감정이 부족한 '밋밋한 연기'가 된다. 이러한 표정 연기 방법에 관한 문제제기를 통해서 상업적 색채가 짙은 장르 드라마에서의 배우들의 표정연기를 분석하였다. 결론적으로, 장르 드라마의 배우들의 표정연기 방법은 일종의 전형(典型)적인 방법으로 수행되고 있었다. 이는 영상연기의 시각적 관습에서 미적 기준이 배우들의 표정연기에서 중요한 기준이 되고 있다는 것을 의미한다. 장르 드라마에서 인물의 감정은 주로 클로즈업 숏에서 발현된다. 클로즈업 숏 안에서 '확대된 얼굴'중 가장 중요한 표현 매체는 '눈동자'이며, 눈과 눈 주변의 근육 움직임을 통한 감정 표현이 주가 된다. 그 뒤로 중요한 표현 매체는 '입'이다. 입을 벌리고 다물면서 그 정도의 차이에 따라서 다양한 감정이 '눈'의 표현과 함께 전달되는 것이다. 이뿐만이 아니라 얼굴 근육의 긴장은 감정표현에 크게 저해되며, 얼굴 근육의 움직임을 최소화하여 얼굴 표면의 지나친 주름을 만드는 것을 경계해야 한다. 얼굴 표정은 근육 움직임으로 만으로는 이루어지지 않는다. 결국, 근육의 움직임은 감정으로 인해서 이루어지는 결과이다. 표정을 일으키는 감정이 먼저 형성되어야 한다. 이 과정에서 배우의 '정서적 기억', '이완', '집중'등을 통해 '자기화'하는 스타니슬라브스키의 심리적 연기술이 필연적이다. 또한, 표정이 발현되는 클로즈업 숏이 요구하는 시각적으로 절제된 연기술이 필요하다. 그 외에, 표정연기는 내러티브 전개에 중요한 지점을 제공하는 반응 연기(reaction acting)이며, 주연과 조연이라는 인물의 역할에 따라서 배우에게 요구되는 표정연기의 방법과 숏의 사이즈는 다르다는 것을 알 수 있었다.

<성인인상무>에 대한 연구 (A Study on 'Seungininsangmu' of Haejugwonbeon)

  • 김영희;김경숙
    • 공연문화연구
    • /
    • 제35호
    • /
    • pp.93-123
    • /
    • 2017
  • 한국 민속춤의 정수인 승무는 춤의 연원이나 유래, 춤의 명칭과 복식을 볼 때 불교와 깊은 영향관계를 가지고 오랜 세월 변화 발전되어 온 춤이다. 현재 주로 추어지고 있는 승무는 장삼춤과 북춤의 구성으로 고착되어 있으나, 일제강점기의 승무는 그 역사성과 다양한 유래설 만큼이나 여러 양상의 승무를 유추해 볼 수 있다. 1940년을 전후해서 해주권번의 사범이었던 장양선은 양소운을 통해 <성인인상무>를 작품화했다. 2010년 '양소운 추모공연'에서 추어진 <성인인상무>의 영상을 분석해 본 결과, 첫째, 이 춤은 춤의 제목에서 전달하고자 하는 주제가 뚜렷하고, 승무의 유래설 중에서 불제자가 수도 중에 번뇌하고 타락했다가 다시 불교에 회귀한다는 기원설을 내포하고 있음을 확인할 수 있다. 둘째, 장삼춤 - 북놀이 - 바라춤 - 허튼춤 - 회심곡 - 귀의로 이어지는 과정은 작품의 주제의식을 순차적으로 잘 보여주고 있었다. 셋째, 불교의식무용인 바라무, 민속적 특징인 개성과 즉흥성이 강한 허튼춤, 불교음악인 회심곡 등 내용과 그 전개에 따라 여러 표현방법이 결합한 형식이었다. 이는 20세기 초 승무를 무대화 내지는 작품화하고자 했던 흐름을 잘 반영하고 있음을 알 수 있었다. <성인인상무>는 현재 장삼춤과 북춤만의 장대한 형식의 승무와 비교했을 때, 내용면에서는 본래 승무가 담고자 했던 의미를 살펴볼 수 있었고, 형식적인 측면에서는 악가무와 극적 요소가 결합된 다양성을 되돌아보게 한다. 미래지향적으로 발전할 수 있는 승무를 위해 많은 시사점을 제시하고 있다는 점에서 본 연구의 의의가 있다고 하겠다.

조식동물 탐지 및 모니터링을 위한 딥러닝 기반 객체 탐지 모델의 강인성 평가 (Evaluation of Robustness of Deep Learning-Based Object Detection Models for Invertebrate Grazers Detection and Monitoring)

  • 박수호;김흥민;김탁영;임재영;장선웅
    • 대한원격탐사학회지
    • /
    • 제39권3호
    • /
    • pp.297-309
    • /
    • 2023
  • 최근 조식동물로 인한 갯녹음 현상으로 인해 연안 생태계 및 어장환경의 황폐화가 가속화되고 있다. 이러한 갯녹음 현상을 모니터링하고 방지대책을 세우기 위해서는 광범위한 해역에 대한 원격탐사 기반의 모니터링 기술 도입이 필요하다. 본 연구에서는 수중에서 촬영된 동영상으로부터 조식동물을 탐지하고 모니터링하기 위한 딥러닝 기반 객체 탐지 모델의 강인성(robustness)을 비교 분석하였다. 우리나라 연안의 대표적인 조식동물 7종을 대상으로 이미지 데이터셋을 구축하였으며, 이를 활용하여 딥러닝 기반 객체 탐지 모델인 You Only Look Once (YOLO)v7과 YOLOv8을 훈련시켰다. 총 6개의 YOLO 모델(YOLOv7, YOLOv7x, YOLOv8s, YOLOv8m, YOLOv8l, YOLOv8x)에 대해 탐지 성능과 탐지 속도를 평가하였으며, 수중환경에서 촬영 시 발생할 수 있는 다양한 이미지 왜곡에 대해서 강인성 평가를 실시하였다. 평가결과 YOLOv8 계열 모델이 파라미터(parameter) 수 대비 더 높은 탐지 속도(약 71-141 FPS [frame per second])를 보였다. 탐지 성능에 있어서도 YOLOv8 계열 모델(mean average precision [mAP] 0.848-0.882)이 YOLOv7 계열 모델(mAP 0.847-0.850)에 비해 더 높은 성능을 보이는 것을 확인하였다. 모델의 강인함에 있어서 형태 왜곡에 대해서는 YOLOv7 계열 모델이 YOLOv8 계열 모델에 비해 강인한 것을 확인하였으며, 색상 왜곡에 대해서는 YOLOv8 계열 모델이 상대적으로 강인한 것을 확인 하였다. 따라서 실해역에서 수중 영상 촬영 시, 형태 왜곡은 발생 빈도가 낮으며 색상 왜곡은 연안에서 빈번하게 발생한다는 점을 고려했을 때, 연안해역에서 조식동물 탐지와 모니터링을 위해서는 YOLOv8 계열 모델을 활용하는 것이 타당한 것으로 판단된다.

높은 정확도의 3차원 대칭 커패시터를 가진 보정기법을 사용하지 않는 14비트 70MS/s 0.13um CMOS 파이프라인 A/D 변환기 (A Calibration-Free 14b 70MS/s 0.13um CMOS Pipeline A/D Converter with High-Matching 3-D Symmetric Capacitors)

  • 문경준;이경훈;이승훈
    • 대한전자공학회논문지SD
    • /
    • 제43권12호
    • /
    • pp.55-64
    • /
    • 2006
  • 본 설계에서는 무선 랜 등 최첨단 무선 통신 및 고급영상 처리 시스템과 같이 고해상도와 높은 신호처리속도, 저전력 및 소면적을 동시에 요구하는 고성능 집적시스템 응용을 위해 기존의 보정기법을 사용하지 않는 14b 70MS/s 0.13um CMOS A/D 변환기(Analog-to-Digital Converts- ADC)를 제안한다. 제안하는 がU는 중요한 커패시터 열에 인접신호에 덜 민감한 3차원 완전 대칭 구조의 레이아웃 기법으로 소자 부정합에 의한 영향을 최소화하였고, 3단 파이프라인 구조로 고해상도와 높은 신호처리속도와 함께 전력 소모 및 면적을 최적화하였다. 입력 단 SHA 회로에는 Nyquist 입력에서도 14비트 이상의 정확도로 신호를 샘플링하기 위해 게이트-부트스트래핑 (gate-bootstrapping) 회로를 적용함과 동시에 트랜스컨덕턴스 비율을 적절히 조정한 2단 증폭기를 사용하여 14비트에 필요한 높은 DC전압 이득을 얻음과 동시에 충분한 위상 여유를 갖도록 하였으며, 최종 단 6b flash ADC에는 6비트 정확도 구현을 위해 2단 오픈-루프 오프셋 샘플링 기법을 적용하였으며, 기준 전류 및 전압 발생기는 온-칩으로 집적하여 잡음을 최소화하면서 필요시 선택적으로 다른 크기의 기준 전압 값을 외부에서 인가할 수 있도록 하였다. 제안하는 시제품 ADC는 0.13um CMOS 공정으로 요구되는 2.5V 전원 전압 인가를 위해 최소 채널길이는 0.35um를 사용하여 제작되었으며, 측정된 DNL 및 INL은 14비트 해상도에서 각각 0.65LSB, 1.80LSB의 수준을 보이며, 70MS/s의 샘플링 속도에서 최대 SNDR 및 SFDR은 각각 66dB, 81dB를 보여준다. 시제품 ADC의 칩 면적은 $3.3mm^2$이며 전력 소모는 2.5V 전원 전압에서 235mW이다.

운전자 졸음 검출을 위한 눈 개폐 검출 알고리즘 연구 (A Study on an Open/Closed Eye Detection Algorithm for Drowsy Driver Detection)

  • 김태형;임웅;심동규
    • 전자공학회논문지
    • /
    • 제53권7호
    • /
    • pp.67-77
    • /
    • 2016
  • 본 논문에서는 변형된 하우스더프 거리 (MDH: Modified Hausdorff Distance)를 이용한 눈 개폐 감지 알고리즘을 제안한다. 제안하는 알고리즘은 얼굴 검출과 눈 개폐 감지로 크게 구분된다. 얼굴 영역의 검출을 위하여 고정 크기의 영역 내에서 픽셀 값을 이용하는 지역 구조특성의 MCT (Modified Census Transform)특징기반 방법을 사용하였다. 이후, 검출된 얼굴 영역 내에서 MHD를 이용하여 눈의 위치 및 개폐를 판단한다. 얼굴 검출의 처리절차는 먼저, 오프라인에서 다양한 얼굴 영상에 대해 MCT 이미지를 생성하고, 이를 기반으로 PCA를 이용하여 기준이 되는 특징벡터들을 추출한다. 다음으로, 온라인에서는 입력되는 실험 영상 내에서 새롭게 추출된 특징벡터들과 기준이 되는 특징 벡터들 간의 유클리드 거리를 이용하여 얼굴 영역을 검출하는 순서로 진행된다. 이후, 검출된 얼굴 영역 내에서 MHD 기반의 눈 영역 검출과 템플릿 매칭을 수행하여 눈의 개폐를 감지한다. 제안하는 방법의 성능 검증을 위하여 그레이 스케일 영상 (30FPS, $320{\times}180$)을 입력으로 실험을 수행한 결과, 눈 계폐 검출율에서 평균 94.04%의 정확도를 달성하였다.