• 제목/요약/키워드: 문자영상

검색결과 796건 처리시간 0.03초

복합 색상과 명암 벡터를 이용한 주차 단속 영상에서의 번호판 추출 (License-Plate Extraction from Parking Regulation Images using Intensity Vector and Composite Color)

  • 권숙연;전병환
    • 전자공학회논문지CI
    • /
    • 제40권6호
    • /
    • pp.47-55
    • /
    • 2003
  • 본 논문에서는 다양한 시간과 장소에서 차량 정면이나 후면 주변의 다양한 위치에서 촬영되고 주변 배경이 충분히 포함되는 주차 단속용 영상에서 차량 번호판을 추출하기 위해, 명암 벡터와 복합 색상을 이용하여 차량 번호판의 고유한 특성을 감지하는 방법을 제안한다. 기본적으로 번호판 영역에서 문자와 배경의 명암도 차이가 뚜렷하여 명암값의 증감이 빈번히 발생하고, 번호판 영역이 차종에 따라 일정한 색상을 갖는다는 특성을 함께 이용한다. 먼저, 번호판 영상의 하단부터 시작하여 일정 간격의 행마다 탐색해가면서, 명암 벡터의 부호가 충분히 자주 변화하고 번호판 색상이 충분히 검출되는 구간을 번호판 후보로 간주하여 대략 영역을 지정한다. 그런 다음, 수직 에지 성분을 수평ㆍ수직으로 프로젝션하여 번호판의 정교 영역을 추출한다. 이때, 추출된 번호판의 색상에 의해 차종도 쉽게 판별된다. 제안한 방법의 성능을 평가하기 위해 다양한 시간과 장소에서 촬영된 실제 단속 영상 200장을 사용하였다. 실험 결과, 제안한 방법이 명암 벡터만을 사용한 방법보다 약 9% 향상된 96%의 번호판 추출률을 보였다.

영화 <동주>(2015)에 표상된 윤동주 시 활용양상 연구 (A Study on the Use Pattern of Yun Dong-Ju in the movie )

  • 손미영
    • 문화기술의 융합
    • /
    • 제5권2호
    • /
    • pp.59-65
    • /
    • 2019
  • 본 연구는 이준익 감독의 2015년작 <동주>를 통해서 영화에서 시 텍스트가 어떻게 활용되며, 이로써 어떠한 서사적이고도 영상적 효과를 얻어내었는가를 검토한다. 이 영화는 시인 윤동주를 중심인물로 내세우고, 그의 생애를 재구성하는 내용을 선택하고 있다. 영화 <동주>에서는 윤동주의 시를 영화의 서정성을 극대화하는 장치이자, 인물의 운명과 내면의 변화를 암시하는 방식으로 활용하였다. 즉, 영화 <동주>는 윤동주의 시를 활용함으로써, 영화 속 인물의 내적 변화와 감성을 미적으로 수준 높게 형상화 한다. 그리고 이를 통해 시인 윤동주를 평범한 문학청년으로 조명함으로써, 문학책 속에 박제되어 있던 윤동주를 고뇌하는 청춘의 한 표상으로 이미지화한다. 이는 현재의 청년들이 겪고 있는 현실의 무게에 대한 위로이자, 역사를 살아가는 한 개인의 문제를 조망한 것이기도 하다. 이러한 측면에서 영화 <동주>는 영상 매체를 통해 시와 시인의 초상, 그리고 시인의 시대를 다채롭게 그려낸 주요한 텍스트라 할 수 있다. 영상과 함께 전달되는 문자 텍스트로서의 '시'는 영상의 서정성을 더욱 극대화하였으며, 높은 미학적 성취까지로 이어졌다. 시와 시인을 통해 역사와 개인, 문학과 현실이라는 문제에 접근하고 있는 주요한 텍스트라 평가할 수 있다.

고전문학의 향유방식과 교육; 과거, 현재, 미래 (Accepting Method in Classical Literature and Education ; Past, Present, and Future)

  • 손태도
    • 고전문학과교육
    • /
    • 제37호
    • /
    • pp.5-45
    • /
    • 2018
  • 문학활동은 이를테면 '문학생산' 활동과 '문학수용' 활동으로 양분된다. 고전문학의 향유방식은 고전문학의 수용과 관계된다. 그러나 문학수용 활동은 사실상 문학생산 활동이 전제되어야만 가능한 것이기에, 문학의 향유방식에 대한 논의에는 문학수용 활동 외에도 문학생산 활동에 대한 논의도 흔히 같이 다뤄진다. 오늘날 현대의 시, 소설 등과 같은 문자문학의 경우 '문학생산 : 문학수용'은 '쓰기 : 읽기'로 비교적 간단하다. 그런데 고전문학에서는 시가문학, 소설문학, 구비문학, 한문학 등에 있어 그것은 '가창, 음영, 구연, 공연, 강독(講讀), 쓰기 : 듣기, 읽기'의 방식들이 있다. 또 현대의 시, 소설 등의 문자문학은 문학만으로 이뤄진 이른바 단독예술이지만, 가창, 공연되기도 하는 고전문학은 음악, 연극 등이 수반된 복합예술들도 많다. 이러한 고전문학의 향유방식을 이해하기 위해서는 '읽는 문학' 외에 '듣는 문학'에 대한 문학적 소양도 가질 필요가 있고, 문학 외의 음악, 연극 등에 대한 시각도 필요하다. 고전문학의 향유방식들과 관계해서 오늘날에도 연구할 만한 과제들이 많이 있다. 고전시가에는 신라시대 불교의 향찬(鄕讚)으로서의 향가, 가곡과 무가(巫歌)의 관계, 가곡 한바탕에서의 가곡창사들의 순서, 시용향악보에 실린 무가(巫歌)들은 국가의 별기은(別祈恩)과 같은 국행 굿에서 불린 사실, 가사 장르의 향유방식으로서의 '창조로 불림' 등이 오늘날에도 중요하게 다뤄져야 할 연구과제들이다. 고전소설의 경우에는 지금에라도 전통사회의 소설 강독에 대한 현지 조사들이 이뤄질 필요가 있다. 구비문학에는 전문 이야기꾼에 대한 조사와 그의 구연 영상물 제작이 이뤄져야 한다. 한문학에는 시창(詩唱), 한문 사(辭) 부(賦) 문(文)의 '창조로 불림', 한문경서(經書)의 성독(聲讀) 등에 대한 조사, 연구가 이뤄져야 한다. 오늘날 고전문학을 제대로 연구하기 위해서는 고전문학의 향유방식에 입각한 여러 시각들도 가질 필요가 있다. 구비문학과 같은 '듣는 문학'에는 '구전공식구(formular)'(일반적 언술), '핵심적 주제(theme)'(일반적 주제), '즉석변개작법'(improvisation) 등과 같은 A. 로드의 '구전공식구 이론(formular theory)'에 대한 시각이 필요하다. 이것은 '특수한 언술', '특수한 내용', '원전비평'을 중시하는 현대의 시, 소설 등의 문자문학과 정반대되는 면이 있다. '읽는 문학' 외에 '듣는 문학'이 많은 고전문학은 구비문학의 이러한 문학적 방식을 기본적으로 고려할 필요가 있다. 고려가요나 실창 판소리들에 있는 과도한 음란(淫亂) 지향의 경우는 흥행을 목적으로 한 개방된 공간에서의 연행이란 문학 실현 공간 설정에 대한 시각이 필요하다. 한편 문학수용에 있어 '읽기'만 있고 예술적으로도 단독예술로 문학만 있는 현대의 시, 소설 등의 문자문학과 달리, '듣기'도 있고, 고전시가나 구비문학에서처럼 문학 음악, 문학 연극 음악, 문학 연극무용 음악 등의 복합예술로도 있는 고전문학은 역시 '듣기'로 수용되고 문학 음악, 문학 연극 영상 음악 등의 복합예술로 있는 대중가요, 영화, TV 드라마 등과 같은 현대의 매스미디어 문학의 이해, 연구에도 분명 일정한 역할을 할 수 있을 것 같다. 문학연구와 문학교육은 물론 문학 곧 문학사설 그 자체를 가장 중시한다. 그러나 향유방식에 의해 그 문학사설들이 결정되는 면도 분명히 있다. 특히 '읽기' 외에도 '듣기'에 의한 향유가 많았고, 문학 단독 외에 문학이 음악, 연극, 무용 등과 같이 향유된 면들이 많은 고전문학의 경우는 더욱 그러하다. 그러므로 고전문학의 향유방식에 대한 제대로 된 이해와 고려는 고전문학의 이해, 연구, 교육에 있어 참으로 중요한 일이 아닐 수 없다.

미디어테크놀로지의 발전에 따른 시각언어와 시각테크놀로지의 고찰 (An Observation of the Visual Language and the Visual Technology according to the Media Technology)

  • 신청우
    • 디자인학연구
    • /
    • 제17권2호
    • /
    • pp.15-22
    • /
    • 2004
  • 현재의 복잡한 시각문화는 디지털 기술의 발전에 따라 이미지, 그래픽, 사진, 영화, 텔레비전 등의 영상에 따른 광범위하게 확대된 시각 세계이며, 사운드와 문자까지를 삽입하여 의미 내용을 전달하기 때문에 일반적인 언어나 문자를 넘어 정보를 전달하고 커뮤니케이션 하는 멀티미디어 적 성격을 갖는다고 할 수 있다. 이 때의 다양한 이미지들을 보는 시각은 언어와 불가분 하게 연결되며, 이미지와 시각의 상상적 질서가 문화적, 역사적으로 특정한 방식으로 구성된다고 할 수 있다. 언어는 그 시대의 사회, 문화, 역사에 따라 다르기 때문에 시각적 경험이 부분적으로라도 언어적으로 매개된다면 시각적 경험이 보편성을 갖기는 어려운 것이다. 따라서 시각 체계들간의 사회 문화적 차이를 형성하고 규정하는데 에는 언어적 질서의 역할이 크다고 할 수 있다. 이러한 시각 언어와 함께 역사적으로 다양한 시각적, 광학적 장치들 또한 많은 영향을 끼쳤는데 이 시각적 테크놀로지들은 가시적 세계 속에서 주체와 주체의 가시적인 대상들과 관계 맺는 방식을 결정하는 구체적인 물질적 실천체인 것이다. 시각언어는 이렇게 이미지들의 표상이라는 차원과 일련의 역사적인 물질적, 제도적 실천들로의 시각테크놀로지라는 차원이 결합된 것이며, 이것이 하나의 시각체제 내에서의 대상 세계를 보는 사회적인 시각 양식을 결정하였다. 따라서 본 연구는 미디어테크놀로지의 발전에 따라 변화된 개념이나 특성들에 따라 시각언어를 사회적이고 역사적인 성격을 가진 것으로 이해하고 표상의 차원으로서의 시각언어와 제도적이고 물질적인 실천으로서의 시각 테크놀로지의 차원에서 설명했다. 결국 시각 테크놀로지는 그 기능과 시각 양식에 대한 영향은 그것의 기술적 요소만으로는 설명할 수 없으며, 그것과 결부된 담론적 실천들과 물질적 제도적 실천과 분리될 수 없다. 특정 테크놀로지의 기술적 요소가 담고 있는 가능성 역시 그대로 실현되는 것이 아니라 항상 사회적 맥락에 의해 그 효과가 매개되고 제약되면서 실현된다고 할 수 있다.

  • PDF

기록학적 관점에서의 구술의 의미와 역할에 관한 연구 (A Study on the Meanings and Roles of Oral History from a Perspective of Archival Science)

  • 김명훈
    • 기록학연구
    • /
    • 제24호
    • /
    • pp.73-112
    • /
    • 2010
  • 최근 녹음 및 녹화기술의 진전은 문자화된 기록만이 아닌 음성이나 영상 역시 행위의 증거 및 기억의 보존 도구로 활용할 수 있게 해주었다. 이러한 경향에 보조를 맞추어 기록학 영역에서는 기록으로서의 구술이 지닌 중요성을 인식하고 구술채록 사업을 활발히 수행하고 있다. 하지만 기록보존기관에서의 구술채록은 아직 정체성 정립이 요원한 실정이다. 기록학은 현재의 삶의 모습을 기록을 통해 미래에 전승하는 과업을 모토로 한다는 점에서, 구술채록 역시 여타 학문분야에서 사료의 생성 및 연구 목적을 위해 수행되는 구술채록과는 다른 특성을 도출할 필요가 있다. 더불어 기록학은 수많은 기록 중 맥락을 지닌 행위의 증거를 평가하여 현재의 사회상 및 집단 기억을 형성시키는 분야라는 점에서, 구술채록에 앞서 기록학 고유의 구술 정체성 정립이 선행되어야 한다. 이에 본고에서는 기록학적 관점에서의 구술이 지닌 의미와 역할을 분석하고자 한다. 기록학에서는 그동안 실증주의의 뿌리 깊은 영향 속에 문자화된 기록 위주로 학문적 이론 및 방법론을 개발시켜왔다. 하지만 '말'을 통한 기록의 생성 및 보존이 가능해진 지금, 기억 및 사회상을 보존해 전승하는 또 하나의 방식으로 구술에 주목해야 할 필요가 있다. 이에 본고에서는 기록보존기관에서의 구술채록 정체성을 정립시키기 위한 일환으로, 기록학적 관점에서의 구술이 지닌 의미 및 역할을 분석할 것이다.

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

  • 박정은;주경돈;김철연
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.148-158
    • /
    • 2018
  • 광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

AI Fire Detection & Notification System

  • Na, You-min;Hyun, Dong-hwan;Park, Do-hyun;Hwang, Se-hyun;Lee, Soo-hong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.63-71
    • /
    • 2020
  • 본 논문에서는 최근 가장 신뢰도 높은 인공지능 탐지 알고리즘인 YOLOv3와 EfficientDet을 이용한 화재 탐지 기술과 문자, 웹, 앱, 이메일 등 4종류의 알림을 동시에 전송하는 알림서비스 그리고 화재 탐지와 알림서비스를 연동하는 AWS 시스템을 제안한다. 우리의 정확도 높은 화재 탐지 알고리즘은 두 종류인데, 로컬에서 작동하는 YOLOv3 기반의 화재탐지 모델은 2000개 이상의 화재 데이터를 이용해 데이터 증강을 통해 학습하였고, 클라우드에서 작동하는 EfficientDet은 사전학습모델(Pretrained Model)에서 추가로 학습(Transfer Learning)을 진행하였다. 4종류의 알림서비스는 AWS 서비스와 FCM 서비스를 이용해 구축하였는데, 웹, 앱, 메일의 경우 알림 전송 직후 알림이 수신되며, 기지국을 거치는 문자시스템의 경우 지연시간이 1초 이내로 충분히 빨랐다. 화재 영상의 화재 탐지 실험을 통해 우리의 화재 탐지 기술의 정확성을 입증하였으며, 화재 탐지 시간과 알림서비스 시간을 측정해 화재 발생 후 알림 전송까지의 시간도 확인해보았다. 본 논문의 AI 화재 탐지 및 알림서비스 시스템은 과거의 화재탐지 시스템들보다 더 정확하고 빨라서 화재사고 시 골든타임 확보에 큰 도움을 줄 것이라고 기대된다.

국내 재난 예경보 시스템 현황 및 통합 방안에 대한 분석 연구 (An Analysis Study on the Current Status and Integration Methods of the Domestic Early Warning System)

  • 황우석;표경수
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.80-90
    • /
    • 2022
  • 현재 국내 재난 예경보 시스템은 재난별로 발령 방식에 차이가 있고 중앙에서 자자체까지 독립적으로 운영되고 있다. 대표적인 국내 재난 예경보 시스템은 재난문자방송, DMB(Digital Multimedia Broadcasting) 재난경보서비스, 재난방송온라인시스템, 자동우량경보시설, 자동음성통보시설, 재해문자전광판 등이 활용되고 있다. 하지만 이러한 재난 예경보 시스템이 간급한 재난경보 현장에서 각각의 매체별로 재난경보 발령 방식의 차이를 두고 경보가 발령되고 있으며, 전달되는 내용 또한 통합되지 않는다. 따라서 경보를 받는 국민들의 입장에서는 매체별 경보의 내용이 상이하여 혼란을 받는 상황이다. 이러한 시스템이 통합된다면 음성·영상·데이터 등 재난정보의 공유와 통합관리를 통해 종합적으로 재난 상황의 판단 및 의사결정이 가능함으로써 상황 파악과 현장 대응에 소요되는 업무를 줄일 수 있을 것이다. 또한 신속한 정보전달과 정확한 상황 파악을 통해 재산 및 인명의 피해를 최소화할 수 있을 것으로 기대한다. 그렇기때문에 본 연구에서는 국내 재난 예경보 시스템 운영 현황에 대한 분석과 함께 재난 예경보 시스템의 통합을 위한 방안을 제시한다.

오류가 발생한 멀티바이트 인코딩 데이터의 인코딩 기법 판별 알고리즘 개선 (Improvement of Encoding Detection Algorithm for Multi-byte Encoded Data with Errors)

  • 배준우;김선범;박희진
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권2호
    • /
    • pp.18-25
    • /
    • 2017
  • 인코딩(encoding)은 컴퓨터에서 사용되는 음성, 영상 및 텍스트 문자를 부호화하는 방법을 가리킨다. 그러므로 특정 데이터를 열람하기 위해서는 해당 인코딩 정보를 알아야하며, 데이터마다 인코딩을 판별해주는 알고리즘들이 존재한다. 하지만 실제 음원이나 문서를 송수신하는 과정에서 패킷 손실이 발생할 수 있으며, 특히 무선 통신망에서 패킷 스니핑으로 정보를 가로챌 경우 손실률은 더욱 증가되어 인코딩 기법 판별에 어려움이 발생한다. 본 논문에서는 이러한 오류가 발생한 데이터의 인코딩 기법 판별율을 향상시키기 위해 기존의 문자 인코딩 기법 판별 프로그램인 'uchardet'에 Bit-shift 알고리즘을 적용하여 성능 향상을 이루었다. 알고리즘의 성능 평가를 위해 임의의 한글 및 일본어 텍스트 파일에 손실률(loss rate)을 적용하여 부분적으로 데이터가 소실된 인코딩 파일을 생성하여 결과를 비교하였다. 그 결과, 패킷이 손실된 데이터에서 Bit-shift 알고리즘을 적용한 'uchardet-bitshift' 경우 기존의 알고리즘보다 더 나은 성능을 보였다. 한국어 인코딩의 경우 기존의 uchardet는 0.005% 손실률까지 100%의 정확도를 보이고 1%보다 높은 손실률에서는 인코딩을 전혀 판별해 내지 못한데 비해, Bit-shift 알고리즘을 적용할 경우 0.05%의 손실률에도 100%의 정확도를 보였으며 그보다 큰 손실률에서도 해당 인코딩을 판별해냈다. 또한 한자어를 많이 포함하는 일본어의 경우 손실률이 높아질수록 중국어 인코딩으로 잘못 판별하는 경향을 보였다. 시뮬레이션 분석 결과, Bit shift 알고리즘을 추가하여 기존 인코딩 기법 판별 알고리즘의 개선이 가능하였다.

스크린 콘텐츠를 위한 VVC 화면내 삼각형 분할 예측 방법 (VVC Intra Triangular Partitioning Prediction for Screen Contents)

  • 최재륜;권대혁;한희지;이하현;강정원;최해철
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.325-337
    • /
    • 2020
  • VVC(Versatile Video Coding)는 ISO/IEC/ITU-T의 JVET(Joint Video Experts Team)에서 표준화 중인 새로운 비디오 부호화 표준으로 스크린 콘텐츠 부호화 툴을 포함한 다양한 기술을 채택하고 있다. 스크린 콘텐츠는 문자 영역과 같이 사선 방향 에지가 자주 발생하는 특징을 가지며, 이런 특징을 갖는 영상에 삼각형 형태의 분할 부호화를 적용하면 압축 효율이 증가할 수 있다. 본 논문에서는 스크린 콘텐츠를 위한 VVC 기반 화면내 삼각형 분할 예측 방법을 제안한다. 기존 VVC의 화면간 예측 부호화에서 삼각형 분할 예측을 지원하는 Triangular Prediction Mode 방법과 유사하게, 제안 방법은 화면내 예측 부호화에서 수직과 수평 방향 예측 모드와 주변 복원 참조 라인을 이용하여 두 개의 사각형 예측 블록을 생성하고 삼각형 모양의 마스크로 두 예측 블록을 가중합하여 최종 예측 신호를 만든다. 제안 방법의 실험 결과는 All Intra 스크린 콘텐츠 영상 실험에서 YUV 각각 평균 1.86%, 1.49%, 1.55% 부호화 성능향상을 보이고, 자연 영상 실험 조건에서는 부호화 효율에 미미한 손실을 보였다. 결론적으로, 화면내 예측 부호화 모드에 제안 방법을 적용하여 압축 성능을 향상할 수 있었다.