• 제목/요약/키워드: 이미지변환

검색결과 960건 처리시간 0.023초

음성 인식 기반 쇼핑 어플리케이션 개발을 위한 데이터 전처리 알고리즘 (Data Preprocessing Algorithm for Developing Voice Recognition-based Shopping Applications)

  • 구연우;박은비;추서연;김유정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.1006-1008
    • /
    • 2022
  • 시각장애인이 이미지로 구성된 온라인 쇼핑몰에서 정보를 얻기 어려운 문제를 해결하기 위해, 본 논문에서는 이미지 텍스트 변환 알고리즘 연구를 진행하였다. 해당 연구를 기반으로 개발한 어플리케이션 <들리네>는 쇼핑몰 홈페이지로부터 정보를 수집하고, 이미지 속 텍스트를 추출하여 전처리 및 음성 변환 과정을 거쳐 사용자에게 제공한다. <들리네>는 사용자가 이미지 정보로 이루어진 온라인 쇼핑몰에서 명확한 정보를 편리하게 얻는 것을 목표로 한다.

CMOS 이미지 센서의 CDS

  • 백남대
    • 광학세계
    • /
    • 통권90호
    • /
    • pp.60-65
    • /
    • 2004
  • 현대의 정보통신 사회에 있어서 카메라는 여러 분야에 사용이 되고 있다. 카메라는 아날로그사진에서 피사체를 기록하기위한 필름을 사용하는데 이미지 센서는 빛을 변환하는 역할을 하는 필름대용품으로 사용되는 것이다. 이 이미지 센서는 전하결합소자(CCD : Charge Coupled Device)와 상보금속 산화물반도체(CMOS : Complementary Metal-Oxide-Semiconductor)가 대표적이다. 특히 디지털 카메라를 이용하여 과거의 카메

  • PDF

이동 컴퓨터를 위한 클래스 기반 프락시 서버 (Class-based Proxy Server for Mobile Computers)

  • 이종국;김명철;이경희
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권4호
    • /
    • pp.463-476
    • /
    • 2001
  • 기존의 PC나 W/S보다 이동성으로 인해 성능 상 제약이 많은 이동 컴퓨터 (mobile computer)는 인터넷을 통한 멀티미디어 서비스를 위해 프락시 서버(proxy server)를 이용하여 이미지 파일의 양을 줄이거나 모든 데이타를 문자로만 처리해서 전송 받고 있다. 그러나 기존의 프락시 서버들은 다양한 이동 컴퓨터들로부터 H/W의 사양을 전송 받지 못하기 때문에, 이동 컴퓨터의 디스플레이 크기가 다양함에도 불구하고 동일한 크기(pixels)의 이미지 파일을 이동 컴퓨터들에게 전송해야만 한다. 그리고 사용자 별로 구분된 캐시를 사용함으로써 캐시의 적중률(hit ratio)이 떨어지게 된다. 이를 해결하기 위하여, 본 논문에서는 디스플레이 크기와 색상을 기준으로 다양한 이동 컴퓨터들을 클래스로 나누고, WWW의 이미지 파일을 각각의 클래스에 적합하게 변환하여 저장하는 프락시 서버인 '클래스 기반 프락시(Class-based Proxy)'를 설계하고 구현하였다. 클래스 기반 프락시는 클라이언트 장치 (client device)가 요구하는 이미지 파일을 해당 클래스의 디스플레이 크기에 비례하여 변환한다. 따라서, 이동 컴퓨터들은 해당 클래스에 맞도록 변환된 이미지 파일을 클래스 기반 프락시로부터 전송 받기 때문에 PC나 W/S에서 보던 홈페이지의 화면을 이동 컴퓨터에서도 유사하게 볼 수 있다. 또한, 클래스 기반 프락시는 캐시에 저장되어 있는 변환된 이미지 파일을 동일한 클래스의 이동 컴퓨터들이 서로 공유하도록 하였다. 본 논문에서 구현한 클래스 기반 프락시와 기존의 프락시 서버를 테스트 한 결과, 클래스 기반 프락시 는 클라이언트에게 적합하게 변환된 이미지 파일들이 캐시에 저장되어 사용될 때 기존의 프락시 서버보다 빠른 속도를 보였다. 그리고 사용자들이 늘어날수록 클래스 기반 프락시가 기존의 프락시 서버보다 빠른 처리 속도를 나타냈다. 따라서, 클래스 기반 프락시는 클래스 별로 구분된 캐시로 인해 프락시 서버의 부담을 줄임으로써, 기존의 프락시 서버들보다 확장성(scalability)이 향상되었다.

  • PDF

디지털 사진기록물 관리를 위한 Raw 이미지 파일 포맷의 도입에 관한 연구 (A Study on the Introduction of Raw Image File Formats for the Management of Digital Photographic Records)

  • 박준영;이명규
    • 한국기록관리학회지
    • /
    • 제19권3호
    • /
    • pp.155-178
    • /
    • 2019
  • 이 연구의 목적은 Raw 이미지 파일 포맷의 특성과 문제점을 분석하고, 디지털 사진기록물 관리에 적합한지 평가하고, 공공기관에서 Raw 이미지 파일 포맷을 활용하기 위한 도입 방안을 제시하는 것이다. Raw 이미지 파일 포맷은 적용된 이미지 편집을 되돌릴 수 있는 가역성과 편집자의 의도를 효과적으로 반영할 수 있는 유연성을 지닌다. 하지만 Raw 이미지 파일 포맷의 대다수가 디지털카메라 제조업체에 종속된 독점 파일 포맷이라는 문제가 있다. Raw 이미지 파일 포맷을 표준화하기 위해 개발된 DNG 포맷은 해외 공공기관에서 긍정적인 평가를 받고 있다. 그러나 공식 표준 혹은 사실상 표준으로 완전히 인정받지 못했다는 한계가 있어 표준 Raw 포맷이 등장하기까지 잠정적으로 활용하는 것이 적합하다. 한편, 대검찰청에서 포맷 변환한 디지털 사진 파일을 법적 진본성을 가진 원본으로 인정하지 않는다는 문제가 있다. 따라서 단기적으로는 포맷 변환하여 생성한 DNG 파일과 원본 Raw 파일을 캡슐화하여 병행 보존하고, 장기적으로는 포맷 변환하여 생성한 DNG 파일만으로 법적 진본성을 인정받을 수 있도록 디지털 사진기록물의 해시값과 파일 크기 기준 시점을 재정의할 필요가 있다.

한국어 및 영어 이미지 캡션이 가능한 범용적 모델 및 목적에 맞는 텍스트를 생성해주는 기법 (A general-purpose model capable of image captioning in Korean and Englishand a method to generate text suitable for the purpose)

  • 조수현;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1111-1120
    • /
    • 2022
  • Image Captioning은 이미지를 보고 이미지를 언어로 설명하는 문제이다. 해당 문제는 이미지 처리와 자연어 처리 두 가지의 분야를 하나로 묵고 이해하고 하나로 묶어 해결할 수 있는 중요한 문제이다. 또한, 이미지를 자동으로 인식하고 텍스트로 설명함으로써 시각 장애인을 위해 이미지를 텍스트로 변환 후 음성으로 변환하여 주변 환경을 이해하는 데 도움을 줄 수 있으며, 이미지 검색, 미술치료, 스포츠 경기 해설, 실시간 교통 정보 해설 등 많은 곳에 적용할 수 있는 중요한 문제이다. 지금까지의 이미지 캡션 구 방식은 이미지를 인식하고 텍스트화시키는 데에만 집중하고 있다. 하지만 실질적인 사용을 하기 위해 현실의 다양한 환경이 고려되어야 하며 뿐만 아니라 사용하고자 하는 목적에 맞는 이미지 설명을 할 수 있어야 한다. 본 논문에서는 범용적으로 사용 가능한 한국어 및 영어 이미지 캡션 모델과 이미지 캡션 목적에 맞는 텍스트 생성 기법을 제한한다.

효율적인 전자상거래를 위한 무선 컨텐츠 변환기 시스템의 설계 (Design of Wireless Content Converter System For Efficient eCommerce System)

  • 김민수;유승범;신동규;신동일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1573-1576
    • /
    • 2001
  • 기존 유선인터넷의 발전에 힘입어 무선인터넷의 필요성이 대두되고 있으나, 기존의 유선인터넷의 콘텐츠에 비하면 무선인터넷의 제약과 개발자의 부족으로 인해 무선 인터넷 컨텐츠가 부족한게 현실이다. 이에 본 논문의 연구 방향은 기존의 유선 콘텐츠를 WML로 변환시킴으로써 기존 컨텐츠의 다양함을 유지하는 것이다. 또한 기존의 JPG, GIF포멧의 이미지들을 무선인터넷에 적합한 이미지로 변환하여 기존 콘텐츠의 효율적인 변환을 할 수 있도록 본 논문에서 설계하였다.

  • PDF

혼합 영상의 3D 변환을 위한 이미지 영역 검출 (Detecting Image Regions in Mixed Images for 3D Conversion)

  • 이준석;위진영;길종인;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.363-365
    • /
    • 2013
  • 최근 3D산업의 급성장으로 인해 3D콘텐츠 제작에 대한 관심이 확산되고 있다. 지금까지는 3D콘텐츠 제작을 영화나 애니메이션 같은 자연영상을 3D변환하는 것에 초점이 맞추어져 있었다. 자동 3D변환에서는 window 영상처럼 텍스트, 이미지, 로고 등의 혼합되어 있는 영상을 처리하는데 어려움이 있다. 특히 텍스트는 동일한 깊이맵을 얻지 못하면, 깨짐, 흔들림 등의 문제점이 발생한다. 해결방법으로 혼합 영상을 구분하고 영상 영역만을 탐색해서, 3D변환을 하고, 다른 영역은 2D로 처리함으로써 상기 문제점을 극복할 수 있다.

  • PDF

웨이블릿변환과 신경회로에 의한 칼라 동영상의 실시간 전송 (Real-time Image Transmission on the Internet Using Wavelet Transform and Neural Network)

  • Kim, Jeong-Ha;Kim, Hyoung-Bae;Nam, Boo-Hee
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 I
    • /
    • pp.145-148
    • /
    • 2003
  • 본 논문에서는 TCP/IP 기반에서 웨이블릿 변환과 신경회로(Neural Network)를 이용하여 실시간으로 동영상 전송을 위한 알고리즘에 대해 연구하였다. 우선, 서버에서 카메라를 이용하여 영상을 획득한다. 획득한 영상에 대해 2 단계 웨이블릿 변환을 한 후, 인터넷을 통하여 수신 측으로 전송한다. 그 다음, 수신 측에서는 동영상을 보이기 위해, 제한된 시간 안에 수신한 이미지 프레임(image frame)만을 가지고 역웨이블릿변환을 하여 보여주게 된다. 만약 네트워크에 혼잡이 발생하게 되면 소량의 이미지 프레임 만을 전송하도록 하였다. 수신 측에서는 네트워크의 혼잡 정도를 송신 측에 특별한 목적으로 제안된 프레임을 전송함으로써 알려주도록 하였으며, 송신 측에서는 이러한 정보를 수신한 후 역전파 신경회로(back-propagation neural network)를 이용하여 송신할 데이터의 양(data rate)을 조절하여줌으로써 네트워크 속도에 대처하도록 하였다. 이러한 방법을 통해서 우리는 네트워크의 혼잡에 알맞게 조정된 동영상의 스트림(stream)을 보낼 수 있었다.

  • PDF

웨이블릿 필터계수를 적용한 그레이 이미지의 의사컬러 향상에 관한 연구 (The Psuedocolor Image Enhancement on Gray Image with Wavelet Filter Coefficients)

  • 유병근;김윤호;류광렬
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.260-263
    • /
    • 2003
  • 본 논문은 그레이 영상에 웨이블릿 필터계수를 적용하여 의사컬러 이미지를 향상한 연구이다. 의사컬러 향상은 웨이블릿 변환을 사용해 분해능을 상승시켰고, 웨이블릿 필터계수를 사용하여 RGB 영상을 추출한 후 의사변환 하였다. 웨이블릿 필터계수를 사용한 의사컬러 변환은 일반적인 웨이블릿 변환에 비해 30dB이상 향상 되었다.

  • PDF

EMR 서식 및 이미지 형식 기록의 전자인증을 위한 XML 변환 (Converting Paper and Image Formats of EMR to XML for Electronic Signature)

  • 문우영;김병기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.629-632
    • /
    • 2006
  • 최근 EMR(Electronic Medical Record, 전자의무기록)에 대한 관심이 높아지면서 EMR을 도입하는 병원이 늘어나는 추세이다. EMR은 법적 효력과 증거력의 보유하기 위하여 정부가 인정하는 공인 인증기관으로부터 인증서를 발급받아 전자서명법에 따라 암호화 및 기명날인하여 별도의 저장장치에 관리하도록 하고 있다. 이러한 일련의 과정에서 EMR 데이터를 XML 문서나 다른 형식의 문서로 변환하게 된다. 본 논문은 XML 스키마에 따른 문서 생성이 용이한 텍스트나 코드화된 의무기록 뿐만 아니라 각종서식, 이미지 및 검사지 등 다양한 형식 기록의 전자인증을 위해 XML 문서로 변환하는 연구이며, 특히 표준화되기 힘든 비정형 기록들에 대한 XML 문서 변환 방법을 제안하고 이를 구현하였다.

  • PDF