• Title/Summary/Keyword: 이미지 대 이미지 변환

Search Result 35, Processing Time 0.027 seconds

Mosaics Image Generation based on Mellin Transform (멜린 변환을 이용한 모자이크 이미지 생성)

  • 이지현;양황규
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.7 no.8
    • /
    • pp.1785-1791
    • /
    • 2003
  • This paper presents the mosaic method that the video sequence with shift and rotation information after Mellin Transform. The results are used to compute the projection matrix for each image registration. So before registration, we process camera calibration in order to reduce the image warp by camera and then compute the global projection matrix for image registration for reducing errors from rut image to last image. This paper describes the mosaic method that compute duplication and movement information quickly and robust noise using projection matrix on Mellin Transform.

An Efficient Content-based Retrieval System using High-Dimensional Index Structure Image Database (대규모 이미지 데이터베이스에서 고차원 색인 구조를 이용한 효율적인 내용 기반 검색 시스템)

  • Lee, Dong-Ho;Park, Ju-Hong;Jeong, Jin-Wan;Kim, Hyeong
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.1
    • /
    • pp.52-65
    • /
    • 1999
  • 이미지나 비디오, 오디오와 같이 멀티미디어 데이터들은 기존의 단순한 텍스트 기반의 데이터에 비하여 대용량적인 특성과 비정형적인 특성을 가지고 있어서 검색시 많은 어려움이 따른다. 본 논문에서는 대규모의 이미지 데이터베이스에서 효율적이고 신속하게 사용자가 원하는 이미지를 검색할수 있는 내용 기반 검색 시스템을 제시한다. 이를 위해서 본 논문에서는 최근 여러 장점으로 인하여 신호 분석이나 이미지 압축 분야에 많이 사용되는 웨이브릿 변환을 이용하여 이미지 데이터로부터 내용 기반 검색에 사용되는 특징 벡터를 효율적으로 추출하는 기법과 유사성 측정 방법을 제안한다. 그리고, 이러한 특징 추출방법과 유사성 측정 방법을 이용하여 내용 기반 질의 및 검색을 수행할 경우, 검색 조건을 만족하는 객체인데 실수로 검색해내지 못하는 경우인 false dismissals 이 발생하지 않음을 보인다. 또한 대규모 이미지 데이터베이스에서 신속한 내용 기반 검색을 지원하기 위하여 고차원 데이터에 대한 효율적인 색인을 제공하는 X-tree를 이용한 이미지 색인 방법을 보이며 이것이 기존의 순차 검색이나 R*-tree를 이용한 색인 방법보다 신속하게 이미지 데이터들을 검색할 수 있다는 것을 다양한 실험을 통해 보인다. 마지막으로 QBIC에서 제안한 검색 적합성 측정 방법을 이용하여 본 논문에서 제안하는 내용 기반 이미지 검색시스템의 검색 적합성을 보인다.

Design of XML DTDs for Content-based Retrieval of Web Image (웹 이미지 내용 기반 검색을 위한 XML DTD 설계)

  • 김형근;홍성용;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.232-234
    • /
    • 2001
  • 인터넷의 발달과 사용의 확산에 따라 멀티미디어 데이터의 양이 급격히 증가하고 있다. 특히 멀티미디어 정보 가운데에서도 이미지 양은 대규모이므로 사용자가 원하는 이미지를 찾기가 쉽지 않았으며, 이에 따라 이미지 데이타를 검색하기 위한 여러 가지 방법들이 계속해서 제안되고 있다. 본 논문에서는 XML을 활용하여 웹상의 이미지 데이터에 대한 특징 정보를 구조적으로 표현해 웹 이미지에 대한 내용 기반 검색 능력을 개선한다. 관계 테이터베이스에 저장된 색상, 질감, 키워드 등 이미지 데이터에 대한 특징 정보들을 XML 문서로 자동 변환하기 위하여 이들 각각의 대한 DTD를 설계하고, 이들을 통합하여 검색할 수 있도록 통합 DTD를 설계한다. 통합 DTD를 XML 데이터 서버를 이용하여 구현에 실제 웹 상의 상품이미지를 검색하는데 적용함으로써 제안한 결과의 유용성을 보인다.

  • PDF

Semantic Object Segmentation Using Conditional Generative Adversarial Network with Residual Connections (잔차 연결의 조건부 생성적 적대 신경망을 사용한 시맨틱 객체 분할)

  • Ibrahem, Hatem;Salem, Ahmed;Yagoub, Bilel;Kang, Hyun Su;Suh, Jae-Won
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.26 no.12
    • /
    • pp.1919-1925
    • /
    • 2022
  • In this paper, we propose an image-to-image translation approach based on the conditional generative adversarial network for semantic segmentation. Semantic segmentation is the task of clustering parts of an image together which belong to the same object class. Unlike the traditional pixel-wise classification approach, the proposed method parses an input RGB image to its corresponding semantic segmentation mask using a pixel regression approach. The proposed method is based on the Pix2Pix image synthesis method. We employ residual connections-based convolutional neural network architectures for both the generator and discriminator architectures, as the residual connections speed up the training process and generate more accurate results. The proposed method has been trained and tested on the NYU-depthV2 dataset and could achieve a good mIOU value (49.5%). We also compare the proposed approach to the current methods in semantic segmentation showing that the proposed method outperforms most of those methods.

Building a fashion platform using 3D conversion based on deep learning and NFT (딥러닝 기반 3D 변환과 NFT를 활용한 패션 플랫폼 구축)

  • Park, Min-Gyu;Kim, Min-Ho;Han, Su-Han;Jung, Dong-Ju;Lee, Byung-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.922-924
    • /
    • 2022
  • 본 연구에서는 2D 이미지 파일을 NFT 3D 패션 아이템으로 변환하여 거래할 수 있도록 한다. 한 장의 2D 이미지가 SMR을 통해 3D 오브젝트로 변환된다. 변환된 오브젝트는 KIP-17 기반의 스마트 컨트랙트를 통해 NFT을 발행할 수 있도록 환경을 구축하고, 최종적으로 NFT를 거래할 수 있는 플랫폼을 제공한다.

Depth Map Using New Single Lens Stereo (단안렌즈 스테레오를 이용한 깊이 지도)

  • Changwun Ku;Junghee Jeon;Kim, Choongwon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.4 no.5
    • /
    • pp.1157-1163
    • /
    • 2000
  • In this paper, we present a novel and practical stereo vision system that uses only one camera and four mirrors placed in front of the camera. The equivalent of a stereo pair of images are formed as left and right halves of a single CCD image by using four mirrors placed in front of the ten of a CCD camera. An object arbitrary point in 3D space is transformed into two virtual points by the four mirrors. As in the conventional stereo system, the displacement between the two conjugate image points of the two virtual points is directly related to the depth of the object point. This system has the following advantages over traditional two camera stereo that identical system parameters, easy calibration and easy acquisition of stereo data.

  • PDF

VRML Model Retrieval System Based on XML (XML 기반 VRML 모델 검색 시스템)

  • Im, Min-San;Gwun, O-Bong;Song, Ju-Whan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.709-711
    • /
    • 2005
  • 컴퓨터 그래픽스 분야의 발전으로 3D 모델의 수가 기하급수적으로 늘고 있다. 기존의 텍스트나 2D 이미지만을 검색하는 시스템으로는 정확한 3D 모델의 검색이 힘들다. 따라서 3D 모델 검색 시스템의 필요성이 대두되고 많은 분야에서 그 정확도와 속도향상을 위한 3D 모델 검색 연산자(Descriptor)와 검색 알고리즘을 개발하기 위한 연구가 진행 중이다. 본 논문에서는 VRML 모델을 XML 데이터로 변환하여 3D 모델 검색에 사용하는 것이 주요 목표이다. 검색 방법은 크게 VRML의 노드 분류화를 통한 기본 도형에 대한 검색과 XML로 변환하면서 생성하는 무게중심(Mass-Center)을 이용한 검색 두 가지이다. 즉, 3D 모델 데이터베이스를 구축함으로써 VRML 노드를 통한 분류화와 라벨화된 3D 모델 데이터베이스 지원 등의 장점을 활용한다. 3D 모델을 Key값(Descriptor)을 생성하여 분류화된 XML 데이터로 저장하고, 처리하여 유사도 비교의 대상과 횟수가 많아질수록, 3D 모델을 바로 데이터베이스에서 검색에 사용할 수 있어 검색의 속도와 성능을 보다 증가시킬 수 있다. 보다 복잡한 3D 모델의 유사도 비교에 있어서는 Princeton Shape Benchmark(PSB)[1]에서 정확도가 가장 높게 평가된 방법인 LFD(Light Field Descriptor)[6] 검색 연산자를 사용한다. 이 방법은 3D 모델에서 2D 이미지를 얻어 검색하는 방법으로 많은 2D 이미지 관측점(View-Point)과 관측된 2D 이미지의 적합도를 비교하는 계산량이 많은 단점이 있다. 그래서 3D 모델 검색을 위한 2D 이미지 관측에 있어 x, y, z축 방향의 관측점을 얻는 방법을 제안함으로써 2D 이미지의 관측점을 줄여 계산량을 대폭 감소시키는 장점을 갖는다.것으로 조사되었으며 40대 이상의 연령층은 점심비용으로 더 많은 지출을 하고 있는 것으로 나타났다. 4) 끼니별 한식에 대한 선호도는 아침식사의 경우가 가장 높았으며, 이는 40대와 50대에서 높게 나타났다. 점심 식사로 가장 선호되는 음식은 중식, 일식이었으며 저녁 식사에서 가장 선호되는 메뉴는 전 연령층에서 일식, 분식류 이었으며, 한식에 대한 선택 정도는 전 연령층에서 매우 낮게 나타났다. 5) 각 연령층에서 선호하는 한식에 대한 조사에서는 된장찌개가 전 연령층에서 가장 높은 선호도를 나타내었고, 김치는 40대 이상의 선호도가 30대보다 높게 나타났으며, 흥미롭게도 30세 이하의 선호도는 30대보다 높게 나타났다. 그 외에도 떡과 죽에 대한 선호도는 전 연령층에서 낮게 조사되었다. 장아찌류의 선호도는 전 연령대에서 낮았으며 특히 30세 이하에서 매우 낮게 조사되었다. 한식의 맛에 대한 만족도 조사에서는 연령이 올라갈수록 한식의 맛에 대한 만족도는 낮아지고 있었으나, 한식의 맛에 대한 만족도가 높을수록 양과 가격에 대한 만족도는 높은 경향을 나타내었다. 전반적으로 한식에 대한 선호도는 식사 때와 식사 목적에 따라 연령대 별로 다르게 나타나고 있으나, 선호도는 성별이나 세대에 관계없이 폭 넓은 선호도를 반영하고 있으며, 이는 대학생들을 대상으로 하는 연구 등에서도 나타난바 같다. 주 5일 근무제의 확산과 초 중 고생들의 토요일 휴무와 더불어 여행과 엔터테인먼트산업은 더욱 더 발전을 거듭하고 있으며, 외식은 여행과 여가 활동의 필수적인 요소로써 그 역할을 일조하고 있다. 이와 같은 여가시간의 증가는 독신자들에게는 좀더 많은 여유시간을 가족을 이루고 있는 가족구성원들에게는 가족과의 유대를 강화하는 휴식과 오락의 소비 트렌드를 창출시켰다. 이와 더불어 외식은 식사를 해결하기 위한

  • PDF

Comparison of DICOM images and various types of images (DICOM 영상과 다양한 형식의 영상 비교)

  • Kim, Ji-yul;Ko, Seong-Jin
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.18 no.2
    • /
    • pp.76-83
    • /
    • 2017
  • In this study, the original medical image, DICOM file, was converted into TIFF, BITMAP, GIF, JPEG image file, and then the conversion loss ratio according to the image compression and conversion process was quantitatively evaluated using Origin pro and ICY image analysis program. As the evaluation method, 50% MTF, structural similarity index, MSE, RMSE, maximum signal - to - noise ratio and so on were evaluated. The TIFF image file showed the same result as DICOM image in all experimental groups, Image file format. In this study, we propose a new method for evaluating the quality of digital images by applying original evaluation program such as Origin pro or ICY medical image analysis program. Is expected to be used as research data in the field of medical image processing, and TIFF image file showing the same result as DICOM image in the basic research field using digital medical image and evaluation program that does not support DICOM file Therefore, it is believed that it will help to secure reliability in digital medical image processing research using image file.

  • PDF

Feature Point Matching for Product Name Recognition in O2O Stores (특징점 매칭을 이용한 O2O 상점에서의 상품명 인식)

  • Daemin Kim;Jongwook Si;Sungyoung Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.79-80
    • /
    • 2024
  • 인공지능과 디지털 변환의 추세가 소매업계에서 온라인으로의 전환을 가속화하고 있다. 이러한 변화에 부응하여 본 논문에서는 O2O(Online-to-Offline) 상점을 위한 상품명 인식 기술을 제안한다. 제안하는 방법은 이미지 내 특징점과 이들 주변의 픽셀 정보를 포함하는 특징 디스크립터를 활용하여 상품 이미지와 진열대 사진을 비교하는 것에 초점을 맞춘다. 사용된 주요 알고리즘은 SURF와 BFMatcher, KnnMatch 방법으로, 이들은 각각 이미지의 특징점을 탐지하고 매칭하는 데 사용된다. 실험을 통해 적절한 임계값을 설정하여 높은 신뢰도의 매칭 결과를 선별하는 방법을 제시하였으며, 이를 통해 O2O 상점에서 상품 관리와 인식을 향상시키는 데 기여할 수 있다.

  • PDF

Implementation of Image Gradient Detection System with High-Performance DSP (고성능 DSP를 이용한 영상기울기 검출 시스템 구현에 관한 연구)

  • Lee, Seung-Joon;Rhee, Sang-Burm
    • Journal of the Korea Computer Industry Society
    • /
    • v.9 no.3
    • /
    • pp.129-136
    • /
    • 2008
  • This paper implement image gradient detection algorithm with high-performance DSP. First the NTSC color image convert to B/W image. The image gradient detect with Hough transform after edge detection image from the B/W images. The value of image gradient detection control the servo motor to original position of the NTSC camera if camera base to the left or right tilt.

  • PDF