• 제목/요약/키워드: Shape-Based Retrieval

검색결과 184건 처리시간 0.035초

효율적인 이미지 검색 시스템을 위한 자기 감독 딥해싱 모델의 비교 분석 (Comparative Analysis of Self-supervised Deephashing Models for Efficient Image Retrieval System)

  • 김수인;전영진;이상범;김원겸
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.519-524
    • /
    • 2023
  • 해싱 기반 이미지 검색에서는 조작된 이미지의 해시코드가 원본 이미지와 달라 동일한 이미지 검색이 어렵다. 본 논문은 이미지의 질감, 모양, 색상 등 특징 정보로부터 지각적 해시코드를 생성하는 자기 감독 기반 딥해싱 모델을 제안하고 평가한다. 비교 모델은 오토인코더 기반 변분 추론 모델들이며, 인코더는 완전 연결 계층, 합성곱 신경망과 트랜스포머 모듈 등으로 설계된다. 제안된 모델은 기하학적 패턴을 추출하고 이미지 내 위치 관계를 활용하는 SimAM 모듈을 포함하는 변형 추론 모델이다. SimAM은 뉴런과 주변 뉴런의 활성화 값을 이용한 에너지 함수를 통해 객체 또는 로컬 영역이 강조된 잠재 벡터를 학습할 수 있다. 제안 방법은 표현 학습 모델로 고차원 입력 이미지의 저차원 잠재 벡터를 생성할 수 있으며, 잠재 벡터는 구분 가능한 해시코드로 이진화 된다. CIFAR-10, ImageNet, NUS-WIDE 등 공개 데이터셋의 실험 결과로부터 제안 모델은 비교 모델보다 우수하며, 지도학습 기반 딥해싱 모델과 동등한 성능이 분석되었다.

창고 시스템의 효율성 평가를 위한 교육용 프로그램 개발 (A Development of Educational Program for Evaluating the Efficiency of Warehouse System)

  • 김문기;김희성
    • 한국실천공학교육학회논문지
    • /
    • 제4권1호
    • /
    • pp.80-85
    • /
    • 2012
  • 현대 산업 사회에서 창고의 역할은 보관창고의 개념에서 정보시스템의 도입을 통해 구매, 생산, 저장 및 분배 활동을 원활히 하는 유통창고의 개념으로 바뀌어 창고의 중요성은 계속 커지고 있다. 본 연구에서는 자동창고의 효율성을 평가할 수 있는 프로그램이 C#을 이용하여 개발되었다. 저장법, 자동창고의 배치형태 및 명령수행절차의 세 가지 운영조건의 조합으로 8가지의 방안에 대하여 모의실험이 이루어졌고, 프로그램에 동일한 입출고 데이터를 입력하여 스태커 크레인의 이동거리 값을 산출하였으며, 결과 값을 토대로 원인을 분석하고 최적의 운영방안을 제시할 수 있다. 이 프로그램은 모의실험을 통해 프로그램의 효율성과 응용가능성을 보여주었고, 공장설비 관련 교과목에 활용되어질 수 있다.

  • PDF

젖소의 개체인식 및 형상 정보화를 위한 컴퓨터 시각 시스템 개발 (I) - 반문에 의한 개체인식 - (Development of Computer Vision System for Individual Recognition and Feature Information of Cow (I) - Individual recognition using the speckle pattern of cow -)

  • 이종환
    • Journal of Biosystems Engineering
    • /
    • 제27권2호
    • /
    • pp.151-160
    • /
    • 2002
  • Cow image processing technique would be useful not only for recognizing an individual but also for establishing the image database and analyzing the shape of cows. A cow (Holstein) has usually the unique speckle pattern. In this study, the individual recognition of cow was carried out using the speckle pattern and the content-based image retrieval technique. Sixty cow images of 16 heads were captured under outdoor illumination, which were complicated images due to shadow, obstacles and walking posture of cow. Sixteen images were selected as the reference image for each cow and 44 query images were used for evaluating the efficiency of individual recognition by matching to each reference image. Run-lengths and positions of runs across speckle area were calculated from 40 horizontal line profiles for ROI (region of interest) in a cow body image after 3 passes of 5$\times$5 median filtering. A similarity measure for recognizing cow individuals was calculated using Euclidean distance of normalized G-frame histogram (GH). normalized speckle run-length (BRL), normalized x and y positions (BRX, BRY) of speckle runs. This study evaluated the efficiency of individual recognition of cow using Recall(Success rate) and AVRR(Average rank of relevant images). Success rate of individual recognition was 100% when GH, BRL, BRX and BRY were used as image query indices. It was concluded that the histogram as global property and the information of speckle runs as local properties were good image features for individual recognition and the developed system of individual recognition was reliable.

퓨리에 시리즈를 사용한 외형기반 이미지 검색 (Shape Based Image Retrieval using Fourier Series)

  • 탁윤식;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.366-371
    • /
    • 2006
  • 퓨리에 시리즈를 사용하면 이미지의 외곽선 특성을 표현할 수 있다. 이미지의 퓨리에 계수를 추출하기 위해서는 우선 이미지를 구성하는 주요 오브젝트를 표현하는 곡선을 추출한다. 이러한 곡선은 오브젝트의 특정 중심점에서 외곽선을 따라 일회전하면서 그 거리를 좌표상에 표시함으로써 얻을 수 있다. 기존의 퓨리에 계수를 추출하는 방법들은 추출된 계수를 이용하여 해당 곡선을 복원했을 때 원래의 곡선에 존재하던 상세한 특성을 표현하지 못한다는 단점이 있으며 이는 결국 이미지로부터 추출한 곡선을 사용하여 이미지를 검색할 때 정확도를 상당히 떨어뜨리게 한다. 이러한 문제점을 해결하기 위해서 본 논문에서는 Binary Range Reduction (BRR) 알고리즘을 제안한다. BRR 알고리즘은 원래의 곡선과 퓨리에 계수를 통해서 복원된 곡선간의 차이를 줄이기 위해서 전체의 곡선을 통해서 하나의 퓨리에 계수 세트를 추출하지 않고, 복원된 곡선이 원래의 곡선과 차이가 일정 크기 이상 나지 않도록 퓨리에 계수를 추출하는 구간을 나누어가며 퓨리에 계수를 추출한다. 이렇게 추출된 다수의 퓨리에 계수 세트를 통해서 복원된 곡선을 사용하여 이미지들 간의 유사도를 비교한다. 실험을 통하여 BRR 알고리즘을 사용하여 곡선에서 추출한 퓨리에 계수로 복원한 곡선이 원래 곡선의 특성을 정확하게 표현하고 있음을 보였고, 퓨리에 계수와 BRR알고리즘을 이미지 검색에 적용하였을 때, 높은 검색 결과를 얻을 수 있음을 보였다.

  • PDF

모바일 기반의 3 차원 객체 검색과 자세 추정을 위한 외형 기반의 인덱스 구축 및 검색 기법 (A Shape-based 3D object retrieval and pose estimation scheme for the mobile environment)

  • 탁윤식;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.395-398
    • /
    • 2009
  • 3 차원 객체 검색 및 자세 추정 기법은 의료, 보안 등의 다양한 산업 영역에서 매우 중요한 이슈 중 하나로써 연구되고 있다. 정확한 객체 검색 및 자세 추정을 위해서는 객체의 가능한 모든 영상 정보를 사용하여야 하기 때문에 많은 연산시간이 걸리게 되고, 특히 객체의 정확한 자세를 추정하기 위해서는 높은 CPU 의 성능과 큰 메모리 공간을 필요로 한다. 이러한 제약으로 인해, 3 차원 객체 검색 및 자세 추정은 상대적으로 하드웨어의 성능이 낮은 모바일 장치에서 실행되기 어려웠다. 따라서, 본 논문에서는 모바일 장치에서도 효과적으로 객체 검색 및 자세 추정이 가능하도록 하기 위한 클라이언트-서버 환경에서의 객체의 외형 기반 인덱스 구축 및 검색 기법을 제안한다. 제안된 기법의 주요 특징은 i) 모바일 장치의 하드웨어 환경을 고려하여 비교적 적은 수의 객체의 영상을 바탕으로 한 객체 검색 및 후보 자세 예측과 ii) 모바일 장치에서의 검색 결과와 많은 수의 객체 영상을 기반으로 한 서버에서의 정확한 자세 추정이다. 실험 결과에서는 제안된 기법들을 통해, 빠른 시간 내에 정확한 객체 검색 및 자세 추정이 가능함을 보였다.

Attentional View Pooling을 이용한 조립 부품 이미지 기반 3 차원 물체 검색 (Assembly Part Image-based 3D Shape Retrieval using Attentional View Pooling)

  • 이은지;강이삭;김민우;박선지;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.72-75
    • /
    • 2020
  • 조립 부품 이미지에 해당하는 3D CAD 모델 매칭 기술은 최근 로봇 조립 기술의 발전으로 필요성이 대두되고 있다. 이미지 기반 3 차원 모델 매칭 연구는 진행되어 왔지만 가구 부품 이미지와는 특성이 다른 RGB[5] 이미지나 스케치 이미지를 다루는[1] 접근들이었다. 딥러닝을 사용하는 스케치 이미지 기반 3 차원 물제 검색 연구에서는 대부분 3 차원 이미지를 다각도에서 렌더링한 view 이미지들에서 feature를 추출하고 pooling 하여 하나의 feature를 출력한다. 그러나 기존의 view pooling 방식은 단순한 평균 방식으로, 부품 이미지에 따른 view를 반영하기에는 한계가 있었다. 따라서 본 논문에서는 조립 부품 이미지 기반 3 차원 물체 검색을 위해 query 부품 이미지에 따라 다른 view 이미지에 집중할 수 있는 방식의 attentional view pooling을 제안한다. 또한 조립 부품 데이터의 특성 상 class 당 CAD 모델이 하나인 상황이므로 학습 데이터가 터무니없이 부족하여 이를 해결하기 위한 학습 데이터 증강 방법을 제안한다. 실험은 의자 부품 11가지에 대해 진행하였고 이를 통해 제안하는 방식의 성능을 입증하였다.

  • PDF

윤곽선 특성과 동적 시간 정합을 이용한 식물 잎 이미지 검색 기법 (A Leaf Image Retrieval Scheme based on Shape Descriptor and Dynamic Time Warping)

  • 탁윤식;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.3-5
    • /
    • 2007
  • 본 논문에서는 새로운 내용기반 이미지 검색 기법으로 식물 잎의 윤곽선에 대하여 동적 시간 정합 기법을 이용하여 유사한 이미지를 효과적으로 검색하는 방법을 제안한다. 이를 위하여 우선 식물 잎의 기준점에 대하여 잎의 가장자리를 따라 가면서 구해지는 거리의 곡선을 통하여 잎의 외형 특성을 표현하였다. 추출된 곡선 정보의 효율적인 저장과 처리를 위하여 곡선의 특성을 표현할 수 있는 퓨리에 계수(Fourier Coefficients)를 계산하고 이를 바탕으로 유사한 이미지를 계산하였다. 이런 과정에서 생기는 문제점으로는 복잡한 형태의 곡선에 대해서는 퓨리에 계수를 통하여 저장하고 복원하는 과정에서 원본 곡선의 세부적인 형태 정보를 상실하게 된다. 이러한 문제를 해결하기 위해서는 복잡한 곡선 유형에 대해서는 복원시 상실되는 정보가 최소화될 수 있는 작은 단위의 구간으로 나누고 이에 대한 퓨리에 계수를 계산하는 방법으로 다수의 퓨리에 계수 세트를 추출하는 이진 구간 분할 (Binary Range Reduction) 알고리즘을 사용하였고 질의 이미지와 저장된 이미지들을 비교하는 과정에서 검색의 정확도를 향상시키기 위하여 동적 시간 정합(Dynamic Time Warping) 알고리즘을 사용하였다. 그리고 검색의 효율을 더욱 높이기 위하여 추출된 외형 정보를 기반으로 잎의 유형을 다양한 카테고리로 분류하는 외형 기형 기반의 잎 분류 기법을 제안하였다. 다양한 실험을 통하여 제안한 기법이 식물 잎 검색에 우수한 성능을 나타냄을 보인다.

한국과 영국 사이의 국립공원 자연 경관 특색의 판별 분석 - 내용기반 영상검색의 저단계 기능 측면에서 - (Discriminant Analysis of Natural Landscape Features in National Parks between Korea and Scotland - Using Low-Level Functions of Content-Based Image Retrieval -)

  • 이덕재
    • 한국환경생태학회지
    • /
    • 제22권3호
    • /
    • pp.289-300
    • /
    • 2008
  • 질감, 모양, 색채 등 내용기반 영상검색(CBIR)의 기능을 이용하여 한국의 지리산 국립공원과 영국의 케이른고럼스 국립공원의 자연 경관에 있어서의 차이를 판별하는데 본 연구의 목적이 있다. 먼저 각 국립공원의 자연경관을 디지털 사진영상으로 촬영한 후, 전형적인 경관사진을 선별하였다. 사진영상의 저단계 기능(Low-level function)이 계량화되어 수직적으로 회전된 다섯 개의 요인으로 축약되었다. 이 중 유의한 차이를 보이지 않은 물 관련 요인이 제외된 나머지 네 개의 요인에 근거한 판별선이 케이른고럼스 경관과 지리산 경관 사이에서 도출되어, 판별함수가 두 그룹을 유의하게 분할하였다($x^2(4)$=61.433; p<0.001). 고유치 2.417과 월크스 람다 0.293에 의하여 전체 변이가 두 그룹의 판별함수 평균의 차이에서 대부분 산출되었음을 확인하였다. 또한, 네 개의 독립변수가 종속변수 전체 분산의 70.7%를 설명하는 것으로 추정되었다. 경관에 대하여 가장 큰 효과를 나타내는 변수는 원거리관련 변수(r=1.073)이며, 다음으로 근거리관련 변수(r=0.896)였으며, 전체적으로 90.7%가 타당하게 분류되었다. 이는 케이른고럼스 국립공원과 지리산 국립공원 자연경관 사이에서 사진영상의 근거리 요인뿐만 아니라, 원거리 요인이 보다 경관 차이에 유의한 판별력을 보이는 것으로 해석되므로, 국립공원의 경관정체성과 관련한 원거리 스카이라인의 시각적 중요성을 보여주는 것이라 하겠다.

NMF를 이용한 영문자 활자체 폰트 분류 (Font Classification of English Printed Character using Non-negative Matrix Factorization)

  • 이창우;강현;정기철;김항준
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.65-76
    • /
    • 2004
  • 최근 대부분의 문서들이 전자적으로 생성되고 많은 고문서들이 이미지 형태로 전자화되고 있다. 이미지 형태의 전자 문서들은 정보 추출과 데이터베이스화에 많은 어려움이 있기 때문에, 이러한 문서를 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문자 인식을 위한 많은 연구가 필요하다. 본 논문은 폰트의 구분 특성(font discrimination features)들이 폰트이미지의 공간적으로 지역적인 특징들에 기반함을 가정한 방법으로써, 객체의 부분기반 표현들을 학습할 수 있는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법이다. 제안된 방법은 부분기반의 비지도 학습 방법(part-based unsupervised learning technique)을 이용하여 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들이 폰트의 식별을 위한 적절성을 보인다. 제안된 방법이 기존의 문자인식, 문서 검색 시스템들의 전처리기로 사용되면, 그 시스템들의 성능을 향상시킬 것으로 기대된다.

칼라와 에지 히스토그램 기술자를 이용한 영상 마이닝 향상 기법 (The Usage of Color & Edge Histogram Descriptors for Image Mining)

  • 안성옥;박동원
    • 컴퓨터교육학회논문지
    • /
    • 제7권5호
    • /
    • pp.111-120
    • /
    • 2004
  • 영상의 칼라, 텍스쳐, 오브젝트의 형체 등과 같은 하위 수준의 특징을 표현할 수 있는 기술자를 MPEG-7 표준에서 규정하고 있다. 하지만, 각각의 기술자를 따로 분석함으로써는 성능 향상에 불충분한 점이 있었다. 본 논문에서는 칼라 기술자와 텍스쳐 기술자를 결합하여 영상검색의 성능을 향상시키는 방법을 제안한다. MPEG-7 표준에서 정의한 $l_{1}$-norm방법보다, 본 논문에서는 칼라 히스토그램의 경우 코사인 근사도 계수를, 에지 히스토그램의 경우 유클리디언 디스턴스를 적용 실험하여 진일보한 결과를 도출할 수 있었다.

  • PDF