• 제목/요약/키워드: sketch recognition

검색결과 26건 처리시간 0.02초

스케치 기반 이미지 검색의 최신 연구 동향 (Recent advances in sketch based image retrieval: a survey)

  • 오세홍;석호식
    • 전기전자학회논문지
    • /
    • 제28권2호
    • /
    • pp.209-220
    • /
    • 2024
  • 스케치는 직관적으로 정보를 표현할 수 있는 수단이나 실제 이미지와 비교하였을 때 추상화가 심하고 동일한 대상에 대한 스케치 임에도 변화가 매우 크다는 문제점이 있다. 따라서 스케치에 기반한 이미지 인식에 도움이 되는 특성을 표현하기 어려웠는데, 딥뉴럴 모델의 발전은 이미지와 스케치라는 두 도메인에 공통으로 존재하는 특성을 발견할 수 있게 해 주었다. 본 논문에서는 스케치에 기반한 이미지 검색 기술의 최신 연구 동향을 소개한다. 이미지 검색 외에 스케치에 기반한 이미지 인식과 이미지 생성의 연구 동향도 함께 요약하였으며, 스케치 기반 연구에서 주로 활용되는 데이터셋 및 해당 데이터셋에 기반하여 측정한 검색 성능을 포함하였다.

Autism Spectrum Disorder Recognition with Deep Learning

  • Shin, Jongmin;Choi, Jinwoo
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1268-1271
    • /
    • 2022
  • Since it is common to have touch-screen devices, it is less challenging to draw sketches anywhere and save them in vector form. Current research on sketches considers coordinate sequence data and adopts sequential models for learning sketch representation in sketch understanding. In the sketch dataset, it has become customary that the dataset is in vector coordinate format. Moreover, the popular dataset does not consider real-life sketches, sketches from pencil, pen, and paper. Art psychology uses real-life sketches to analyze patients. ETRI presents a unique sketch dataset for sketch recognition of autism spectrum disorder in pixel format. We present a method to formulate the dataset for better generalization of sketch data. Through experiments, we show that pixel-based models can produce a good performance.

  • PDF

Sketch Recognition Using LSTM with Attention Mechanism and Minimum Cost Flow Algorithm

  • Nguyen-Xuan, Bac;Lee, Guee-Sang
    • International Journal of Contents
    • /
    • 제15권4호
    • /
    • pp.8-15
    • /
    • 2019
  • This paper presents a solution of the 'Quick, Draw! Doodle Recognition Challenge' hosted by Google. Doodles are drawings comprised of concrete representational meaning or abstract lines creatively expressed by individuals. In this challenge, a doodle is presented as a sequence of sketches. From the view of at the sketch level, to learn the pattern of strokes representing a doodle, we propose a sequential model stacked with multiple convolution layers and Long Short-Term Memory (LSTM) cells following the attention mechanism [15]. From the view at the image level, we use multiple models pre-trained on ImageNet to recognize the doodle. Finally, an ensemble and a post-processing method using the minimum cost flow algorithm are introduced to combine multiple models in achieving better results. In this challenge, our solutions garnered 11th place among 1,316 teams. Our performance was 0.95037 MAP@3, only 0.4% lower than the winner. It demonstrates that our method is very competitive. The source code for this competition is published at: https://github.com/ngxbac/Kaggle-QuickDraw.

중국 윈난성(云南省) 소수민족 전통마을 청쯔고촌(城子古村)의 공간 인지 특성 연구 (A Study on the Spatial Cognition Characteristics at Minority Traditional Village of Chengzi in Yunnan Province of China)

  • 손영림;이인희;유재우
    • 대한건축학회논문집:계획계
    • /
    • 제35권9호
    • /
    • pp.101-108
    • /
    • 2019
  • Chinese ethnic minorities are inheriting their own traditions based on thousands of years of community life. Yunnan province in china is a castle in which many ethnic minorities have been living on the basis of various natural environments. Their traditional village can be regarded as a place reflecting minorities' thousands year of history and culture, and elements of positive social spaces are seen from the old village. Streets and places of the village are accumulated as images for residents. Based on their imagination-concept, sketch maps, reflecting residents' cognitive perception were collected. Analysis of 21 sketch maps shows that architectural elements, forming a unique landscape and community life contribute to establish a unity of one nation. the oldest tree in the village has a strong specificity as a place with the belief that the tree protects all residents in the village. Space in the head of the residents and Social spaces, embedded in the memories of the residents living in the community continued organically and the roads of the village showed clear recognition. Following this, the analysis methodology of social spaces and sketch will be examined in depth.

투명한 입력오버레이를 이용한 필기 및 음성 입력 (Handwriting and Voice Input using Transparent Input Overlay)

  • 김대현;김명준;이진호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.245-254
    • /
    • 2008
  • 본 논문은 IBM ViaVoice와 마이크로소프트 필기-인식 시스템(handwriting-recognition system)과 같은 인식 엔진(recognition engines)을 UMPC와 같은 펜-입력 디스플레이에서 작동하는 일반적인 윈도우 어플리케이션과 연동하기 위한 단일화된 멀티모달 입력 프레임워크(unified multi-modal input framework)를 제안한다. 사용자가 펜-입력 디스플레이에 부탁되어있는 버튼을 한 손으로 누르면, 인터넷 검색 윈도우나 워드 프로세서와 같이 현재 포커스를 갖는 윈도우는 전체 데스크탑을 덮을 수 있는 투명한 윈도우로 덮여진다. 이 위에 사용자는 다른 한 손으로, 현재 working context를 놓치지 않으면서, 필기 입력을 자유롭게 수행할 수 있다. 이런 투명 입력 윈도우를 이용하여 필기 및 음성 입력뿐만 아닐라 다이어그램까지 그릴 수 있게 해준다.

스케치를 이용한 웹 환경에서의 3차원 모델 검색 (Web-based 3D Object Retrieval from User-drawn Sketch Query)

  • 송종헌;주재호;윤상민
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.838-846
    • /
    • 2014
  • 터치기반 스마트 기기의 발달에 따라, 사용자가 펜/손가락을 이용하여 그린 스케치를 기반으로 다양한 멀티미디어 검색 기술은 컴퓨터 비전, 컴퓨터 그래픽스, 패턴인식, HCI 분야에서 많은 각광을 받고 있다. 하지만, 기존의 텍스트 정보를 기반으로 한 검색 시스템은 사용자가 원하는 멀티미디어 데이터를 정확히 검색하는데 한계가 있다. 따라서, 멀티미디어 자체가 가지고 있는 정보를 이용하여 검색할 수 있는 내용 기반 멀티미디어 검색에 관한 연구가 필요하게 되었다. 본 논문에서는 Hybrid Edge Descriptor(HED)를 사용한 웹 환경에서의 사용자가 스케치로부터 3차원 모델을 검색할 수 있는 시스템을 제안한다. 3차원 모델로부터 다양한 방향으로 투영된 suggestive contour 영상 및 사용자가 그린 스케치 영상으로부터 전역/지역 히스토그램 분석을 이용한 HED 검색자를 통해 회전 및 이동에 강인한 3차원 모델 검색 시스템을 제안한다.

인터액티브 펜-입력 디스플레이 애플리케이션을 위한 효과적인 특징점 추출법 (An Efficient Feature Point Detection for Interactive Pen-Input Display Applications)

  • 김대현;김명준
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.705-716
    • /
    • 2005
  • 패턴 인식 연구 분야에서 많은 특징점 추출 알고리즘들이 개발되었지만, 태블릿 PC나 LCD 태블릿과 같은 펜-입력 디스플레이를 위한 인터액티브 애플리케이션들은 기존과는 다른 요구사항을 가진다. 사용자 마다 다른 다양한 스케치 스타일의 대해서 세그멘테이션 및 특징점 추출을 그림을 그리는 동안 실시간에 안정적으로 수행하여야 한다. 본 논문은 사용자로부터 자유로이 입력된 펜 입력을 분할(segmentation)하기 위해 필수적인 곡률(curvature) 측정 방법을 제안한다. 이 방법은 국소적인 모양 정보(shape descriptors)만을 사용하므로 펜 입력동안 곧바로(on-the-fly) 곡률을 측정할 수 있다. 본 알고리즘은 3차원 스케치 기반 모델링 애플리케이션에서 펜 마킹 인식을 위해서 사용되었다.

애니메이션 저작도구를 위한 음성 기반 음향 스케치 (Voice Driven Sound Sketch for Animation Authoring Tools)

  • 권순일
    • 한국콘텐츠학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-9
    • /
    • 2010
  • 애니메이션 캐릭터의 동작을 만들어내기 위해 펜으로 스케치하는 형식의 인터페이스를 이용하는 저작 도구들이 연구되어 왔지만, 아직까지 음향적인 요소에 있어서 직관적인 인터페이스를 사용하여 만들어내는 방법은 연구되지 않았다. 본 논문에서는 사용자가 음향과 대응되는 의성어의 발성을 통하여 표현하면 이에 대응되는 음향샘플이 선택되어 삽입되는 방법을 제안하고자 한다. 일반적으로 사용되는 통계적 모델을 기반으로 하는 패턴인식 방법을 이용하여 의성어 발성만으로 대응되는 음향샘플을 어느 정도 인식할 수 있는지를 실험해본 결과 의성어의 음성샘플을 이용한 경우 최대 97%의 인식률을 얻을 수 있었다. 또한 새로운 음향샘플 등록 시에 발생하는 음성데이터 수집의 어려움을 극복하기 위하여 음성모델을 만드는 대신에 의성어의 음성샘플 하나만 사용하는 GLR Test를 활용해보니 기존의 방법과 거의 대등한 인식률을 실험적으로 확인할 수 있었다.

지게차 계기판의 인지성 평가에 관한 연구 (A study on the recognition of the dashboard in forklift)

  • 최진봉;윤용구;정명철;박범
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.219-225
    • /
    • 2006
  • This paper studies on the visibility of dashboard in forklift. As part of the real setting devised for this study, 1. Important evaluation by males experience in forklift driving, 2. Icon cognition experiment, 3. Gage cognition experiment, subjects were asked to estimate the important evaluation, sketched to icon and gage position on the screen. Subjective evaluations were carried out by semantic differential method, sketch method, sketch method, then analyzed by consistency test, frequency rate and T-test. I gather the results concerning the relationship between consistent answers and cognition rates of dashboard understand the conditions which create a desired instrument panel.

  • PDF

스케치 인식을 통한 디지털 도면 생성 기법 (Method of Generating Digital Drawing through Sketch Recognition)

  • 오수현;이성진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.91-94
    • /
    • 2019
  • 스케치를 거쳐 생성되는 디지털 자료로 건축도면이나 제품 디자인시안 등은 수요가 많음에도 불구하고 디지털 도면 자동생성에 대한 영상처리는 아직 연구되지 않고 있다. 현행 필기인식에 대한 영상처리 연구는 주로 글자나 숫자에 국한되어 있어 본 연구에서는 선으로 이루어진 필기를 인식하여 도면이라는 이진영상의 특징을 이용해 특징점을 도출하고 디지털 도면을 생성하는 영상처리를 제안한다. 먼저 입력받은 아날로그 스캔이미지를 메디안블러링과 OSTU임계처리로 노이즈가 없는 이진영상으로 변환한 후 해리스코너검출기를 이용하여 특징점을 검출하고 좌표를 추출하고, 좌표값을 활용해 외곽선과 내부윤곽선까지 구현하여 디지털도면을 양산한다.

  • PDF