• 제목/요약/키워드: hidden image

검색결과 340건 처리시간 0.032초

MLP-Mixer를 이용한 이미지 이상탐지 (Image Anomaly Detection Using MLP-Mixer)

  • 황주효;진교홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.104-107
    • /
    • 2022
  • 오토인코더 딥러닝 모델은 이상 데이터도 정상 데이터로 복원하는 능력이 우수하여 이상탐지에 적절하지 못한 경우가 발생한다. 그리고 데이터의 일부를 가린(마스킹) 후 가린 데이터를 복원하는 방식인 Inpainting 방식은 잡음이 많은 이미지에 대해서는 복원능력이 떨어지는 문제점을 가지고 있다. 본 논문에서는 MLP-Mixer 모델을 수정·개선하여 이미지를 일정 비율로 마스킹하고 마스킹된 이미지의 압축된 정보를 모델에 전달해 이미지를 재구성하는 방식을 사용하였다. MVTec AD 데이터 셋의 정상 데이터로 학습한 모델을 구축한 뒤, 정상과 이상 이미지를 각각 입력하여 재구성 오류를 구하고 이를 통해 이상탐지를 수행하였다. 성능 평가 결과 제안된 방식이 기존의 방식에 비해 이상탐지 성능이 우수한 것으로 나타났다.

  • PDF

정지영상과 동영상의 융합모델에 의한 얼굴 감정인식 (Face Emotion Recognition by Fusion Model based on Static and Dynamic Image)

  • 이대종;이경아;고현주;전명근
    • 한국지능시스템학회논문지
    • /
    • 제15권5호
    • /
    • pp.573-580
    • /
    • 2005
  • 본 논문에서는 인간과 컴퓨터의 인터페이스를 좀더 자연스럽고 쉬운 형태의 능동적인 휴먼 인터페이스로 구현하기 위해 정지영상 및 동영상에서의 감정인식기법을 제안하고자 한다. 제안된 얼굴의 감정인식 기법은 Hidden Markov Model(HMM), 주성분분석기법(PCA)와 웨이블렛 변환을 기반으로 구성하였다. 얼굴의 감정인식을 위하여 심리학자인 Ekman과 Friesen의 연구에 의해 문화에 영향을 받지 않고 공통으로 인식하는 6개의 기본 감정인 기쁨, 슬픔, 화남, 놀람, 공포, 혐오를 바탕으로 실험하였다. 감정인식에서 입력영상은 이산 웨이블렛을 기반으로 한 다해상도 분석기법을 사용하여 데이터 수를 압축한 후, 각각의 영상에서 PCA 특징벡터를 추출한 후 이를 사용하여 HMM의 모델을 생성한다. 인식단계에서는 정지영상에서의 인식값과 동영상에서의 인식값을 정규화 과정을 통하여 상호보완 함으로써 인식률을 높일 수 있었다.

지화 인식을 위한 계층적 은닉 마코프 모델 (Hierarchical Hidden Markov Model for Finger Language Recognition)

  • 권재홍;김태용
    • 전자공학회논문지
    • /
    • 제52권9호
    • /
    • pp.77-85
    • /
    • 2015
  • 지화(finger language)는 수화(sign language)에 포함되며, 손의 제스쳐로 한글의 모음, 자음을 표현하는 언어 체계이다. 한글 지화는 총 31 제스쳐로 구성되어 있으며, 정확한 인식을 위해서는 하나의 제스쳐에 대해 학습 모델이 많이 필요로 하게 된다. 대량의 학습 모델이 존재할 경우, 입력 데이터는 많은 공간을 탐색하는데 시간을 소비하게 된다. 따라서 실시간 인식 시스템은 이러한 탐색 공간을 줄이는 것이 가장 중요한 문제로 인식되고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 인식률 저하 없이 탐색 공간을 효율적으로 줄이는 계층적 HMM 구조를 제안하였다. 지화는 손목의 방향성에 따라 총 3개의 범주로 설정, 입력 데이터는 이 범주 안에서 모델을 검색하게 된다. 이러한 사전 분류를 진행하여 비슷한 한글 지화의 분별력을 확립하게 되며 탐색 공간 또한 효율적으로 관리되므로 실시간 인식 시스템에 적용 가능하다. 실험 결과, 제안된 방법은 일반적인 HMM 인식 방법보다 평균 3배 정도의 시간을 단축할 수 있있고, 비슷한 한글 지화 제스쳐에 대해 오인식 또한 감소하였다.

여성정치지도자의 패션컬러를 통해 본 휴먼이미지 연구 (Human Image Analysis Through Fashion Color of Female Political Leaders)

  • 김세아;장성호
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.247-256
    • /
    • 2017
  • 21세기는 사람의 이미지를 디자인하는 시대가 되었다. 사람의 이미지를 디자인함으로써 개인 내면의 숨겨진 능력을 밖으로 표출시켜 줄 수 있다. 현대사회는 빠르게 변화되고 이러한 사회는 이제 빠르고 복잡함보다는 배려와 공감, 이해심, 소통의 여성 리더십이 새로운 원동력으로 주목받고 있다. 세계적으로 큰 기업에서는 여성 최고 경영자가 선출되는 것이 빈번할 뿐만 아니라 북유럽에서는 여성 국회의원의 수가 40%를 육박하고 있다. 여성리더십의 향상과 함께 여성 지도자의 패션은 주목받고 있으며 장소와 상황에 적합한 패션 컬러는 여성 지도자에게 중요한 이미지 전략 중 하나로 쓰여 진다. 본 연구는 시각 이미지이자, 감각 언어인 컬러 이미지를 통해 여성 정치 지도자의 패션을 분석하고 연구하고자 한다. 그리고 여성 지도자들이 패션컬러를 통해 제시하는 휴먼이미지를 분석한다.

Performance Comparison on Speech Codecs for Digital Watermarking Applications

  • Mamongkol, Y.;Amornraksa, T.
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.466-469
    • /
    • 2002
  • Using intelligent information contained within the speech to identify the specific hidden data in the watermarked multimedia data is considered to be an efficient method to achieve the speech digital watermarking. This paper presents the performance comparison between various types of speech codec in order to determine an appropriate one to be used in digital watermarking applications. In the experiments, the speech signal encoded by four different types of speech codec, namely CELP, GSM, SBC and G.723.1codecs is embedded into a grayscale image, and theirs performance in term of speech recognition are compared. The method for embedding the speech signal into the host data is borrowed from a watermarking method based on the zerotrees of wavelet packet coefficients. To evaluate efficiency of the speech codec used in watermarking applications, the speech signal after being extracted from the attacked watermarked image will be played back to the listeners, and then be justified whether its content is intelligible or not.

  • PDF

DCT영역에 기반한 반복적 이진위상컴퓨터형성홀로그램을 이용한 디지털 영상 워터마킹 기술

  • 김철수
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.32-36
    • /
    • 2009
  • 본 논문에서는 DCT영역에서 반복적 이진위상컴퓨터형성홀로그램을 이용한 디지털 영상 워터마킹 기술을 제안하였다. 워터마크로 주로 사용되는 랜덤 시퀸스 또는 로고와 같은 은닉영상 대신 은닉영상을 손실없이 재생할 수 있는 이진위상컴퓨터형성홀로그램을 생성하고, 이를 반복적으로 표현해서 워터마크로 사용한다. 그리고 이 워터마크를 호스트영상의 DCT 계수에 적절한 규칙을 통해 가중치를 부여하여 삽입한 후, IDCT한다. 워터마크의 추출은 워터마킹된 영상과 호스트영상을 DCT하고, 삽입시 적용한 규칙을 통해서 수행한다. 그리고 추출된 워터마크의 역푸리에 변환과 호스트영상에 삽입하기전의 워터마크를 역푸리에 변환하여 재생한 은닉영상과의 상관을 취함으로써 워터마크의 존재여부를 검증한다. 제안한 방법은 워터마크 삽입/추출시 반복되는 홀로그램정보를 활용하고, 이진 값으로 구성되어 있으므로 기존의 어떠한 워터마킹 기술보다 외부 공격에 견실한 특징을 가지고 있으며, 컴퓨터 시뮬레이션을 통해 그 성능을 확인하였다.

  • PDF

목공예품의 이미지제공 및 수종분석(II) - 목조각류를 중심으로 - (Image Support and Wood Identification of Wood Crafts (II) - Focusing on Wooden Sculpts -)

  • 김사익
    • 한국가구학회지
    • /
    • 제26권3호
    • /
    • pp.274-285
    • /
    • 2015
  • Wood carving has been extremely widely practiced, but survives much less well than the other main materials, being vulnerable to decay, insect damage, and fire. It therefore forms an important hidden element in the art history of many cultures. Even though wood is less durable than either steel or stone, it has been used for a long time due to its usefulness. Wood has a lot of benefits. So people have used wood for materials in houses, trains, cars, bridges, and simple utilities in their ways according to their own religions, climates, and environment they are living in. Nowadays, there are wood products that are made up for its weaknesses and this has made wood be used in variety fields. Moreover, wood has been widely selected materials for sculptures, interior, and also for architecture thanks to its colors and textures. Wood has helped our life more abundant and beautiful.

개선된 움직임 실루엣 영상을 이용한 발걸음 인식에 관한 연구 (Gait Recognition using Modified Motion Silhouette Image)

  • 홍성준;이희성;오경세;김은태
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.49-52
    • /
    • 2006
  • 본 논문에서는 은닉 마르코프 모델을 바탕으로 하는 발걸음을 이용한 개인 식별 시스템을 제안한다. 개인의 발걸음은 연속적인 자세나 움직임의 집합으로 나타낼 수 있는데, 구조적으로 연속적인 움직임의 변화는 확률적인 특성을 가지고 있기 때문에 은닉 마르코프 모델을 이용하여 적절하게 모델링 할 수 있다. 개인의 발걸음은 N개의 이산적인 자세 간의 전이로 이루어졌다고 가정하였으며, 이를 계산하기 위해 MMSI라는 발걸음 특징 모델을 제안하였다. MMSI는 발걸음 인식에 중요한 역할을 하는 시공간적인 정보를 가지고 있는 그레이-스케일 영상이다. 실험 결과는 MMSI를 이용하여 은닉 마르코프 모델을 바탕으로 한 발걸음 인식 결과를 보여준다.

  • PDF

신경회로망을 이용한 한글 문자의 인식 (The Recognition of Korean Characters by a Neural Network)

  • 김상우;전윤호;최종호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1989년도 하계종합학술대회 논문집
    • /
    • pp.166-169
    • /
    • 1989
  • A study for the recognition of the Korean characters by a neural network is presented. To reduce the dimension of the input image data, DC components are extracted from each input image and used as input to the neural net. A multi-layer perceptron with one hidden layer was trained with back-error propagation training algorithm. Its performance is tested for 24 ${\times}$ 24 binary images of Korean characters and the results of several experiments are presented.

  • PDF

다중 시점 영상 시퀀스를 이용한 강인한 행동 인식 (Robust Action Recognition Using Multiple View Image Sequences)

  • 아마드;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.509-514
    • /
    • 2006
  • Human action recognition is an active research area in computer vision. In this paper, we present a robust method for human action recognition by using combined information of human body shape and motion information with multiple views image sequence. The principal component analysis is used to extract the shape feature of human body and multiple block motion of the human body is used to extract the motion features of human. This combined information with multiple view sequences enhances the recognition of human action. We represent each action using a set of hidden Markov model and we model each action by multiple views. This characterizes the human action recognition from arbitrary view information. Several daily actions of elderly persons are modeled and tested by using this approach and they are correctly classified, which indicate the robustness of our method.

  • PDF