• Title/Summary/Keyword: 검출 모델

Search Result 1,728, Processing Time 0.033 seconds

Dynamic Synthesis of Pseudo 2D HMMs for Korean Characters in Key Character Recognition Tasks (키워드 인식을 위한 한글 Pseudo 2D HMM의 동적 합성 방법)

  • 조범준
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.6B
    • /
    • pp.820-827
    • /
    • 2001
  • 한글은 둘 또는 세 개의 자모가 사각형 영역 안에 적절히 배치된 구조로 되어 있다. 이와 같은 구성 방법에 따라 글자의 영상을 합성하고 이를 실시간에 Pseudo 2D HMM으로 변환하는 방법을 제안한다. 본 방법에 따라 실시간 합성된 모델과 추가의 필러(filler) 모델, 여백 모델을 문서 영상의 글자 영역에서 핵심어 검출에 적용하였다. 실험 결과 최소한의 설계 변수 조정으로도 오검출, 미검출률이 낮고 언어 모델 없이 숫자 89%, 한글 80%의 검출성능을 보였으며, 따라서 제안된 방법이 인쇄 문자 패턴의 실시간 모델링 및 키워드 검출에 효과가 있음을 보였다. 본 연구 결과는 내용 기반의 광학 문서 색인 등에 활용할 수 있다.

  • PDF

Shot Boundary Detection Model using Knowledge Distillation (지식의 증류기법을 이용한 샷 경계 검출 모델)

  • Park, Sung Min;Yoon, Ui Nyoung;Jo, Geun-Sik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.29-31
    • /
    • 2019
  • 샷 경계 검출(Shot Boundary Detection)은 영상 콘텐츠 분석을 위한 필수적인 기술이며, 다양한 방식으로 편집된 영상의 샷 경계를 정확하게 검출하기 위한 연구가 지속되어 왔다. 그러나 기존에 연구들은 고정된 샷 경계 검출 알고리즘이나 매뉴얼한 작업과 같이 학습이 불가능한 과정이 포함되어 있어 성능 개선에 한계가 있었다. 본 논문에서는 이러한 과정을 제거한 End-to-End 모델을 제안한다. 제안하는 모델은 시공간 정보 추출성능을 높이기 위해 행동 인식 데이터셋을 이용한 전이학습을 사용하고, 샷 경계 검출 성능을 높이기 위해 개선된 지식의 증류기법(Knowledge Distillation)을 결합한다. 제안하는 모델은 ClipShots 데이터셋에서 DeepSBD 에 비해 cut transition 과 gradual transition 이 각각 5.4%, 41.29% 높은 성능을 보였고, DSM 과의 비교에서 cut transition 의 정확도가 1.3% 더 높은 결과를 보였다.

  • PDF

Detection of ROIs using the Bottom-Up Saliency Model for Selective Visual Attention (관심영역 검출을 위한 상향식 현저함 모델 기반의 선택적 주의 집중 연구)

  • Kim, Jong-Bae
    • Annual Conference of KIPS
    • /
    • 2011.11a
    • /
    • pp.314-317
    • /
    • 2011
  • 본 논문은 상향식 현저함 모델을 이용하여 입력 영상으로부터 시각적 주의를 갖는 영역들을 자동으로 검출하는 방법을 제안한다. 제안한 방법에서는 인간의 시각 시스템과 같이 사전 지식 없이 시각정보의 공간적인 분포에 근거하여 장면을 해석하는 상향식 현저함 모델 방법을 입력 영상에 적용하여 관심 물체 영역을 검출하는 연구이다. 상향식 현저함 방법은 Treisman의 세부특징이론 연구에서 제시한 바와 같이 시각적 주의를 갖는 영역은 시각정보의 현격한 대비차이를 가지는 영역으로 집중되어 배경에서 관심영역을 구분할 수 있다. 입력 영상에서 현저함 모델을 통해 3차원 현저함 맵을 생성한다. 그리고 생성된 현저함 맵으로부터 실제 관심영역들을 검출하기 위해 제안한 방법에서는 적응적 임계치 방법을 적용하여 관심영역을 검출한다. 제안한 방법을 관심영역 분할에 적용한 결과, 영역 분할 정확도 및 정밀도가 약 88%와 89%로 제시되어 관심 영상분할 시스템에 적용이 가능함을 알 수 있다.

3D Building Reconstruction Using Building Model and Segment Measure Function (건물모델 및 선소측정함수를 이용한 건물의 3차원 복원)

  • Ye, Chul-Soo;Lee, Kwae-Hi
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.37 no.4
    • /
    • pp.46-55
    • /
    • 2000
  • This paper presents an algorithm for 3D building reconstruction from a pair of stereo aerial images using the 3D building model and the linear segments of building. Direct extraction of linear segments from original building images using parametric building model is attempted instead of employing the conventional procedures such as edge detection, linear approximation and line linking A segment measure function is simultaneously applied to each line segment extracted in order to improve the accuracy of building detection comparing to individual linear segment detection. The algorithm has been applied to pairs of stereo aerial images and the result showed accurate detection and reconstruction of buildings.

  • PDF

Robust Face Alignment using Progressive AAM (점진적 AAM을 이용한 강인한 얼굴 윤곽 검출)

  • Kim, Dae-Hwan;Kim, Jae-Min;Cho, Seong-Won;Jang, Yong-Suk;Kim, Boo-Gyoun;Chung, Sun-Tae
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.2
    • /
    • pp.11-20
    • /
    • 2007
  • AAM has been successfully applied to face alignment, but its performance is very sensitive to initial values. In this paper, we propose a face alignment method using progressive AAM. The proposed method consists of two stages; modelling and relation derivation stage and fitting stage. Modelling and relation derivation stage first builds two AAM models; the inner face AAM model and the whole face AAM model and then derive the relation matrix between the inner face AAM model parameter vector and the whole face AAM model parameter vector. The fitting stage is processed progressively in two phases. In the first phase, the proposed method finds the feature parameters for the inner facial feature points of a new face, and then in the second phase it localizes the whole facial feature points of the new face using the initial values estimated utilizing the inner feature parameters obtained in the first phase and the relation matrix obtained in the first stage. Through experiments, it is verified that the proposed progressive AAM-based face alignment method is more robust with respect to pose, and face background than the conventional basic AAM-based face alignment.

Performance Evaluation of YOLOv5s for Brain Hemorrhage Detection Using Computed Tomography Images (전산화단층영상 기반 뇌출혈 검출을 위한 YOLOv5s 성능 평가)

  • Kim, Sungmin;Lee, Seungwan
    • Journal of the Korean Society of Radiology
    • /
    • v.16 no.1
    • /
    • pp.25-34
    • /
    • 2022
  • Brain computed tomography (CT) is useful for brain lesion diagnosis, such as brain hemorrhage, due to non-invasive methodology, 3-dimensional image provision, low radiation dose. However, there has been numerous misdiagnosis owing to a lack of radiologist and heavy workload. Recently, object detection technologies based on artificial intelligence have been developed in order to overcome the limitations of traditional diagnosis. In this study, the applicability of a deep learning-based YOLOv5s model was evaluated for brain hemorrhage detection using brain CT images. Also, the effect of hyperparameters in the trained YOLOv5s model was analyzed. The YOLOv5s model consisted of backbone, neck and output modules. The trained model was able to detect a region of brain hemorrhage and provide the information of the region. The YOLOv5s model was trained with various activation functions, optimizer functions, loss functions and epochs, and the performance of the trained model was evaluated in terms of brain hemorrhage detection accuracy and training time. The results showed that the trained YOLOv5s model is able to provide a bounding box for a region of brain hemorrhage and the accuracy of the corresponding box. The performance of the YOLOv5s model was improved by using the mish activation function, the stochastic gradient descent (SGD) optimizer function and the completed intersection over union (CIoU) loss function. Also, the accuracy and training time of the YOLOv5s model increased with the number of epochs. Therefore, the YOLOv5s model is suitable for brain hemorrhage detection using brain CT images, and the performance of the model can be maximized by using appropriate hyperparameters.

Hybrid Color Model for Robust Detection of Skin Color under the Illumination Variance (조명 변화에 강건한 피부색 영역 검출을 위한 혼합 컬러 모델)

  • Moon, Kyu-Hyung;Choi, Yoo-Joo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.98-101
    • /
    • 2006
  • 본 논문에서는 얼굴영상 인식의 전처리 단계인 피부 영역 자동 검출시 적용 가능하며 조명변화에 강건한 피부 영역 검출을 위한 혼합 컬러모델을 제시한다. 또한, 사용자별로 차이를 보이는 다양한 피부색을 자동으로 인식하고 사용자에 적합한 피부색 영역을 결정하기 위하여 제시한 컬러 모델을 기반으로 한 피부색 영역 모델링 전처리 단계를 제시한다. 우선, 사용자 및 사용 카메라에 따라 차이를 보이는 피부색에 대한 영역 모델을 구축하기 위하여 화면상의 가운데에 손이나 얼굴 영역이 위치하도록 하고 일정 프레임의 화면 정보를 취득한다. 취득 화면 정보로서 각 픽셀에 대한 정규화 된 RGB 성분 및 H 성분, V 성분 정보를 추출하고 이에 대한 평균화된 혼합 컬러 모델을 구축한다. H성분으로 피부색과 비슷한 배경을 제거하고 여기에 YUV 성분 중 적색에서 밝기 값을 뺀 성분인 V 값을 한 번 더 사용하여 밝기 값을 제거한 보다 뚜렷한 얼굴영역을 검출한다.

  • PDF

Detection of Facial Region using Multi-Channel Color Model (다채널 컬러 모델을 이용한 얼굴영역 검출)

  • Song, Sun-Hee;Suk, Kyung-Hyu;Kim, Chul-Young;Kim, Moon-Hwan;Jeoung, You-Sun;Bae, Chul-Soo;Ra, Sang-dong
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.805-808
    • /
    • 2004
  • 본 논문에서는 컬러정보를 이용하여 외부 조명의 영향에 대응하면서 얼굴 후보영역을 추출하고, 추출된 후보 영역으로부터 다채널 스킨컬러 모델로 특정 정보를 추출하는 검출 기법을 제시한다. 외부 조명에 민감한 스킨컬러 특성을 고려해 색상정보와 광도를 분리할 수 있는 $YC_rC_b$ 색상모델을 이용하며, Green, Blue 채널의 정보를 Gaussian 확률밀도 모델로부터 $C_b-C_g$의 좁은 범위에 분포되어 있는 스킨컬러 영역 밀도를 모델링한다. 또한 얼굴영역에 Region Restricting과 임계값 반복 알고리즘을 사용하여 눈 영역 검출 과정을 보이고, 실시간 복합 얼굴 검출 시스템 조명방식에 의해 결과를 나타낸다.

  • PDF

Plant leaf area estimation using synthetic dataset and deep learning model (합성 데이터셋과 딥러닝 모델을 이용한 식물 엽면적 추정)

  • Suh, Hyun Kwon;Ahn, Juyeon;Park, Hyeonji
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.90-92
    • /
    • 2022
  • 이 논문에서는 합성된 애기장대 데이터셋을 활용하여 딸기의 엽면적을 추정할 수 있는 딥러닝 모델을 제안한다. 제안된 모델에서는 개별 잎 검출을 위하여 합성 데이터셋으로 학습된 Mask R-CNN 의 객체 검출 모델을 사용하였고, 이어 이미지 후처리 작업에 해당되는 모폴로지 연산의 침식 및 팽창, 픽셀 카운터를 통해 엽면적을 추정하였다. 각기 다른 역할을 수행하는 신경망 계층에 어텐션 메커니즘 적용하여 검출 성능의 향상과 검출 시간을 단축하였다. 제안된 모델은 딸기 데이터셋을 사용하지 않는 합성된 데이터셋만으로도 실제 온실에서 획득한 다양한 이미지에서의 딸기 엽면적을 추정하는 데에 우수한 성능을 보여준다.

  • PDF

Eye Localization based on Multi-Scale Gabor Feature Vector Model (다중 스케일 가버 특징 벡터 모델 기반 눈좌표 검출)

  • Kim, Sang-Hoon;Jung, Sou-Hwan;Oh, Du-Sik;Kim, Jae-Min;Cho, Seong-Won;Chung, Sun-Tae
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.1
    • /
    • pp.48-57
    • /
    • 2007
  • Eye localization is necessary for face recognition and related application areas. Most of eye localization algorithms reported thus far still need to be improved about precision and computational time for successful applications. In this paper, we propose an improved eye localization method based on multi-scale Gator feature vector models. The proposed method first tries to locate eyes in the downscaled face image by utilizing Gabor Jet similarity between Gabor feature vector at an initial eye coordinates and the eye model bunch of the corresponding scale. The proposed method finally locates eyes in the original input face image after it processes in the same way recursively in each scaled face image by using the eye coordinates localized in the downscaled image as initial eye coordinates. Experiments verify that our proposed method improves the precision rate without causing much computational overhead compared with other eye localization methods reported in the previous researches.