• 제목/요약/키워드: Otsu

검색결과 145건 처리시간 0.03초

SOM과 개선된 ART-1을 이용한 악보 인식 (Musical Score Recognition with SOM and Enhanced ART-1)

  • 김광백
    • 한국정보통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.1064-1069
    • /
    • 2013
  • 본 논문에서는 SOM과 개선된 ART-1을 이용하여 악보를 인식하는 방법을 제안한다. 악보 인식을 위해 스캔된 악보 이미지를 호프 변환, Otsu's 이진화를 원본 이미지에 적용하고, 히스토그램 분석을 통해 구분된 작은악절에서 오선을 제거하여 악보의 음표 성분을 추출할 수 있는 이미지 전처리 단계를 수행한다. 오선이 제거된 작은악절은 레이블링을 이용하여 음표 성분을 분리한다. 추출된 음표들은 SOM 알고리즘을 적용하여 일정한 크기로 정규화하고, 정규화된 음표 정보들을 개선된 ART-I 알고리즘을 적용하여 학습과 인식한다. 제안된 방법을 적용하여 음표 인식 실험을 한 결과, 제안된 방법이 음표 인식에 효율적임을 확인하였다.

Study on Image Processing Techniques Applying Artificial Intelligence-based Gray Scale and RGB scale

  • Lee, Sang-Hyun;Kim, Hyun-Tae
    • International Journal of Advanced Culture Technology
    • /
    • 제10권2호
    • /
    • pp.252-259
    • /
    • 2022
  • Artificial intelligence is used in fusion with image processing techniques using cameras. Image processing technology is a technology that processes objects in an image received from a camera in real time, and is used in various fields such as security monitoring and medical image analysis. If such image processing reduces the accuracy of recognition, providing incorrect information to medical image analysis, security monitoring, etc. may cause serious problems. Therefore, this paper uses a mixture of YOLOv4-tiny model and image processing algorithm and uses the COCO dataset for learning. The image processing algorithm performs five image processing methods such as normalization, Gaussian distribution, Otsu algorithm, equalization, and gradient operation. For RGB images, three image processing methods are performed: equalization, Gaussian blur, and gamma correction proceed. Among the nine algorithms applied in this paper, the Equalization and Gaussian Blur model showed the highest object detection accuracy of 96%, and the gamma correction (RGB environment) model showed the highest object detection rate of 89% outdoors (daytime). The image binarization model showed the highest object detection rate at 89% outdoors (night).

다중가우시안혼합모델을 이용한 소동물 심근경색 PET 영상의 정량적 평가 기술 (Quantitative Assessment Technology of Small Animal Myocardial Infarction PET Image Using Gaussian Mixture Model)

  • 우상근;이용진;이원호;김민환;박지애;김진수;김종국;강주현;지영훈;최창운;임상무;김경민
    • 한국의학물리학회지:의학물리
    • /
    • 제22권1호
    • /
    • pp.42-51
    • /
    • 2011
  • 전통적으로 심근 생존능을 식별하고 심근 관류를 정확히 평가하기 위한 도구로 핵의학영상이 이용되고 있으나 경색영역을 정의하기에는 어려움이 있다. 이에 본 연구에서는 극성지도의 분포를 분석하여 특성에 맞는 적응적 임계값을 이용하여 심근경색 모델을 정량적으로 평가하고자 하였다. 쥐 심근경색 모델은 왼쪽 관상동맥을 결찰시켜 제작하였다. 소동물PET 영상은 37 MBq $^{18}F$-FDG를 쥐의 꼬리정맥에 주사한 후 60분 섭취 후 Siemens Inveon SPECT/PET 스캐너를 이용하여 20분 동안 ECG 신호와 함께 획득하였고, OSEM 2D 알고리즘을 이용하여 재구성하였다. PET 영상의 심근 극성지도는 Siemens QGS 소프트웨어에 적합한 형식으로 변환 후 자동으로 심근 벽을 설정하여 작성하였다. 심근경색영역의 기준데이터는 TTC 염색으로 설정하였으며 전체 좌심실대비 염색된 영역의 백분율로 획득하였다. 최적의 임계값 설정을 위해 절대치 설정 방법, Otsu 알고리즘, 다중가우시안혼합모델(Multi Gaussian mixture model, MGMM)을 이용하여 평가하였다. 절대치 설정 방법은 10~90%까지 10%단위로 미리 정의 된 임계값을 이용하였고, Otsu 알고리즘은 영상 내에서 두 군집의 분산을 최대로 하는 임계값으로 설정하였다. MGMM 방법은 영상의 화소 강도를 분석하여 여러 개의 가우시안 분포함수(MGMM2, $\cdots$ MGMM4)로 반복 수행하여 최적의 가우시안 분포를 구하여 적응적 임계값을 설정하였다. 극성지도 평가지표는 각각의 알고리즘에서 측정된 임계값을 이용하여 이진화하고 전체 극성지도와 경색영역의 백분율로 획득한 후, TTC 염색으로 획득된 기준데이터와의 차이를 비교하였다. 그 차이는 절대치 방법의 20%에서 $7.04{\pm}3.44%$, 30%에서 $3.87{\pm}2.09%$, 40%에서 $2.15{\pm}2.07%$이었다. Otsu 방법은 $3.56{\pm}4.16%$이었으며 MGMM 방법은 $2.29{\pm}1.94%$이었다. 소동물 PET 극성지도에서는 30% 임계값이 조직학적 데이터와 비교하여 가장 작은 차이를 보였다. 그러나 TTC 염색으로 측정한 크기가 10% 이하에서는 MGMM 방법이 절대치 방법보다 작은 차이를 보였다(MGMM: 0.006%, 절대치방법: 0.59%). 이 연구에서는 심근경색 모델 평가를 위하여 생체영상 극성지도에서 다중가우시안혼합모델을 이용하여 평가하고자 하였다. MGMM은 사용자의 선택 없이도 자동적으로 영상 특성을 고려하여 적응적 임계값을 찾아주는 방법으로 극성지도에서 심근경색을 평가하는데 도움이 될 것으로 기대된다.

산업용 매니퓰레이터의 작업 성능 향상을 위한 영상 기반 물체 인식에 관한 연구 (Study on vision-based object recognition to improve performance of industrial manipulator)

  • 박인철;박종호;류지형;김형주;정길도
    • 한국산학기술학회논문지
    • /
    • 제18권4호
    • /
    • pp.358-365
    • /
    • 2017
  • 본 논문에서는 산업용 매니퓰레이터의 작업 성능 향상을 위하여 영상 기반의 물체 인식 방법을 제안하였다. 기존 산업용 매니퓰레이터의 경우 대부분 산업 현장에서 제공하는 정보만을 활용해 산업용 매니퓰레이터를 동작시킴으로써 작업 물체 틀어짐 등에 대한 문제를 고려하지 않고 있기에 보다 안정적인 작업을 수행하는데 있어 문제점이 발생할 수 있다. 본 연구에서 사용된 물체인식 방법은 기존의 Harris Coner 알고리즘의 인식률 향상을 위하여 HSV채널로부터 색상정보를 포함한 V채널과 배경분리가 용이한 S채널을 분리 한 뒤 이를 바탕으로 Otsu Thresholding 기법을 적용하였다. 이를 통해 작업 물체를 보다 정확하게 인식하고 만약 작업 물체가 외부요인에 의하여 정확한 위치에 놓여있지 않거나 뒤틀어져 있는 경우 신속하게 확인한 후 원활한 작업을 위해 산업용 매니퓰레이터의 동작 제어를 수행하는 것으로 실제 산업용 매니퓰레이터에 적용한 후 실험을 통하여 이를 검증하였다. 이는 실제 공장 시스템에서 갑작스런 사람의 유입 혹은 외부요인에 의한 작업 물체의 변화 등의 문제점에 대하여 강인하고 유연하게 대처하며 오류로 인한 작업공정의 중단을 사전에 방지함으로서 전체시스템 가동시간의 효율성을 증대시키는 결과를 가져올 수 있다.

컬러 영상 분석을 통한 백반증 영역 분할 (Color Image Segmentation of Vitiligo Region)

  • 신승원;김경섭;이세민;김정환
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.2037-2038
    • /
    • 2011
  • 피부에 나타나는 난치성 질환인 백반증은 심리적인 위축감을 주어 정상적인 생활에 지장을 줄 수 있는 질병이다. 이에 따라서 본 연구에서는 피부에 나타나는 백반증의 진행 상태를 판단하기 위하여 L*a*b* 컬러 공간으로 변환된 피부 영상에 Otsu 임계값 설정 기법을 적용하여 백반증의 발병 영역을 자동으로 판별하는 알고리즘을 제안하였다.

  • PDF

색역 압축과 특징치 투영을 이용한 입술영역 분할 (Segmentation of the Lip Region by Color Gamut Compression and Feature Projection)

  • 김정엽
    • 한국멀티미디어학회논문지
    • /
    • 제21권11호
    • /
    • pp.1279-1287
    • /
    • 2018
  • In this paper, a new type of color coordinate conversion is proposed as modified CIEXYZ from RGB to compress the color gamut. The proposed segmentation includes principal component analysis for the optimal projection of a feature vector into a one-dimensional feature. The final step adopted for lip segmentation is Otsu's threshold for a two-class problem. The performance of the proposed method was better than that of conventional methods, especially for the chromatic feature.

Application of UAV-based RGB Images for the Growth Estimation of Vegetable Crops

  • Kim, Dong-Wook;Jung, Sang-Jin;Kwon, Young-Seok;Kim, Hak-Jin
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.45-45
    • /
    • 2017
  • On-site monitoring of vegetable growth parameters, such as leaf length, leaf area, and fresh weight, in an agricultural field can provide useful information for farmers to establish farm management strategies suitable for optimum production of vegetables. Unmanned Aerial Vehicles (UAVs) are currently gaining a growing interest for agricultural applications. This study reports on validation testing of previously developed vegetable growth estimation models based on UAV-based RGB images for white radish and Chinese cabbage. Specific objective was to investigate the potential of the UAV-based RGB camera system for effectively quantifying temporal and spatial variability in the growth status of white radish and Chinese cabbage in a field. RGB images were acquired based on an automated flight mission with a multi-rotor UAV equipped with a low-cost RGB camera while automatically tracking on a predefined path. The acquired images were initially geo-located based on the log data of flight information saved into the UAV, and then mosaicked using a commerical image processing software. Otsu threshold-based crop coverage and DSM-based crop height were used as two predictor variables of the previously developed multiple linear regression models to estimate growth parameters of vegetables. The predictive capabilities of the UAV sensing system for estimating the growth parameters of the two vegetables were evaluated quantitatively by comparing to ground truth data. There were highly linear relationships between the actual and estimated leaf lengths, widths, and fresh weights, showing coefficients of determination up to 0.7. However, there were differences in slope between the ground truth and estimated values lower than 0.5, thereby requiring the use of a site-specific normalization method.

  • PDF

구간평균 기법과 직선으로부터의 최대거리를 이용한 초분광영상의 무감독변화탐지 (Unsupervised Change Detection of Hyperspectral images Using Range Average and Maximum Distance Methods)

  • 김대성;김용일;편무욱
    • 한국측량학회지
    • /
    • 제29권1호
    • /
    • pp.71-80
    • /
    • 2011
  • 임계값 결정은 변화유무만을 판단하는 무감독변화탐지에 있어 매우 중요한 과정으로 인식되고 있다. 본 논문은 향후 수요 증가가 기대되는 원격탐사 데이터 중 하나인 초분광영상을 이용한 새로운 무감독변화탐지 기법을 제안하고 있다. 다중시기의 화소간 유사도 측정을 통해 도출된 결과값을 일정 간격으로 평균하여 그래프를 생성하고, 최대거리 기법을 적용하여 변화유무 정보를 추출하기 위한 임계값을 결정하였다. 참조자료를 취득할 수 있는 두 가지 의사영상을 통해 기대최대화 기법, 교점방법, Otsu 기법과 결과를 비교하여 성능을 평가하였으며, 이를 토대로 다중시기의 Hyperion 영상에 각 기법을 적용하여 변화탐지 결과를 확인하였다. 제안기법은 기존의 임계값 결정 기법과 비슷하거나 높은 정확도를 보였으며, 간단하게 적용할 수 있는 장점이 있어 향후 초분광영상을 이용한 무감독변화탐지에 효과적으로 사용될 수 있을 것으로 기대된다.

퍼지논리를 이용한 α-cut 자동 설정 기반 퍼지 이진화 (An α-cut Automatic Set based on Fuzzy Binarization Using Fuzzy Logic)

  • 이호창;김광백;박현준;차의영
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2924-2932
    • /
    • 2015
  • 영상 이진화 기술은 객체와 배경을 분할하는 과정으로 영상 분석 및 인식 분야에 널리 적용되고 있다. 기존의 이진화 방법은 임계치를 설정하는 과정에서 객체와 배경의 명암 차이가 크지 않을 경우에 불확실성이 존재한다. 이러한 문제점을 개선한 퍼지 이진화는 객체의 특징을 효과적으로 이진화 하지만 ${\alpha}$-cut값을 정적으로 설정하기 때문에 객체의 특징들이 손실된 상태로 이진화 되는 문제점이 있다. 따라서 본 논문에서는 평균, 반복, Otsu 이진화 방법들의 임계치를 이용한 퍼지 소속 함수를 구하여 ${\alpha}$-cut값을 동적으로 설정하는 방법을 제안한다. 다양한 영상을 대상으로 실험한 결과, 제안된 방법은 기존의 이진화 방법 및 퍼지 이진화 방법보다 배경과 객체들의 손실이 적은 상태로 이진화된 것을 확인하였다.

자동차 번호판 이진화 방법에 대한 성능 비교 (Comparative Performance Evaluation of Binarization Methods for Vehicle License Plate)

  • 김민기
    • 한국콘텐츠학회논문지
    • /
    • 제9권8호
    • /
    • pp.9-17
    • /
    • 2009
  • 자동차 번호 인식에 대한 연구가 활발히 이루어져 왔으나, 번호판 이진화 방법들에 대한 비교 연구는 거의 이루어지지 않았다. 이로 인하여 관련 연구자들마다 효과적인 이진화 방법을 찾기 위하여 유사한 시행착오를 겪어 왔다. 본 연구에서는 이러한 시행착오를 줄일 수 있도록 기존의 번호판 이진화 방법들을 구현하여 성능을 양적으로 비교 제시하였다. 이진화 성능 측정은 저수준 척도와 고수준 척도를 모두 사용함으로써 이진화 자체에 대한 평가뿐만 아니라 후속 단계에서의 유용성을 함께 고려하였다. 그리고 이진화 방법들의 특성을 파악하기 위하여 조도의 특성에 따라 번호판 영상을 세 그룹으로 분류하여 이진화 성능을 측정하였다. 실험 결과 조도의 강도보다는 조도의 균일성 여부가 이진화 성능에 더 큰 영향을 미치는 것으로 나타났다. 조도가 균열한 영상은 Otsu의 방법이 가장 효과적이었으며, 조도가 불균일한 영상은 파라미터를 보정한 Niblack 방법이 가장 좋은 결과를 나타냈다.