• 제목/요약/키워드: Segmentation model

검색결과 1,031건 처리시간 0.024초

Mean Shift 분석을 이용한 그래프 컷 기반의 자동 칼라 영상 분할 (Graph Cut-based Automatic Color Image Segmentation using Mean Shift Analysis)

  • 박안진;김정환;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권11호
    • /
    • pp.936-946
    • /
    • 2009
  • 그래프 컷(graph cuts) 방법은 주어진 사전정보와 각 픽셀간의 유사도를 나타내는 데이터 항(data term)과 이웃하는 픽셀간의 유사도를 나타내는 스무드 항(smoothness term)으로 구성된 에너지 함수를 전역적으로 최소화하는 방법으로, 최근 영상 분할에 많이 이용되고 있다. 기존 그래프 컷 기반의 영상 분할 방법에서 데이터 항을 설정하기 위해 GMM(Gaussian mixture model)을 주로 이용하였으며, 평균과 공분산을 각 클래스를 위한 사전정보로 이용하였다. 이 때문에 클래스의 모양이 초구(hyper-sphere) 또는 초타원(hyper-ellipsoid)일 때만 좋은 성능을 보이는 단점이 있다. 다양한 클래스의 모양에서 좋은 성능을 보이기 위해, 본 논문에서는 mean shift 분석 방법을 이용한 그래프 컷 기반의 자동 영상분할 방법을 제안한다. 데이터 항을 설정하기 위해 $L^*u^*{\upsilon}^*$ 색상공간에서 임의로 선택된 초기 mean으로부터 밀도가 높은 지역인 모드(mode)로 이동하는 mean의 집합들을 사전정보로 이용한다. Mean shift 분석 방법은 군집화에서 좋은 성능을 보이지만, 오랜 수행시간이 소요되는 단점이 있다. 이를 해결하기 위해 특징공간을 3차원 격자로 변형하였으며, mean의 이동은 격자에서 모든 픽셀이 아닌 3차원 윈도우내의 1차원 모멘트(moment)를 이용한다. 실험에서 GMM을 이용한 그래프 컷 기반의 영상분할 방법과 최근 많이 이용되고 있는 mean shift와 normalized cut기반의 영상분할 방법을 제안된 방법과 비교하였으며, Berkeley dataset을 기반으로 앞의 세 가지 방법보다 좋은 성능을 보였다.

영상 기반 Semantic Segmentation 알고리즘을 이용한 도로 추출 (Road Extraction from Images Using Semantic Segmentation Algorithm)

  • 오행열;전승배;김건;정명훈
    • 한국측량학회지
    • /
    • 제40권3호
    • /
    • pp.239-247
    • /
    • 2022
  • 현대에는 급속한 산업화와 인구 증가로 인해 도시들이 더욱 복잡해지고 있다. 특히 도심은 택지개발, 재건축, 철거 등으로 인해 빠르게 변화하는 지역에 해당한다. 따라서 자율주행에 필요한 정밀도로지도와 같은 다양한 목적을 위해 빠른 정보 갱신이 필요하다. 우리나라의 경우 기존 지도 제작 과정을 통해 지도를 제작하면 정확한 공간정보를 생성할 수 있으나 대상 지역이 넓은 경우 시간과 비용이 많이 든다는 한계가 있다. 지도 요소 중 하나인 도로는 인류 문명을 위한 많은 다양한 자원을 제공하는 중추이자 필수적인 수단에 해당한다. 따라서 도로 정보를 정확하고 신속하게 갱신하는 것이 중요하다. 이 목표를 달성하기 위해 본 연구는 Semantic Segmentation 알고리즘인 LinkNet, D-LinkNet 및 NL-LinkNet을 사용하여 광주광역시 도시철도 2호선 공사 현장을 촬영한 드론 정사영상에서 도로를 추출한 다음 성능이 가장 높은 모델에 하이퍼 파라미터 최적화를 적용하였다. 그 결과, 사전 훈련된 ResNet-34를 Encoder로 사용한 LinkNet 모델이 85.125 mIoU를 달성했다. 향후 연구 방향으로 최신 Semantic Segmentation 알고리즘 또는 준지도 학습 기반 Semantic Segmentation 기법을 사용하는 연구의 결과와의 비교 분석이 수행될 것이다. 본 연구의 결과는 기존 지도 갱신 프로세스의 속도를 개선하는 데 도움을 줄 수 있을 것으로 예상된다.

조건부 랜덤 필드와 컨볼루션 신경망을 이용한 의미론적인 객체 분할 방법 (Semantic Segmentation using Convolutional Neural Network with Conditional Random Field)

  • 임수창;김도연
    • 한국전자통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.451-456
    • /
    • 2017
  • 컴퓨터비전에서 가장 기본적이고, 복잡한 문제를 수반하는 의미론적 분할(Semantic segmentation)은 이미지의 각 픽셀을 특정 객체로 분류하며, 레이블(label)을 지정하는 작업을 수행한다. 기존에 연구되어온 확률적 그래프 모델인 MRF와 CRF는 픽셀 수준의 라벨링 작업의 정확도를 높이는 효과적인 방법으로 연구되어왔다. 본 논문에서는 최근 각광받고 있는 딥러닝의 한 부류인 CNN과 확률 모델인 CRF를 결합한 형태의 의미론적 분할 방법을 제안하였다. 학습과 성능 검증을 위하여 Pascal VOC 2012 이미지 데이터베이스를 사용하였고, 학습에 사용되지 않은 임의의 이미지를 이용하여 테스트를 진행 하였다. 연구의 결과로서 기존 의미론적 분할 알고리즘보다 더욱 뛰어난 분할 성능을 보여주었다.

결막 충혈도 측정을 위한 공막 영상 분할 (Sclera Segmentation for the Measurement of Conjunctival Injection)

  • 배장표;김광기;정창부;양희경;황정민
    • 한국멀티미디어학회논문지
    • /
    • 제13권8호
    • /
    • pp.1142-1153
    • /
    • 2010
  • 결막 충혈은 결막염, 각막염, 포도막염 등의 안과질환의 초기 증세로서 정량적으로 평가할 수 있다면 진단과 경과 관찰에 도움이 된다. 충혈의 정량화에서 공막의 크기는 중요한 지표이지만 기존의 공막 분할 방법이 정확하지 않기 때문에 수동으로 분할하고 있다. 본 논문에서는 충혈의 정량화를 위하여 level set 방법을 이용한 공막 분할 알고리즘을 제안한다. Level set의 초기 모델은 Lab 색상 모드와 k-means 알고리즘, 기하학적인 정보를 이용하여 지정된다. 헤이시안(hessian) 분석으로 공막과 피부 사이의 골을 향상시킨 영상에 level set을 적용하였다. 제안 방법의 성능 측정을 위하여 52개의 전안부 영상에 대하여 실험하였다. 실험 결과, 제안 방법이 화소값만 이용하는 region growing이나 level set의 초기 모델로 임의의 원을 이용하는 방법보다 성능이 우수하였다. 이 논문에서 제안한 공막 분할 방법은 객관적인 충혈도 측정에서 중요한 요소 기술의 역할을 할 것이다.

색상의 주기성을 고려한 자연영상 분할방법 (Natural Image Segmentation Considering The Cyclic Property Of Hue Component)

  • 남혜영;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제46권6호
    • /
    • pp.16-25
    • /
    • 2009
  • 본 논문은 HSI 컬러 모델에서 색상(Hue)의 주기성을 고려한 블록기반 영상분할 방법을 제안한다. 제안한 방법에서는 영역 병합 시 사용되는 영역의 색상 대푯값으로 색상의 평균 대신 중앙점을 사용하며, 영역 간 색상차를 계산하기 위해 단방향 거리를 사용한다. 그리고 기존방법에서 사용한 복잡하게 계산된 영역별 임계값을 파라메타를 통해 조절할 수 있는 간단하지만 효율적인 임계값으로 수정한다. 실험결과 제안한 방법의 분할결과가 질감 성분이나 붉은 색상을 가진 영역에서 기존 방법을 사용했을 때 보다 더 자연스러우며, 제안한 방법과 기존 방법으로 버클리 영상분할 데이터베이스에서 제공하는 자연영상들을 분할하여 평가값을 비교해 본 결과 제안한 방법이 기존방법에 비해서 더 우수함을 알 수 있었다.

볼륨영상 분할을 위한 새로운 레벨 셋 방법과 기존 방법의 성능비교 (Performance Comparison Between New Level Set Method and Previous Methods for Volume Images Segmentation)

  • 이명은;조완현;김선월;진연연;김수형
    • 정보처리학회논문지B
    • /
    • 제18B권3호
    • /
    • pp.131-138
    • /
    • 2011
  • 본 논문에서는 볼륨 의료영상 분할에 대한 기존의 레벨 셋 기법과 제안하는 방법의 성능을 비교하고자 한다. 기존의 방법들은 영역의 정보만을 이용하여 분할을 시행하므로, 영상의 종류에 따라서 정확한 분할을 못한 경우가 있다. 따라서 새롭게 제안하는 방법은 정확한 분할 결과를 위하여 영상의 객체가 가지고 있는 에지 정보와 영역 정보를 함께 이용한다. 에지 정보는 레벨 셋의 곡면이 객체의 표면에 잘 도달할 수 있도록 해주는 기울기 벡터장을 이용하고, 영역 정보는 각 영역에서 픽셀의 밝기 값을 가우시안 분포를 이용하여 통계적 모델로 적합시킴으로써 영상의 분할에 적용하였다. 또한, 곡면 주변 잡음의 영향을 최소화 시켜주는 정규화 항을 사용한다. 기존의 레벨 셋 기반의 방법들과 제안한 방법의 성능 평가를 위하여 실제 볼륨 의료영상에 대하여 다양한 실험을 실시하고, 분할된 결과의 비교를 통하여 제안된 방법의 우수성을 입증한다.

딥러닝 기반의 영상분할을 이용한 토지피복분류 (Land Cover Classification Using Sematic Image Segmentation with Deep Learning)

  • 이성혁;김진수
    • 대한원격탐사학회지
    • /
    • 제35권2호
    • /
    • pp.279-288
    • /
    • 2019
  • 본 연구에서는 항공정사영상을 이용하여 SegNet 기반의 의미분할을 수행하고, 토지피복분류에서의 그 성능을 평가하였다. 의미분할을 위한 분류 항목을 4가지(시가화건조지역, 농지, 산림, 수역)로 선정하였고, 항공정사영상과 세분류 토지피복도를 이용하여 총 2,000개의 데이터셋을 8:2 비율로 훈련(1,600개) 및 검증(400개)로 구분하여 구축하였다. 구축된 데이터셋은 훈련과 검증으로 나누어 학습하였고, 모델 학습 시 정확도에 영향을 미치는 하이퍼파라미터의 변화에 따른 검증 정확도를 평가하였다. SegNet 모델 검증 결과 반복횟수 100,000회, batch size 5에서 가장 높은 성능을 보였다. 이상과 같이 훈련된 SegNet 모델을 이용하여 테스트 데이터셋 200개에 대한 의미분할을 수행한 결과, 항목별 정확도는 농지(87.89%), 산림(87.18%), 수역(83.66%), 시가화건조지역(82.67%), 전체 분류정확도는 85.48%로 나타났다. 이 결과는 기존의 항공영상을 활용한 토지피복분류연구보다 향상된 정확도를 나타냈으며, 딥러닝 기반 의미분할 기법의 적용 가능성이 충분하다고 판단된다. 향후 다양한 채널의 자료와 지수의 활용과 함께 분류 정확도 향상에 크게 기여할 수 있을 것으로 기대된다.

구강구조모델과 워터쉐드를 이용한 치아영역 분할 (Tooth Region Segmentation by Oral Cavity Model and Watershed Algorithm)

  • 나승대;이기현;이정현;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제16권10호
    • /
    • pp.1135-1146
    • /
    • 2013
  • 본 논문에서는 치아에 대한 컬러영상에서 개별적인 치아영역을 분할하기 위한 새로운 방법을 제안하였다. 제안하는 알고리듬은 치아의 구조적 특징을 이용한 구강구조모델과 워터쉐드 알고리듬의 새로운 경계선 설정방법 등이 사용되었다. 먼저, 컬러영상으로부터 치아영역이 강조된 회색레벨 영상을 획득하고 치아영역 분할시 문제가 될 수 있는 불필요한 부분을 영상에서 제거하였다. 다음으로 제안한 구강구조모델을 이용한 치아영상의 영상향상을 실행하였고, 향상된 영상을 워터쉐드 알고리즘을 이용하여 개별적 치아영역을 분할하였다. 워터쉐드 알고리즘에 필요한 경계선과 시드는 최소 문턱치를 이용한 이진영상의 경계선과 국부 최대값을 적용하였다. 제안한 방법의 성능을 평가하기 위하여 기존의 방법과 제안한 방법에 대하여 비교 실험을 수행하였다. 실험 결과, 제안한 방법이 기존의 방법에 비하여 대구치영역의 검출율이 향상됨을 확인하였으며 치아를 포함한 구강 내 영역의 중복검출 등의 문제를 방지하여 치아영역 검출 성능이 향상되었음을 확인하였다.

칼라 양자화 맵의 영역 히스토그램에 기반한 조명 적응적 피부색 영역 분할 (Adaptive Skin Segmentation based on Region Histogram of Color Quantization Map)

  • 조성식;배정태;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.54-61
    • /
    • 2009
  • 피부색 정보는 비전 기반 시스템에서 인체 인식에 널리 쓰이는 중요한 정보이다. 그러나 기존의 픽셀 단위의 피부색 분할 방법은 피부색 영역 내부와 외부에 발생하는 오분할로 인해 여러 가지 피부색 관련 시스템의 인식률을 저해시키는 요인이 된다. 본 논문에서는 양자화 영역 정보로부터 프레임 간에 근접한 유사 피부색의 영역별 분할을 통한 피부색 분할 방법을 제안한다. 제안하는 방법은 피부색 영역분할을 위해 JSEG 알고리즘을 통해 영상의 칼라를 양자화하여 영역을 분할한다. 분할된 영역으로부터 근접한 유사 피부 영역의 후보를 결정하고, 각 영역의 히스토그램 비교를 통해 피부색 영역을 결정한다. 이렇게 결정된 영역으로부터 피부색 표본을 추출하여 다음 프레임을 위한 피부색 모델을 갱신한다. 성능 평가를 위해 ECHO 데이타베이스와 조명이 변화하는 환경에서 실제 촬영한 영상을 이용하여 기존 연구의 분류 방법 비교 실험을 실시하였고, 기존보다 향상된 영역 분할 및 조명 적응 성능을 보였다.

CT 이미지 세그멘테이션을 위한 3D 의료 영상 데이터 증강 기법 (3D Medical Image Data Augmentation for CT Image Segmentation)

  • 고성현;양희규;김문성;추현승
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.85-92
    • /
    • 2023
  • X-ray, Computed Tomography (CT), Magnetic Resonance Imaging (MRI)과 같은 의료데이터에서 딥러닝을 활용해 질병 유무 판별 태스크와 같은 문제를 해결하려는 시도가 활발하다. 대부분의 데이터 기반 딥러닝 문제들은 높은 정확도 달성과 정답과 비교하는 성능평가의 활용을 위해 지도학습기법을 사용해야 한다. 지도학습에는 다량의 이미지와 레이블 세트가 필요하지만, 학습에 충분한 양의 의료 이미지 데이터를 얻기는 어렵다. 다양한 데이터 증강 기법을 통해 적은 양의 의료이미지와 레이블 세트로 지도학습 기반 모델의 과소적합 문제를 극복할 수 있다. 본 연구는 딥러닝 기반 갈비뼈 골절 세그멘테이션 모델의 성능 향상과 효과적인 좌우 반전, 회전, 스케일링 등의 데이터 증강 기법을 탐색한다. 좌우 반전과 30° 회전, 60° 회전으로 증강한 데이터셋은 모델 성능 향상에 기여하지만, 90° 회전 및 ⨯0.5 스케일링은 모델 성능을 저하한다. 이는 데이터셋 및 태스크에 따라 적절한 데이터 증강 기법의 사용이 필요함을 나타낸다.