• 제목/요약/키워드: 데이터 분할 평가

검색결과 494건 처리시간 0.028초

SKU-Net: Improved U-Net using Selective Kernel Convolution for Retinal Vessel Segmentation

  • Hwang, Dong-Hwan;Moon, Gwi-Seong;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.29-37
    • /
    • 2021
  • 본 논문에서는 안저영상의 다중 스케일 정보를 다루기 위한 딥러닝 기반의 망막 혈관 분할 모델을 제안한다. 제안 모델은 이미지 분할 딥러닝 모델인 U-Net과 선택적 커널 합성곱을 통합한 합성곱 신경망으로 안저영상에서 눈과 관련된 질병을 진단하는데 중요한 정보가 되는 망막 혈관의 다양한 모양과 크기를 갖는 특징 정보를 추출하고 분할한다. 제안 모델은 일반적인 합성곱과 선택적 커널 합성곱으로 구성된다. 일반적인 합성곱 층은 같은 크기 커널 크기를 통해 정보를 추출하는 반면, 선택적 커널 합성곱은 다양한 커널 크기를 갖는 브랜치들에서 정보를 추출하고 이를 분할 주의집중을 통해 적응적으로 조정하여 결합한다. 제안 모델의 성능 평가를 위해 안저영상 데이터인 DRIVE와 CHASE DB1 데이터셋을 사용하였으며 제안 모델은 두 데이터셋에 대하여 F1 점수 기준 82.91%, 81.71%의 성능을 보여 망막 혈관 분할에 효과적임을 확인하였다.

데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정 (Optimal Identification of Data Granules-based Fuzzy Set Fuzzy Model)

  • 박건준;김완수;오성권;김현기
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.317-320
    • /
    • 2005
  • 본 논문은 비선형 시스템의 퍼지모델을 설계하기 위해 데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정을 제안한다. 퍼지모델은 주로 경험적 방법에 의해 추출되기 때문에 보다 구체적이고 체계적인 방법에 의한 동정 및 최적화 될 필요성이 요구된다. HCM 클러스터링을 통한 데이터 입자는 입력 변수의 개별적인 퍼지 규칙을 형성하고, 퍼지 공간 분할 및 삼각형 멤버쉽 함수의 초기 정점을 정의한다. 또한, 데이터 입자의 중심을 이용하여 후반부의 구조를 결정한다. 초기 퍼지 모델을 동정하기 위해 유전자 알고리즘을 이용하여 입력 변수의 수, 선택될 입력 변수, 멤버쉽 함수의 수, 그리고 후반부 형태를 결정한다. 데이터 입자에 의한 전반부 멤버쉽 파라미터는 유전자 알고리즘을 이용하여 최적으로 동정한다 제안된 모델을 평가하기 위해 수치적인 예를 사용한다.

  • PDF

딥러닝 기반의 영상분할을 이용한 토지피복분류 (Land Cover Classification Using Sematic Image Segmentation with Deep Learning)

  • 이성혁;김진수
    • 대한원격탐사학회지
    • /
    • 제35권2호
    • /
    • pp.279-288
    • /
    • 2019
  • 본 연구에서는 항공정사영상을 이용하여 SegNet 기반의 의미분할을 수행하고, 토지피복분류에서의 그 성능을 평가하였다. 의미분할을 위한 분류 항목을 4가지(시가화건조지역, 농지, 산림, 수역)로 선정하였고, 항공정사영상과 세분류 토지피복도를 이용하여 총 2,000개의 데이터셋을 8:2 비율로 훈련(1,600개) 및 검증(400개)로 구분하여 구축하였다. 구축된 데이터셋은 훈련과 검증으로 나누어 학습하였고, 모델 학습 시 정확도에 영향을 미치는 하이퍼파라미터의 변화에 따른 검증 정확도를 평가하였다. SegNet 모델 검증 결과 반복횟수 100,000회, batch size 5에서 가장 높은 성능을 보였다. 이상과 같이 훈련된 SegNet 모델을 이용하여 테스트 데이터셋 200개에 대한 의미분할을 수행한 결과, 항목별 정확도는 농지(87.89%), 산림(87.18%), 수역(83.66%), 시가화건조지역(82.67%), 전체 분류정확도는 85.48%로 나타났다. 이 결과는 기존의 항공영상을 활용한 토지피복분류연구보다 향상된 정확도를 나타냈으며, 딥러닝 기반 의미분할 기법의 적용 가능성이 충분하다고 판단된다. 향후 다양한 채널의 자료와 지수의 활용과 함께 분류 정확도 향상에 크게 기여할 수 있을 것으로 기대된다.

동적 분할 기법을 이용한 효율적인 대표키 프레임 추출 (Efficient Representative-Key Frame Extraction Using Dynamic Segmentation Method)

  • 김영희;이순희;최운종;박장춘
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.515-517
    • /
    • 1999
  • 본 논문에서는 내용 기반 검색을 위한 방법의 핵심 기술중의 하나인 효율적인 대표키 프레임 추출을 위해 동적인 분할 기법을 제안하고, 다양한 장르의 비디오 데이터에 대하여 그 성능을 평가해 본다. 제안된 대표키 프레임 추출법은 기존의 균등 분할 방법에서 필요 이상의 분할이나 적은 분할로 인하여 중복 추출되거나 추출 대상에서 제외되었던 대표키를 효율적으로 검출할 수 있는 방법으로서 이는 분할 기준을 영상의 각 장르별 특징에 맞도록 동적으로 적용함으로써 획일적인 값을 적용한 기존의 연구와는 달리 차별을 가진다. 제안된 알고리즘으로 대표키 프레임을 추출하기 위하여 뉴스, 영화, 뮤직 드라마, 광고와 같은 다양한 장르별로 실험한 결과, 제안된 대표키 프레임 검출 방법이 효율적임을 확인할 수 있었다.

  • PDF

영상 데이터 특징 커버리지 기반 딥러닝 모델 검증 기법 (Deep Learning Model Validation Method Based on Image Data Feature Coverage)

  • 임창남;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권9호
    • /
    • pp.375-384
    • /
    • 2021
  • 딥러닝 기법은 영상 처리 분야에서 높은 성능을 입증 받아 다양한 분야에서 적용되고 있다. 이러한 딥러닝 모델의 검증에 가장 널리 사용되는 방법으로는 홀드아웃 검증 방법, k-겹 교차 검증 방법, 부트스트랩 방법 등이 있다. 이러한 기존의 기법들은 데이터 셋을 분할하는 과정에서 클래스 간의 비율에 대한 균형을 고려하지만, 같은 클래스 내에서도 존재하는 다양한 특징들의 비율은 고려하지 않고 있다. 이러한 특징들을 고려하지 않을 경우, 일부 특징에 편향된 검증 결과를 얻게 될 수 있다. 따라서 본 논문에서는 기존 검증 방법들을 개선하여 영상 분류를 위한 데이터 특징 커버리지 기반의 딥러닝 모델 검증 기법을 제안한다. 제안하는 기법은 딥러닝 모델의 학습과 검증을 위한 훈련 데이터 셋과 평가 데이터 셋이 전체 데이터 셋의 특징을 얼마나 반영하고 있는지 수치로 측정할 수 있는 데이터 특징 커버리지를 제안한다. 이러한 방식은 전체 데이터 셋의 특징을 모두 포함하도록 커버리지를 보장하여 데이터 셋을 분할할 수 있고, 모델의 평가 결과를 생성한 특징 군집 단위로 분석할 수 있다. 검증결과, 훈련 데이터 셋의 데이터 특징 커버리지가 낮아질 경우, 모델이 특정 특징에 편향되게 학습하여 모델의 성능이 낮아지며, Fashion-MNIST의 경우 정확도가 8.9%까지 차이나는 것을 확인하였다.

CORE-Dedup: 내용보존 접근 지역성 활용한 IO 크기 분할 기반 중복제거 (CORE-Dedup: IO Extent Chunking based Deduplication using Content-Preserving Access Locality)

  • 김명식;원유집
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.59-76
    • /
    • 2015
  • 고성능 내장형 기기의 대중화 및 광대역 통신기술의 발달로 생성-관리되는 데이터가 증가하고 있다. 중복제거 기법은 중복된 저장 요청을 판별하여 유일한 데이터만을 저장함으로써 저장 공간을 절약하는 방법으로 폭증하는 데이터의 저장과 처리 시스템을 경제적으로 구축 할 수 있다. 본 연구는 입출력 크기 (IO Extent) 단위 기반 분할 방법을 사용한 CORE-Dedup을 제안한다. CORE-Dedup의 Extent 단위 분할은 접근한 Content가 보존하는 접근 단위의 속성을 활용 한다. 가상머신에서 IO 경향을 수집하고 고정 크기 분할과 새로운 Extent 분할 방법에 대해 중복제거 성능을 비교 평가하였다. 동일 크기 워크로드 경우 4 KB 고정 분할 대비 적은 색인 버퍼를 가지고 유사한 수준의 중복 비교를 성능을 얻을 수 있다. 특히 다수 유저의 유사 IO 중복 접근을 가정한 워크로드 경우에는 CORE-Dedup이 Extent 단위 분할의 넓은 워크로드 Coverage에 의해 고정 크기 분할을 사용한 동일 조건의 Inline-Dedup에 비해 1/10 수준 버퍼를 가지고도 유사 중복제거 성능을 얻었다. 10명 사용자의 동일 compile 입출력을 가정한 병합 워크로드에서 4 KB 고정 크기 분할에서는 14,500개 분할 색인에서 최대 60.4%의 중복 발견율을 얻었으나 Extent 분할에서는 1,700개 색인만으로 57.6%를 얻었다.

3 차원 영역확장 알고리즘 기반의 MRI 에서의 뇌 영상 분할 시스템 (The segmentation system of brain in MRI based on 3-D region growing algorithm)

  • 이정민;윤현주;김명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.1769-1772
    • /
    • 2005
  • 본 논문에서는 사용자의 작업을 최소화하고 결과의 정확성을 높일 수 있는 3 차원 영역 분할 알고리즘을 제시하고 있다. 경계선을 강화하고 유사영역을 평탄화하는 SRAD(Speckle Reducing Anisotropic Diffusion) 필터링은 잡음에 의한 3 차원 영역확장의 오류를 줄이고 분할 대상의 경계부분까지 안정적으로 영역을 확장시켜준다. 3 차원 영역확장 방법은 사용자에 의해 입력된 시작점을 기반으로 영역의 유사성과 집합성을 판단하는 평가함수(cost Function)를 계산하여 3 차원으로 영역을 확장시킨다. 이러한 방법을 이용할 때에 보다 효과적으로 3D MRI 데이터에 대한 영상 분할을 수행할 수 있다. 또한 논문에서 제시한 알고리즘의 검증을 위해서 분할 결과에 대한 의료진의 검증을 수행하였다.

  • PDF

연관관계 군집 분할 방법을 이용한 아이템 필터링 시스템 (Item Filtering System Using Associative Relation Clustering Split Method)

  • 조동주;박양재;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.1-8
    • /
    • 2007
  • 전자상거래에서 많은 아이템 중에 사용자에게 적합한 아이템을 추천하기 위해서는 많은 시간과 노력이 소요된다. 그러므로 추천 시스템이 사용자들을 대신하여 적합한 아이템을 추천해줄 수 있다면 만족을 얻을 수 있다. 본 논문에서는 정확성과 확장성을 향상시키기 위해서 협력적 필터링에서 연관관계 군집 분할 방법을 제안하였다. 평가한 데이터를 사용하여 연관 아이템간의 향상도를 산출하고 연관관계 군집의 효율성을 높이기 위해서 아이템으로 구성된 노드 군집을 분할하였다. 이는 군집들 중 하나의 아이템만이 연관성을 달리하고, 나머지 아이템들은 군집의 연관성이 충족되어진다면 결합하는 방법이다. 성능을 평가하기 위해서 MovieLens 데이터 집합에서 K-means와 EM에 의한 군집과 비교 평가하였다.

다중 분할된 구조를 가지는 클러스터 검사점 저장 기법 (A Multistriped Checkpointing Scheme for the Fault-tolerant Cluster Computers)

  • 장윤석
    • 정보처리학회논문지A
    • /
    • 제13A권7호
    • /
    • pp.607-614
    • /
    • 2006
  • 검사점 저장 기법을 사용하여 주기적으로 클러스터 노드들의 프로세스 수행 정보를 전역 저장 장치에 저장하는 분산 클러스터 시스템에서 결함 허용 성능을 유지하는 데 드는 비용을 줄이고 전체 프로세스의 수행 성능을 증가시키기 위해서는 검사점 정보를 저장할 때에 네트워크로 전달되는 부하를 각 노드에 최대한 적절하게 분산하여 데이터 저장 시간을 줄임으로써 검사점 정보를 저장하는 동안 전체 클러스터 시스템의 프로세스가 지연되는 시간을 줄이도록 하여야 한다. 이를 위하여 분산 RAID 기반의 단일 입출력 공간을 사용하는. 클러스터 시스템에서는 여러가지 검사점 저장 기법을 사용하며, 검사점 정보의 저장 기법에 따라서 저장 성능과 결함 회복 성능이 달라진다. 본 연구에서는 분할된 검사점 저장 기법을 개선하여 검사점 데이터를 분산 RAID 기반의 단일 입출력 공간에 저장할 때에 그룹별로 분할되는 분할 그룹 크기를 검사점 정보가 저장될 때의 네트워크의 트래픽에 따라서 동적으로 결정하여 네트워크를 통한 분산 RAID에 저장함으로써 네트워크 병목현상을 최소화하는 다중 분할된 검사점 저장 구조를 제안하였다. 제안된 구조의 성능을 분석하기 위하여 최대 512개의 가상 노드로 구성된 클러스터 시스템을 대상으로 하여 MPI 와 Linpack HPC 벤치마크를 통한 성능 평가를 수행하였으며, 성능 평가 결과는 검사점 정보의 크기와 클러스터의 크기가 증가할수록 제안된 기법이 검사점 정보의 저장과 결함 회복 능력에 대하여 기존의 검사점 저장 기법에 비하여 우수한 성능을 보인다.

대규모 분산 컴퓨팅 환경에서 확장성을 고려한 실시간 데이터 공급 기법 (Scalable Data Provisioning Scheme on Large-Scale Distributed Computing Environment)

  • 김병상;윤찬현
    • 정보처리학회논문지A
    • /
    • 제18A권4호
    • /
    • pp.123-128
    • /
    • 2011
  • 본 논문은 원격지간의 연결된 대규모 분산 환경에서 데이터 분석 작업의 실행을 위해 필수적으로 고려되는 데이터 전송 부하를 감소시키는 기법을 제안한다. 계산 노드들이 밀집된 지역 인근에 다수의 데이터 노드를 배치시킴으로서 계산 노드들이 단일 데이터센터가 아닌 자신과 인접한 데이터 노드에 접근하여 작업을 수행함으로서 전송부하를 감소시키고 확장성을 증가시키는 것이 가능하다. 따라서 본 논문은 지역적으로 분산된 데이터 노드들의 데이터 처리율을 기반으로 실시간 데이터 공급을 수행함으로서 전송 지연을 최소화 할 수 있는 이론적인 모델과 시뮬레이션을 통한 성능 평가를 수행한다. 제안된 기법은 PRAGMA 그리드 테스트베드에서 실험을 통하여 성능의 우수성을 검증하였다.