• 제목/요약/키워드: 세밀한 이미지 분류

검색결과 11건 처리시간 0.023초

딥러닝기반 건축폐기물 이미지 분류 시스템 비교 (A Comparison of Image Classification System for Building Waste Data based on Deep Learning)

  • 성재경;양민철;문경남;김용국
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.199-206
    • /
    • 2023
  • 본 연구는 건축시 발생되는 폐기물의 자동분류를 위해 딥러닝 알고리즘을 활용해 건출 폐기물 데이터를 각각 목재 폐기물, 플라스틱 폐기물, 콘크리트 폐기물로 분류하는 두 모델들을 통해서 성능 비교를 한다. 건축 폐기물의 분류를 위해 사용된 딥러닝 알고리즘은 합성곱 신경망 이미지 분류 알고리즘 VGG-16과 NLP를 기반으로 이미지를 시퀀스화 시킨ViT, Vision Transformer 모델을 사용했다. 건축 폐기물 데이터 수집을 위해 이미지 데이터를 전 세계 검색엔진에서 크롤링 하였고, 육안으로도 명확히 구분하기 어렵거나, 중복되는 등 실험에 방해되는 이미지는 전부 제외하여 각 분류당 1천장씩 총 3천장의 이미지를 확보했다. 또한, 데이터 학습시에 모델의 정확도 향상에 도움을 주기 위해 데이터 확대 작업을 진행해 총 3만장의 이미지로 실험을 진행 하였다. 수집된 이미 데이터가 정형화 되어있지 않은 데이터 임에도 불구하고 실험 결과는 정확도가 VGG-16는 91.5%, ViT 는 92.7%의 결과가 나타났다. 이는 실제 건축폐기물 데이터 관리 작업에 실전 활용 가능성을 제시한 것으로 보인다. 본 연구를 바탕으로 추후에 객체 탐지 기법이나 의미론적 분할 기법까지 활용한다면, 하나의 이미지 안에서도 여러 세밀한 분류가 가능해 더욱 완벽한 분류가 가능할 것이다.

합성곱 신경망을 이용한 '미황' 복숭아 과실의 성숙도 분류 (Grading of Harvested 'Mihwang' Peach Maturity with Convolutional Neural Network)

  • 신미희;장경은;이슬기;조정건;송상준;김진국
    • 생물환경조절학회지
    • /
    • 제31권4호
    • /
    • pp.270-278
    • /
    • 2022
  • 본 연구는 무대재배 복숭아 '미황'을 대상으로 성숙기간 중 RGB 영상을 취득한 후 다양한 품질 지표를 측정하고 이를 딥러닝 기술에 적용하여 복숭아 과실 숙도 분류의 가능성을 탐색하고자 실시하였다. 취득 영상 730개의 데이터를 training과 validation에 사용하였고, 170개는 최종테스트 이미지로 사용하였다. 본 연구에서는 딥러닝을 활용한 성숙도 자동 분류를 위하여 조사된 품질 지표 중 경도, Hue 값, a*값을 최종 선발하여 이미지를 수동으로 미성숙(immature), 성숙(mature), 과숙(over mature)으로 분류하였다. 이미지 자동 분류는 CNN(Convolutional Neural Networks, 컨볼루션 신경망) 모델 중에서 이미지 분류 및 탐지에서 우수한 성능을 보이고 있는 VGG16, GoogLeNet의 InceptionV3 두종류의 모델을 사용하여 복숭아 품질 지표 값의 분류 이미지별 성능을 측정하였다. 딥러닝을 통한 성숙도 이미지 분석 결과, VGG16과 InceptionV3 모델에서 Hue_left 특성이 각각 87.1%, 83.6%의 성능(F1 기준)을 나타냈고, 그에 비해 Firmness 특성이 각각 72.2%, 76.9%를 나타냈고, Loss율이 각각 54.3%, 62.1%로 Firmness를 기준으로 한 성숙도 분류는 적용성이 낮음을 확인하였다. 추후에 더 많은 종류의 이미지와 다양한 품질 지표를 가지고 학습이 진행된다면 이전 연구보다 향상된 정확도와 세밀한 성숙도 판별이 가능할 것으로 판단되었다.

딥러닝과 다양한 데이터 증강 기법을 활용한 주변국 군용기 기종 분류에 관한 연구 (A Study on the Classification of Military Airplanes in Neighboring Countries Using Deep Learning and Various Data Augmentation Techniques)

  • 이찬우;황하준;권혁;백승령;김우주
    • 한국군사과학기술학회지
    • /
    • 제25권6호
    • /
    • pp.572-579
    • /
    • 2022
  • The analysis of foreign aircraft appearing suddenly in air defense identification zones requires a lot of cost and time. This study aims to develop a pre-trained model that can identify neighboring military aircraft based on aircraft photographs available on the web and present a model that can determine which aircraft corresponds to based on aerial photographs taken by allies. The advantages of this model are to reduce the cost and time required for model classification by proposing a pre-trained model and to improve the performance of the classifier by data augmentation of edge-detected images, cropping, flipping and so on.

효율적인 비디오 카투닝을 위한 인터랙티브 시스템 (Interactive System for Efficient Video Cartooning)

  • 홍성수;윤종철;이인권
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.859-864
    • /
    • 2006
  • Mean shift 는 데이터의 특징을 잘 살려내는 None-parametric 방법으로, 특히 영상처리분야에서 많은 각광을 받아왔다. 하지만 좋은 결과를 보장하는 뛰어난 성능에도 불구하고, 높은 메모리소요와 긴 처리시간에 기인하여, 비디오처리 등의 분야에 적용하기엔 현실적인 제약점이 있다. 상기한 제약점을 극복하기 위해, 본 시스템은 비디오를 분석하여 전경과 후경으로 나눈다. 본 논문은 전경으로 분류된 부분에 대해 각 분리된 개체를구분하고, 좌표변환(coordinate shift)을 실행하여 연산을 할 비디오의 연산의 규모를 줄이는 방법론을 제시한다. 이러한 처리로 매우 많은 처리시간이 단축됨을 실험을 통해 알 수 있었다. 다음으로, 나뉘어진 전경에 3D mean shift를 적용하여 생성된 결과물에 대하여 3D cluster data structure 를 생성하고, 이를 이동하여 인터랙티브 에디팅이 가능하도록 하였다. 후경으로 나뉜 데이터는 이미지 한 장으로 축약이 되며, 2D mean shift 기반의 interactive cartooning system 을 통하여 만화화가 된다. 본 논문은 만화 특유의 단순한 톤을 표현하기 위해, 세밀한 분할이 필요한 부분과 그렇지 않은 부분을 따로 구분하여 처리하는 레이어처리방법을 제안한다. 위의 과정을 여러 실사이미지에 적용, 실험해본 결과 기존의 연구결과에 비해 매우 짧은 시간 내에 대상의 특징이 잘 나타낸 양질의 결과물이 생성되었다. 이러한 결과물은 출판, 영상편집분야 등 여러 분야에서 요긴하고 간편하게 사용될 수 있을 것으로 생각된다.

  • PDF

다중 축 슬라이싱 및 3 차원 재구성을 통한 갈비뼈 세그멘테이션 (Rib Segmentation via Biaxial Slicing and 3D Reconstruction)

  • 김현성;변규린;고성현;범정현;리덕타이;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.611-614
    • /
    • 2023
  • 갈비뼈 병변 진단 과정은 방사선 전문의가 CT 스캐너를 통해 생성된 2 차원 CT 이미지들을 해석하며 진행된다. 병변의 위치를 파악하고 정확한 진단을 내리기 위해 수백장의 2차원 CT 이미지들이 세밀하게 검토되며 갈비뼈를 분류한다. 본 연구는 이런 노동 집약적 작업의 문제점을 개선시키기 위해 Biaxial Rib Segmentation(BARS)을 제안한다. BARS 는 흉부 CT 볼륨의 관상면과 수평면으로 구성된 2 차원 이미지들을 U-Net 모델에 학습한다. 모델이 산출한 세그멘테이션 마스크들의 조합은 서로 다른 평면의 공간 정보를 보완하며 3 차원 갈비뼈 볼륨을 재건한다. BARS 의 성능은 DSC, Recall, Precision 지표를 사용해 평가하며, DSC 90.29%, Recall 89.74%, Precision 90.72%를 보인다. 향후에는 이를 기반으로 순차적 갈비뼈 레이블링 연구를 진행할 계획이다.

Identity-CBAM ResNet 기반 얼굴 감정 식별 모듈 (Face Emotion Recognition using ResNet with Identity-CBAM)

  • 오규태;김인기;김범준;곽정환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.559-561
    • /
    • 2022
  • 인공지능 시대에 들어서면서 개인 맞춤형 환경을 제공하기 위하여 사람의 감정을 인식하고 교감하는 기술이 많이 발전되고 있다. 사람의 감정을 인식하는 방법으로는 얼굴, 음성, 신체 동작, 생체 신호 등이 있지만 이 중 가장 직관적이면서도 쉽게 접할 수 있는 것은 표정이다. 따라서, 본 논문에서는 정확도 높은 얼굴 감정 식별을 위해서 Convolution Block Attention Module(CBAM)의 각 Gate와 Residual Block, Skip Connection을 이용한 Identity- CBAM Module을 제안한다. CBAM의 각 Gate와 Residual Block을 이용하여 각각의 표정에 대한 핵심 특징 정보들을 강조하여 Context 한 모델로 변화시켜주는 효과를 가지게 하였으며 Skip-Connection을 이용하여 기울기 소실 및 폭발에 강인하게 해주는 모듈을 제안한다. AI-HUB의 한국인 감정 인식을 위한 복합 영상 데이터 세트를 이용하여 총 6개의 클래스로 구분하였으며, F1-Score, Accuracy 기준으로 Identity-CBAM 모듈을 적용하였을 때 Vanilla ResNet50, ResNet101 대비 F1-Score 0.4~2.7%, Accuracy 0.18~2.03%의 성능 향상을 달성하였다. 또한, Guided Backpropagation과 Guided GradCam을 통해 시각화하였을 때 중요 특징점들을 더 세밀하게 표현하는 것을 확인하였다. 결과적으로 이미지 내 표정 분류 Task에서 Vanilla ResNet50, ResNet101을 사용하는 것보다 Identity-CBAM Module을 함께 사용하는 것이 더 적합함을 입증하였다.

정평면적 카메라 앵글이 갖는 우연성에 관한 연구 (A Study on Aleatorism of Frontal-Flat Camera Angle)

  • 이용수
    • 만화애니메이션 연구
    • /
    • 통권32호
    • /
    • pp.263-288
    • /
    • 2013
  • 본고는 영화에서 정평면적 앵글의 특성이 내포하는 효과에 관한 연구이다. 이러한 제한적 카메라 앵글은 수용자로 하여금 무언지 모를 긴장감을 갖게 하는데, 본고는 그 긴장감이 우연성에서 기인하고 있다고 본다. 본고는 하나의 서사물에서 그 우연성이 어떤 가치 면으로 어떻게 작용하여 어떤 효과를 갖는지에 대한 담론적 고찰이다. 러시아 형식주의자들은 내러티브를 완전히 배제함으로써 영화 자체의 미학적 가치에 접근하자는 주장을 해 왔는데, 이는 감각적인 각성이 지나친 감정이입을 막고 반성적 사유를 하게 한다는 브레히트의 소격화의 실천이라고 할 수 있다. 하지만 영화에서 시각적인 각성은 내용과의 관련에 따라서 때로는 반성적 사유보다는 더 깊은 관조로의 침잠을 유도하기도 한다. 본고는 정평면적 앵글이 쓰인 영화의 쇼트들 속에서 우연성의 가치를 조형적으로, 내용적으로 분석함으로써 이에 대한 사례를 찾아보고자 한다. 이를 위해 본고는 우연성에 대한 좀 더 세밀한 정의를 제시한다. 왜냐하면 회화, 사진 같은 정지영상에서 언급되어 왔던 우연성과 서사극에서 말하는 우연성이 성질을 달리 하기 때문이다. 그것은 형식상의 우연과 내용상의 우연으로 분류되어 고려되어질 것이다. 그리고 사실상 영화에서 '정평면적 앵글'의 조형적 범주가 무척 애매하므로 가능한 한 몇 개의 제한을 둠으로써 그 범주를 최대한 구체화시키고자 한다. 사례분석은 형식과 내용 면을 구분하여 담론적으로 서술하고자 한다. 결론적으로, 영화의 정평면적 앵글은 일차적으로 시각적 각성에 의한 주목성의 효과를 갖기는 한다. 하지만 감각적 각성이 항상 서사적 가치의 약화를 가져오는 것은 아니다. 전체 내용에 대한 사건의 인과성에 따라 정평면적 앵글이 갖는 우연성은 각성이 아닌 몰입의 가치에 봉사할 수도 있다.

K-Means Clustering으로 분류한 닭 깃털색 표현형의 분석 (Analysis of Chicken Feather Color Phenotypes Classified by K-Means Clustering using Reciprocal F2 Chicken Populations)

  • 박종호;허선영;김민준;조은진;차지혜;진대혁;고영준;이승환;이준헌
    • 한국가금학회지
    • /
    • 제49권3호
    • /
    • pp.157-165
    • /
    • 2022
  • RGB 조건에서 하나의 픽셀은 255의 세제곱 개 이상의 색상을 표현할 수 있다. 현재까지의 컴퓨터 비전 연구는 조류에서 나타나는 다양한 깃털색 표현형에 대해 세밀히 분석하여 종을 구분하였지만, GWAS에 이용될 목적을 위해 다양하게 유전되는 색상을 단순화하지 못하였다고 판단된다. 본 연구는 연산오계(YO)와 백색레그혼(WL) 상호역교배 F2 집단을 이용하였으며 이미지 양자화를 통하여 이미지의 크기를 줄이고 저장을 용이하게 하였으며 깃털색의 원인 유전자 탐색을 위한 기초 자료를 제공하기 위하여 육안으로 결정하였던 다양한 깃털색을 단순화하였다. 특히, GWAS 연구에 필요한 수치화된 표현형을 제시하였다는 측면에서 가치가 있다고 판단된다.

영화색채 하양의 활용 양상과 문화적 의미 (The Style and Cultural Significance of Film Color White)

  • 김종국
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권4호
    • /
    • pp.187-198
    • /
    • 2020
  • 이 글은 한국영화 가운데 색채를 의도적이거나 관습적으로 활용한 사례들을 분석하였다. 장르영화 대부분이 관례적 활용 빈도가 높으며, 색채를 의도적으로 부각시킨 미학적 선택 또한 예술영화에 한정되지 않고 다양한 양식으로 나타난다. 영화색채의 시각적 인상만큼이나 그것의 분석과 해석은 주관적일 수 있다. 보기의 객관성을 위해 색채에 관한 오랜 문화적 관점을 채택하고, 유사성과 차이에 따라 발생하는 의미를 제시하고자 하였다. 영화색채 하양의 활용 양상의 분류는 보편적이고 일반적인 절대선, 특수한 사례로서의 강박과 치유, 성의 구분 없이 여성성의 특성을 보여주는 전형과 시각적 쾌락, 미학적 용어인 프레임의 경계를 넘어서는 유령적 사유라는 범주에서 접근하였다. 특정한 장르, 작가, 영화를 세밀하게 분석하는 미시적 방법보다는 하양을 시각장치로 활용하는 영화들의 유형별 특성을 분류해보고, 색채 활용의 미학적이고 문화적인 의미를 고찰하였다. 첫째, <악인전>(2019), <범죄와의 전쟁: 나쁜 놈들 전성시대>(2011), <불한당: 나쁜 놈들의 세상>(2016), <아수라>(2016), <나쁜 녀석들>(2019) 같은 영화들에서 하양이 절대선을 표현하는 시각의 전형으로 기능한다. 둘째, <기생충>(2019)의 공포와 불안, <곡성>(2016)의 악몽, <슈퍼맨이었던 사나이>(2008)의 과대망상, <기억의 밤>(2017)의 신경쇠약, <마더>(2009)의 광기, <윤희에게>(2019)의 강박, <밀양>(2007)의 히스테리 등이 가학과 피학을 시각적으로 강조하는 사례들이다. 셋째, <태극기 휘날리며>(2004), <포화 속으로>(2010), <마이웨이>(2011>, <고지전>(2011), <명량>(2014), <연평해전>(2015), <봉오동전투>(2019), <장사리: 잊혀진 영웅들>(2019) 등에서 여성 인물에 부여되는 하양이 전통적인 이미지를 고착시킨다. 넷째, 사회정치적 변화를 반영하는 <박하사탕>(2000), <변호인>(2013), <택시운전사>(2017), <1987>(2017) 등에서 하양이 역사의 순간을 기억하고 기록한다.

고려 나전국화넝쿨무늬상자의 제작기법 고찰 및 원형 연구 (A study on the production techniques and prototype of the mother-of-pearl chrysanthemum pattern box from the Goryeo Dynasty)

  • 이희승;이민혜;김성훈;이현주
    • 헤리티지:역사와 과학
    • /
    • 제57권1호
    • /
    • pp.126-144
    • /
    • 2024
  • 고려시대 나전국화넝쿨무늬상자는 미세한 자개표면에 문양을 세기거나, 금속선을 이용해 넝쿨의 줄기를 표현하고, 금속선을 꼬아 각 문양의 경계를 구성하는 등 고려나전칠기의 대표적인 특징이 아주 세밀하게 표현되어있다. 현재 남아있는 고려시대 나전칠기는 경함 및 합의 형태를 가지고 있는 반면 이번 연구대상인 나전국화넝쿨무늬상자는 뚜껑과 몸체가 분리되는 상자의 형태를 하고 있어 제작목적 혹은 보관된 내용물을 추정하기 어려웠다. 이번 연구에서는 나전국화넝쿨무늬상자의 원형을 확인하기 위해 조형적인 특징을 확인하고, X선 투과촬영과 X선 형광분석을 통해 구조와 제작기법에 대해 규명하고자 하였다. 그리고 기존에 알려진 고려시대 나전칠기를 유형별로 분류 및 비교분석해 상자의 용도와 제작목적을 규명하고자 하였다. 조사결과 X선 이미지 상 바닥면과 속상자에서 직물이 확인되었다. 이를 통해 기물을 직물로 감싸는 목심저피칠기기법이 사용된 것을 확인할 수 있었다. 그리고 목리를 통해 복원부분으로 추정되는 부분의 판재구성과 기존 장석이 있었을 것으로 추정되는 부분을 확인할 수 있었으며 결구부에서 맞대임 방식으로 연결한 것을 확인할 수 있었다. 문양에 사용된 금속선은 X선 형광분석 결과 황동으로 판단된다. 조사결과를 근거로 현재 남아있는 고려시대 경함류 9점, 상자류 3점, 소상자류 2점 등 총 14점을 유형별로 분류해 유사성을 조사하였다. 이중 일본 개인소장 국화넝쿨무늬경함, 도쿠가와미술관 흑칠지국당초문나전경상, 영국박물관의 나전국당초문경함, 국내소장 나전칠국당초문합(소상자) 등 5점의 문양구성이 본 연구대상과 가장 유사하였다. 그리고 손상양상, 조형적 특성, 구조적 특징 등을 부위별로 대조한 결과 영국박물관의 나전국당초문경함의 형태가 나전넝쿨무늬상자의 원형으로 현재 형태로 변형된 것으로 추정된다. 마지막으로 이번 상자의 용도, 즉 제작목적을 확인하기 위해 당시 고려의 사회분위기와 비슷한 시기 제작된 고려대장경 인경본의 사례를 조사하였다. 당시 무신정권 이후 몽골의 침입을 겪으면서 국가의 안정과 개인의 명복을 빌기 위한 사경이 출현, 그리고 13세기 국내 인쇄술과 종이의 발전으로 점차 두루마리에서 절첩식 형태로의 전환기와 맞물려 경함에서 상자의 형태로 보관방식이 변경된 것으로 판단된다.