• 제목/요약/키워드: 컴퓨터 비전 기술

검색결과 407건 처리시간 0.026초

멀티 모달리티 데이터 활용을 통한 골다공증 단계 다중 분류 시스템 개발: 합성곱 신경망 기반의 딥러닝 적용 (Multi-classification of Osteoporosis Grading Stages Using Abdominal Computed Tomography with Clinical Variables : Application of Deep Learning with a Convolutional Neural Network)

  • 하태준;김희상;강성욱;이두희;김우진;문기원;최현수;김정현;김윤;박소현;박상원
    • 한국방사선학회논문지
    • /
    • 제18권3호
    • /
    • pp.187-201
    • /
    • 2024
  • 골다공증은 전 세계적으로 주요한 건강 문제임에도 불구하고, 골절 발생 전까지 쉽게 발견되지 않는 단점을 가지고 있습니다. 본 연구에서는 골다공증 조기 발견 능력 향상을 위해, 복부 컴퓨터 단층 촬영(Computed Tomography, CT) 영상을 활용하여 정상-골감소증-골다공증으로 구분되는 골다공증 단계를 체계적으로 분류할 수 있는 딥러닝(Deep learning, DL) 시스템을 개발하였습니다. 총 3,012개의 조영제 향상 복부 CT 영상과 개별 환자의 이중 에너지 X선 흡수 계측법(Dual-Energy X-ray Absorptiometry, DXA)으로 얻은 T-점수를 활용하여 딥러닝 모델 개발을 수행하였습니다. 모든 딥러닝 모델은 비정형 이미지 데이터, 정형 인구 통계 정보 및 비정형 영상 데이터와 정형 데이터를 동시에 활용하는 다중 모달 방법에 각각 모델 구현을 실현하였으며, 모든 환자들은 T-점수를 통해 정상, 골감소증 및 골다공증 그룹으로 분류되었습니다. 가장 높은 정확도를 갖는 모델 우수성은 비정형-정형 결합 데이터 모델이 가장 우수하였으며, 수신자 조작 특성 곡선 아래 면적이 0.94와 정확도가 0.80를 제시하였습니다. 구현된 딥러닝 모델은 그라디언트 가중치 클래스 활성화 매핑(Gradient-weighted Class Activation Mapping, Grad-CAM)을 통해 해석되어 이미지 내에서 임상적으로 관련된 특징을 강조했고, 대퇴 경부가 골다공증을 통해 골절 발생이 높은 위험 부위임을 밝혔습니다. 이 연구는 DL이 임상 데이터에서 골다공증 단계를 정확하게 식별할 수 있음을 보여주며, 조기에 골다공증을 탐지하고 적절한 치료로 골절 위험을 줄일 수 있는 복부 컴퓨터 단층 촬영 영상의 잠재력을 제시할 수 있습니다.

칼라 상관관계 역투영법을 적용한 효율적인 객체 지역화 기법 (Efficient Object Localization using Color Correlation Back-projection)

  • 이용환;조한진;이준환
    • 디지털융복합연구
    • /
    • 제14권5호
    • /
    • pp.263-271
    • /
    • 2016
  • 이미지 내에서 객체를 검출하고 해당 위치를 추출하는 지역화 기법은 컴퓨터 비전에서 많이 활용되는 기술이다. 기존 연구들은 하나의 객체를 대상으로 위치 검출을 수행하지만, 실제 사진에서는 다수의 유사 객체를 포함하는 경우가 많기 때문에, 활용에 한계가 있다. 이러한 문제를 해결하기 위해, 본 논문에서는 이미지 인식을 위해 객체 지역화의 새로운 알고리즘을 제안한다. 제안 알고리즘은 YCbCr 색채 성분에서 코렐로그램 역투영 기법을 활용하여 객체 지역화 문제를 해결한다. 제안 알고리즘에서는 질의 이미지의 객체가 포함되는 이미지의 위치를 검출할 수 있으며, 다수의 유사 객체가 존재할 경우 포함되는 객체 개수 정보 없이도 유사 후보 객체의 영역과 위치를 검출할 수 있다. 제안 알고리즘의 성능을 평가할 실험 결과, 기존에 연구된 방법에 비해, 21%의 성능 향상을 보였다. 이러한 결과를 통해, 색상 코렐로그램이 히스토그램 기법보다 성능적 우위를 보였다. 본 논문의 주요 공헌은 색 공간과 공간-색상 정보를 통해 객체 지역화 문제를 해결할 수 있는 또다른 기술을 제시한 것으로 학문적 기여를 검증하였다.

다수의 영상간 효율적인 스티칭을 위한 카메라 센서 정보 기반 영상 그룹핑 기술 (Images Grouping Technology based on Camera Sensors for Efficient Stitching of Multiple Images)

  • 임지헌;이의상;김회정;김규헌
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.713-723
    • /
    • 2017
  • 파노라마 영상은 카메라 시야각의 제한을 극복하여 넓은 시야를 가질 수 있으므로 컴퓨터 비전, 스테레오 카메라 등의 분야에서 효율적으로 연구되고 있다. 파노라마 영상을 생성하기 위해서는 왜곡이 생기는 광각 카메라를 사용하는 대신 다수의 일반 카메라로 촬영한 영상들을 스티칭 하는 것이 영상의 왜곡 현상을 줄일 수 있기에 많이 활용되어지고 있다. 영상 스티칭 기술은 여러 영상에서 추출한 특징점의 디스크립터를 생성하고, 특징점들 간의 유사도를 비교하여 영상들을 이어 붙여 큰 하나의 영상으로 만드는 것이다. 각각의 특징점은 수십 수백차원의 정보를 가지고 있고, 스티칭 할 영상이 많아질수록 데이터 처리 시간이 증가하게 된다. 특히, 하나의 객체에 대하여 다수의 불특정 카메라에 의해 촬영한 영상들을 기반으로 파노라마를 생성할 경우, 유사한 영상들에 대한 중복적 특징점 추출의 과정을 거치기에 그 처리 시간은 더욱 증가한다. 본 논문에서는 이와 같이, 하나의 객체 또는 환경에 대하여 불특정 다수의 카메라에서 획득한 영상을 기반으로 스티칭을 효율적으로 처리하기 위한 전처리 과정을 제안한다. 그 방법으로 카메라 센서 정보를 기반으로 영상들을 미리 그룹화 하여 한 번에 스티칭 할 영상의 수를 줄임으로써 데이터 처리 시간을 줄일 수 있다. 후에 계층적으로 스티칭 하여 하나의 큰 파노라마를 만든다. 본 논문에서 제안한 그룹핑 전처리를 통해 다수의 영상을 대상으로 한 스티칭 시간이 대폭 감소하는 것을 실험 결과를 통해 검증하였다.

웹 멀티미디어 컨텐츠의 디자인과 유용성분석에 대한 연구 (Study on the Design and Usability factor analysis of Web Multimedia Contents)

  • 고은영;신순호
    • 디자인학연구
    • /
    • 제17권4호
    • /
    • pp.69-78
    • /
    • 2004
  • 컴퓨터 기술의 발달과 웹 환경의 개선은 e비즈니스의 확대와 웹 사이트의 트랜드에 영향을 주었다. 멀티미디어를 사용한 사이트의 인기가 상승하고 경쟁 사이트보다 높은 인지도를 보여주고 있어 멀티미디어 도입이 활성화되고 있다. 웹 멀티미디어 콘텐츠에 있어서도 평가기준에 합당한 멀티미디어 컨텐츠의 구성요소가 필요하다. 이들 구성요소는 정보디자인, 영상디자인, 인터랙티브 디자인의 요소로 정리할 수 있다. 이 요소들을 사용자에게 대표적인 웹 멀티미디어 사이트를 평가하도록 하였다. 웹 사이트의 선정은 대표적인 웹 사이트의 유형인 HTML기반, 플래시 기반, 혼합기반으로 한정하였다. 사용자가 평가한 데이터를 이용하여 디자인과 멀티미디어의 요소별 연관성과 상관관계를 규명하는 통계분석을 하였다. 서울, 경기, 충청지방에 거주하는 C대학교 재학생 중 디자인 비전공자들 101명을 대상으로 분석하였다. 설문내용은 인터넷을 이용하여 코카콜라, 나이키, 삼성전자 각 기업의 한국어 사이트에 방문하여 평가하도록 하였다. 설문의 평가 방식은 각 항목 당 5점 척도로 평가하도록 하여 이를 점수화했다. 설문 분석을 위한 통계 패키지는 SPSS Ver 10.0을 사용하였다. 기술 분석을 통해 각 유형별 웹 사이트가 정보디자인, 영상디자인, 인터랙티브디자인, 디자인에서 사용자 평가를 분석하였다. 웹 멀티미디어 컨텐츠 유형에 따른 웹 사이트 평가에 같은 웹 멀리미디어 평가 항목을 설문한 결과 eigenvalue의 요인추출개수가 다르게 나왔으며 회귀식 또한 다르게 나왔다. 이는 웹 사이트를 제작할 때 목적에 따라 유형의 방법을 다르게 선택해야하는 것을 알 수 있었다.

  • PDF

Flying Cake: 모바일 단말기를 이용한 실감형 게임 (Flying Cake: An Augmented Game on Mobile Device)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.79-94
    • /
    • 2007
  • 언제, 어디서, 누구나 대용량 네트워크를 사용할 수 있는 유비쿼터스(ubiquitous) 시대가 다가오면서, 카메라가 장착되어 있고 무선 통신이 가능한 PDA, 웨어러블(wearable) 컴퓨터와 같은 휴대용 장치가 가까운 미래에는 일상의 한 부분이 될 것이다. 이런 상황을 반영하듯, 휴대용 장치를 이용한 실감형 게임(augmented game)에 관한 다양한 연구가 진행되어 왔다. 기존의 실감형 게임들은 전통적으로 'backpack' 시스템이나 패턴마커(pattern marker)를 이용하였다. 'backpack' 시스템은 비싸고, 거추장스러우며, 사용하기 불편한 단점이 있으며, 패턴마커를 사용하면 미리 정한 장소에서만 게임을 해야 하는 단점을 가지고 있다. 본 논문에서 소개하는 게임 Flying Cake는 거추장스러운 장비 대신, 가볍고 휴대 가능한 PDA를 이용하며, 실제 세계에서 가상의 물체를 접목(overlay)하기 위해, 수동적인 패턴마커 대신 얼굴 영역을 이용한다. Flying Cake는 PDA만을 이용하여 실제 세계를 돌아다니며 카메라에 의해 입력된 영상에 접목된 가상의 캐릭터를 공격하는 일인용과 무선 랜을 통해 전송되는 상대방의 영상에 접목된 가상의 캐릭터를 공격하는 이인용을 제공하는 실감형 슈팅 게임이다. 얼굴 추출 기술을 이용하여 입력 영상의 얼굴영역에 가상의 캐릭터를 접목하며, 사용자는 가상의 캐릭터를 공격하며 게임을 즐긴다. Flying Cake는 얼굴 추출 기술을 이용하여 PDA카메라를 통해 입력된 실제 세계와 가상의 물체 사이의 상호작용을 제공하는 새로운 패러다임(paradigm)을 제공함으로써 사용자에게 새로운 즐거움을 제공할 것이다.

대학생의 AI 리터러시 역량 신장을 위한 교양 교육 모델 (The Education Model of Liberal Arts to Improve the Artificial Intelligence Literacy Competency of Undergraduate Students)

  • 박윤수;이유미
    • 정보교육학회논문지
    • /
    • 제25권2호
    • /
    • pp.423-436
    • /
    • 2021
  • 다가오는 미래사회에서는 인공지능 기술이 범용기술이 될 것이며, 인공지능 역량이 필수 역량이 될 것으로 예측되고 있다. 이에 전 세계 주요 국가들은 AI 경쟁력을 갖추기 위해 AI 전문가를 육성하고, 누구나 AI를 이해하고, 설명하며, 응용할 수 있는 인프라와 교육 환경을 갖추기 위해 노력하고 있다. 본 연구에서는 국내·외 인공지능 교육의 선행 연구 사례와 함께 서울 소재 31개 종합대학의 SW 교양 교육 현황을 조사했으며, 이를 바탕으로 SW 교양 교육과 전문적인 AI 교육을 연계할 수 있는 AI 리터러시 교육 모델이 필요하다는 결론을 도출하였다. 이에 KOCW에 공개된 20개의 AI 관련 강좌를 AI 리터러시 역량을 중심으로 분류하였으며, 분류된 결과를 바탕으로 대학생을 위한 AI 리터러시 교양 교육 모델을 제안하고자 한다. 제안하는 AI 리터러시 교육 모델은 기존의 이론적 교육 모델이나 컴퓨터과학적 교육 모델과는 달리 인문학적 소양과 함께 인공지능을 체험할 수 있는 AI·SW 융합 교육 모델이다. 제안하는 AI 리터러시 교육 모델이 AI의 확산에 기여할 수 있기를 기대한다.

계층적 학습 기반 다중 콘크리트 손상에 대한 의미론적 분할 (Semantic Segmentation for Multiple Concrete Damage Based on Hierarchical Learning)

  • 심승보;민지영
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제26권6호
    • /
    • pp.175-181
    • /
    • 2022
  • 구조물의 공용연수가 증가함에 따라 각종 성능 저하가 발생한다. 특히 국내 인프라 구조물은 대부분 경제가 성장하는 시기에 집중적으로 건설되었기 때문에 노후 인프라 비율 급증이 최근 주요 이슈가 되고 있다. 인프라의 노후화는 자칫 안전사고로 이어질 수 있으며 인명 피해까지 유발할 수 있다. 이러한 문제를 사전에 예방하기 위하여 주기적이고 정확한 점검 및 유지관리가 필수적이다. 이 같은 이유로 최근 컴퓨터 비전과 딥러닝을 활용하여 다양한 손상을 탐지하는 연구에 대한 수요가 원격점검 혹은 점검자동화 분야에서 증가하고 있다. 따라서 본 논문에서는 콘크리트 손상의 종류를 세 가지로 구분하여 이를 탐지할 수 있는 신경망 구조를 제안했다. 특히 계층적 학습 기법을 통해 보다 정확하게 다양한 손상을 탐지할 수 있는 신경망을 개발하였다. 이 신경망은 2,026장의 손상 영상으로 학습되었고, 508장의 손상 영상으로 실험하였다. 그 결과 67.04%의 평균 중첩 정확도와 52.65%의 F1 점수를 갖는 알고리즘을 완성하였다. 이 같은 손상 탐지 알고리즘은 향후 구조물의 정확한 상태 진단에 활용될 수 있으리라 기대한다.

데이터 증강을 위한 순환 생성적 적대 신경망 기반의 아스팔트와 콘크리트 균열 영상 간의 변환 기법 (CycleGAN Based Translation Method between Asphalt and Concrete Crack Images for Data Augmentation)

  • 심승보
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.171-182
    • /
    • 2022
  • 구조물을 안전하게 관리하기 위해서는 우선적으로 건전한 유지가 전제되어야 한다. 이 같은 구조물의 건전성을 결정하는 요인 중에서 가장 대표적인 예로는 균열을 들 수 있다. 여러 가지 원인에 의해 발생하는 균열은 다양한 종류와 형태로 구조물에 손상을 입힌다. 무엇보다 이러한 균열이 방치될 경우 위험도가 증가하여 안전사고로 이어질 수 있다. 이러한 문제점을 경감하기 위하여 최근 들어 딥러닝과 컴퓨터 비전 기술을 활용하여 손상을 점검하는 방법들이 소개되고 있다. 이 같은 방법들은 대체로 충분한 양의 학습 데이터가 필요한 것이 사실이다. 하지만, 학습을 위한 영상 데이터의 충분한 확보가 어렵다는 점은 딥러닝 균열 탐지 알고리즘의 성능에 부정적인 영향을 미친다. 따라서 본 논문에서는 이에 대한 문제의식을 바탕으로 영상 변환 기법을 활용하여 균열 영상 데이터를 증강하는 방법을 제시했다. 이는 아스팔트 균열 영상을 콘크리트 균열 영상으로 변환하거나 혹은 이와 반대로 콘크리트 균열 영상을 아스팔트 균열 영상으로 변환하여 딥러닝 신경망 모델을 학습하기 위한 영상 데이터를 확보하는 방법이다. 이를 통해 학습 데이터의 다양성을 향상시켜 강건한 균열 탐지 알고리즘 개발에 기여할 수 있기를 기대한다.

샴 네트워크를 사용하여 추적 레이블을 사용하지 않는 다중 객체 검출 및 추적기 학습에 관한 연구 (Training of a Siamese Network to Build a Tracker without Using Tracking Labels)

  • 강정규;송유승;민경욱;최정단
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.274-286
    • /
    • 2022
  • 이동객체 추적은 컴퓨터 비전 분야에서 오랜 시간 동안 연구가 진행되어 온 분야로 자율주행이나 운전 보조 시스템 등의 시스템에서 아주 중요한 역할을 수행하고 있다. 이동객체 추적 기술은 일반적으로 객체를 검출하는 검출기와 검출된 객체를 추적하는 추적기의 결합으로 이루어져 있다. 검출기는 다양한 데이터셋이 공개되어 사용되고 있기 때문에 쉽게 좋은 모델을 학습할 수 있지만, 추적기의 경우 상대적으로 공개된 데이터셋도 적고 직접 데이터셋을 구성하는 것도 검출기 데이터셋에 비해 굉장히 오랜 시간을 소요한다. 이에 검출기를 따로 개발하고, 별도의 추적기를 학습 기반이 아닌 방식을 활용하여 개발하는 경우가 많은데 이런 경우 두 개의 시스템이 차례로 작동하게 되어 전체 시스템의 속도를 느리게 하고 앞단의 검출기의 성능이 변할 때마다 별도로 추적기 또한 조정해줘야 한다는 단점이 있다. 이에 본 연구는 검출용 데이터셋만을 사용하여 검출과 추적을 동시에 수행하는 모델을 구성하는 방법을 제안한다. 데이터 증강 기술과 샴 네트워크를 사용하여 단일 이미지에서 객체를 검출 및 추적하는 방법을 연구하였다. 공개 데이터셋에 실험을 진행하여 학습 결과 높은 속도로 작동하는 이동객체 검출 및 추적기를 학습할 수 있음을 검증하였다.

균열 탐지의 의미론적 분할을 위한 Mean Teacher 학습 구조 최적화 (Mean Teacher Learning Structure Optimization for Semantic Segmentation of Crack Detection)

  • 심승보
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제27권5호
    • /
    • pp.113-119
    • /
    • 2023
  • 인프라 구조물은 대부분 경제 성장기에 완공되었다. 이러한 인프라 구조물은 최근 들어 공용연수가 점차 증가하고 있어 노후 구조물의 비중이 점차 증가하고 있다. 이러한 노후 구조물은 설계 당시의 기능과 성능이 저하될 수 있고 안전사고로까지 이어질 수 있다. 이를 예방하기 위해서는 정확한 점검과 적절한 보수가 필수적이다. 이를 위해서는 우선 미세한 균열까지 정확히 탐지할 수 있도록 컴퓨터 비전과 딥러닝 기술에 수요가 증가하고 있다. 하지만 딥러닝 알고리즘은 다수의 학습 데이터가 있어야 한다. 특히 영상 내 균열의 위치를 표시한 라벨 영상은 필수적이다. 이러한 라벨 영상을 다수 확보하기 위해서는 많은 노동력과 시간이 필요한 실정이다. 이러한 비용을 절감하고 탐지 정확도를 높이기 위해서 본 연구에서는 mean teacher 방식의 학습 구조를 제안하였다. 이 학습 구조는 900장의 라벨 영상 데이터 세트와 3000장의 비라벨 영상 데이터 세트로 훈련되었다. 학습된 균열 탐지 신경망 모델은 300여장의 실험용 데이터 세트를 통해 평가되었고 탐지 정확도는 89.23%의 mean intersection over union과 89.12%의 F1 score를 기록하였다. 이 설험을 통해 지도학습과 비교하여 탐지 성능이 향상된 것을 확인하였다. 향후에 이러한 방법은 라벨 영상을 확보하는데 필요한 비용을 절감하는데 활용될 것으로 기대한다.