• 제목/요약/키워드: Visual Information processing

검색결과 1,073건 처리시간 0.032초

시각 장애인을 위한 영상 기반 심층 합성곱 신경망을 이용한 화재 감지기 (Fire Detection using Deep Convolutional Neural Networks for Assisting People with Visual Impairments in an Emergency Situation)

  • 보라시 콩;원인수;권장우
    • 재활복지
    • /
    • 제21권3호
    • /
    • pp.129-146
    • /
    • 2017
  • 본 연구는 실내에서 화재 발생시 시각 장애인들을 지원하기 위한 영상 기반의 화재감지기를 제안한다. 건물 내에 화재가 발생하는 비상 상황 발생시 시각 장애인은 일반인보다 상황을 인지하는 것이 늦기 때문에 위험한 상황에 노출되기 쉽다. 기존의 연기 감지기와 같은 현재의 화재 감지 방법은 화재 발생시 발생하는 화학 센서 기반 기술을 사용함으로써 감지가 상대적으로 늦으며 화재가 확산된 후에 감지가 되는 등 낮은 신뢰성이 문제가 될 수 있다. 이를 보완하기 위해 영상 기반의 화재 감지 기술이 개발되었지만 낮은 정확도가 문제가 되어 실용화되지 못하였다. 최근 인공 지능을 위한 심층 학습 분야의 큰 발전으로 영상 내의 물체 인식률이 높아짐에 따라 관련 연구가 활발히 진행되고 있다. 따라서 본 연구에서는 보안 카메라 영상을 사용하여 화재를 감지할 수 있는 심층 학습 기반의 화재 감지기를 제안한다. 심층 학습 기반의 접근법은 영상에서 자동으로 특징을 학습할 수 있으므로 일반적으로 복잡한 상황에 대해서도 일반화가 가능하다. 본 논문에서는 화재감지 정확도와 속도 측면의 균형을 고려하여 두 개의 심층 합성곱 신경망 모델을 제안하였다. 실험을 통해 두 모델 모두 99%의 평균 정밀도로 화재를 감지할 수 있으며 첫 번째 모델은 초당 30장의 처리 속도와 76%의 정확도를 나타냈다. 두번째 모델은 초당 50장의 처리 속도와 61%의 정확도를 나타낸다. 또한 두 개의 모델의 메모리 사용량을 서로 비교하였으며 다양한 실제 화재 시나리오에서 테스트하여 신뢰할 수 있는 모델임을 증명하였다. 본 논문에 제안한 영상 기반 화재 감지기가 상용화된다면 상대적으로 실내 화재에 취약한 시각 장애인들의 안전에 도움이 될 것이다.

Assessment of Mild Cognitive Impairment in Elderly Subjects Using a Fully Automated Brain Segmentation Software

  • Kwon, Chiheon;Kang, Koung Mi;Byun, Min Soo;Yi, Dahyun;Song, Huijin;Lee, Ji Ye;Hwang, Inpyeong;Yoo, Roh-Eul;Yun, Tae Jin;Choi, Seung Hong;Kim, Ji-hoon;Sohn, Chul-Ho;Lee, Dong Young
    • Investigative Magnetic Resonance Imaging
    • /
    • 제25권3호
    • /
    • pp.164-171
    • /
    • 2021
  • Purpose: Mild cognitive impairment (MCI) is a prodromal stage of Alzheimer's disease (AD). Brain atrophy in this disease spectrum begins in the medial temporal lobe structure, which can be recognized by magnetic resonance imaging. To overcome the unsatisfactory inter-observer reliability of visual evaluation, quantitative brain volumetry has been developed and widely investigated for the diagnosis of MCI and AD. The aim of this study was to assess the prediction accuracy of quantitative brain volumetry using a fully automated segmentation software package, NeuroQuant®, for the diagnosis of MCI. Materials and Methods: A total of 418 subjects from the Korean Brain Aging Study for Early Diagnosis and Prediction of Alzheimer's Disease cohort were included in our study. Each participant was allocated to either a cognitively normal old group (n = 285) or an MCI group (n = 133). Brain volumetric data were obtained from T1-weighted images using the NeuroQuant software package. Logistic regression and receiver operating characteristic (ROC) curve analyses were performed to investigate relevant brain regions and their prediction accuracies. Results: Multivariate logistic regression analysis revealed that normative percentiles of the hippocampus (P < 0.001), amygdala (P = 0.003), frontal lobe (P = 0.049), medial parietal lobe (P = 0.023), and third ventricle (P = 0.012) were independent predictive factors for MCI. In ROC analysis, normative percentiles of the hippocampus and amygdala showed fair accuracies in the diagnosis of MCI (area under the curve: 0.739 and 0.727, respectively). Conclusion: Normative percentiles of the hippocampus and amygdala provided by the fully automated segmentation software could be used for screening MCI with a reasonable post-processing time. This information might help us interpret structural MRI in patients with cognitive impairment.

스킵연결이 적용된 오토인코더 모델의 클러스터링 성능 분석 (Clustering Performance Analysis of Autoencoder with Skip Connection)

  • 조인수;강윤희;최동빈;박용범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.403-410
    • /
    • 2020
  • 오토인코더의 데이터 복원(Output result) 기능을 이용한 노이즈 제거 및 초해상도와 같은 연구가 진행되는 가운데 오토인코더의 차원 축소 기능을 이용한 클러스터링의 성능 향상에 대한 연구도 활발히 진행되고 있다. 오토인코더를 이용한 클러스터링 기능과 데이터 복원 기능은 모두 동일한 학습을 통해 성능을 향상시킨다는 공통점이 있다. 본 논문은 이런 특징을 토대로, 데이터 복원 성능이 뛰어나도록 설계된 오토인코더 모델이 클러스터링 성능 또한 뛰어난지 알아보기 위한 실험을 진행했다. 데이터 복원 성능이 뛰어난 오토인코더를 설계하기 위해서 스킵연결(Skip connection) 기법을 사용했다. 스킵연결 기법은 기울기 소실(Vanishing gradient)현상을 해소해주고 모델의 학습 효율을 높인다는 장점을 가지고 있을 뿐만 아니라, 데이터 복원 시 손실된 정보를 보완해 줌으로써 데이터 복원 성능을 높이는 효과도 가지고 있다. 스킵연결이 적용된 오토인코더 모델과 적용되지 않은 모델의 데이터 복원 성능과 클러스터링 성능을 그래프와 시각적 추출물을 통해 결과를 비교해 보니, 데이터 복원 성능은 올랐지만 클러스터링 성능은 떨어지는 결과를 확인했다. 이 결과는 오토인코더와 같은 신경망 모델이 출력된 결과 성능이 좋다고 해서 각 레이어들이 데이터의 특징을 모두 잘 학습했다고 확신할 수 없음을 알려준다. 마지막으로 클러스터링의 성능을 좌우하는 잠재변수(latent code)와 스킵연결의 관계를 분석하여 실험 결과의 원인에 대해 파악하였고, 파악한 결과를 통해 잠재변수와 스킵연결의 특징정보를 이용해 클러스터링의 성능저하 현상을 보완할 수 있다는 사실을 보였다. 이 연구는 한자 유니코드 문제를 클러스터링 기법을 이용해 해결하고자 클러스터링 성능 향상을 위한 선행연구이다.

'미술'과 '언어' 활동 융합형의 아동 발달지원 교육 프레임워크 개발을 위한 탐색적 연구: 텍스트 마이닝을 중심으로 (An exploratory study for the development of a education framework for supporting children's development in the convergence of "art activity" and "language activity": Focused on Text mining method)

  • 박윤미;김시정
    • 한국융합학회논문지
    • /
    • 제12권3호
    • /
    • pp.297-304
    • /
    • 2021
  • 이 연구는 학령기 아동의 발달지원을 위하여 기존의 미술 치료 및 교육에서 시행되어 온 시각적 사고 중심의 접근에 더하여, 언어 교육 및 치료적 접근을 융합하고자 한 것이다. 이에 언어와 미술의 서로 다른 영역의 융합 가능 영역을 탐색하기 위하여 텍스트 마이닝 기법을 적용하였다. 이에 따라 이 연구는 기초 연구, 예비 DB구축, 텍스트 선별, DB 전 처리 및 확정, 불용어 처리, 텍스트 마이닝 분석 및 융합 가능 역 도출'의 절차에 따라 연구를 진행하였다. 연구 결과, 미술 치료 및 교육과 언어 치료 및 교육 분야에서 나타나는 문헌상의 각 군집을 연계하여 의사소통 및 학습 기능, 문제해결 및 감각 기관, 예술 및 지능, 정보와 의사소통, 가정 및 장애, 주제와 개념화 및 또래, 통합과 재구성 및 태도 등과 관련된 융합역을 도출할 수 있었다. 결론적으로 본 연구를 통하여 향후 미술과 언어의 활동 중심 융합형 프로그램을 설계할 수 있는 프레임워크를 마련하고 아동발달 지원을 위한 총체적 접근을 시도하였다는 점에서 연구의 의의가 있다.

프라이빗 블록체인 환경에서 생체인증과 위치기반을 통한 치매환자 배회행동 및 이상징후 탐지 기법 (Dementia Patient Wandering Behavior and Anomaly Detection Technique through Biometric Authentication and Location-based in a Private Blockchain Environment)

  • 한영애;강혁;이근호
    • 사물인터넷융복합논문지
    • /
    • 제8권5호
    • /
    • pp.119-125
    • /
    • 2022
  • 최근 고령화로 인한 치매환자의 증가로 그들의 배회행동과 실종예방을 위한 대책이 시급하다. 이러한 문제를 해결하기 위해 다양한 인증 방법과 위치 탐지 기법들이 소개되고 있으나 개인인증의 보안성 문제와 실내·외를 전반적으로 확인할 수 있는 시스템은 찾아보기 어려웠다. 본 연구에서는 프라이빗 블록체인 환경에서 손목 밴드 형태의 웨어러블 디바이스를 활용해 개인인증, 기본적 건강 상태 파악 및 실내·외의 전반적인 위치를 파악할 수 있는 시스템을 제안하고자 한다. 이 시스템에서 개인인증은 위변조가 어렵고 개인식별성이 높은 ECG를, 실내는 저전력, 비접촉 및 자동 송수신 방식으로 사용이 용이한 블루투스 비콘을, 실외는 GPS 위성의 의사거리 오차를 보정한 DGPS를 활용하여 치매환자의 위치를 파악함으로써 배회행동 및 이상징후를 탐지하고자 한다. 이를 통해 재가나 요양시설 등에서 생활하는 치매환자의 배회행동 및 이상징후 시 신속한 대처와 실종예방에 기여하고자 한다.

드론 활용 교량 안전점검을 위한 표준절차 정립 (Establishment of a Standard Procedure for Safety Inspections of Bridges Using Drones)

  • 이석배;이기홍;최현민;임치성
    • 대한토목학회논문집
    • /
    • 제42권2호
    • /
    • pp.281-290
    • /
    • 2022
  • 우리나라는 안전점검을 의무적으로 시행하여야 하는 국가시설물이 증가하고 있으며, 또한 보다 안전한 안전점검 방법이 필요한 시점이다. 본 연구는 주로 육안조사에 의존하던 교량의 안전점검을 드론을 활용하여 수행함으로써 점검자의 안전을 확보하고 신속한 외관조사가 가능하게 함으로써 교량 안전점검 외관조사의 효율성을 높이고자 하였다. 연구를 위하여 인천의 영종대교를 테스트베드로 선정하고 와렌 트러스 부분, 현수교 메인 케이블, 주탑, 교각의 네 부분으로 나누어 드론 촬영을 실시하고 성과물을 제작하였으며 그 과정에서의 작업 내용들을 정리하고 분석하여 교량시설물에 대한 드론 안전점검시 다섯 단계의 표준절차를 정립할 수 있었다. 연구결과로 얻어진 표준절차의 단계별 내용은 1단계, 시설물 정보수집 및 분석, 2단계, 취약부 분석 및 비행계획, 3단계, 드론 촬영 및 데이터 처리, 4단계, 외관조사 상태평가, 5단계, 외관조사망도 및 DB 구축이다. 따라서 이 표준절차에 따라 교량을 포함한 토목시설물의 안전점검이 수행된다면 보다 체계적이고 효율적으로 안전점검을 수행해 나갈 수 있을 것으로 기대된다.

인물 개체 분할을 위한 맥락-의존적 비디오 데이터 보강 (Context-Dependent Video Data Augmentation for Human Instance Segmentation)

  • 전현진;이종훈;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권5호
    • /
    • pp.217-228
    • /
    • 2023
  • 비디오 개체 분할은 비디오를 구성하는 영상 프레임 각각에 대해 관심 개체 분할을 수행해야 할 뿐만 아니라, 해당 비디오를 구성하는 프레임 시퀀스 전체에 걸쳐 개체들에 대한 정확한 트래킹을 요구하기 때문에 난이도가 높은 기술이다. 특히 드라마 비디오에서 인물 개체 분할은 다양한 장소와 시간대에서 상호 작용하는 복수의 주요 등장인물들에 대한 정확한 트래킹을 요구하는 특징을 가지고 있다. 또한, 드라마 비디오 인물 개체분할은 주연 인물들과 조연 혹은 보조 출연 인물들 간의 등장 빈도에 상당한 차이가 있어 일종의 클래스 불균형 문제도 있다. 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오들의 시-공간적 맥락을 충분히 고려해서 목표 인물이 삽입되어야 할 배경 클립 내의 위치를 결정함으로써, 보다 더 현실적인 보강 비디오들을 생성한다. 따라서 본 논문에서 제안하는 새로운 비디오 데이터 보강 기법인 CDVA는 비디오 개체 분할을 위한 심층 신경망 모델의 성능을 효과적으로 향상시킬 수 있다. 본 논문에서는 MHIS 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 유용성과 효과를 입증한다.

뮤직비디오 브라우징을 위한 중요 구간 검출 알고리즘 (Salient Region Detection Algorithm for Music Video Browsing)

  • 김형국;신동
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.112-118
    • /
    • 2009
  • 본 논문은 모바일 단말기, Digital Video Recorder (DVR) 등에 적용할 수 있는 뮤직비디오 브라우징 시스템을 위한 실시간 중요 구간 검출 알고리즘을 제안한다. 입력된 뮤직비디오는 음악 신호와 영상 신호로 분리되어 음악 신호에서는 에너지기반의 음악 특징값 최고점기반의 구조분석을 통해 음악의 후렴 구간을 포함하는 음악 하이라이트 구간을 검출하고, SVM AdaBoost 학습방식에서 생성된 모델을 이용해 음악신호를 분위기별로 자동 분류한다. 음악신호로부터 검출된 음악 하이라이트 구간과 영상신호로부터 검출된 가수, 주인공의 얼굴이 나오는 영상장면을 결합하여 최종적으로 중요구간이 결정된다. 제안된 방식을 통해 사용자는 모바일 단말기나 DVR에 저장되어 있는 다양한 뮤직비디오들을 분위기별로 선택한 후에 뮤직비디오의 30초 내외의 중요구간을 빠르게 브라우징하여 자신이 원하는 뮤직비디오를 선택할 수 있게 된다. 제안된 알고리즘의 성능을 측정하기 위해 200개의 뮤직비디오를 정해진 수동 뮤직비디오 구간과 비교하여 MOS 테스트를 실행한 결과 제안된 방식에서 검출된 중요 구간이 수동으로 정해진 구간보다 사용자 만족도 측면에서 우수한 결과를 나타내었다.

블로그 데이터 감성분석을 통한 북한산둘레길 구간별 선호도 평가 (Evaluation of Preference by Bukhansan Dulegil Course Using Sentiment Analysis of Blog Data)

  • 이성희;손용훈
    • 한국조경학회지
    • /
    • 제49권3호
    • /
    • pp.1-10
    • /
    • 2021
  • 본 연구는 탐방객이 자유롭게 서술한 블로그 텍스트 데이터를 자연어 처리 기술 중 하나인 감성분석을 활용하여 북한산둘레길의 선호도를 평가하고, 선호 요인과 비선호 요인을 도출하는 것을 목적으로 하였다. 이에 2019년 1년 동안 작성된 블로그를 수집하고 21개 둘레길 구간별 텍스트에 나타난 긍정 및 부정 감성 단어 도출을 통해 감성점수를 산출하였다. 이후 내용분석을 통해 탐방객이 어떤 요소로 인해 구간을 선호하거나 선호하지 않는지 파악하였다. 북한산둘레길에 대해 작성된 블로그에서는 긍정적인 단어가 평균적으로 약 73% 출현하고 있었고, 각 구간별 게시물의 감성 극성 비율에서도 긍정적인 문서의 비율이 부정적인 문서의 비율보다 높았다. 이를 통해 탐방객은 북한산둘레길에 대하여 대체로 긍정적으로 인식하고 있는 것으로 나타났다. 그럼에도 감성점수를 도출한 결과, 21개 둘레길 구간에서는 선호하는 구간과 선호하지 않는 구간이 존재하고 있었다. 선호 구간과 비선호 구간에 대해 탐방객은 난이도가 낮고 부담 없이 걸을 수 있는 구간을 선호하고 있었고, 경관에 대한 여러 요소(시각, 청각, 후각 등)가 조화롭고 계절감이 뚜렷해 다양한 경관이 연출되는 곳, 경관 시퀀스의 변화가 존재하는 구간을 선호하는 것으로 나타났다. 또한 탐방객은 전망대, 조망점 등의 뷰포인트 유무를 둘레길에서의 주요 요소로 인식하고 있었고, 접근성이 우수하고 안내판 등 정보 제공이 원활하게 이뤄지는 구간에 대해 선호도가 더 높은 것을 알 수 있다. 반면, 도로와 인접함에 따라 발생되는 주변 소음과 과도한 시가지 비율, 구간별 난이도 불균형 등으로 인한 둘레길 동선 불만족이 비선호 요인으로 크게 작용하고 있었으며, 경관 단절 및 구간에 대한 정보 부족 등이 선호도를 떨어트리는 원인으로 나타났다. 본 연구의 결과는 국립공원뿐만 아니라 근교 산림 녹지 관리에 있어서 둘레길 정비 및 개선방안 마련에 활용될 수 있으며, 연구에 활용된 감성분석은 자연지역에 대한 실제 이용자들의 반응을 지속적으로 모니터링 할 수 있다는 점에 의의가 있다. 다만 사전에 정의된 감성사전을 기반으로 평가하였기에 지속적인 사전 업데이트가 필요하다. 또한 소셜미디어 특성상 부정적인 견해보다는 긍정적인 내용을 공유하는 경향이 존재하기 때문에, 현장 설문조사 등의 분석 결과와 비교, 검토하는 작업이 필요하다.

학령기 정상아동에서 '전산화 신경인지기능검사'의 타당도 및 신뢰도 분석 (The Validity and Reliability of 'Computerized Neurocognitive Function Test' in the Elementary School Child)

  • 이종범;김진성;서완석;신현진;배대석;이혜린
    • 정신신체의학
    • /
    • 제11권2호
    • /
    • pp.97-117
    • /
    • 2003
  • 연구목적: 학령기 정상아동에 있어서 전산화 신경인지기능검사의 타당도 및 신뢰도를 알아보고자 하였다. 방 법: 2002년 6월부터 2003년 1월까지 평균 범위 이상의 지능을 유지하고 있고, 배제기준(ru1e out criteria)을 통과한 학년별 남녀 각각 10명씩, 120명의 정상아동에게 K-ABC, K-PIC 및 전산화 신경인지기능검사를 실시하였다. 그리고 이들 중 무작위로 선발된 30명에게 검사-재검사 신뢰도(reliability)를 알아보기 위해 4주뒤 전산화 신경인지기능검사를 재실시하였다. 결 과: 타당도 검증을 위한 상관분석 결과, 4가지 연속수행검사는 성인을 대상으로 한 연구와 동일하였으며, 기억력 검사에서도 단기기억의 순방향과 역방향 검사의 차이를 보이면서 선행연구와 동일하였다. 고위인지기능검사들에서는 각기 다른 측정 목적을 가지고 있는 검사들로 구성되어 있음을 시사하였다. 12개 검사 43개의 변수에 대해 요인분석을 실시한 결과, 10개의 요인이 도출되었으며, 전체 설병변량은 75.5%였다. 도출된 요인은 '주의력 유지, 정보처리속도, 경계력, 언어학습, 주의의 배분 및 개념형성, 사고의 유연성, 개념형성, 시각기억능력, 단기기억, 선택적 주의력' 순이었다. 해석적 준거(criteria)를 마련하기 위한 K-ABC와의 상관분석에서, K-ABC의 하위척도와 선택적인 관련성이 있음을 확인하였다. 신뢰도 검증에서, 연습효과를 반영하는 결과들이 발견되었으며, 특히 고위인지기능검사에서 현저하였다. 하지만, 각 검사 군의 반분신뢰도와 내적 일치도는 유의하게 높았다. 결 론: 아동기 정상아동의 전산화 신경인지기능 수행은 성인과는 다른 발달적 특성을 반영하고 있음을 발견할 수 있었으며, 신경심리학적 배경을 가진 표준화된 지능검사와의 관계를 알아봄으로써 해석적 준거 마련을 위한 기본적인 정보를 얻을 수 있었다.

  • PDF