• 제목/요약/키워드: Vision System Model

검색결과 576건 처리시간 0.026초

로봇활용 공동 주의 훈련자극에 대한 사용자 반응상태를 추정하는 프로세스 (The process of estimating user response to training stimuli of joint attention using a robot)

  • 김다영;윤상석
    • 한국정보통신학회논문지
    • /
    • 제25권10호
    • /
    • pp.1427-1434
    • /
    • 2021
  • 본 연구는 사회성 상호작용 훈련자극에 반응하는 아동의 행동 및 정서적 긴장상태를 연산하는 심리반응 상태 추정 프로세스를 제안한다. 행동 중재에 필요한 훈련자극으로는 공동 주의(Joint attention) 사회성 훈련을 채택하고, 훈련프로토콜은 불연속 개별시도 훈련(DTT: Discrete trial training)기법이 적용된다. 공동 주의 훈련에서 사용자의 집중과 긴장 정도를 확인하기 위해 3가지 훈련자극용 콘텐츠를 구성한 후, 캐릭터 형태의 탁상 로봇을 이용하여 사용자에게 훈련자극을 수행하게 된다. 그런 다음, 비전 기반 헤드 포즈 인식기와 기하학 연산모델로 사용자 응시반응을 추정하고, PPG와 GSR의 생체신호를 심박변이도와 히스토그램 기법으로 신경계 반응을 분석한다. 로봇을 활용한 실험에서 공동 주의에 대한 각 콘텐츠 별 훈련에 사용자의 심리반응을 정량화 할 수 있음을 확인하였다.

Normative-Legal and Information Security of Socio-Political Processes in Ukraine: a Comparative Aspect

  • Goshovska, Valentyna;Danylenko, Lydiia;Chukhrai, Ihor;Chukhrai, Nataliia;Kononenko, Pavlo
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.57-66
    • /
    • 2022
  • The aim of the article is to investigate socio-political processes in Ukraine on the basis of institutional and behavioral approaches, in particular their regulatory and informational support. Methodology. To determine the nature and content of sociopolitical processes, the following approaches have been used: 1. Institutional approach in order to analyze the development of Ukraine's political institutions. 2. The behavioral approach has been used for the analysis of socio-political processes in Ukraine in the context of political behavior of citizens, their political activity which forms the political culture of the country. Results. The general features of the socio-political situation in Ukraine are as follows: the formed model of government, which can be conditionally described as "presidential"; public demand for new leaders remains at a high level; the society has no common vision of further development; significant tendency of reduction of real incomes of a significant part of the society and strengthening of fiscal pressure on businessmen will get a public response after some time. Increasing levels of voice, accountability, efficiency of governance and the quality of the regulatory environment indicate a slow change in the political system, which will have a positive impact on public sentiment in the future. At the same time, there has been little change in the quality of Ukraine's institutions to ensure political stability, the rule of law and control of corruption. There are no cardinal changes in the development of the institution of property rights, protection of intellectual rights, changes in the sphere of ethics and control of corruption. Thus, Ukraine's political institutions have not been able to bring about any change in the social-political processes. Accordingly, an average level of trust and confidence of citizens in political institutions and negative public sentiment regarding their perception and future change can be traced in Ukraine.

헬멧 착용 여부 및 쓰러짐 사고 감지를 위한 AI 영상처리와 알람 시스템의 구현 (Implementation of an alarm system with AI image processing to detect whether a helmet is worn or not and a fall accident)

  • 조용화;이혁재
    • 융합신호처리학회논문지
    • /
    • 제23권3호
    • /
    • pp.150-159
    • /
    • 2022
  • 본 논문은 실시간 영상 분석을 통해서 산업현장에서 활동하는 여러 근로자의 영상 객체를 추출해 내고, 추출된 이미지로 부터 개별 영상 분석을 통해 헬멧의 착용 여부와 낙상 사고 여부를 확인하는 방법을 구현한다. 근로자의 영상 객체를 탐지하기 위해서 딥러닝 기반 컴퓨터 비전 모델인 YOLO를 사용하였으며, 추출된 이미지를 이용하여 헬멧의 착용여부를 판단하기 위해 따로 5,000장의 다양한 헬멧 학습 데이터 이미지를 만들어서 사용하였다. 또한, 낙상사고 여부를 판단하기 위해서 Mediapipe의 Pose 실시간 신체추적 알고리즘을 사용하여 머리의 위치를 확인하고 움직이는 속도를 계산하여 쓰러짐 여부를 판단하였다. 결과에 신뢰성을 주기위한 방법으로 YOLO의 바운딩 박스의 크기를 구하여 객체의 자세를 유추하는 방법을 추가하고 구현하였다. 최종적으로 관리자에게 알림 서비스를 위하여 텔레그램 API Bot과 Firebase DB 서버를 구현하였다.

딥러닝을 이용한 구강 스캐너 이미지 내 치아 영역 실시간 검출 (Real-time Tooth Region Detection in Intraoral Scanner Images with Deep Learning)

  • 박나윤;김지훈;김태민;송경진;변유진;강민주;전경구;김재곤
    • 산업경영시스템학회지
    • /
    • 제46권3호
    • /
    • pp.1-6
    • /
    • 2023
  • In the realm of dental prosthesis fabrication, obtaining accurate impressions has historically been a challenging and inefficient process, often hindered by hygiene concerns and patient discomfort. Addressing these limitations, Company D recently introduced a cutting-edge solution by harnessing the potential of intraoral scan images to create 3D dental models. However, the complexity of these scan images, encompassing not only teeth and gums but also the palate, tongue, and other structures, posed a new set of challenges. In response, we propose a sophisticated real-time image segmentation algorithm that selectively extracts pertinent data, specifically focusing on teeth and gums, from oral scan images obtained through Company D's oral scanner for 3D model generation. A key challenge we tackled was the detection of the intricate molar regions, common in dental imaging, which we effectively addressed through intelligent data augmentation for enhanced training. By placing significant emphasis on both accuracy and speed, critical factors for real-time intraoral scanning, our proposed algorithm demonstrated exceptional performance, boasting an impressive accuracy rate of 0.91 and an unrivaled FPS of 92.4. Compared to existing algorithms, our solution exhibited superior outcomes when integrated into Company D's oral scanner. This algorithm is scheduled for deployment and commercialization within Company D's intraoral scanner.

A Review on Detection of COVID-19 Cases from Medical Images Using Machine Learning-Based Approach

  • Noof Al-dieef;Shabana Habib
    • International Journal of Computer Science & Network Security
    • /
    • 제24권3호
    • /
    • pp.59-70
    • /
    • 2024
  • Background: The COVID-19 pandemic (the form of coronaviruses) developed at the end of 2019 and spread rapidly to almost every corner of the world. It has infected around 25,334,339 of the world population by the end of September 1, 2020 [1] . It has been spreading ever since, and the peak specific to every country has been rising and falling and does not seem to be over yet. Currently, the conventional RT-PCR testing is required to detect COVID-19, but the alternative method for data archiving purposes is certainly another choice for public departments to make. Researchers are trying to use medical images such as X-ray and Computed Tomography (CT) to easily diagnose the virus with the aid of Artificial Intelligence (AI)-based software. Method: This review paper provides an investigation of a newly emerging machine-learning method used to detect COVID-19 from X-ray images instead of using other methods of tests performed by medical experts. The facilities of computer vision enable us to develop an automated model that has clinical abilities of early detection of the disease. We have explored the researchers' focus on the modalities, images of datasets for use by the machine learning methods, and output metrics used to test the research in this field. Finally, the paper concludes by referring to the key problems posed by identifying COVID-19 using machine learning and future work studies. Result: This review's findings can be useful for public and private sectors to utilize the X-ray images and deployment of resources before the pandemic can reach its peaks, enabling the healthcare system with cushion time to bear the impact of the unfavorable circumstances of the pandemic is sure to cause

실내모형시험에서 No-target 프로그램을 이용한 터널 굴착으로 인한 지반거동 측정 (Measurement of ground behaviour due to tunnelling using No-target program in laboratory model test)

  • 이종현;이창노;이용주
    • 한국터널지하공간학회 논문집
    • /
    • 제21권3호
    • /
    • pp.397-418
    • /
    • 2019
  • 터널 굴착으로 인한 지반 및 인접 구조물의 거동을 이해하고 분석하는 것은 매우 중요하며, 이는 현대사회에서의 과학기술의 발전과 함께 토목공학 분야에서 폭넓게 활용되고 있다. 근거리 사진계측기법은 지반공학 분야에서 주로 쓰이고 있으며, 최근 GeoPIV 등을 이용한 계측기법의 연구가 증가하고 있는 추세이다. 본래에는 지반의 거동을 계측하여 시각화하는 방법으로 알루미늄 봉과 타겟 포인트를 이용한 VMS 프로그램이 주로 사용되어 왔다. 하지만 이러한 방법을 적용할 경우, 타겟 포인트가 손에 의해 인위적으로 설치되기 때문에 외부적인 오차가 발생할 수 있다. 또한 포인트 사이의 그리드가 넓거나 좁을 경우 희박한 데이터가 도출될 수 있는 문제점을 안고 있다. 따라서 본 연구에서는 타겟의 사용 없이 변위를 분석할 수 있는 MATLAB 기반의 No-target 프로그램을 개발하였고 수치해석과 실내 모형시험을 통해 기존의 프로그램과의 비교 및 검증에 초점을 맞추었다. 연구 내용으로는 greenfield condition, strip foundation, pile foundation 3가지 Case에 대하여 실내 모형시험을 실시하였으며, VMS 프로그램과 No-target 프로그램의 결과로부터 total displacement와 vertical displacement의 오차율을 분석하였다. 또한 유한요소 수치해석 프로그램인 PLAXIS를 통하여 실내 모형시험과의 결과와 비교 및 검증하였다.

CTR 예측을 위한 비전 트랜스포머 활용에 관한 연구 (A Study on Utilization of Vision Transformer for CTR Prediction)

  • 김태석;김석훈;임광혁
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.27-40
    • /
    • 2021
  • Click-Through Rate(CTR) 예측은 추천시스템에서 후보 항목의 순위를 결정하고 높은 순위의 항목들을 추천하여 고객의 정보 과부하를 줄임과 동시에 판매 촉진을 통한 수익 극대화를 달성할 수 있는 핵심 기능이다. 자연어 처리와 이미지 분류 분야는 심층신경망(deep neural network)의 활용을 통한 괄목한 성장을 하고 있다. 최근 이 분야의 주류를 이루던 모델과 차별화된 어텐션(attention) 메커니즘 기반의 트랜스포머(transformer) 모델이 제안되어 state-of-the-art를 달성하였다. 본 연구에서는 CTR 예측을 위한 트랜스포머 기반 모델의 성능 향상 방안을 제시한다. 자연어와 이미지 데이터와는 다른 이산적(discrete)이며 범주적(categorical)인 CTR 데이터 특성이 모델 성능에 미치는 영향력을 분석하기 위해 임베딩의 일반화(regularization)와 트랜스포머의 정규화(normalization)에 관한 실험을 수행한다. 실험 결과에 따르면, CTR 데이터 입력 처리를 위한 임베딩 과정에서 L2 일반화의 적용과 트랜스포머 모델의 기본 정규화 방법인 레이어 정규화 대신 배치 정규화를 적용할 때 예측 성능이 크게 향상됨을 확인하였다.

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

수문학적 가뭄지수와 가상가뭄훈련에 의한 저수지의 최적 물 공급 방안 연구 (A Study on the Optimal Water Supply using Virtual Drought Exercise with Hydrological Drought Index)

  • 서형덕;정상만;김성준;이주헌
    • 한국수자원학회논문집
    • /
    • 제41권10호
    • /
    • pp.1045-1058
    • /
    • 2008
  • 가뭄은 장시간동안 강수의 부족으로 발생하는 자연현상이며, 지역에 따라 해마다 여러 가지 피해를 발생시키고 있다. 특히 1994$\sim$1995년과 2001년에 발생한 가뭄은 피해가 매우 심각하였으며 중.소규모의 저수지가 바닥을 드러냈을 뿐 아니라 상당한 경제적인 손실도 발생하였다. 하지만 가뭄관리계획에 의해 저수지를 통한 최적의 물 공급방안을 제시함으로써 이러한 피해들을 최소화 시킬 수 있을 것이다. 본 연구에서는 최적의 저수지 운영을 위한 전문가시스템을 개발하여 수문학적 가뭄지수인(Modified Surface Water Supply Index, MSWSI) 값과 저수지 유입량과의 연계를 통한 가상가뭄모의운영(Virtual Drought Exercise, VDE)을 실시한 후 도출된 결과를 바탕으로 가뭄단계에 따른 댐 운영대안을 제시하였다. 가상가뭄모의운영으로 여러 가지 가뭄사상에 대한 효과적인 장 단기 대안을 도출할 수 있었으며 가뭄기간동안 최적의 물 공급방안을 준비하는데 효과적으로 사용될 수 있을 것이라고 판단된다.

이동수요 대응형 클라우드 교통시스템 공유차량 대여소 입지선정 (Study on Location Decisions for Cloud Transportation System Rental Station)

  • 신민성;배상훈
    • 대한교통학회지
    • /
    • 제30권2호
    • /
    • pp.29-42
    • /
    • 2012
  • 최근 개인차량의 증가로 인해 도로교통의 혼잡은 심화되고 있다. 개인차량의 운행 억제를 위한 여러 방편 중 카쉐어링, 렌트카 등의 시스템이 IT 기술과 접목되어 등장하고 있다. 또한, 차량의 소유를 억제하고 아울러 지속가능한 교통환경을 위한 차량공유 시스템에 대한 도입이 검토되고 있다. 이러한 차량 공유는 도로교통의 혼잡을 줄이고 차량의 효율성을 증대시키며 보다 친환경적인 교통의 구현을 목적으로 한다. 본 논문에서는 차량공유시스템에 대한 개념, 체계도, 운영시나리오 등을 소개하고자 한다. 아울러 차량 공유시스템 운영에 있어 최우선 과제인 차량 대여소 입지선정 및 수요를 추정하였다. 연구지역은 부산시 남구, 해운대구, 수영구를 연구 지역으로 선정하고 인구수, 종사자수, 학생수, OD 통행량 등 주요 교통현황을 분석하고 이용 설문조사를 통해 설정된 존의 수요를 추정하였다. 각 존의 발생통행과 도착통행을 고려하고, 이용 빈도 평균사용시간을 분석해 필요 수요를 산정하였다. 대여소 입지선정은 입지후보지를 인구 밀도와 접근성을 통해 평가하고 평가단위를 통일하기위해 평과결과를 정규화 하여 각 후보지를 평가하였다. 평가점수에 따라 선정된 입지후보지의 CTS 존 수요에 따른 차량 대수 및 주차면수를 산정하였다. 산정결과 대표존으로 해운대구 우1동의 3개의 후보지중 해운대광장공영주차장과 동백사거리공영주차장이 선정되었으며 각각의 차량대수와 주차면은 11대와 14.23면, 7.9대와 10.29면으로 추정되었다. 향후연구로 클라우드 교통 구현시 발생된 실데이터의 적용을 통한 정확한 수요추정이 필요하며 선정된 대여소간의 차량 재분배를 위한 효율적인 네트워크 설계와 알고리즘이 연구되어야 할 것이다.