• Title/Summary/Keyword: 시각지능

Search Result 506, Processing Time 0.023 seconds

Trends in Video Visual Relationship Understanding (비디오 시각적 관계 이해 기술 동향)

  • Y.J. Kwon;D.H. Kim;J.H. Kim;S.C. Oh;J.S. Ham;J.Y. Moon
    • Electronics and Telecommunications Trends
    • /
    • v.38 no.6
    • /
    • pp.12-21
    • /
    • 2023
  • Visual relationship understanding in computer vision allows to recognize meaningful relationships between objects in a scene. This technology enables the extraction of representative information within visual content. We discuss the technology of visual relationship understanding, specifically focusing on videos. We first introduce visual relationship understanding concepts in videos and then explore the latest existing techniques. Next, we present benchmark datasets commonly used in video visual relationship understanding. Finally, we discuss future research directions in video visual relationship understanding.

Research Trends of Multi-agent Collaboration Technology for Artificial Intelligence Bots (AI Bots를 위한 멀티에이전트 협업 기술 동향)

  • D., Kang;J.Y., Jung;C.H., Lee;M., Park;J.W., Lee;Y.J., Lee
    • Electronics and Telecommunications Trends
    • /
    • v.37 no.6
    • /
    • pp.32-42
    • /
    • 2022
  • Recently, decentralized approaches to artificial intelligence (AI) development, such as federated learning are drawing attention as AI development's cost and time inefficiency increase due to explosive data growth and rapid environmental changes. Collaborative AI technology that dynamically organizes collaborative groups between different agents to share data, knowledge, and experience and uses distributed resources to derive enhanced knowledge and analysis models through collaborative learning to solve given problems is an alternative to centralized AI. This article investigates and analyzes recent technologies and applications applicable to the research of multi-agent collaboration of AI bots, which can provide collaborative AI functionality autonomously.

Self-Improving Artificial Intelligence Technology (자율성장 인공지능 기술)

  • Song, H.J.;Kim, H.W.;Chung, E.;Oh, S.;Lee, J.W.;Kang, D.;Jung, J.Y.;Lee, Y.K.
    • Electronics and Telecommunications Trends
    • /
    • v.34 no.4
    • /
    • pp.43-54
    • /
    • 2019
  • Currently, a majority of artificial intelligence is used to secure big data; however, it is concentrated in a few of major companies. Therefore, automatic data augmentation and efficient learning algorithms for small-scale data will become key elements in future artificial intelligence competitiveness. In addition, it is necessary to develop a technique to learn meanings, correlations, and time-related associations of complex modal knowledge similar to that in humans and expand and transfer semantic prediction/knowledge inference about unknown data. To this end, a neural memory model, which imitates how knowledge in the human brain is processed, needs to be developed to enable knowledge expansion through modality cooperative learning. Moreover, declarative and procedural knowledge in the memory model must also be self-developed through human interaction. In this paper, we reviewed this essential methodology and briefly described achievements that have been made so far.

Development of Range of Motion Visualization System using 3D Avatar (3차원 아바타를 이용한 관절 가동 범위 시각화 시스템 개발)

  • Yoon, Chang-Rak;Chang, Yoon-Seop;Kim, Jae-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.303-304
    • /
    • 2022
  • 근골격계 질환 재활환자들의 신체 능력을 평가하기 위한 주요 측정 도구로 관절 가동 범위(ROM: Range of Motion)가 사용된다. 본 논문에서는 근골격계 환자들의 재활운동을 통한 관절 가동 범위 정보를 시각적 이해하기 용이하도록 서비스하기 위하여 3차원 아바타를 이용한 관절 가동 범위 시각화 시스템을 제안한다. 제안하는 3차원 아바타를 이용한 관절 가동 범위 시각화 시스템은 근골격계 질환 재활환자들의 관절 가동 범위 데이터를 3차원 아바타의 대응하는 관절 작동 범위로 사상하고 다양한 시점으로 시각화하거나 애니메이션으로 재현함으로써 재활 수준의 변화를 직관적으로 제공할 수 있다.

소프트웨어 테스트 정지시각 결정 방법에 대한 연구

  • 최규식;장원석;김종기
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2001.06a
    • /
    • pp.485-488
    • /
    • 2001
  • 소프트웨어의 신뢰도모델을 적용하는 중요한 일 중의 하나는 소프트웨어 발행시각을 결정하는 일이다. 이 문제에 대해서 여러 연구자들이 그동안 많은 연구논문을 발표하였다. 본 논문에서는 최적발행시각을 결정하는 문제를 심도있게 다루고자 하였다. 특정한 발행시각을 결정하는데 있어서 신뢰도 요건 및 비용 모델 모두를 고려하여 고찰한다. 신뢰도 목표로서 허용치 이내의 고장강도를 사용해야 하며, 최적 발행방책은 순차적인 접근법에 근거하여 검토

  • PDF

Film Production Using Artificial Intelligence with a Focus on Visual Effects (인공지능을 이용한 영화제작 : 시각효과를 중심으로)

  • Yoo, Tae-Kyung
    • Journal of Korea Entertainment Industry Association
    • /
    • v.15 no.1
    • /
    • pp.53-62
    • /
    • 2021
  • After the first to present projected moving pictures to audiences, the film industry has been reshaping along with technological advancements. Through the full-scale introduction of visual effects-oriented post-production and digital technologies in the film-making process, the film industry has not only undergone significant changes in the production, but is also embracing the cutting edge technologies broadly and expanding the scope of industry. Not long after the change to digital cinema, the concept of artificial intelligence, first known at the Dartmouth summer research project in 1956, before the digitalization of film, is expected to bring about a big transformation in the film industry once again. Large volume of clear digital data from digital film-making makes easy to apply recent artificial intelligence technologies represented by machine learning and deep learning. The use of artificial intelligence techniques is prominent around major visual effects studios due to automate many laborious, time-consuming tasks currently performed by artists. This study aims to predict how artificial intelligence technology will change the film industry in the future through analysis of visual effects production cases using artificial intelligence technology as a production tool and to discuss the industrial potential of artificial intelligence as visual effects technology.

Data Preprocessing Techniques for Visualizing Gas Sensor Datasets (가스 센서 데이터셋 시각화를 위한 데이터 전처리 기법)

  • Kim, Junsu;Park, Kyungwon;Lim, Taebum;Park, Gooman
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.21-22
    • /
    • 2021
  • 최근 AI(Artificial Intelligence)를 기반으로 정밀한 가스 성분 감지를 위한 후각지능(Olfactory intelligence) 기술에 연구가 활발히 진행 중이다. 후각지능 학습데이터는 다른 감지 방식의 가스 센서들이 동시에 적용되는 멀티모달리티의 특성을 지니며 또한, 공간상에 분포된 센서 배열을 통해 획득된 다차원의 시계열 특성을 지닌다. 따라서 대량의 다차원 데이터에 대한 정확한 이해와 분석을 위해서는 데이터를 전처리하고 시각화할 수 있는 기술이 필요하다. 본 논문에서는 후각지능 학습을 위한 다차원의 복잡한 가스 데이터의 시각화를 위해 잡음 등의 불필요한 값을 제거하고, 데이터가 일관성을 가지도록 하며, 데이터의 차원을 시각화 가능하도록 축소하기 위한 전처리 방법을 제시한다.

  • PDF

로보트의 시각시스템

  • 최종수
    • 전기의세계
    • /
    • v.33 no.12
    • /
    • pp.726-734
    • /
    • 1984
  • 본고에서는 아직도 연구지향의 성격을 띄고 있는 인공지능로보트의 시각시스템에 관해 기술하였고, 이들의 연구를 바탕으로 하여 needs에 답하는 형식인 응용지향인 산업용로보트의 시각시스템에 관해 언급하였다. 끝으로 필자의 연구실에서 발표한 인쇄악보의 인식에 관해 간단히 소개하였다.

  • PDF

A Full Body Gumdo Game with an Intelligent Cyber Fencer using Multi-modal(3D Vision and Speech) Interface (멀티모달 인터페이스(3차원 시각과 음성 )를 이용한 지능적 가상검객과의 전신 검도게임)

  • 윤정원;김세환;류제하;우운택
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.9 no.4
    • /
    • pp.420-430
    • /
    • 2003
  • This paper presents an immersive multimodal Gumdo simulation game that allows a user to experience the whole body interaction with an intelligent cyber fencer. The proposed system consists of three modules: (i) a nondistracting multimodal interface with 3D vision and speech (ii) an intelligent cyber fencer and (iii) an immersive feedback by a big screen and sound. First, the multimodal Interface with 3D vision and speech allows a user to move around and to shout without distracting the user. Second, an intelligent cyber fencer provides the user with intelligent interactions by perception and reaction modules that are created by the analysis of real Gumdo game. Finally, an immersive audio-visual feedback by a big screen and sound effects helps a user experience an immersive interaction. The proposed system thus provides the user with an immersive Gumdo experience with the whole body movement. The suggested system can be applied to various applications such as education, exercise, art performance, etc.

Deep Learning based Visual-Inertial Drone Odomtery Estimation (딥러닝 기반 시각-관성을 활용한 드론 주행기록 추정)

  • Song, Seung-Yeon;Park, Sang-Won;Kim, Han-Gyul;Choi, Su-Han
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.842-845
    • /
    • 2020
  • 본 연구는 시각-관성 기반의 딥러닝 학습으로 자유분방하게 움직이는 드론의 주행기록을 정확하게 추정하는 것을 목표로 한다. 드론의 비행주행은 드론의 온보드 센서와 조정값을 이용하는 것이 일반적이다. 본 연구에서는 이 온보드 센서 데이터를 학습에 사용하여 비행주행의 위치추정을 실험하였다. 선행연구로써 DeepVO[1]룰 구현하여 KITTI[3] 데이터와 Midair[4] 데이터를 비교, 분석하였다. 3D 좌표면에서의 위치 추정에 선행연구 모델의 한계가 있음을 확인하고 IMU를 Feature로써 사용하였다. 본 모델은 FlowNet[2]을 모방한 CNN 네트워크로부터 Optical Flow Feature에 IMU 데이터를 더해 RNN으로 학습을 진행하였다. 본 연구를 통해 주행기록 예측을 다소 정확히 했다고 할 수 없지만, IMU Feature를 통해 주행기록의 예측이 가능함을 볼 수 있었다. 본 연구를 통해 시각-관성 분야에서 사람의 지식이나 조정이 들어가는 센서를 융합하는 기존의 방식에서 사람의 제어가 들어가지 않는 End-to-End 방식으로 인공지능을 학습했다. 또한, 시각과 관성 데이터를 통해 주행기록을 추정할 수 있었고 시각적으로 그래프를 그려 정답과 얼마나 차이 있는지 확인해보았다.