• Title/Summary/Keyword: 시각객체

Search Result 494, Processing Time 0.033 seconds

A Clustering using Two-Dimensional Projection in High-Dimensional Data (고차원 데이터에서 2차원 프로젝션을 이용한 클러스터링)

  • 장미희;이혜명;박영배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.16-18
    • /
    • 2001
  • 데이터마이닝 기법 중의 하나인 플러스터링은 대용량 데이터베이스에서 유사한 특징을 가진 객체들을 집단화하는데 사용되는 매우 유용한 분석방법이다. 그러나 대부분의 클러스터링 알고리즘들은 고차원 데이터에서는 성능이 급격히 저하된다. 이것은 고차원 데이터 집합이 상당한 양의 잡음을 포함하고 있기 때문이며 고차원 데이터 고유의 희소성에 기인한다. 이에 따라 고차원 데이터의 구조와 특성을 지원하는데 적합한 클러스터링 기법이 개발되고 있다. 본 논문에서는 고차원 클러스터링에서 잡음 데이터를 효과적으로 제거하기 위한 새로운 알고리즘을 제안하는데, 이 일고리즘은 고차원 데이터의 저차원으로의 변환에 기초한다. 저 차원으로 변환을 위해 2차원 프로젝션을 이용하며, 반복적으로 2차원 프로젝션을 적용하여 잡음을 단계적으로 최소화한다. 이와 같은 2차원 프로젝션은 잡음을 점차적으로 줄여줄 뿐 아니라, 데이터 분포에 대한 시각화 작업에도 용이하다.

  • PDF

Design and Implementation of HMI Authoring Tool for Window-based PLC Control (윈도우 기반 PLC 제어용 HMI 저작 도구의 설계 및 구현)

  • Chung, Soon-Bo;Kim, Hyo-Jeung;Yoon, Sung-Hee;Han, Kwang-Rok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.523-526
    • /
    • 2004
  • 본 논문은 산업용 자동화기기에 사용되는 다수의 PLC(Programmable Logic Controller)를 모니터링하고 제어하기 위해, HMI(Human Machine Interface) 시스템에서 구동되는 저작 도구 응용프로그램을 설계 및 구현한다. HMI 저작 도구에서는 스크린이라는 가상화면 객체의 영역 안에서 태그라는 구성요소의 속성들을 편집하고 저장 및 전송하는 과정을 그래픽 화면을 통해 시각적으로 제공한다.

  • PDF

Implementation of Networked Virtual Environment by Using Effective Java Multi-Thread Parallelism (효과적인 자바 다중 쓰레드 병렬처리를 이용한 네트워크 가상환경의 구현)

  • Kim, Woo-Yeal;Park, Jong-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.829-832
    • /
    • 2004
  • 대단위(large-scale) 가상현실 시스템이나 가상현실 시스템의 구성요소가 네트워크(일반적인 통신망)를 통하여 분산되어 있는 경우를 네트워크 가상현실 시스템(Net-VE : Networked Virtual Environment)이라 한다. 가상현실의 환경을 분산 처리하는 경우 가상현실 시각의 공유방법, 분산시스템의 구성방법, 저속 혹은 고속통신망을 통한 대량의 데이터를 전송하는 방법, 가상현실 내의 이용자의 상호작용 방법, 데이터 공유방법, 분산처리 방법 등 가상현실 기술에 부가하여 통신망기술, 프로토콜 공학, 분산 처리기술 등 다양한 주변 기술이 필요하다. 따라서 본 논문에서는 더 유연성 있고 모듈러한 네트워크 가상 환경을 구축하는데 있어 효율적인 객체 지향 프로그래밍 기술인 자바의 다중 쓰레드 병렬처리 기법을 사용하고자 한다. 자바의 쓰레드 구조를 사용함으로써 네트워크 가상환경에서 여러 클라이언트에서 요청하는 데이터를 네트워크를 통한 지연에 대한 효과적인 대안으로서 자바의 다중 쓰레드 병렬처리 기법을 제안하고자 한다.

  • PDF

Virtual Reenactment of Royal's Procession in the Joseon Dynasty via Mobile Augmented Reality (모바일 증강현실 기술을 활용한 조선시대 왕실 행차 복원)

  • Kim, Eun-Jin;Kim, Hye-Weon;Yu, Jeong-Min
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.361-362
    • /
    • 2019
  • 조선시대 반차도는 왕실 행차에 관한 배열을 나타낸 시각자료이다. 반차도는 구성요소를 평면적이고 간략하게 표현했기 때문에 전문적인 지식이 없는 일반 관람객이 왕실 행차의 내용을 파악하기는 쉽지 않았다. 기존 왕실 행차와 관련된 콘텐츠는 모니터 상에서 2D 이미지를 애니메이션으로 상영하거나 간단한 조작을 통해 3D 콘텐츠를 감상하는 방식으로 재현되었다. 그러나 공간적으로 한정된 모니터를 통해 관람해야 했기 때문에 행렬의 전체적인 모습을 충분히 전달하지 못하는 단점이 있었다. 본 논문에서는 3D 객체를 반차도에 직접 증강시킴으로써 기존 콘텐츠의 문제를 극복하고 왕실 행차에 관한 정확하고 구체적인 이미지를 전달하고자 한다. 이 연구를 통해 관람객에게 문화유산에 관한 높은 품질의 경험을 제공할 수 있을 것으로 기대한다.

  • PDF

Odometry Using Strong Features of Recognized Text (인식된 문자의 강한 특징점을 활용하는 측위시스템)

  • Song, Do-hoon;Park, Jong-il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.219-222
    • /
    • 2021
  • 본 논문에서는 시각-관성 측위시스템(Visual-Inertial Odometry, VIO)에서 광학 문자 인식(Optical Character Recognition, OCR)을 활용해 문자의 영역을 찾아내고, 그 위치를 기억해 측위시스템에서 다시 인식되었을 때 비교하기 위해 위치와 특징점을 저장하고자 한다. 먼저, 실시간으로 움직이는 카메라의 영상에서 문자를 찾아내고, 카메라의 상대적인 위치를 이용하여 문자가 인식된 위치와 특징점을 저장하는 방법을 제안한다. 또한 저장된 문자가 다시 탐색되었을 때, 문자가 재인식되었는 지 판별하기 위한 방법을 제안한다. 인공적인 마커나 미리 학습된 객체를 사용하지 않고 상황에 따른 문자를 사용하는 이 방법은 문자가 존재하는 범용적인 공간에서 사용이 가능하다.

  • PDF

Analysis of the effect of class classification learning on the saliency map of Self-Supervised Transformer (클래스분류 학습이 Self-Supervised Transformer의 saliency map에 미치는 영향 분석)

  • Kim, JaeWook;Kim, Hyeoncheol
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.67-70
    • /
    • 2022
  • NLP 분야에서 적극 활용되기 시작한 Transformer 모델을 Vision 분야에서 적용하기 시작하면서 object detection과 segmentation 등 각종 분야에서 기존 CNN 기반 모델의 정체된 성능을 극복하며 향상되고 있다. 또한, label 데이터 없이 이미지들로만 자기지도학습을 한 ViT(Vision Transformer) 모델을 통해 이미지에 포함된 여러 중요한 객체의 영역을 검출하는 saliency map을 추출할 수 있게 되었으며, 이로 인해 ViT의 자기지도학습을 통한 object detection과 semantic segmentation 연구가 활발히 진행되고 있다. 본 논문에서는 ViT 모델 뒤에 classifier를 붙인 모델에 일반 학습한 모델과 자기지도학습의 pretrained weight을 사용해서 전이학습한 모델의 시각화를 통해 각 saliency map들을 비교 분석하였다. 이를 통해, 클래스 분류 학습 기반 전이학습이 transformer의 saliency map에 미치는 영향을 확인할 수 있었다.

  • PDF

Enhanced Video Frame Interpolation Transformer based on Optical Flow Guidance (광학 흐름 안내 기반의 향상된 비디오 프레임 보간 트랜스포머)

  • Huh, Jingang;Jeong, Jinwoo;Kim, Sungjei;Yoon, Kihwan;Kwon, Yonghoon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.214-216
    • /
    • 2022
  • 비디오 프레임 보간 기술은 시간 해상도를 증가시키는 기술로 최근 Convolutional Neural Network(이하 CNN) 기반의 다양한 연구가 진행되고 있다. 하지만 일부 시각에서는 CNN 기반의 연구가 동일한 커널을 모든 화소에 적용하는 것과 객체의 움직임을 예측하기 위해 장기간의 데이터를 활용하는 것에 한계점이 있다고 주장한다. 이에 따라 장기간의 데이터 활용에 특화된 트랜스포머 기반의 비디오 프레임 보간 기술이 제안되었다. 본 논문에서는 트랜스포머 기반의 기존 연구에서 합성 네트워크의 성능을 향상시키기 위해 광학 흐름 안내 기반의 새로운 학습 방법을 제안한다 실험 결과를 통해 평균 PSNR 0.09dB와 SSIM 0.0031 성능 향상을 확인한다.

  • PDF

Personalized game recommendation system (개인 맞춤형 게임 추천 시스템)

  • Ju-hyun Kim;Yeo-eun Kim;Ah-ram Kim;Jin-hee Park;Hyon Hee Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.1202-1203
    • /
    • 2023
  • 본 논문은 스팀(Steam) 게임 플랫폼을 기반으로 약 1000개의 게임 데이터를 활용하여 사용자들에게 알맞은 게임을 추천해주는 시스템을 제안한다. 게임 선택에 영향을 주는 요인들을 언어 객체로 설정하여 규칙 기반 추론 시스템을 구현했다. 선호도 정보는 게임 선택의 기준이 되는 세 가지 요소에 대한 질문에 답하는 방식으로 수집된다. 게임 추천 결과를 시각화하여 신규 유저를 게임에 유입하고 몰입을 촉진하고자 한다.

AR walking support application-based on object recognition for people with low vision (저시력 장애인을 위한 객체인식 기반의 AR 보행 앱 설계 및 구현)

  • Hyo-jin Oh;Chae-yeon Kim;Ju-Ha Park;Hye-bin Lee;Yang-gyu Lim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.1029-1030
    • /
    • 2023
  • 시각장애인의 독립보행은 많은 위험 부담과 어려움을 안고 있다. 본 연구는 이러한 어려움을 해결하고자 사용자에게 GPS를 통해 목적지까지 안전한 경로로 안내하는 기능을 제공한다. 사물 인식 알고리즘을 통해 주행 시 필요한 장애물 판별과 신호등의 색상 등을 인식한다. 그리고 아두이노 초음파 센서를 활용하여 장애물과 사용자 간의 거리를 인식하고, 블루투스 모듈을 통해 측정한 값을 송신하여 구간별에 따라 사용자에게 경고음을 울린다. 더 나아가 AR 기능을 통해서 장애물을 입체적으로 강조하여 표시함으로써 저시력 장애인들이 장애물과 충돌하는 것을 예방한다.

Design and Implementation of User-Interactive Crowd Accident Avoiding System (CAAS) (공공데이터와 인공지능을 활용한 상호작용형 군중 사고 예방 시스템 설계 및 구현)

  • JunWan Kim;YoungBae Kong;ByeongHo Kim;MinJae Park;JeongEun Nah
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.914-915
    • /
    • 2023
  • COVID-19 대유행 및 이태원 압사 사고로 인해 안전 관점의 인구 밀집에 관심이 높아졌으며, 기존 CCTV를 통한 단순 관찰방식을 넘어 유동 인구의 흐름까지 예측한 인구 밀집도 파악이 필요하게 되었다. 본 논문에서는 기존 관찰방식 공공데이터 CCTV에 컴퓨터 비전(CV) 및 다중 객체 추적(MOT) 기술을 추가 적용하여 사용자 중심(시각, 장소)의 유동 인구수와 인구 밀집 지역을 파악할 수 있는 모델을 제안하고 구현하였다. 이 모델을 적용함으로써 시민들은 안전한 환경에서 인구 밀집에 관련된 사고로부터 보호받을 수 있을 것으로 기대한다.