• 제목/요약/키워드: Visual Information processing

검색결과 1,075건 처리시간 0.028초

Designing a Vibrotactile Reading System for Mobile Phones

  • Chu, Shaowei;Zhu, Keying
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1102-1113
    • /
    • 2018
  • Vibrotactile feedback is widely used in designing non-visual interactions on mobile phones, such as message notification, non-visual reading, and blind use. In this work, novel vibrotactile codes are presented to implement a non-visual text reading system for mobile phones. The 26 letters of the English alphabet are formed in an index table with four rows and seven columns, and each letter is mapped using the codes of vibrations. Two kinds of vibrotactile codes are designed with the actuator's on and off states and with specific lengths (short and long) assigned to each state. To improve the efficiency of tactile perception and user satisfaction, three user experiments are conducted. The first experiment explores the maximum number of continuous vibrations and minimum vibration time of the actuator's on and off states that the human can perceive. The second experiment determines the minimum interval between continuous vibrations. The vibrotactile reading system is designed and evaluated in the third experiment according to the results of the two preceding experiments. Results show that the character reading accuracy reaches 91.7% and the character reading speed is approximately 617.8 ms. Our method has better reading efficiency and is easier to learn than the traditional Braille coding method.

Method for estimating workability of self-compacting concrete using mixing process images

  • Li, Shuyang;An, Xuehui
    • Computers and Concrete
    • /
    • 제13권6호
    • /
    • pp.781-798
    • /
    • 2014
  • Estimating the workability of self-compacting concrete (SCC) is very important both in laboratories and on construction site. A method using visual information during the mixing process was proposed in this paper to estimate the workability of SCC. First, fourteen specimens of concrete were produced by a single-shaft mixer. A digital camera was used to record all the mixing processes. Second, employing the digital image processing, the visual information from mixing process images was extracted. The concrete pushed by the rotating blades forms two boundaries in the images. The shape of the upper boundary and the vertical distance between the upper and lower boundaries were used as two visual features. Thirdly, slump flow test and V-funnel test were carried out to estimate the workability of each SCC. Finally, the vertical distance between the upper and lower boundaries andthe shape of the upper boundary were used as indicators to estimate the workability of SCC. The vertical distance between the upper and lower boundaries was related to the slump flow, the shape of the upper boundary was related to the V-funnel flow time. Based on these relationships, the workability of SCC could be estimated using the mixing process images. This estimating method was verified by three more experiments. The experimental results indicate that the proposed method could be used to automatically estimate SCC workability.

제스처 인식 모듈을 이용한 대규모 멀티 인터랙티브 디스플레이 시스템 (large-scale interactive display system using gesture recognition module)

  • 강맹관;김정훈;조성현;주우석;윤태수;이동훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.803-806
    • /
    • 2010
  • 본 논문에서는 스크린을 터치를 하지 않고 또한 스크린의 영역의 크기에 상관없이 제스처를 이용하여 인터랙션이 가능한 제스쳐 인식 모듈을 이용한 대규모 멀티 인터랙티브 디스플레이 시스템을 제안한다. IR laser를 이용하여 인터랙션 영역을 생성하고 band pass filter를 장착한 적외선 카메라를 이용하여 인터랙션 영역 안의 영상을 획득한다. 획득되어진 영상은 제안하는 영상처리모듈을 이용하여 이진화->블랍-라벨링 과정을 거쳐 잡음을 제거한 후 인터랙션 영역 안에서 이루어지는 인터랙션 좌표를 획득한 후 Packet으로 저장한다. 저장 된 Packet은 네트워크 통신 시스템을 이용하여 Server로 보내어지고 Server에서는 메타포분석모듈을 이용하여 분석하여 결과를 메타포이벤트로 저장한 후 콘텐츠에 보낸다. 콘텐츠에서는 받은 메타포이벤트에 따라서 콘텐츠 결과를 보여 줌으로써 스크린을 터치 하지 않아도 터치 인터랙션이 가능하며 스크린 영역에 제한 없이 많은 사용자가 동시에 사용이 가능한 시스템 사용이 가능하도록 한다. 본 시스템은 향후 보다 다양한 인터랙션과 시스템 크기의 확장으로 보다 많은 사용자가 동시에 사용가능하며 다양한 인터랙션을 사용할 수 있는 인식 디바이스로써 활용이 가능하다.

트랜스포머를 이용한 GVQA 모델의 성능 개선에 관한 연구 (A Study on Performance Improvement of GVQA Model Using Transformer)

  • 박성욱;김준영;박준;이한성;정세훈;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.749-752
    • /
    • 2021
  • 오늘날 인공지능(Artificial Intelligence, AI) 분야에서 가장 구현하기 어려운 분야 중 하나는 추론이다. 근래 추론 분야에서 영상과 언어가 결합한 다중 모드(Multi-modal) 환경에서 영상 기반의 질의 응답(Visual Question Answering, VQA) 과업에 대한 AI 모델이 발표됐다. 얼마 지나지 않아 VQA 모델의 성능을 개선한 GVQA(Grounded Visual Question Answering) 모델도 발표됐다. 하지만 아직 GVQA 모델도 완벽한 성능을 내진 못한다. 본 논문에서는 GVQA 모델의 성능 개선을 위해 VCC(Visual Concept Classifier) 모델을 ViT-G(Vision Transformer-Giant)/14로 변경하고, ACP(Answer Cluster Predictor) 모델을 GPT(Generative Pretrained Transformer)-3으로 변경한다. 이와 같은 방법들은 성능을 개선하는 데 큰 도움이 될 수 있다고 사료된다.

역광 사진의 빠른 보정을 위한 K-Retinex 알고리즘 (K-Retinex algorithm for fast backlight compensation)

  • 강봉협;고한석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.309-310
    • /
    • 2006
  • This paper presents an enhanced algorithm for compensating the visual quality in backlight image. Current cameras do not represent all details of scene into human's eye. Saturation and underexposure are common problems in backlight image. Retinex algorithm, derived from Land's theory on human visual perception is known to be effective in enhancing the contrast. However, its weaknesses are long processing time and low contrast of bright area in backlight scene because of compensating the details of dark area. In this paper, K-Retinex algorithm is proposed to reduce the processing time and enhance the contrast in both dark and bright area. To show the superiority of proposed algorithm, we compare the processing time and local variance of each area above.

  • PDF

양안식 스테레오 비디오에 대한 변이 기반 비대칭 필터링의 효과에 관한 연구 (A Study on the Effect of Disparity-based Asymmetrical Filtering on the Binocular Stereoscopic Video)

  • 엄기문;강훈종;윤국진;안충현;이수인
    • 방송공학회논문지
    • /
    • 제9권2호
    • /
    • pp.131-141
    • /
    • 2004
  • 기존의 양안식 스테레오 비디오는 장면 내에 매우 큰 변이를 가지는 물체가 존재할 경우에 시각피로를 유발하여 오랜 시간 동안 시청하기가 어렵게 된다. 이러한 시각피로를 개선하기 위한 하나의 방법으로서 본 논문에서는 변이 기반 비대칭 필터링 기법을 제안한다. 제안한 방법은 좌우영상 중 한쪽 눈에 해당하는 영상에만 필터링을 수행하고, 필터링 수준을 스테레오 영상 사이에서 구해진 변이 정보에 의해 조절한다. 제안한 기법의 시각 피로도 및 영상의 선명도에 미치는 영향을 주관적 평가에 의해 조사한 결과, 적절한 조건 하에 제안한 기법을 주시되지 않은 시차가 큰 영역에 적용할 경우 화질은 원영상의 화질을 유지하면서 시각 피로가 개선되는 효과를 얻을 수 있었다.

모바일 작업을 위한 수정된 GOMS-model에 대한 연구 (Modified GOMS-Model for Mobile Computing)

  • 이석재;명노해
    • 산업경영시스템학회지
    • /
    • 제32권2호
    • /
    • pp.85-93
    • /
    • 2009
  • GOMS model is a cognitive modeling method of human performance based on Goal, Operators, Methods, Selection rules. GOMS model was originally designed for desktop environment so that it is difficult for GOMS model to be implemented into the mobile environment. In addition, GOMS model would be inaccurate because the original GOMS model was based on serial processing, excluding one of most important human information processing characteristics, parallel processing. Therefore this study was designed to propose a modified GOMS model including mobile computing and parallel processing. In order to encompass mobile environment, an operator of 'look for' was divided into 'visual move to' and 'recognize' whereas 'point to' and 'click' were combined into 'tab.' The results showed that newly introduced operators were necessary to estimate more accurate mobile computing behaviors. In conclusion, modified-GOMS model could predict human performance more accurately than the original GOMS model in the mobile computing environment.

대량의 트랜잭션을 처리하는 블록체인을 위한 분산처리 시스템 (Distributed processing system for blockchain processing a large number of transactions)

  • 고혁준;한성수;정창성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.65-67
    • /
    • 2019
  • 최근 비트코인(Bitcoin)과 이더리움(Etherium)과 같은 퍼블릭 블록체인(Public Blockchain) 사용자의 급격한 증가로 인하여 블록체인 지갑 사용자가 늘어나고 있다. 또한, 암호화폐 거래소의 거래량이 증가와 이로 인한 지갑의 잔액 조회와 코인 이체를 위한 트랜잭션이 빈번하게 이루어 지고 있다. 한편, 최신의 잔액 조회와 빠른 이체를 위하여 마이닝 풀(Mining Pool)에서 사용되는 노드(Node)를 사용하는 것 같이 트래픽이 일부 노드에 집중되는 현상이 발생하여 시스템의 성능이 저하되는 문제가 있다. 이러한 문제를 해결하기 위하여 본 연구에서는 아파치 카프카(Apache Kafka)를 이용하여 트래픽 분산처리를 통한 효율적인 시스템을 제안한다. 또한, 시스템의 구조 설계 및 상세 모듈 설계를 제안한다. 제안 시스템은 기존 블록체인 시스템과의 연계가 가능하며, 기존 시스템의 변경 없이 구축할 수 있다. 또한, 주키퍼(ZooKeeper)의 분산처리를 통해 고성능과 가용성 및 안정성을 확보할 수 있다.

영상처리 알고리즘 개발을 위한 소프트웨어형상관리시스템 (The software configuration management system for image processing algorithm development)

  • 이정헌;채옥삼
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.1-8
    • /
    • 2005
  • 디지털기기 개발에 있어서 소프트웨어의 중요성이 높아지고, 규모가 커짐에 따라 소프트웨어의 위기를 해결하기 위한 소프트웨어형상관리의 필요성이 증가하고 있다. 그러나 일반적인 소프트웨어형상관리 시스템들은 영상처리 알고리즘 개발 환경의 특성 및 특징들을 수용하기에 부족하다. 영상처리 알고리즘 개발 환경은 컴파일러와 같은 기본적인 개발 도구 외에 컴포넌트(나 라이브러리)들을 인터액티브하게 조합하고 테스트 할 수 있는 시뮬레이션 환경을 통하여 테스트와 분석을 반복하면서 개발하는 특징을 가지고 있다. 뿐만 아니라, 시뮬레이션 과정 중에는 유사한 기능을 가진 알고리즘 중에 적합한 알고리즘을 빠르고 효과적으로 찾기 위한 방법이 필요하다. 본 논문에서는 이러한 영상처리 알고리즘 개발 환경에서 사용하는 시뮬레이션 도구를 체계적으로 지원해줄 수 있는 비주얼 워크스페이스 기반의 소프트웨어형상관리 방법과 이를 수용할 수 있는 소프트웨어형상관리 시스템을 제안한다. 또한, 개발된 시스템을 실제 시뮬레이션 도구와 연계하여 소프트웨어형상관리 시스템으로써의 적합성을 확인한다.

VIOLA : 웹 응용 프로그램 개발을 위한 자료흐름 방식의 시각 프로그래밍 도구 (VIOLA : An Iconic Data-flow Visual Language for Web Applications)

  • 조창식;신규상;마평수
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.1022-1031
    • /
    • 1999
  • 본 논문에서는 VIOLA(VIsual Object-oriented Language for Multimedia Applications)이 시각 언어 프레임워크를 제안하다. VIOLA는 웹 응용 프로그램을 자동으로 생성시켜주는 도구이며, 사용자가 정확한 HTML 태그나 CGI 프로그래밍을 모르더라도 자동으로 고수준의 웹 응용 프로그램을 작성할 수 있게 해준다. VIOLA에서는 사용자 접속 설계 부분과 프로그램의 논리 설계 부분 자료흐름 방식에 의해 통합되어 나타난다. 사용자 접속 설계 부분은 직접 조작과 위지윅을 지원하고, 프로그램 논리 설계 부분은 추상화된 아이콘과 사용자 접속과의 연결을 위한 자료흐름 방식을 사용한다. 프로그램 논리는 도구에서 정의된 클래스를 재사용하여 결합함으로써 자동으로 CGI 프로그램으로 생성되어진다. 이러한 방법은 직관적이고 사용하기 쉬워서 초보자라도 쉽고 빠르게 고수준의 웹 응용 프로그램을 생성할 수 있다. 또한 웹 문서의 생성과 저작에 필요한 일련의 기능들이 통합되어 잇다. 생성된 CGI 프로그램은 java로 구현되기 때문에 HTML 문서와 더불어 플랫폼에 독립적이다.

  • PDF