• 제목/요약/키워드: Vision-language analysis

검색결과 39건 처리시간 0.035초

외국인 근로자의 조직몰입에 영향을 미치는 요인 연구 (Factors Affecting Organizational Commitment of Foreign Workers)

  • 이유나;하규수
    • 벤처혁신연구
    • /
    • 제6권1호
    • /
    • pp.161-179
    • /
    • 2023
  • 한국에 체류하는 외국인이 200만명이 넘어서고 있다. 본 연구에서는 외국인 근로자들을 대상으로 개인 특성 및 환경 특성이 조직몰입에 미치는 영향을 실증 분석하였다. 실증 분석을 위한 연구 모형을 설정하였다. 개인욕구, 적응능력, 조직생활, 사회적 지지로 크게 4개의 부분으로 나누어 독립변수를 설정하고 종속변수로 조직몰입도를 설정하여 연구 모형을 도출하였다. 이러한 연구 모형을 바탕으로 분석을 위한 데이터 수집은 한국에서 근무 중인 외국인을 대상으로 설문조사 방식으로 하였다. 응답자 중 유효한 200부를 바탕으로 SPSS 24를 활용하여 실증 분석을 하였다. 실증분석 결과는 다음과 같다. 첫째, 외국인 근로자의 성취욕구, 언어적응능력, 상사 및 동료 관계, 직업의 미래비전, 사회적 지지는 조직몰입에 유의한 정(+)의 영향이 있는 것으로 나타났다. 반면, 문화적응능력은 유의한 영향관계가 검정되지 않았다. 둘째, 조직몰입도에 유의한 영향을 미치는 요인의 크기는 사회적 지지, 상사 및 동료 관계, 직업의 미래비전, 언어적응능력, 성취욕구 순으로 나타났다. 이러한 연구 결과를 바탕으로 학술적인 시사점을 제시하였고 아울러 외국인 근로자의 조직몰입도를 높이기 위한 실무적인 시사점을 제시하였다.

Deep-Learning Approach for Text Detection Using Fully Convolutional Networks

  • Tung, Trieu Son;Lee, Gueesang
    • International Journal of Contents
    • /
    • 제14권1호
    • /
    • pp.1-6
    • /
    • 2018
  • Text, as one of the most influential inventions of humanity, has played an important role in human life since ancient times. The rich and precise information embodied in text is very useful in a wide range of vision-based applications such as the text data extracted from images that can provide information for automatic annotation, indexing, language translation, and the assistance systems for impaired persons. Therefore, natural-scene text detection with active research topics regarding computer vision and document analysis is very important. Previous methods have poor performances due to numerous false-positive and true-negative regions. In this paper, a fully-convolutional-network (FCN)-based method that uses supervised architecture is used to localize textual regions. The model was trained directly using images wherein pixel values were used as inputs and binary ground truth was used as label. The method was evaluated using ICDAR-2013 dataset and proved to be comparable to other feature-based methods. It could expedite research on text detection using deep-learning based approach in the future.

Swerve, Trope, Peripety: Turning Points in Criticism and Theory

  • Tally, Robert T. Jr.
    • 영어영문학
    • /
    • 제64권1호
    • /
    • pp.25-37
    • /
    • 2018
  • The turning point is one of the more evocative concepts in the critic's arsenal, as it is equally suited to the evaluation and analysis of a given moment in one's day as to those of a historical event. But how does one recognize a turning point? As we find ourselves always "in the middest," both spatially and temporally, we inhabit sites that may be points at which many things may be seen to turn. Indeed, it is usually only possible to identify a turning point, as it were, from a distance, from the remove of space and time which allows for a sense of recognition, based in part on original context and in part of perceived effects. In this article, Robert T. Tally Jr. argues that the apprehension and interpretation of a turning point involves a fundamentally critical activity. Examining three models by which to understand the concept of the turning point-the swerve, the trope, and peripety (or the dialectical reversal)-Tally demonstrates how each represents a different way of seeing the turning point and its effects. Thus, the swerve is associated with a point of departure for a critical project; the trope is connected to continuous and sustained critical activity in the moment, and peripety enables a retrospective vision that, in turn, inform future research. Tally argues for the significance of the turning point in literary and cultural theory, and concludes that the identification, analysis, and interpretation of turning points is crucial to the project of criticism today.

우리나라 시·군·구 지역보건의료계획의 비전(Vision) 문구 분석 (Analysis of Vision Statements in 6th Community Health Plan of Local Government in Korea)

  • 안치영;김현수;김원빈;오창훈;홍지영;김은영;이무식
    • 농촌의학ㆍ지역보건
    • /
    • 제42권1호
    • /
    • pp.1-12
    • /
    • 2017
  • 지역보건의료계획서에서 비전은 각 지역의 보건의료계획을 나타내는 핵심요소임에도 불구하고 작성방법에 대한 구체적인 지침이 부재하여 각 지역의 비전은 매우 다양하게 표현되어 있다. 이에 이 연구에서는 제6기 지역보건의료계획에서 제시한 비전 문구를 보건소 유형별, 권역별로 분석하였다. 전국 229개 지역의 제6기 지역보건의료계획서의 비전 문구와 이와 관련된 미션, 전략체계도, 중장기 추진과제 등을 대상으로 하였다. 지역을 권역별 4개, 읍 면 동 구성에 따른 보건소 유형을 4개로 분류하였고, 각 지역 비전의 글자 수, 문장 평가, 단어 빈도, 문구 평가를 빈도분석과 카이제곱검정, 일원배치분산분석을 이용하여 분석하였다. 비전의 글자 수가 17자 이하인 보건소가 172개소(75.1%)였고, 보건소 유형별로 유의한 차이가 있었다(p<0.05). 문구에 대한 수사표현에서 비유법(37.1%)이, 한글 외에 표현 언어 사용에서는 특수문자(43.2%)가 많았으며, 보건소 유형별로 유의한 차이가 있었다(p<0.01). 비전에 사용된 단어들은 '건강', '행복', '함께', '군민' 또는 '시민', '도시', '100세' 등이었다. 문구 평가 점수에서는 특 광역시 및 수도권에서 가장 높았으며, 보건소 유형 및 권역별로 유의한 차이를 보였다(p<0.05). 보건소 유형별로 과정 및 평가 영역, 공유가능성 등에서 유의한 차이가 있었다(p<0.01). 방향성은 충청권, 수도권 순으로 권역별로 유의한 차이가 있었으며(p<0.01), 미래지향성 및 공유가능성은 영남권이 가장 높아 권역별로 유의한 차이가 있었다(p<0.01). 비전은 지역보건의료계획에 가장 중요 요소 중 하나이다. 이 연구는 지역사회 특성별로 비전의 설정이 다름을 확인하였으며, 이러한 결과를 통하여 지역보건의료계획 등 보건소 비전 수립시 참고가 될 수 있는 기초적인 자료가 될 것으로 판단된다.

딥러닝 기반 비디오 캡셔닝의 연구동향 분석 (Analysis of Research Trends in Deep Learning-Based Video Captioning)

  • 려치;이은주;김영수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.35-49
    • /
    • 2024
  • 컴퓨터 비전과 자연어 처리의 융합의 중요한 결과로서 비디오 캡셔닝은 인공지능 분야의 핵심 연구 방향이다. 이 기술은 비디오 콘텐츠의 자동이해와 언어 표현을 가능하게 함으로써, 컴퓨터가 비디오의 시각적 정보를 텍스트 형태로 변환한다. 본 논문에서는 딥러닝 기반 비디오 캡셔닝의 연구 동향을 초기 분석하여 CNN-RNN 기반 모델, RNN-RNN 기반 모델, Multimodal 기반 모델, 그리고 Transformer 기반 모델이라는 네 가지 주요 범주로 나누어 각각의 비디오 캡셔닝 모델의 개념과 특징 그리고 장단점을 논하였다. 그리고 이 논문은 비디오 캡셔닝 분야에서 일반적으로 자주 사용되는 데이터 집합과 성능 평가방안을 나열하였다. 데이터 세트는 다양한 도메인과 시나리오를 포괄하여 비디오 캡션 모델의 훈련 및 검증을 위한 광범위한 리소스를 제공한다. 모델 성능 평가방안에서는 주요한 평가 지표를 언급하며, 모델의 성능을 다양한 각도에서 평가할 수 있도록 연구자들에게 실질적인 참조를 제공한다. 마지막으로 비디오 캡셔닝에 대한 향후 연구과제로서 실제 응용 프로그램에서의 복잡성을 증가시키는 시간 일관성 유지 및 동적 장면의 정확한 서술과 같이 지속해서 개선해야 할 주요 도전과제와 시간 관계 모델링 및 다중 모달 데이터 통합과 같이 새롭게 연구되어야 하는 과제를 제시하였다.

이민자의 법무부 사회통합프로그램 참여경험에 관한 연구 (A Study on Participation Experience of Immigrants in Korea Immigration & Integration Program of the Ministry of Justice)

  • 최배영;한은주
    • 가정과삶의질연구
    • /
    • 제30권3호
    • /
    • pp.83-103
    • /
    • 2012
  • This thesis is based on an in-depth interview on participation experience of ten immigrants who reside in S Multi-cultural Family Support Center that is located in Gyeonggi-do in Korea Immigration & Integration Program(KIIP). The purpose of this research is to present through it's basic data for improvement in the operation of KIIP in the future by grasping participation process in KIIP that the immigrants have experienced, problems involved in their operation, and related requirements. Major results of the research are as follows: First, the motive for the immigrants' participation in KIIP was to acquire Korean nationality, learn Korean, and prepare for their future in Korea. Second, as a difficulty in participation in KIIP, access to educational institutions loomed large. Third, regarding improvements in the operation of KIIP, marriage immigrants needed to continue Korean language education, whereas other immigrants revealed a demand for opening evening classes or weekend classes. In the final analysis, it seems that for KIIP to provide an opportunity for the immigrants to have a vision for their life in the future, as well as for its realization in Korean society, policy-oriented institutional support that pays attention to their life situation and demands is badly needed.

컴퓨터 시각(視覺)에 의거한 측정기술(測定技術) 및 측정오차(測定誤差)의 분석(分析)과 보정(補正) (Computer Vision Based Measurement, Error Analysis and Calibration)

  • 황헌;이충호
    • Journal of Biosystems Engineering
    • /
    • 제17권1호
    • /
    • pp.65-78
    • /
    • 1992
  • When using a computer vision system for a measurement, the geometrically distorted input image usually restricts the site and size of the measuring window. A geometrically distorted image caused by the image sensing and processing hardware degrades the accuracy of the visual measurement and prohibits the arbitrary selection of the measuring scope. Therefore, an image calibration is inevitable to improve the measuring accuracy. A calibration process is usually done via four steps such as measurement, modeling, parameter estimation, and compensation. In this paper, the efficient error calibration technique of a geometrically distorted input image was developed using a neural network. After calibrating a unit pixel, the distorted image was compensated by training CMLAN(Cerebellar Model Linear Associator Network) without modeling the behavior of any system element. The input/output training pairs for the network was obtained by processing the image of the devised sampled pattern. The generalization property of the network successfully compensates the distortion errors of the untrained arbitrary pixel points on the image space. The error convergence of the trained network with respect to the network control parameters were also presented. The compensated image through the network was then post processed using a simple DDA(Digital Differential Analyzer) to avoid the pixel disconnectivity. The compensation effect was verified using known sized geometric primitives. A way to extract directly a real scaled geometric quantity of the object from the 8-directional chain coding was also devised and coded. Since the developed calibration algorithm does not require any knowledge of modeling system elements and estimating parameters, it can be applied simply to any image processing system. Furthermore, it efficiently enhances the measurement accuracy and allows the arbitrary sizing and locating of the measuring window. The applied and developed algorithms were coded as a menu driven way using MS-C language Ver. 6.0, PC VISION PLUS library functions, and VGA graphic functions.

  • PDF

능동 시각을 이용한 이미지-텍스트 다중 모달 체계 학습 (Active Vision from Image-Text Multimodal System Learning)

  • 김진화;장병탁
    • 정보과학회 논문지
    • /
    • 제43권7호
    • /
    • pp.795-800
    • /
    • 2016
  • 이미지 분류 문제는 인간 수준의 성능을 보이지만 일반적인 인식 문제는 어려운 점들이 남아있다. 실내 환경은 다양한 정보를 담고 있어 정보 처리의 양을 효율적으로 줄일 필요성이 있다. 정보의 양을 효율적으로 줄일 수 있도록 대상 객체의 위치 측정을 위한 변분 추론, 변분 베이지안 등의 방법이 소개되었지만, 모든 경우에 대한 주변(marginal) 확률 분포를 구하기 어렵기 때문에 현실적으로 계산하기 어렵다. 본 연구에서는 공간 변형 네트워크(Spatial Transformer Networks)을 응용하여 능동 시각을 이용한 이미지-텍스트 통합 인지 체계를 제안한다. 이 체계는 주어진 텍스트 정보를 바탕으로 이미지의 일부를 효율적으로 샘플링 하도록 학습한다. 이를 통해 전통적인 방법으로 해결하기 어려운 문제를 상당한 격차로 성능을 향상 시킬 수 있다는 것을 보인다. 제안하는 모델을 통해 샘플링 된 이미지를 정성적으로 분석하여 이 모델이 가지는 특성도 함께 살펴본다.

Meme Analysis using Image Captioning Model and GPT-4

  • Marvin John Ignacio;Thanh Tin Nguyen;Jia Wang;Yong-Guk Kim
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.628-631
    • /
    • 2023
  • We present a new approach to evaluate the generated texts by Large Language Models (LLMs) for meme classification. Analyzing an image with embedded texts, i.e. meme, is challenging, even for existing state-of-the-art computer vision models. By leveraging large image-to-text models, we can extract image descriptions that can be used in other tasks, such as classification. In our methodology, we first generate image captions using BLIP-2 models. Using these captions, we use GPT-4 to evaluate the relationship between the caption and the meme text. The results show that OPT6.7B provides a better rating than other LLMs, suggesting that the proposed method has a potential for meme classification.

유아 상상력을 위한 연상 인터렉티브 놀이 콘텐츠 (Associative Interactive play Contents for Infant Imagination)

  • 장은정;임찬
    • 문화기술의 융합
    • /
    • 제5권1호
    • /
    • pp.371-376
    • /
    • 2019
  • 창조적 사고는 언어로 표현되기 전부터 나타나며, 논리학이나 언어학법칙이 작동하기 전에 감정과 직관, 이미지와 몸의 느낌을 통해 그 존재를 드러낸다. 본 연구에서는 레고 놀이를 이미지 표현 방식으로, 이미지 프로세싱 기법을 중심으로 컴퓨터 비전을 응용한 실험적인 유아 참여형 인터렉티브 콘텐츠를 제시하고자 한다. 특히 유아의 경우 손의 소 근육 발달과 상상력을 실재로 구현하는 것은 매우 중요한 창조의 과정이다. 사물인식으로 대표되는 이미지 프로세싱 기술의 지각변동 속에서 'OpenCV 라이브러리'의 분석 알고리즘과 그것을 'Node'로써 구현한 'VVVV'로 이미지 프로세싱을 진행하고, 웹캠을 이용하여 물체를 촬영하고, 인식하고, 해당 분석에 맞는 결과를 도출해 내어 사용자가 참여함으로 완성되는 인터렉티브 콘텐츠를 제작하는 것을 목표로 한다. 연구를 통해서 아이들이 만든 레고가 어떤 작품인지 알 수 있고, 아이들은 스스로 무언가를 만들며 창의성을 기를 수 있다. 나아가, 더 많은 데이터를 기반으로 다양하고 개성적인 사람의 사고를 유추할 수 있을 것이라 기대한다.