• 제목/요약/키워드: Vision Based System

검색결과 1,695건 처리시간 0.031초

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

하이브리드 집합체로서의 인간존재: 교차의 가능성과 한계 (Human Existence as a Hybrid Assemblage: the Possibilities and Limits of Intersectionality)

  • 손향구
    • 문화기술의 융합
    • /
    • 제10권4호
    • /
    • pp.509-516
    • /
    • 2024
  • 우리는 신유물론을 배경으로 공각기동대, 뉴럴링크, 유전자 혼종인 카밀, 삼체인 등의 SF 주인공을 참조하여, 자기생성체계와 공-산 체계 사이의 교차적 연결을 비교하는 과정을 통해 인간 존재에 대해 새롭게 성찰하였다. 연구 결과 첫째, 래디컬한 공-산 체계에서는 개체와 경계를 해체하고 혼종적 연결과 융합만으로 존재를 정의하려는 경향이 있다는 점 둘째, 이들이 개체수준의 자율적 사고능력을 외면함으로써, 혼종적 공-산이 야기할 파괴적 성격을 제대로 규명하거나 이에 따른 실질적 대응책을 모색하는 단계로 나가지 못하고 있음을 드러냈다. 셋째, 이질적 연결에 의해 인류의 생존 자체가 위협받게 될 상황이라면 혼종적 공-산의 연결망보다는 자기생성적 체계의 자율적 구성원이라는 정체성에 관심을 기울이고 나아가 자기준거적인 조절을 안정시키기 위한 개체단위의 역할에도 관심을 기울여야 한다는 점을 제안하였다. 우리는 본 연구를 통해, 존재자간 교차를 통해 반복되는 혼종적 연결을 기술(description)하는데에만 치우친다면 제대로 된 실천적 비전을 제시하는데 실패할 가능성이 크다는 점과, 존재자간 파괴적 상호작용에 대한 상상을 촉발하는 다양한 SF를 활용하여 인류종의 정체성을 새로운 관점에서 정의하고, 나아가 일정한 수준의 경계긋기와 이에 기초한 공생적 상호작용이라는 관점에서 자기생성 기제를 탐색하고 자기준거를 마련하기 위한 노력을 병행할 것으로 촉구함으로써 신유물론의 한계를 극복하는데 기여하고자 하였다.

Reproducibility of Regional Pulse Wave Velocity in Healthy Subjects

  • Im Jae-Joong;Lee, Nak-Bum;Rhee Moo-Yong;Na Sang-Hun;Kim, Young-Kwon;Lee, Myoung-Mook;Cockcroft John R.
    • International Journal of Vascular Biomedical Engineering
    • /
    • 제4권2호
    • /
    • pp.19-24
    • /
    • 2006
  • Background: Pulse wave velocity (PWV), which is inversely related to the distensibility of an arterial wall, offers a simple and potentially useful approach for an evaluation of cardiovascular diseases. In spite of the clinical importance and widespread use of PWV, there exist no standard either for pulse sensors or for system requirements for accurate pulse wave measurement. Objective of this study was to assess the reproducibility of PWV values using a newly developed PWV measurement system in healthy subjects prior to a large-scale clinical study. Methods: System used for the study was the PP-1000 (Hanbyul Meditech Co., Korea), which provides regional PWV values based on the measurements of electrocardiography (ECG), phonocardiography (PCG), and pulse waves from four different sites of arteries (carotid, femoral, radial, and dorsalis pedis) simultaneously. Seventeen healthy male subjects with a mean age of 33 years (ranges 22 to 52 years) without any cardiovascular disease were participated for the experiment. Two observers (observer A and B) performed two consecutive measurements from the same subject in a random order. For an evaluation of system reproducibility, two analyses (within-observer and between-observer) were performed, and expressed in terms of mean difference ${\pm}2SD$, as described by Bland and Altman plots. Results: Mean and SD of PWVs for aorta, arm, and leg were $7.07{\pm}1.48m/sec,\;8.43{\pm}1.14m/sec,\;and\;8.09{\pm}0.98m/sec$ measured from observer A and $6.76{\pm}1.00m/sec,\;7.97{\pm}0.80m/sec,\;and\;\7.97{\pm}0.72m/sec$ from observer B, respectively. Between-observer differences ($mean{\pm}2SD$) for aorta, arm, and leg were $0.14{\pm\}0.62m/sec,\;0.18{\pm\}0.84m/sec,\;and\;0.07{\pm}0.86m/sec$, and the correlation coefficients were high especially 0.93 for aortic PWV. Within-observer differences ($mean{\pm}2SD$) for aorta, arm, and leg were $0.01{\pm}0.26m/sec,\;0.02{\pm}0.26m/sec,\;and\;0.08{\pm}0.32m/sec$ from observer A and $0.01{\pm}0.24m/sec,\;0.04{\pm}0.28m/sec,\;and\;0.01{\pm}0.20m/sec$ from observer B, respectively. All the measurements showed significantly high correlation coefficients ranges from 0.94 to 0.99. Conclusion: PWV measurement system used for the study offers comfortable and simple operation and provides accurate analysis results with high reproducibility. Since the reproducibility of the measurement is critical for the diagnosis in clinical use, it is necessary to provide an accurate algorithm for the detection of additional features such as flow wave, reflection wave, and dicrotic notch from a pulse waveform. This study will be extended for the comparison of PWV values from patients with various vascular risks for clinical application. Data acquired from the study could be used for the determination of the appropriate sample size for further studies relating various types of arteriosclerosis-related vascular disease.

  • PDF

디지털미디어 환경(環境)에서 디자인 특성(特性)에 관한 연구(硏究) - 실내제품(室內製品) 디자인을 중심으로 - (A Destructive Method in the Connection of the Algorithm and Design in the Digital media - Centered on the Rapid Prototyping Systems of Product Design -)

  • 김석화
    • 조형예술학연구
    • /
    • 제5권
    • /
    • pp.87-129
    • /
    • 2003
  • The purpose of this thesis is to propose a new concept of design of the 21st century, on the basis of the study on the general signification of the structures and the signs of industrial product design, by examining the difference between modern and post-modern design, which is expected to lead the users to different design practice and interpretation of it. The starting point of this study is the different styles and patterns of 'Gestalt' in the post-modern design of the late 20th century from modern design - the factor of determination in industrial product design. That is to say, unlike functional and rational styles of modern product design, the late 20th century is based upon the pluralism characterized by complexity, synthetic and decorativeness. So far, most of the previous studies on design seem to have excluded visual aspects and usability, focused only on effective communication of design phenomena. These partial studies on design, blinded by phenomenal aspects, have resulted in failure to discover a principle of fundamental system. However, design varies according to the times; and the transformation of design is reflected in Design Pragnanz to constitute a new text of design. Therefore, it can be argued that Design Pragnanz serves as an essential factor under influence of the significance of text. In this thesis, therefore, I delve into analysis of the 20th century product design, in the light of Gestalt theory and Design Pragnanz, which have been functioning as the principle of the past design. For this study, I attempted to discover the fundamental elements in modern and post-modern designs, and to examine the formal structure of product design, the users' aesthetic preference and its semantics, from the integrative viewpoint. Also, with reference to history and theory of design my emphasis is more on fundamental visual phenomena than on structural analysis or process of visualization in product design, in order to examine the formal properties of modern and post-modern designs. Firstly, In Chapter 1, 'Issues and Background of the Study', I investigated the Gestalt theory and Design Pragnanz, on the premise of formal distinction between modern and post-modern designs. These theories are founded upon the discussion on visual perception of Gestalt in Germany in 1910's, in pursuit of the principle of perception centered around visual perception of human beings. In Chapter 2, I dealt with functionalism of modern design, as an advance preparation for the further study on the product design of the late 20th century. First of all, in Chapter 2-1, I examined the tendency of modern design focused on functionalism, which can be exemplified by the famous statement 'Form follows function'. Excluding all unessential elements in design - for example, decoration, this tendency has attained the position of the international style based on the spirit of Bauhause - universality and regularity - in search of geometric order, standardization and rationalization. In Chapter 2-2, I investigated the anthropological viewpoint that modern design started representing culture in a symbolic way including overall aspects of the society - politics, economics and ethics, and its criticism on functionalist design that aesthetic value is missing in exchange of excessive simplicity in style. Moreover, I examined the pluralist phenomena in post-modern design such as kitsch, eclecticism, reactionism, hi-tech and digital design, breaking away from functionalist purism of modern design. In Chapter 3, I analyzed Gestalt Pragnanz in design in a practical way, against the background of design trends. To begin with, I selected mass product design among those for the 20th century products as a target of analysis, highlighting representative styles in each category of the products. For this analysis, I adopted the theory of J. M Lehnhardt, who gradated in percentage the aesthetic and semantic levels of Pragnantz in design expression, and that of J. K. Grutter, who expressed it in a formula of M = O : C. I also employed eight units of dichotomies, according to the G. D. Birkhoff's aesthetic criteria, for the purpose of scientific classification of the degree of order and complexity in design; and I analyzed phenomenal aspects of design form represented in each unit. For Chapter 4, I executed a questionnaire about semiological phenomena of Design Pragnanz with 28 units of antonymous adjectives, based upon the research in the previous chapter. Then, I analyzed the process of signification of Design Pragnanz, founded on this research. Furthermore, the interpretation of the analysis served as an explanation to preference, through systematic analysis of Gestalt and Design Pragnanz in product design of the late 20th century. In Chapter 5, I determined the position of Design Pragnanz by integrating the analyses of Gestalt and Pragnanz in modern and post-modern designs In this process, 1 revealed the difference of each Design Pragnanz in formal respect, in order to suggest a vision of the future as a result, which will provide systemic and structural stimulation to current design.

  • PDF

고객 맞춤형 서비스를 위한 관객 행동 기반 감정예측모형 (The Audience Behavior-based Emotion Prediction Model for Personalized Service)

  • 유은정;안현철;김재경
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.73-85
    • /
    • 2013
  • 정보기술의 비약적 발전에 힘입어, 오늘날 기업들은 지금까지 축적한 고객 데이터를 기반으로 맞춤형 서비스를 제공하는 것에 많은 관심을 가지고 있다. 고객에게 소구하는 맞춤형 서비스를 효과적으로 제공하기 위해서는 우선 그 고객이 처한 상태나 상황을 정확하게 인지하는 것이 중요하다. 특히, 고객에게 서비스가 전달되는 이른바 진실의 순간에 해당 고객의 감정 상태를 정확히 인지할 수 있다면, 기업은 더 양질의 맞춤형 서비스를 제공할 수 있을 것이다. 이와 관련하여 사람의 얼굴과 행동을 이용하여 사람의 감정을 판단하고 개인화 서비스를 제공하기 위한 연구가 활발하게 이루어지고 있다. 얼굴 표정을 통해 사람의 감정을 판단하는 연구는 좀 더 미세하고 확실한 변화를 통해 정확하게 감정을 판단할 수 있지만, 장비와 환경의 제약으로 실제 환경에서 다수의 관객을 대상으로 사용하기에는 다소 어려움이 있다. 이에 본 연구에서는 Plutchik의 감정 분류 체계를 기반으로 사람들의 행동을 통해 감정을 추론해내는 모형을 개발하는 것을 목표로 한다. 본 연구는 콘텐츠에 의해 유발된 사람들의 감정적인 변화를 사람들의 행동 변화를 통해 판단하고 예측하는 모형을 개발하고, 4가지 감정 별 행동 특징을 추출하여 각 감정에 따라 최적화된 예측 모형을 구축하는 것을 목표로 한다. 모형 구축을 위해 사람들에게 적절한 감정 자극영상을 제공하고 그 신체 반응을 수집하였으며, 사람들의 신체 영역을 나누었다. 특히, 모션캡쳐 분야에서 널리 쓰이는 차영상 기법을 적용하여 사람들의 제스쳐를 추출 및 보정하였다. 이후 전처리 과정을 통해 데이터의 타임프레임 셋을 20, 30, 40 프레임의 3가지로 설정하고, 데이터를 학습용, 테스트용, 검증용으로 구분하여 인공신경망 모형을 통해 학습시키고 성과를 평가하였다. 다수의 일반인들을 대상으로 수집된 데이터를 이용하여 제안 모형을 구축하고 평가한 결과, 프레임셋에 따라 예측 성과가 변화함을 알 수 있었다. 감정 별 최적 예측 성과를 보이는 프레임을 확인할 수 있었는데, 이는 감정에 따라 감정의 표출 시간이 다르기 때문인 것으로 판단된다. 이는 행동에 기반한 제안된 감정예측모형이 감정에 따라 효과적으로 감정을 예측할 수 있으며, 실제 서비스 환경에서 사용할 수 있는 효과적인 알고리즘이 될 수 있을 것으로 기대할 수 있다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

패러다임 전환에 의한 기업 측면의 IoT 경영 프로세스 구축방안 연구 (A Study on the establishment of IoT management process in terms of business according to Paradigm Shift)

  • 정민의;유성진
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.151-171
    • /
    • 2015
  • 본 연구는 최근 가장 큰 이슈로 떠오르는 "사물인터넷(IoT: Internet of Things)"의 개념과 국내 외 IoT 시장에 대한 현황을 고찰하였으며, IoT 시대의 도래로 인해 유발되는 패러다임 전환 발생에 따른 기업측면의 적절한 대응방안에 대한 해결책을 도출하였다. 따라서 본 연구는 티핑포인트(Tipping point)에 있는 IoT 경쟁 시대에 적절하게 대응하기 위한 기업의 경영전략을 '패러다임 전환(paradigm shift)'이라는 시각을 통해 대응 방안을 제시하였다. 특히, 과거의 경영 패러다임과 IoT 시대의 경영 패러다임을 비교 분석하여 i)지식 및 학습 주도 경영, ii)기술 및 혁신 중심 경영, iii)수요 창출 경영, iv)글로벌 협업 경영으로 새롭게 패러다임 전환(Paradigm Shift)이 발생할 것으로 예측 및 제안하였고, 이러한 패러다임의 전환에 대응하기 위한 기업측면의 경영전략 프로세스 모델을 구축하기 위해 Gartner가 제시한 'RTE Cyclone model'을 활용하였다. '실시간 기업(RTE)' 이라는 개념은 급변하는 IoT 시대에 기업측면의 경영 전략 프로세스로 활용가치가 있다고 판단되며, 본 연구에서 적절히 응용하여 'IoT-RTE Cyclone model'을 제안하였다. 특히, 제안한 모델은 기업의 민첩성을 강조하고 IT 및 IoT 기술을 통한 실시간 모니터링, 분석, 실행을 기본으로 하며, 기업의 경영 프로세스 각 부문을 통합시켜 기업의 전반적인 서비스를 지원하기 때문에 빠르게 변화하는 IoT 시대에서 영위하는 기업측면에서의 효과적인 대응전략으로 활용할 수 있다.

지역 중심의 만화 창· 제작센터 구축에 대한 연구 (A Study on Construction of Region-Based Cartoon Creation & Production Center)

  • 이진희;김병수
    • 만화애니메이션 연구
    • /
    • 통권45호
    • /
    • pp.147-175
    • /
    • 2016
  • 본 논문은 2013년 이후 급변하는 한국의 만화산업에서 수도권에 집중된 창, 제작 환경의 지역 균형 발전을 위한 방안을 연구하기 위한 것이다. 만화는 여타 문화 콘텐츠 산업에 비해 제작비가 낮을 뿐만 아니라 제작기반이 최소한의 요건만 갖추어지면 가능하므로 지역 분권이 상대적으로 매우 용이한 분야이다. 현재 대부분의 만화 관련 기업, 진흥 기관 등은 서울과 부천 등에 분포하고 있다. 그러나 작가의 경우 전국적으로 분산되어 있으며 해외에서 작품 활동을 전개하는 작가도 유의미한 수치에 이른다. 대전, 부산, 순천, 경북 등에서는 만화 창 제작 센터를 구축하기 위해 2015년부터 본격적인 움직임을 보이고 있다. 본 논문에서는 지역별 만화 창 제작센터 구축 움직임을 해외 사례와 함께 살펴보고 각 지역별 특색과 균형, 조화를 어떻게 이룰 것인가를 점검해보고자 한다. 먼저 정부의 만화산업 육성 정책의 현황을 분석했다. 만화산업중장기발전계획을 축으로 한 정부의 만화진흥정책은 그간 한국콘텐츠진흥원과 부천의 한국만화영상진흥원을 축으로 전개되어 왔으나 웹툰 산업이 급성장하면서 각 지역에서도 진흥 기관의 필요성이 2015년 이후 제기되어 왔다. 2019년부터 시행하게 될 4차 만화산업 중장기발전계획 수립을 앞두고 본격적인 지역균형발전의 지원 틀이 갖춰져야 할 것으로 보인다. 해외의 경우는 미국 샌디에고(코미콘), 프랑스의 앙굴렘(국립이미지센터), 일본의 교토(만화박물관), 사카이미나토(미즈키시게루로드) 등 일찍부터 지역을 중심으로 만화진흥 기관, 행사 등이 발달해 왔던 점은 시사하는 바가 크다. 결론에서는 지역마다 만화창 제작센터가 구축된다고 하더라도 지역의 성격과 특징에 맞게 설립되는 것의 중요성과 필요성을 구체적인 방안을 들어 제안하고자 했다. 이를 바탕으로 문화콘텐츠 산업에서 거의 유일하게 지역 창 제작 시스템이 정착될 수 있는 만화, 웹툰 산업의 비전을 제시하고자 한다.

대구·경북지역 섬유산업의 정책변화와 혁신과제 (Policy Change and Innovation of Textile Industry in Daegu·Kyungbuk Region)

  • 신진교;김요한
    • 경영과정보연구
    • /
    • 제31권3호
    • /
    • pp.223-248
    • /
    • 2012
  • 본 연구는 대구경북지역 섬유산업의 경쟁력 회복을 위해 1999년부터 소위 '밀라노프로젝트'로 시작된 대구지역 섬유산업진흥사업을 중심으로 지난 10년간의 대구지역 섬유산업의 정책변화와 지역 섬유산업의 구조변화에 대한 현황분석을 토대로 향후 대구경북지역 섬유산업의 혁신과제를 제안하고자 하였다. 분석결과를 요약하면 다음과 같다. 1단계 밀라노프로젝트('99-'03)는 기획 수립단계에서부터 섬유산업의 중장기 발전시나리오에 기초한 비전과 전략의 부재로 체계적인 사업기획 및 단위사업 선정이 미흡함으로써 패션어패럴밸리 조성 등 사업의 추진일정이 지연된 문제점이 노출되었지만, 신제품개발지원센터, 염색디자인실용화센터 등 차별화 제품의 개발을 지원할 수 있는 기반을 구축하게 되었다는 점에서 성과의 의의가 있다. 2단계 대구섬유산업진흥사업('04-'08)은 경상북도의 도비 매칭을 통하여 대구경북지역의 광역사업으로 추진되었으며, 기 구축된 인프라를 중심으로 지원된 기술개발지원 사업은 특허출원 등 기술적 성과와 신상품 매출액 비중 증가 등의 경제적 성과가 가시화되고 있는 것으로 나타났다. 아울러 섬유업계는 1990년대 후반부터 한계업체 퇴출, 설비매각 이전 등 고강도의 구조조정이 진행되어 왔으나, 현재 영업중인 섬유업체는 재무구조, 생산성, 수익성 측면에서는 기업의 경영성과가 호전되었다. 산업 구조적인 측면에서는 의류용섬유소재분야에서 산업용섬유소재분야로 구조전환이 이루어지고 있는 것으로 나타났다. 기업의 혁신역량 분석에서는 타 산업과 비교할 때 큰 차이는 없으나, 최고경영자의 기술혁신의지, 기업가 정신, 연구개발 역량과 인적자원분야에서 혁신역량이 다소 떨어지는 것으로 나타났다. 향후 섬유산업의 지속발전을 위한 경쟁력 제고를 위해서는 하이테크 섬유소재와 생활용 섬유분야에 대한 선택과 집중이 필요하며, 향후 물리적 집적기반보다는 신뢰와 협력에 기반한 네트워크를 통해 '혁신 시너지'를 창출할 수 있도록 소프트웨어적 인프라 구축에 보다 집중하여야 할 것이다. 특히 지역 섬유산업이 지역 전략산업으로 선정되어 10년 이상 지속적인 지원을 받아 온 만큼, 이제 전통 주력산업에서 미래 성장산업으로 변모하기 위해서는 기업의 기술혁신의지와 기업가정신에 기초한 기업주도의 '혁신 클러스터'를 반드시 창출해야 할 것이다.

  • PDF

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.