• 제목/요약/키워드: AI character

검색결과 75건 처리시간 0.026초

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.

Study on OCR Enhancement of Homomorphic Filtering with Adaptive Gamma Value

  • Heeyeon Jo;Jeongwoo Lee;Hongrae Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.101-108
    • /
    • 2024
  • AI-OCR은 광학 문자 인식(OCR) 기술과 Artificial intelligence(AI)의 결합으로 사람의 인식이 필요하던 OCR의 단점을 보완하는 기술 향상을 이뤄내고 있다. AI-OCR의 성능을 높이기 위해서는 다양한 학습데이터의 훈련이 필요하다. 하지만 이미지 색상이 비슷한 밝기를 가진 경우에는 인식률이 떨어지기 때문에, Homomorphic filtering(HF)을 이용한 전처리 과정으로 색상 차이를 분명하게 하여 텍스트 인식률을 높이게 된다. HF은 감마값을 이용해 이미지의 고주파와 저주파를 각각 조절한다는 점에서 텍스트 추출에 적합하지만 감마값의 조절이 수동적으로 이뤄지는 단점이 존재한다. 본 연구는 시험적 과정을 거쳐 이미지의 대비, 밝기 및 엔트로피를 근거하는 감마의 임계값 범위를 제안한다. 제안된 감마값 범위를 적용한 HF의 실험 결과는 효율적인 AI-OCR의 높은 등장 가능성을 시사한다.

YOLOv5에서 자동차 번호판 및 문자 정렬 알고리즘에 관한 연구 (A Study on Vehicle License Plates and Character Sorting Algorithms in YOLOv5)

  • 장문석;하상현;정석찬
    • 한국산업융합학회 논문집
    • /
    • 제24권5호
    • /
    • pp.555-562
    • /
    • 2021
  • In this paper, we propose a sorting method for extracting accurate license plate information, which is currently used in Korea, after detecting objects using YOLO. We propose sorting methods for the five types of vehicle license plates managed by the Ministry of Land, Infrastructure and Transport by classifying the plates with the number of lines, Korean characters, and numbers. The results of experiments with 5 license plates show that the proposed algorithm identifies all license plate types and information by focusing on the object with high reliability score in the result label file presented by YOLO and deleting unnecessary object information. The proposed method will be applicable to all systems that recognize license plates.

AI설계를 위한 FSM 도구의 설계 (Design the FSM Editor for AI)

  • 김성룡;윤성희;김명세;오삼권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.481-484
    • /
    • 2004
  • 가상현실에 생성되는 NPC(Non-Player Character)의 인공지능을 설계하는 AI 디자이너가NPC 행동 패턴을 효율적으로 모델링을 할 수 있게 도와주는 FSM(Finite-State Machines) 도구를 제시한다. 이 도구는 FSM 각 상태와 상태의 변이에 따른 여러 가지 행동 패턴을 쉽게 모델링 할 수 있으며, AI를 디자인하는 디자이너가 가상현실 속에 존재하는 NPC의 AI를 설계 하고 프로그래머가 AI를 구현하는데 필요한 시간을 줄여준다. 또한 행동 패턴의 FSM 구조가 일반화되어 재사용성이 높아질 뿐만 아니라 AI를 하드코딩으로 구현 하는 것을 방지 할 수 있다.

  • PDF

챗 가능한 게임에서 AI 캐릭터와의 대화를 위한 LLM 활용 (Utilizing LLM for Conversations with AI Character in Chat-enabled Games)

  • 최명재;신지호;이세영;정동주;이병정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.673-674
    • /
    • 2024
  • 본 연구에서는 게임에서 자연스런 대화를 통해 스토리 몰입을 제공하는 AI 캐릭터를 위한 LLM 활용을 소개한다. 사용자는 게임 속 AI 캐릭터와 대화하며 스토리를 이어간다. 게임 속에서 사용자는 정해진 대사를 선택할 수도 있고, AI 캐릭터와 대화할 때 직접 대사를 입력할 수도 있다. 대사를 입력하면 그에 맞는 AI 캐릭터의 답변이 제공되고, 앞으로의 스토리에도 영향을 미친다. 결론적으로 LLM 기반 AI 캐릭터와의 자연스러운 대화를 통해 게임의 몰입도와 접근성을 높이는 것이 본 연구의 목표이다.

Radiosity model과 AI 알고리즘을 이용한 모바일 게임 구현 (Implementation of 3D mobile game using radiosity model and AI algorithm)

  • 김성동;진성아;조데레샤
    • 한국게임학회 논문지
    • /
    • 제17권1호
    • /
    • pp.7-16
    • /
    • 2017
  • 3D 게임그래픽 표현기술은 게임콘텐츠발전과 함께 콘텐츠 분야에서 중요한 요소가 되었다. 특히 게임 캐릭터 표현 기술은 사실적인 그래픽 기술과 시각적인 즐거움을 주는 것 이외에 게임을 진행하는 게임에 대한 몰입도의 중간 단계역할을 하며 플레이어가 마치 게임 속에서 영웅적인 모험을 즐길 수 있도록 착각을 만들어 낸다. 3D 게임에 있어서 게임캐릭터의 높은 완성도는 개발과정 가운데 캐릭터 설정작업의 세심한 디테일작업과 신중함이 주요요인으로 작용한다[3]. 본 논문에서는 게임구현을 위하여 인지적 AI 알고리즘이 적용된 3D 유니티 게임 엔진을 사용하여 radiosity의 수학적인 모델과 기본적인 radiosity 모델, 점진적 개선 radiosity 모델 기법을 방법론을 소개하고, 모바일 게임에 적용한 캐릭터 표현기법을 제안하려고 한다. 게임엔진에 실제적으로 적용하여보니 렌더링과정과 모의실험에서 표면의 투영도는 게임콘텐츠 환경의 조명도에 따라 변화됨을 발견 할 수 있어서, 전체적으로 질 높은 게임캐릭터가 완성되었음이 확인 되었다.

시각장애인의 라이프 사이클을 지원하는 인공지능 웨어러블 플랫폼 (Artificial intelligence wearable platform that supports the life cycle of the visually impaired)

  • 박시웅;김정은;강현서;박형준
    • Journal of Platform Technology
    • /
    • 제8권4호
    • /
    • pp.20-28
    • /
    • 2020
  • 본 논문에서는 시각장애인의 라이프 사이클을 사전에 학습하여 시각장애인의 자립생활을 돕는 적정기술로 음성인식 기반 스마트 웨어러블 디바이스, 스마트 기기 및 웹 AI서버를 포함하는 음성, 사물 및 문자 인식 플랫폼을 제안하였다. 시각장애인용 웨어러블 기기는 착용편의성과 사물인식기능 효율을 높이기 위해 리버스 넥밴드 구조로 설계하여 제작하였으며, 웨어러블 기기에 부착된 고감도 소형 마이크와 스피커는 웨어러블 기기와 연동된 스마트기기의 앱으로 구성된 음성인식 인터페이스 기능을 지원하도록 구성하였다. 음성, 사물 및 광학문자 인식 서비스는 웹 AI 서버에서 오픈소스 및 구글 API를 활용하였고, 서비스 플랫폼의 음성, 사물 및 광학문자 인식 정밀도는 실험을 통하여 평균 90%이상 달성하였음을 확인하였다.

  • PDF

딥러닝 기반 OCR 인식 엔진의 정확도 향상을 위한 전/후처리기 기술 구현 (Implementation of Pre-Post Process for Accuraty Improvement of OCR Recognition Engine Based on Deep-Learning Technology)

  • 장창복;김기봉
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.163-170
    • /
    • 2022
  • 4차산업 혁명이 도래함에 따라 AI 기술을 적용하는 솔루션 개발이 활발하게 이루어지고 있다. 2017년도부터 금융권, 보험사를 중심으로 AI 기반 RPA(Robotic Process Automation)을 이용한 업무 자동화 솔루션 도입이 이루어지기 시작했으며, 최근에는 RPA 솔루션 도입 단계를 지나 확산하는 시기로 진입하고 있다. 이러한 RPA 솔루션을 이용한 업무 자동화 중에서 각 종 문서들을 이용한 업무 자동화에는 문서내의 문자 정보를 얼마나 정확하게 인식하는지가 매우 중요하다. 이러한 문자 인식은 최근 딥러닝 기술을 도입함으로써 그 정확도가 많이 높아졌지만, 여전히 완벽한 인식 정확도 갖는 인식 모델은 존재하지 않는다. 따라서, 본 논문에서는 딥러닝 기반 문자 인식 엔진에 전/후 처리기 기술을 적용할 경우 얼마나 정확도가 향상되는지를 확인하고 RPA 인식 엔진과 연계 기술을 구현하였다.

캐릭터 웹드라마 요약 분석을 통한 간접광고 제품 추천 시스템 개발 (Recommendation System Development of Indirect Advertising Product through Summary Analysis of Character Web Drama)

  • 이현수;김정이
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.15-20
    • /
    • 2023
  • 본 논문은 캐릭터 웹드라마에 적합한 간접광고 제품을 추천하는 인공지능(AI) 시스템 알고리즘 개발에 관한 연구이다. 본 연구는 웹드라마의 대사 작성에 있어 그에 어울리는 간접광고 제품을 추천함으로써 시청자의 콘텐츠 몰입도를 높이고, 드라마의 스토리를 보다 깊게 이해하는 데 도움을 주는 것을 목표로 한다. 본 연구에서는 자연어처리 모델 인 GPT를 활용하여 대사, 줄거리를 분석하고, 분석 결과를 바탕으로 소품형, 배경형 등 두 가지 유형의 간접광고 제품 추천 시스템을 개발한다. 이를 통해 웹드라마의 스토리에 부합하는 제품을 적절히 배치함으로써 간접광고가 자연스럽게 노출될 수 있도록 하고, 그로 인해 시청자들의 몰입도가 증가하며, 상품 홍보의 효과 또한 높인다. 숨겨진 뜻이나 문화적 뉘앙스를 완벽하게 이해하기 어려운 인공지능 모델의 한계와 학습에 필요한 충분한 데이터 확보가 어렵다는 한계가 있다. 그러나 본 연구는 AI가 창작물 제작에 어떻게 기여할 수 있는지에 대한 새로운 인사이트를 제공하고, 창의적 산업 분야에서 자연어 처리 모델의 활용 가능성을 넓히는 중요한 발판이 될 것이다.