• 제목/요약/키워드: 컴퓨터 비전 기술

검색결과 404건 처리시간 0.02초

오픈소스 소프트웨어를 활용한 고고 유물의 디지털 실측 연구 (A Study on the Digital Drawing of Archaeological Relics Using Open-Source Software)

  • 이호선;안형기
    • 헤리티지:역사와 과학
    • /
    • 제57권1호
    • /
    • pp.82-108
    • /
    • 2024
  • 고고 자료의 기록방식이 아날로그 기록에서 디지털로 전환되면서 3D 스캐닝 기술의 도입은 본격화되었다. 현재 3D스캔과 사진측량을 이용한 고고 자료의 디지털 기록에 대한 연구와 도입은 지속적으로 이루어지고 있다. 하지만 비용, 인력 문제 등으로 인해 대부분의 매장문화재 기관에서는 적극적인 디지털 기술의 도입을 주저하고 있다. 본고는 3D 스캔 방식 중 효율성이 가장 높다고 평가되는 사진측량 기술을 이용하여 오픈소스 소프트웨어를 활용한 유물의 디지털 실측 방법을 제시하고자 한다. 유물의 디지털 실측 절차는 크게 3D 모델 획득, 3D 모델 편집 및 입단면도 제작, 전자도면 작성의 세 단계로 이루어진다. 디지털 기술 적용의 접근성을 살펴보기 위해 전 과정은 오픈소스 소프트웨어만을 이용하였다. 연구 결과 정량적 평가에서 실제 유물과 3D 모델의 수치 데이터 간 계측의 편차가 크지 않았다. 또한, 오픈소스 소프트웨어와 상용 소프트웨어 간 정량적 품질 비교분석 결과 유사도가 높았다. 다만 데이터 처리시간은 상용 소프트웨어의 성능이 우위에 있었다. 이는 지속적인 알고리즘 개선으로 인한 연산속도 향상의 결과로 판단된다. 정성적 평가에서는 메시 및 텍스처 품질의 차이가 일부 발생하였다. 오픈소스 소프트웨어로 생성된 3D 모델은 메시표면에 노이즈가 다수 발생하거나 메시의 표면이 부드럽지 않고 유물의 제작흔, 문양의 표현을 확인하기 어려웠다. 하지만 일부 프로그램에서 정량적·정성적 평가에서 상용 소프트웨어에 견줄 만한 품질을 획득할 수 있었다. 3D 모델 편집을 위한 오픈소스 소프트웨어에서는 사진실측 결과물의 후처리, 정합, 병합뿐만 아니라 유물 실측에 필요한 스케일 조정, 입단면도 제작 및 이미지 렌더링까지 가능하였다. 이후 오픈소스 캐드 프로그램에서 트레이싱하여 최종 도면을 완성하였다. 고고학 연구에서 사진실측의 적용은 발굴과정부터 보고서 작성 그리고 3D 모델 데이터의 수치정보를 이용한 연구 등 활용 가능성이 매우 높다. 컴퓨터 비전의 획기적인 발전으로 오픈소스 소프트웨어의 종류도 다양해졌고 성능도 상당부분 개선된 것으로 확인되었다. 누구나 쉽게 디지털 기술의 적용이 가능한 현재 고고 자료의 3D 모델 데이터의 획득은 문화유산의 보존과 연구 활성화를 위한 기초자료로 활용될 수 있다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.

경호경비 발전전략에 따른 위치기반서비스(LBS) 도입 (Development Plan of Guard Service According to the LBS Introduction)

  • 김창호;장예진
    • 시큐리티연구
    • /
    • 제13호
    • /
    • pp.145-168
    • /
    • 2007
  • 정보화시대로 변하는것처럼 경호경비에 있어서도 변화가 요구되고 있는 실정이다. 통신과 하드웨어 기술이 빠르게 발전하고 인터넷 환경이 유선에서 무선으로 변화함에 따라 현대인들은 노트북, 컴퓨터, PDA, 모바일 폰 등과 같은 이동성있는 무선 통신기기들은 이용하여 더욱 더 쉽게 각종 정보 서비스에 접근할 수 있게 되었다. 필요한 정보와 서비스를 언제, 어디서나 그리고 어떤 디바이스에도 비전을 제시한 LBS분야는 유비쿼터스(ubiquitous)개념의 출현과 더불어 그 영역을 더욱 더 넓혀가고 있는 상황이다. LBS는 바로 이 모바일 폰 속의 칩을 이용해 가입자들의 위치를 반경 수십센티에서 수백미터 내에서 언제든지 확인할 수 있도록 해준다. LBS는 서비스 방식에 따라 이동통신기지국을 이용하는 방식과 위성을 활용한 GPS로 나뉜다. 또 서비스의 유형별로는 크게 위치추적서비스, 공공안전서비스, 위치기반정보서비스 등으로 구분할 수 있으며 이것이 경호경비 발전에 함께 도모할 부분이라고 할 수 있다. 2005년에는 8,460억원 규모, 2007년에는 1조 6,561억원의 시장규모로 성장할 것으로 전망된다. 이처럼 LBS활용에 따른 경호경비도 발빠르게 변화해야하는 추세라 짐작할 수 있다. 연구의 방법에 있어서는 기본적으로 문헌조사(Cocumentary Review)를 선택하였으며, 먼저 이론적 연구는 국내${\cdot}$외에서 발간된 학술지와 단행본, 인터넷 검색, 기타 각종 연구보고서, 법령집 및 경찰청 치안 연구소에서 발간한 각종 논문과 경찰과 업무자료, 법률관계의 자료, 민간경호업체들의 문헌과 통계자료 등에 의존한 2차 문헌검토를 위주로 하였다.

  • PDF

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.