• 제목/요약/키워드: 영상 언어 모델

검색결과 74건 처리시간 0.031초

고해상도 위성영상과 SML을 이용한 남제주 지역의 임상분류 기법 개발 (Developing the forest classification technique in Namjeju area using high resolution satellite images and SML (Spatial Modeling Language))

  • 조명희;조윤원;김성재;송완영;정영교
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.359-364
    • /
    • 2006
  • 최근 GIS를 비롯한 공간정보기술의 눈부신 발전으로 국토전반에 대한 정보화와 과학적인 관리기법이 확산되고 있다. 이에 효율적인 산림관리를 위하여 위성영상과 지리정보시스템을 이용한 산림정보가 구축되고 있으나, 산림지역이라는 지리특성상 현장 출입이 제한적이고 위험하여 정보수집에 어려움이 있다. 본 연구에서는 효율적인 산림정보구축을 위하여 남제주군을 대상으로 고해상도 위성영상과 공간정보추출언어인 SML(Spatial Modeler Language)을 이용하여 다양한 모델별 산림지역의 임상정보를 추출, 임상분류를 위한 모델링 기법을 개발하였다. 또한 l/5,000도엽을 기준으로 표본점을 배치하고 임상, 하층식생, 입지 및 토양에 대한 현지조사를 수행하였으며, 추출자료와의 상관성 분석 및 검증을 통하여 공간정보 기술을 이용한 산림정보 구축의 기반을 마련하고자 하였다.

  • PDF

신뢰성있는 딥러닝 기반 분석 모델을 참조하기 위한 딥러닝 기술 언어 (Deep Learning Description Language for Referring to Analysis Model Based on Trusted Deep Learning)

  • 문종혁;김도형;최종선;최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권4호
    • /
    • pp.133-142
    • /
    • 2021
  • 최근 딥러닝은 하드웨어 성능이 향상됨에 따라 자연어 처리, 영상 인식 등의 다양한 기술에 접목되어 활용되고 있다. 이러한 기술들을 활용해 지능형 교통 시스템(ITS), 스마트홈, 헬스케어 등의 산업분야에서 데이터를 분석하여 고속도로 속도위반 차량 검출, 에너지 사용량 제어, 응급상황 등과 같은 고품질의 서비스를 제공하며, 고품질의 서비스를 제공하기 위해서는 정확도가 향상된 딥러닝 모델이 적용되어야 한다. 이를 위해 서비스 환경의 데이터를 분석하기 위한 딥러닝 모델을 개발할 때, 개발자는 신뢰성이 검증된 최신의 딥러닝 모델을 적용할 수 있어야 한다. 이는 개발자가 참조하는 딥러닝 모델에 적용된 학습 데이터셋의 정확도를 측정하여 검증할 수 있다. 이러한 검증을 위해서 개발자는 학습 데이터셋, 딥러닝의 계층구조 및 개발 환경 등과 같은 내용을 포함하는 딥러닝 모델을 문서화하여 적용하기 위한 구조적인 정보가 필요하다. 본 논문에서는 신뢰성있는 딥러닝 기반 데이터 분석 모델을 참조하기 위한 딥러닝 기술 언어를 제안한다. 제안하는 기술 언어는 신뢰성 있는 딥러닝 모델을 개발하는데 필요한 학습데이터셋, 개발 환경 및 설정 등의 정보와 더불어 딥러닝 모델의 계층구조를 표현할 수 있다. 제안하는 딥러닝 기술 언어를 이용하여 개발자는 지능형 교통 시스템에서 참조하는 분석 모델의 정확도를 검증할 수 있다. 실험에서는 제안하는 언어의 유효성을 검증하기 위해, 번호판 인식 모델을 중심으로 딥러닝 기술 문서의 적용과정을 보인다.

키워드 인식을 위한 한글 Pseudo 2D HMM의 동적 합성 방법 (Dynamic Synthesis of Pseudo 2D HMMs for Korean Characters in Key Character Recognition Tasks)

  • 조범준
    • 한국통신학회논문지
    • /
    • 제26권6B호
    • /
    • pp.820-827
    • /
    • 2001
  • 한글은 둘 또는 세 개의 자모가 사각형 영역 안에 적절히 배치된 구조로 되어 있다. 이와 같은 구성 방법에 따라 글자의 영상을 합성하고 이를 실시간에 Pseudo 2D HMM으로 변환하는 방법을 제안한다. 본 방법에 따라 실시간 합성된 모델과 추가의 필러(filler) 모델, 여백 모델을 문서 영상의 글자 영역에서 핵심어 검출에 적용하였다. 실험 결과 최소한의 설계 변수 조정으로도 오검출, 미검출률이 낮고 언어 모델 없이 숫자 89%, 한글 80%의 검출성능을 보였으며, 따라서 제안된 방법이 인쇄 문자 패턴의 실시간 모델링 및 키워드 검출에 효과가 있음을 보였다. 본 연구 결과는 내용 기반의 광학 문서 색인 등에 활용할 수 있다.

  • PDF

트랜스포머를 이용한 GVQA 모델의 성능 개선에 관한 연구 (A Study on Performance Improvement of GVQA Model Using Transformer)

  • 박성욱;김준영;박준;이한성;정세훈;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.749-752
    • /
    • 2021
  • 오늘날 인공지능(Artificial Intelligence, AI) 분야에서 가장 구현하기 어려운 분야 중 하나는 추론이다. 근래 추론 분야에서 영상과 언어가 결합한 다중 모드(Multi-modal) 환경에서 영상 기반의 질의 응답(Visual Question Answering, VQA) 과업에 대한 AI 모델이 발표됐다. 얼마 지나지 않아 VQA 모델의 성능을 개선한 GVQA(Grounded Visual Question Answering) 모델도 발표됐다. 하지만 아직 GVQA 모델도 완벽한 성능을 내진 못한다. 본 논문에서는 GVQA 모델의 성능 개선을 위해 VCC(Visual Concept Classifier) 모델을 ViT-G(Vision Transformer-Giant)/14로 변경하고, ACP(Answer Cluster Predictor) 모델을 GPT(Generative Pretrained Transformer)-3으로 변경한다. 이와 같은 방법들은 성능을 개선하는 데 큰 도움이 될 수 있다고 사료된다.

생성형 대규모 언어 모델과 프롬프트 엔지니어링을 통한 한국어 텍스트 기반 정보 추출 데이터셋 구축 방법 (A Study on Dataset Generation Method for Korean Language Information Extraction from Generative Large Language Model and Prompt Engineering)

  • 정영상;지승현;권다롱새
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.481-492
    • /
    • 2023
  • 본 연구는 생성형 대규모 언어 모델을 활용하여 텍스트에서 정보를 추출하기 위한 한글 데이터셋 구축 방법을 탐구한다. 현대 사회에서는 혼합된 정보가 빠르게 유포되며, 이를 효과적으로 분류하고 추출하는 것은 의사결정 과정에 중요하다. 그러나 이에 대한 학습용 한국어 데이터셋은 아직 부족하다. 이를 극복하기 위해, 본 연구는 생성형 대규모 언어 모델을 사용하여 텍스트 기반 제로샷 학습(zero-shot learning)을 이용한 정보 추출을 시도하며, 이를 통해 목적에 맞는 한국어 데이터셋을 구축한다. 본 연구에서는 시스템-지침-소스입력-출력형식의 프롬프트 엔지니어링을 통해 언어 모델이 원하는 결과를 출력하도록 지시하며, 입력 문장을 통해 언어 모델의 In-Context Learning 특성을 활용하여 데이터셋을 구축한다. 생성된 데이터셋을 기존 데이터셋과 비교하여 본 연구 방법론을 검증하며, 관계 정보 추출 작업의 경우 KLUE-RoBERTa-large 모델 대비 25.47% 더 높은 성능을 달성했다. 이 연구 결과는 한국어 텍스트에서 지식 요소를 추출하는 가능성을 제시함으로써 인공지능 연구에 도움을 줄 것으로 기대된다. 더욱이, 이 방법론은 다양한 분야나 목적에 맞게 활용될 수 있어, 다양한 한국어 데이터셋 구축에 잠재력을 가진다고 볼 수 있다.

Cadieux 모델에 기반한 Web Globalization 시스템 구현 (Implementation of Web Globalization System Based on Cadieux Model)

  • 이영미;서형국;이경일
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.252-258
    • /
    • 2003
  • Web Globalization(이하 WG)은 global e-biz의 핵심으로 인터넷에 남은 가장 큰 사업이라고 할 수 있다. WG은 국제 시장 대응을 위해 다국어 웹사이트를 구축 및 관리하는 일이며 업무의 복잡성으로 인해 다국어 프로세스 자동화와 관리 도구가 절실히 요구되는 분야이다. 이에 WG의 시장 및 기술 동향을 살펴보고, Cadieux 모델에 기반한 모비코앤시스메타(이하 MnS)의 새로운 WG 시스템을 설명하고자 한다. 본 연구에서는 e-biz 세계화의 가장 큰 특징인 빈번한 트랜잭션과 콘텐츠 번역 프로세스를 자동화함으로 높은 비용 효과 달성을 기본목표로 하였으며, 다국어 글로벌 커뮤니티 지원 기능과 복잡한 문서 및 동영상과 같은 멀티미디어 콘텐츠의 세계화가 가능하도록 설계되었다. 마지막으로 프로토타입인 iGLOBIZ 시스템을 실제 구현해 봄으로 기술 및 상업화 가능성을 확인하고 향후의 연구 방향을 모색해 보았다.

  • PDF

딥러닝을 이용한 대규모 한글 폰트 인식 (Large-Scale Hangul Font Recognition Using Deep Learning)

  • 양진혁;곽효빈;김인중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-12
    • /
    • 2017
  • 본 연구에서는 딥러닝을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 폰트는 디자인 분야에 있어서 필수적인 요소이며 문화적으로도 중요하다. 한글은 영어권 언어에 비해 훨씬 많은 문자를 포함하고 있기 때문에 한글 폰트 인식은 영어권 폰트 인식보다 어렵다. 본 연구에서는 최근 다양한 영상 인식 분야에서 좋은 성능을 보이고 있는 CNN을 이용해 한글 폰트 인식을 수행하였다. 과거에 이루어진 대부분의 폰트 인식 연구에서는 불과 수 십 종의 폰트 만을 대상으로 하였다. 최근에 이르러서야 2000종 이상의 대용량 폰트 인식에 대한 연구결과가 발표되었으나, 이들은 주로 문자의 수가 적은 영어권 문자들을 대상으로 하고 있다. 본 연구에서는 CNN을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 많은 수의 폰트를 인식하기 위해 두 가지 구조의 CNN을 이용해 폰트인식기를 구성하고, 실험을 통해 이들을 비교 평가하였다. 특히, 본 연구에서는 3300종의 한글 폰트를 효과적으로 인식하면서도 학습 시간과 파라미터의 수를 줄이고 구조를 단순화하는 방향으로 모델을 개선하였다. 제안하는 모델은 3300종의 한글 폰트에 대하여 상위 1위 인식률 94.55%, 상위 5위 인식률 99.91%의 성능을 보였다.

  • PDF

보조 자료와 음성 전사를 사용한 강의 검색 시스템 (A LECTURE SEARCH SYSTEM USING RELEVANT INFORMATION AND SPEECH TRANSCRIPTION)

  • 이동현;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.140-144
    • /
    • 2008
  • 음성 오디오 검색 시스템을 구축하기 위해서는 몇 가지 과정이 필요하다. 첫 번째 과정이 음성 인식기를 이용하여 음성 오디오를 텍스트 형태로 표현하는 것이다. 하지만, 음성 인식기에서 수반되는 음성 인식 오류를 피할 수는 없다. 음성 인식 오류를 최소화하기 위해서 음성 인식 출력의 lattice를 색인(index)해야 하는데, 보다 효과적인 처리를 위하여 압축된 형태를 사용한다. 본 연구에서는 특별히 한국어 강의를 대상으로 검색 시스템을 구축했다. 강의에서는 특별히 관련된 자료를 쉽게 구할 수 있는 데, 이런 자료를 언어 모델에 이용하여 음성 인식 성능을 향상 시킬 수 있다. 또한, 강의 자료를 이용한 추가 색인 테이블(index table)을 생성하여 검색 성능 향상에 도움을 준다. 실험에서 고등학교 과정 수학 강의 동영상을 이용하여 자동화된 강의 검색 시스템을 구축하고, 보조 자료를 이용해 성능을 향상 시키는 것을 보인다.

  • PDF

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 남기환;배철수
    • 한국정보통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.783-788
    • /
    • 2002
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 논은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형살 모델을 입력 동영상에 정합시키고 정합된 3차원 형상모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차인 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다.

다중투사영상을 이용한 표적체적의 3차원 재구성 (Three Dimensional Target Volume Reconstruction from Multiple Projection Images)

  • 정광호;진호상;이형구;최보영;서태석
    • 한국의학물리학회지:의학물리
    • /
    • 제14권3호
    • /
    • pp.167-174
    • /
    • 2003
  • 정위적방사선수술과 같은 경우 치료계획 수립 시 병변의 정확한 위치뿐만 아니라 정확한 부피와 모양을 아는 것도 매우 중요하다. 병변의 확인을 위해서 때로는 혈관조영영상이 이용되기도 하는데 동정맥 기형과 같은 경우 이 방법이 병변의 구별을 위하여 가장 좋은 방법이기 때문이다. 병변의 정확한 위치는 두개의 투사영상으로부터 얻을 수 있지만 두 개의 투사영상 만으로는 병변을 3차원적으로 재구성하는 것은 불가능하다고 여겨지고 있다. 본 연구의 목적은 다수의 투사 영상들을 이용하여 병변을 3차원적으로 재구성하는 것이다. 이때 병변의 위치는 기존에 제안된 방법에 의하여 이미 알고 있다고 가정하였으며 모든 과정은 병변의 중심을 원점으로 하는 표적좌표계에서 수행되었다. 본 연구에서는 6개의 투사영상이 이용되었는데 정면과 측면 투사영상은 체적소(voxel)로 구성된 재구성상자를 구하기 위하여 이용되었으며 나머지 네 개의 투사영상은 역투사 방법(back-projection method)에 의하여 재구성 상자(Reconstruction Box) 내에서 3차원적으로 재구성하는데 이용되었다. 이 방법의 정확도와 해상도는 병변의 크기와 모양에 따라 달라질 수 있다. 본 연구에서 제안된 알고리듬의 검증을 위하여 C 언어와 Matlab을 이용하여 타원체 모델과 말굽형 모델에 대하여 투사영상을 얻고 그 영상을 이용하여 재구성해보았다. 타원체모델의 경우에는 원래의 모델보다 약간 크게 재구성되었지만 모양과 방향, 위치가 정확함을 확인할 수 있었다. 말굽형 모델은 재구성된 모양이 원래의 모양과 차이가 많이 났지만 기존 방법에 비하여 실제 모양에 근접하게 재구성할 수 있었으므로 병변을 확인하는 경우에는 도움이 될 것으로 사료된다.

  • PDF