• 제목/요약/키워드: 조합모델

검색결과 1,335건 처리시간 0.026초

딥러닝을 활용한 한글문장 OCR연구 (A Study on the OCR of Korean Sentence Using DeepLearning)

  • 박선우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.470-474
    • /
    • 2019
  • 한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.

  • PDF

기준점 배치에 따른 궤도기반 센서모델의 정확도 분석 (Accuracy analysis of the Orbit-based Sensor Modeling with various GCP configurations)

  • 김동욱;김현숙;김태정
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2008년도 춘계학술대회 논문집
    • /
    • pp.207-212
    • /
    • 2008
  • 연구에서는 SPOT-3 인공위성 영상으로부터 얻어진 영상 스테레오 스트립과 GCP(Ground Control Point)자료를 이용하여 다양한 GCP배치에 따른 궤도기반 센서모델의 정확성에 대해 분석하였다. 실험에 사용된 기준점자료는 춘천지역에서부터 나주지역에 이르기 까지 약 420km 길이의 지역에 대해 GPS측량을 통해 획득하였다. 궤도기반 센서모델에 적용된 미지수는 위성의 위치와 속도, 자세를 표현하는 방정식의 계수를 미지수로 선택하여 일곱 가지 방식으로 조합하였다. 실험은 우선 모델점의 위치를 일곱 가지 경우로 결정하고 각 경우에 대해 일정한 개수의 모델점을 선택하였다. 그리고 각 경우의 모델점의 위치에 대해 궤도기반 센서모델의 미지수 조합 모델을 각 각 다르게 적용해 본 후 그 결과를 시각적, 수치적으로 분석해 보았다. 실험 결과 모델점의 위치에 관계 없이 궤도기반 모델에 적용할 수 있는 높은 정확도를 나타내는 미지수 조합모델을 찾아낼 수가 있었고, 여러 가지 모델점의 위치를 궤도기반 센서모델에 적용해 본 결과 지리적, 시간적, 경제적 효율성을 갖는 최적의 미지수 조합을 찾을 수가 있었다.

  • PDF

소뇌모델 선형조합 신경망의 구조 및 학습기능 연구(I) -분석 및 학습 알고리즘 개발- (On Learning and Structure of Cerebellum Model Linear Associator Network(I) -Analysis & Development of Learning Algorithm-)

  • 황헌;백풍기
    • Journal of Biosystems Engineering
    • /
    • 제15권3호
    • /
    • pp.186-198
    • /
    • 1990
  • 인간 소뇌의 구조와 기능을 간략하게 수학적으로 모델링하여 입력에 따른 시스템의 적정 출력을 학습에 의한 적응 제어 방식으로 추출해 내는 소뇌모델 대수제어기(CMAC : Cerebellar Model Arithmetic Controller)가 제안되었다. 본 논문에서는 연구개발된 기존 신경회로망과의 비교 분석에 의거하여, 소뇌모델 대수제어기 대신 네트의 특성에 따라 소뇌모델 선형조합 신경망(CMLAN : Cerebellum Model Linear Associator Network)이라 하였다. 소뇌모델 선형조합 신경망은 시스템의 제어 함수치를 결정하는 데 있어, 기존의 제어방식이 시스템의 모델링을 기초로 하여 알고리즘에 의한 수치해석적 또는 분석적 기법으로 모델 해를 산출하는 것과 달리, 학습을 통하여 저장되는 분산기억 소자들의 함수치를 선형적으로 조합함으로써 시스템의 입출력을 결정한다. 분산기억 소자로의 함수치 산정 및 저장은 소뇌모델 선형조합 신경망이 갖는 고유의 구조적 상태공간 매핑(State Space Mapping)과 델타규칙(Delta Rule)에 의거한 시스템의 입출력 상태함수의 학습으로써 수행된다. 본 논문을 통하여 소뇌모델 선형조합신경망의 구조적 특성, 학습 성질과 상태공간 설정 및 시스템의 수렴성을 규명하였다. 또한 기존의 최대 편차수정 학습 알고리즘이 갖는 비능률성 및 적용 제한성을 극복한 효율적 학습 알고리즘들을 제시하였다. 언급한 신경망의 특성 및 제안된 학습 알고리즘들의 능률성을 다양한 학습이득(Learning Gain)하에서 비선형 함수를 컴퓨터로 모의 시험하여 예시하였다.

  • PDF

댐 일유입량 예측을 위한 데이터 전처리와 머신러닝&딥러닝 모델 조합의 비교연구 (Comparative Study of Data Preprocessing and ML&DL Model Combination for Daily Dam Inflow Prediction)

  • 조영식;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.358-358
    • /
    • 2023
  • 본 연구에서는 그동안 수자원분야 강우유출 해석분야에 활용되었던 대표적인 머신러닝&딥러닝(ML&DL) 모델을 활용하여 모델의 하이퍼파라미터 튜닝뿐만 아니라 모델의 특성을 고려한 기상 및 수문데이터의 조합과 전처리(lag-time, 이동평균 등)를 통하여 데이터 특성과 ML&DL모델의 조합시나리오에 따른 일 유입량 예측성능을 비교 검토하는 연구를 수행하였다. 이를 위해 소양강댐 유역을 대상으로 1974년에서 2021년까지 축적된 기상 및 수문데이터를 활용하여 1) 강우, 2) 유입량, 3) 기상자료를 주요 영향변수(독립변수)로 고려하고, 이에 a) 지체시간(lag-time), b) 이동평균, c) 유입량의 성분분리조건을 적용하여 총 36가지 시나리오 조합을 ML&DL의 입력자료로 활용하였다. ML&DL 모델은 1) Linear Regression(LR), 2) Lasso, 3) Ridge, 4) SVR(Support Vector Regression), 5) Random Forest(RF), 6) LGBM(Light Gradient Boosting Model), 7) XGBoost의 7가지 ML방법과 8) LSTM(Long Short-Term Memory models), 9) TCN(Temporal Convolutional Network), 10) LSTM-TCN의 3가지 DL 방법, 총 10가지 ML&DL모델을 비교 검토하여 일유입량 예측을 위한 가장 적합한 데이터 조합 특성과 ML&DL모델을 성능평가와 함께 제시하였다. 학습된 모형의 유입량 예측 결과를 비교·분석한 결과, 소양강댐 유역에서는 딥러닝 중에서는 TCN모형이 가장 우수한 성능을 보였고(TCN>TCN-LSTM>LSTM), 트리기반 머신러닝중에서는 Random Forest와 LGBM이 우수한 성능을 보였으며(RF, LGBM>XGB), SVR도 LGBM수준의 우수한 성능을 나타내었다. LR, Lasso, Ridge 세가지 Regression모형은 상대적으로 낮은 성능을 보였다. 또한 소양강댐 댐유입량 예측에 대하여 강우, 유입량, 기상계열을 36가지로 조합한 결과, 입력자료에 lag-time이 적용된 강우계열의 조합 분석에서 세가지 Regression모델을 제외한 모든 모형에서 NSE(Nash-Sutcliffe Efficiency) 0.8이상(최대 0.867)의 성능을 보였으며, lag-time이 적용된 강우와 유입량계열을 조합했을 경우 NSE 0.85이상(최대 0.901)의 더 우수한 성능을 보였다.

  • PDF

자동화된 시멘틱 웹서비스의 조합을 위한 OWL-S 모델의 확장 (A DAML-S Extension Model for Automatic Composition of Semantic Web Service)

  • 이승근;이세훈;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.466-468
    • /
    • 2004
  • W3C의 OWL-S는 기존의 웹 서비스와 시멘틱 웹 기술의 결함을 통한 웹서비스의 자동화된 검색, 조합 등을 지원하기 위한 모델이다. 원하는 특히, 웹서비스 조합은 사용자의 다양한 요구를 지원하기 위해서 매우 중요하며, 웹 서비스 조합을 하나의 처리 단위로 하기 위한 트랜잭션 개념의 도입이 필수적이다. 이를 위해서는 OWL-S웹서비스의 검색시 서비스의 IOPE(Input/Output/Precondition/Effect)와 메시지의 시멘틱 고려뿐만 아니라 트랜잭션에 영향을 미치는 웹 서비스의 응답시간, 수행비용, 신뢰성 등 웹서비스의 품질과 실제 웹 서비스의 연동의 단위가 되는 연산들에 대한 고려가 필요하나, OWL-S에서는 이러한 부분의 정의가 부족하다. 따라서, 이 연구에서는 자동화된 웹 서비스 조합을 위해서 OWL-S을 확장한 새로운 모델을 제안한다. 이 모델은 웹서비스의 성능을 응답속도, 비용, 신뢰도등율 이용해서 웹서비스간의 유사도를 측정할 수 있으며, 실제 연산들에 대한 시멘틱 표현을 가능하게 함으로써 보다 정확한 웹 서비스의 조합을 가능하게 한다.

  • PDF

소셜 프랜차이즈와 사회적 협동조합과의 차이에 관한 연구: 심층 인터뷰를 중심으로

  • 공인원;이일한
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2023년도 춘계학술대회
    • /
    • pp.21-28
    • /
    • 2023
  • 본 논문은 사회적 협동조합과 소셜 프랜차이즈에 대한 정의, 특성, 성공요인 등을 선행연구를 통해 분석하고, 각 모델별 현직자 인터뷰를 통해 모델의 차이를 규명하여, 현재 국내에서의 소셜 프랜차이즈가 활성화 되지 못하고 있는 현상을 분석해보고자 한다. 이를 통해 현 상황에 대한 진단 뿐 아니라 소셜 프랜차이즈의 본질적 목표인 사회적 영향력 확대를 위해서 갖추어야 할 제반사항에 대해 고찰해 보고 나아가 사회적 협동조합과 함께 소셜 프랜차이즈 모델의 성장에 유의미한 제언을 하고자 본 연구를 진행하고자 한다. 연구의 독창성과 연구적 가치를 위해 소셜 프랜차이즈 및 사회적 협동조합 관련자 들에 대해 심층 인터뷰를 진행하고자 하며, 각 사업 모델별 목표, 조직구성, 운영방식, 사업확장 방식 등을 확인하여 두 모델간의 공통점과 차이점을 분석하고 이를 통해 소셜 프랜차이즈의 목표에 대한 정립과 국내 소셜 프랜차이즈의 활성화를 위한 이론적, 실무적 인사이트를 제공하고자 한다.

  • PDF

난류 부분예혼합 제트화염에 대한 난류 및 연소모델의 예측성능 검토 (Investigation of the Prediction Performance of Turbulence and Combustion Models for the Turbulent Partially-premixed Jet Flame)

  • 김유정;오창보
    • 한국화재소방학회논문지
    • /
    • 제28권4호
    • /
    • pp.35-43
    • /
    • 2014
  • 3개의 난류모델과 3개의 연소모델로 구성된 9개의 모델조합을 이용하여 난류 부분예혼합 제트화염 구조에 대한 수치적 예측성능을 검토하였다. 이용된 난류모델은 표준 ${\kappa}-{\varepsilon}$ 모델(SKE), Realizable ${\kappa}-{\varepsilon}$ 모델(RKE) 및 Reynolds 응력모델(RSM)이며 연소모델들은 Eddy Dissipation Concept 모델(EDC), Steady Laminar Flamelet 모델(SLF)와 Unsteady Laminar Flamelet 모델(ULF)이다. 9개 모델조합의 예측성능을 평가하기 위하여 실험결과가 알려진 Sandia D 화염인 난류 부분예혼합 제트화염을 대상으로 수치계산을 수행하였다. 얻어진 결과로서, 화염길이의 예측은 RSM > SKE > RKE순으로 길게 예측하였으며, RKE 난류모델은 화염길이를 너무 과소 예측하는 것을 확인하였다. RSM + SLF과 RSM + ULF의 조합은 화염길이는 비교적 잘 예측하였지만 하류에서의 화염온도를 과대 예측하였다. 반면에 SKE와 연소모델의 조합에서 SLF 또는 ULF 조합은 화염길이 뿐만 아니라 하류에서의 화염온도도 비교적 잘 예측하였는 것을 확인하였다. 반경방향 화염온도 및 화학종 농도분포를 비교해 본 결과 SKE와 연소모델의 조합이 가장 예측성능이 뛰어났으며 SKE + ULF의 조합이 가장 우수한 예측성능을 갖는 것을 확인하였다.

문장성분의 다양한 자질을 이용한 한국어 구문분석 모델 (Korean Parsing Model using Various Features of a Syntactic Object)

  • 박소영;김수홍;임해창
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.743-748
    • /
    • 2004
  • 본 논문에서는 효과적인 구문 중의성 해결을 위해 문장성분의 구문자질, 기능자질, 내용자질, 크기자질을 활용하는 확률적 한국어 구문분석 모델을 제안한다. 그리고, 제안하는 구문분석 모델은 한국어의 부분자유어순과 생략현상을 잘 처리할 수 있도록 문법규칙을 이진형식으로 제한한다. 실험을 통해 제안하는 구문분석 모델의 성능을 각 자질조합별로 분석한다. 분석결과는 서로 다른 특징을 갖는 자질의 조합이 서로 유사한 특징을 갖는 자질의 조합보다 구문중의성 해결에 더 유용하다는 것을 보여준다. 또한, 단일자질인 기능자질이 내용자질과 크기자질의 조합보다 성능이 더 우수함을 알 수 있다.

기준점 위치와 미지수 조합에 따른 궤도모델링의 정확도 분석 (Accuracy Analysis of the Orbit Modeling with Various GCP Configurations and Unknown Parameter Sets)

  • 김동욱;김현숙;김태정
    • 대한원격탐사학회지
    • /
    • 제24권2호
    • /
    • pp.133-140
    • /
    • 2008
  • 본 논문에서는 다양한 기준점 배치와 미지수 조합 모델을 이용하여 궤도모델링의 정확도를 검증하고자 하였다. 실험에 사용된 기준점의 개수는 총 152개로 전체 영상 스트립에 포함되는 지역에 대해 GPS 측량을 통해 획득하였다. 전체 스트립 영상의 길이는 춘천지역에서부터 나주지역까지 약 420km 길이에 해당한다. 궤도모델을 위해 적용된 미지수 조합은 위성의 위치와 속도, 자세를 표현하는 방정식의 계수를 미지수로 선택하여 일곱 가지 방식으로 조합하였다. 실험은 우선 모델점의 배치를 일곱 가지 경우로 결정한 후에 각 경우의 배치에 대해 일정한 개수의 모델점을 선택하였다. 그리고 각 모델점의 배치에 따라 미지수 조합 모델을 각각 다르게 적용해 본 후 그 결과를 분석해 보았다. 실험 결과 모델점의 위치에 관계없이 지리적, 시간적, 경제적 효율성을 갖는 최적의 미지수 조합을 찾을 수가 있었다.

오타에 강건한 자모 조합 임베딩 기반 한국어 품사 태깅 (A typing error-robust Korean POS tagging using Hangul Jamo combination-based embedding)

  • 서대룡;정유진;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2017
  • 본 논문은 한글 자모 조합 임베딩을 이용하여 오타에 강건한 한국어 품사 태깅 시스템을 구축하는 방법에 대해 기술한다. 최근 딥 러닝 연구가 활발히 진행되면서 자질을 직접 추출해야 하는 기존의 기계학습 방법이 아닌, 스스로 자질을 찾아서 학습하는 딥 러닝 모델을 이용한 연구가 늘어나고 있다. 본 논문에서는 다양한 딥 러닝 모델 중에서 sequence labeling에 강점을 갖고 있는 bidirectional LSTM CRFs 모델을 사용하였다. 한국어 품사 태깅 문제에서 일반적으로 사용되는 음절 임베딩은 약간의 오타에도 품사 태깅 성능이 크게 하락하는 한계가 있었다. 따라서 이를 개선하기 위해 본 논문에서는 한글 자모 임베딩 값을 조합시킨 음절 임베딩 방식을 제안하였다. 강제로 오타를 발생시킨 테스트 집합에서 실험한 결과, 자모 조합 임베딩 기법이 word2vec 음절 임베딩 방식에 비해 형태소 분할은 0.9%, 품사 태깅은 3.5% 우수한 성능을 기록하였다.

  • PDF