Search | Korea Science

A Study on the OCR of Korean Sentence Using DeepLearning (딥러닝을 활용한 한글문장 OCR연구)

Park, Sun-Woo
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.470-474
- /
- 2019
한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.
PDF

Accuracy analysis of the Orbit-based Sensor Modeling with various GCP configurations (기준점 배치에 따른 궤도기반 센서모델의 정확도 분석)

Kim, Dong-Wook;Kim, Hyun-Suk;Kim, Tae-Jung
- Proceedings of the KSRS Conference
- /
- 2008.03a
- /
- pp.207-212
- /
- 2008
연구에서는 SPOT-3 인공위성 영상으로부터 얻어진 영상 스테레오 스트립과 GCP(Ground Control Point)자료를 이용하여 다양한 GCP배치에 따른 궤도기반 센서모델의 정확성에 대해 분석하였다. 실험에 사용된 기준점자료는 춘천지역에서부터 나주지역에 이르기 까지 약 420km 길이의 지역에 대해 GPS측량을 통해 획득하였다. 궤도기반 센서모델에 적용된 미지수는 위성의 위치와 속도, 자세를 표현하는 방정식의 계수를 미지수로 선택하여 일곱 가지 방식으로 조합하였다. 실험은 우선 모델점의 위치를 일곱 가지 경우로 결정하고 각 경우에 대해 일정한 개수의 모델점을 선택하였다. 그리고 각 경우의 모델점의 위치에 대해 궤도기반 센서모델의 미지수 조합 모델을 각 각 다르게 적용해 본 후 그 결과를 시각적, 수치적으로 분석해 보았다. 실험 결과 모델점의 위치에 관계 없이 궤도기반 모델에 적용할 수 있는 높은 정확도를 나타내는 미지수 조합모델을 찾아낼 수가 있었고, 여러 가지 모델점의 위치를 궤도기반 센서모델에 적용해 본 결과 지리적, 시간적, 경제적 효율성을 갖는 최적의 미지수 조합을 찾을 수가 있었다.
PDF

On Learning and Structure of Cerebellum Model Linear Associator Network(I) -Analysis & Development of Learning Algorithm- (소뇌모델 선형조합 신경망의 구조 및 학습기능 연구(I) -분석 및 학습 알고리즘 개발-)

Hwang, H.;Baek, P.K.
- Journal of Biosystems Engineering
- /
- v.15 no.3
- /
- pp.186-198
- /
- 1990
인간 소뇌의 구조와 기능을 간략하게 수학적으로 모델링하여 입력에 따른 시스템의 적정 출력을 학습에 의한 적응 제어 방식으로 추출해 내는 소뇌모델 대수제어기(CMAC : Cerebellar Model Arithmetic Controller)가 제안되었다. 본 논문에서는 연구개발된 기존 신경회로망과의 비교 분석에 의거하여, 소뇌모델 대수제어기 대신 네트의 특성에 따라 소뇌모델 선형조합 신경망(CMLAN : Cerebellum Model Linear Associator Network)이라 하였다. 소뇌모델 선형조합 신경망은 시스템의 제어 함수치를 결정하는 데 있어, 기존의 제어방식이 시스템의 모델링을 기초로 하여 알고리즘에 의한 수치해석적 또는 분석적 기법으로 모델 해를 산출하는 것과 달리, 학습을 통하여 저장되는 분산기억 소자들의 함수치를 선형적으로 조합함으로써 시스템의 입출력을 결정한다. 분산기억 소자로의 함수치 산정 및 저장은 소뇌모델 선형조합 신경망이 갖는 고유의 구조적 상태공간 매핑(State Space Mapping)과 델타규칙(Delta Rule)에 의거한 시스템의 입출력 상태함수의 학습으로써 수행된다. 본 논문을 통하여 소뇌모델 선형조합신경망의 구조적 특성, 학습 성질과 상태공간 설정 및 시스템의 수렴성을 규명하였다. 또한 기존의 최대 편차수정 학습 알고리즘이 갖는 비능률성 및 적용 제한성을 극복한 효율적 학습 알고리즘들을 제시하였다. 언급한 신경망의 특성 및 제안된 학습 알고리즘들의 능률성을 다양한 학습이득(Learning Gain)하에서 비선형 함수를 컴퓨터로 모의 시험하여 예시하였다.
PDF

Comparative Study of Data Preprocessing and ML&DL Model Combination for Daily Dam Inflow Prediction (댐 일유입량 예측을 위한 데이터 전처리와 머신러닝&딥러닝 모델 조합의 비교연구)

Youngsik Jo;Kwansue Jung
- Proceedings of the Korea Water Resources Association Conference
- /
- 2023.05a
- /
- pp.358-358
- /
- 2023
본 연구에서는 그동안 수자원분야 강우유출 해석분야에 활용되었던 대표적인 머신러닝&딥러닝(ML&DL) 모델을 활용하여 모델의 하이퍼파라미터 튜닝뿐만 아니라 모델의 특성을 고려한 기상 및 수문데이터의 조합과 전처리(lag-time, 이동평균 등)를 통하여 데이터 특성과 ML&DL모델의 조합시나리오에 따른 일 유입량 예측성능을 비교 검토하는 연구를 수행하였다. 이를 위해 소양강댐 유역을 대상으로 1974년에서 2021년까지 축적된 기상 및 수문데이터를 활용하여 1) 강우, 2) 유입량, 3) 기상자료를 주요 영향변수(독립변수)로 고려하고, 이에 a) 지체시간(lag-time), b) 이동평균, c) 유입량의 성분분리조건을 적용하여 총 36가지 시나리오 조합을 ML&DL의 입력자료로 활용하였다. ML&DL 모델은 1) Linear Regression(LR), 2) Lasso, 3) Ridge, 4) SVR(Support Vector Regression), 5) Random Forest(RF), 6) LGBM(Light Gradient Boosting Model), 7) XGBoost의 7가지 ML방법과 8) LSTM(Long Short-Term Memory models), 9) TCN(Temporal Convolutional Network), 10) LSTM-TCN의 3가지 DL 방법, 총 10가지 ML&DL모델을 비교 검토하여 일유입량 예측을 위한 가장 적합한 데이터 조합 특성과 ML&DL모델을 성능평가와 함께 제시하였다. 학습된 모형의 유입량 예측 결과를 비교·분석한 결과, 소양강댐 유역에서는 딥러닝 중에서는 TCN모형이 가장 우수한 성능을 보였고(TCN>TCN-LSTM>LSTM), 트리기반 머신러닝중에서는 Random Forest와 LGBM이 우수한 성능을 보였으며(RF, LGBM>XGB), SVR도 LGBM수준의 우수한 성능을 나타내었다. LR, Lasso, Ridge 세가지 Regression모형은 상대적으로 낮은 성능을 보였다. 또한 소양강댐 댐유입량 예측에 대하여 강우, 유입량, 기상계열을 36가지로 조합한 결과, 입력자료에 lag-time이 적용된 강우계열의 조합 분석에서 세가지 Regression모델을 제외한 모든 모형에서 NSE(Nash-Sutcliffe Efficiency) 0.8이상(최대 0.867)의 성능을 보였으며, lag-time이 적용된 강우와 유입량계열을 조합했을 경우 NSE 0.85이상(최대 0.901)의 더 우수한 성능을 보였다.
PDF

A DAML-S Extension Model for Automatic Composition of Semantic Web Service (자동화된 시멘틱 웹서비스의 조합을 위한 OWL-S 모델의 확장)

이승근;이세훈;이정현
- Proceedings of the Korean Information Science Society Conference
- /
- 2004.04b
- /
- pp.466-468
- /
- 2004
W3C의 OWL-S는 기존의 웹 서비스와 시멘틱 웹 기술의 결함을 통한 웹서비스의 자동화된 검색, 조합 등을 지원하기 위한 모델이다. 원하는 특히, 웹서비스 조합은 사용자의 다양한 요구를 지원하기 위해서 매우 중요하며, 웹 서비스 조합을 하나의 처리 단위로 하기 위한 트랜잭션 개념의 도입이 필수적이다. 이를 위해서는 OWL-S웹서비스의 검색시 서비스의 IOPE(Input/Output/Precondition/Effect)와 메시지의 시멘틱 고려뿐만 아니라 트랜잭션에 영향을 미치는 웹 서비스의 응답시간, 수행비용, 신뢰성 등 웹서비스의 품질과 실제 웹 서비스의 연동의 단위가 되는 연산들에 대한 고려가 필요하나, OWL-S에서는 이러한 부분의 정의가 부족하다. 따라서, 이 연구에서는 자동화된 웹 서비스 조합을 위해서 OWL-S을 확장한 새로운 모델을 제안한다. 이 모델은 웹서비스의 성능을 응답속도, 비용, 신뢰도등율 이용해서 웹서비스간의 유사도를 측정할 수 있으며, 실제 연산들에 대한 시멘틱 표현을 가능하게 함으로써 보다 정확한 웹 서비스의 조합을 가능하게 한다.
PDF

소셜 프랜차이즈와 사회적 협동조합과의 차이에 관한 연구: 심층 인터뷰를 중심으로

공인원;이일한
- 한국벤처창업학회:학술대회논문집
- /
- 2023.04a
- /
- pp.21-28
- /
- 2023
본 논문은 사회적 협동조합과 소셜 프랜차이즈에 대한 정의, 특성, 성공요인 등을 선행연구를 통해 분석하고, 각 모델별 현직자 인터뷰를 통해 모델의 차이를 규명하여, 현재 국내에서의 소셜 프랜차이즈가 활성화 되지 못하고 있는 현상을 분석해보고자 한다. 이를 통해 현 상황에 대한 진단 뿐 아니라 소셜 프랜차이즈의 본질적 목표인 사회적 영향력 확대를 위해서 갖추어야 할 제반사항에 대해 고찰해 보고 나아가 사회적 협동조합과 함께 소셜 프랜차이즈 모델의 성장에 유의미한 제언을 하고자 본 연구를 진행하고자 한다. 연구의 독창성과 연구적 가치를 위해 소셜 프랜차이즈 및 사회적 협동조합 관련자 들에 대해 심층 인터뷰를 진행하고자 하며, 각 사업 모델별 목표, 조직구성, 운영방식, 사업확장 방식 등을 확인하여 두 모델간의 공통점과 차이점을 분석하고 이를 통해 소셜 프랜차이즈의 목표에 대한 정립과 국내 소셜 프랜차이즈의 활성화를 위한 이론적, 실무적 인사이트를 제공하고자 한다.
PDF

Investigation of the Prediction Performance of Turbulence and Combustion Models for the Turbulent Partially-premixed Jet Flame (난류 부분예혼합 제트화염에 대한 난류 및 연소모델의 예측성능 검토)

Kim, Yu Jeong;Oh, Chang Bo
- Fire Science and Engineering
- /
- v.28 no.4
- /
- pp.35-43
- /
- 2014
The prediction performance of 9 model sets, which combine 3 turbulent models and 3 combustion models, was investigated numerically for turbulent partially-premixed jet flame. The standard ${\kappa}-{\varepsilon}$ (SKE), Realizable ${\kappa}-{\varepsilon}$ (RKE) and Reynolds stress model (RSM) were used as a turbulence model, and the eddy dissipation concept (EDC), steady laminar flamelet (SLF) and unsteady laminar flamelet model (ULF) were also adopted as a combustion model. The prediction performance of those 9 model sets was evaluated quantitatively and qualitatively for Sandia D flame of which flame structure was measured precisely. The flame length was predicted as, from longest to shortest, RSM > SKE > RKE, and the RKE predicted the flame length of the jet flame much shorter than experiment. The flame temperature was over predicted by the combination of RSM + SLF or RSM + ULF while the flame length obtained by RSM + SLF and RSM + ULF was well agreed with the experiment. The combination of SKE + SLF and SKE + ULF predicts well the flame length as well as the temperature distribution. The SKE turbulence model was most superior to the other turbulent models, and SKE + ULF showed the best prediction performance for the structure of turbulent partially-premixed jet flame.
https://doi.org/10.7731/KIFSE.2014.28.4.035 인용 PDF KSCI

Korean Parsing Model using Various Features of a Syntactic Object (문장성분의 다양한 자질을 이용한 한국어 구문분석 모델)

Park So-Young;Kim Soo-Hong;Rim Hae-Chang
- The KIPS Transactions:PartB
- /
- v.11B no.6
- /
- pp.743-748
- /
- 2004
In this paper, we propose a probabilistic Korean parsing model using a syntactic feature, a functional feature, a content feature, and a site feature of a syntactic object for effective syntactic disambiguation. It restricts grammar rules to binary-oriented form to deal with Korean properties such as variable word order and constituent ellipsis. In experiments, we analyze the parsing performance of each feature combination. Experimental results show that the combination of different features is preferred to the combination of similar features. Besides, it is remarkable that the function feature is more useful than the combination of the content feature and the size feature.
https://doi.org/10.3745/KIPSTB.2004.11B.6.743 인용 PDF KSCI

Accuracy Analysis of the Orbit Modeling with Various GCP Configurations and Unknown Parameter Sets (기준점 위치와 미지수 조합에 따른 궤도모델링의 정확도 분석)

Kim, Dong-Wook;Kim, Hyun-Suk;Kim, Tae-Jung
- Korean Journal of Remote Sensing
- /
- v.24 no.2
- /
- pp.133-140
- /
- 2008
In this paper, we analyzed the accuracy of orbit modeling with various control point configurations and adjustment unknown parameter sets. We used 152 GCP points acquired from GPS surveying, which were distributed from Choon-chun to Nha-ju along 420km in distance. For orbit modeling, seven adjustment parameter sets were chosen to include parameters for satellite position, velocity and attitude angles at different degree of freedom. Firstly we determined the location of model point in seven configurations. Secondly we estimated model parameters for each parameter set and for each GCP configurations. Finally we applied the model to reference check points and analyzed its accuracy. We were able to find the unknown parameter set that produce best orbit modeling performance regardless of the configuration of model points.
https://doi.org/10.7780/kjrs.2008.24.2.133 인용 PDF KSCI

A typing error-robust Korean POS tagging using Hangul Jamo combination-based embedding (오타에 강건한 자모 조합 임베딩 기반 한국어 품사 태깅)

Seo, Dae-Ryong;Chung, Youjin;Kang, Inho
- Annual Conference on Human and Language Technology
- /
- 2017.10a
- /
- pp.203-208
- /
- 2017
본 논문은 한글 자모 조합 임베딩을 이용하여 오타에 강건한 한국어 품사 태깅 시스템을 구축하는 방법에 대해 기술한다. 최근 딥 러닝 연구가 활발히 진행되면서 자질을 직접 추출해야 하는 기존의 기계학습 방법이 아닌, 스스로 자질을 찾아서 학습하는 딥 러닝 모델을 이용한 연구가 늘어나고 있다. 본 논문에서는 다양한 딥 러닝 모델 중에서 sequence labeling에 강점을 갖고 있는 bidirectional LSTM CRFs 모델을 사용하였다. 한국어 품사 태깅 문제에서 일반적으로 사용되는 음절 임베딩은 약간의 오타에도 품사 태깅 성능이 크게 하락하는 한계가 있었다. 따라서 이를 개선하기 위해 본 논문에서는 한글 자모 임베딩 값을 조합시킨 음절 임베딩 방식을 제안하였다. 강제로 오타를 발생시킨 테스트 집합에서 실험한 결과, 자모 조합 임베딩 기법이 word2vec 음절 임베딩 방식에 비해 형태소 분할은 0.9%, 품사 태깅은 3.5% 우수한 성능을 기록하였다.
PDF

Search Result 1,335, Processing Time 0.027 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)