• 제목/요약/키워드: Dictionary Learning

검색결과 140건 처리시간 0.028초

손실 영역 분석 기반의 학습데이터 매핑 기법을 이용한 초해상도 연구 (Super Resolution using Dictionary Data Mapping Method based on Loss Area Analysis)

  • 한현호;이상훈
    • 한국융합학회논문지
    • /
    • 제11권3호
    • /
    • pp.19-26
    • /
    • 2020
  • 본 논문에서는 학습된 사전 기반 초해상도 결과를 개선하기 위해 분석한 손실 영역을 기반으로 학습 데이터를 적용하는 방법을 제안하였다. 기존의 학습된 사전 기반 방법은 입력 영상의 특징을 고려하지 않는 학습된 영상의 형태로 출력할 수 있으며, 이 과정에서 인공물이 발생할 수 있다. 제안하는 방법은 입력 영상과 학습된 영상의 일치하지 않는 특징으로 인한 인공물 발생을 줄이기 위해 1차 복원 결과를 분석함으로써 손실 정보를 추정하였다. 추정된 결과의 잡음 및 화소 불균형을 가우시안 기반의 커널로 개선하여 생성된 특징 맵에 따라 학습 데이터를 매핑하였다. 결과 비교를 위해 기존의 초해상도 방법과 제안 방법의 결과를 고화질 영상과 PSNR(Peak Signal to Noise Ratio), SSIM(Structural SIMilarity Index) 으로 비교한 결과 각각 4%와 3%의 향상된 결과를 확인하였다.

재무분야 감성사전 구축을 위한 자동화된 감성학습 알고리즘 개발 (Developing the Automated Sentiment Learning Algorithm to Build the Korean Sentiment Lexicon for Finance)

  • 조수지;이기광;양철원
    • 산업경영시스템학회지
    • /
    • 제46권1호
    • /
    • pp.32-41
    • /
    • 2023
  • Recently, many studies are being conducted to extract emotion from text and verify its information power in the field of finance, along with the recent development of big data analysis technology. A number of prior studies use pre-defined sentiment dictionaries or machine learning methods to extract sentiment from the financial documents. However, both methods have the disadvantage of being labor-intensive and subjective because it requires a manual sentiment learning process. In this study, we developed a financial sentiment dictionary that automatically extracts sentiment from the body text of analyst reports by using modified Bayes rule and verified the performance of the model through a binary classification model which predicts actual stock price movements. As a result of the prediction, it was found that the proposed financial dictionary from this research has about 4% better predictive power for actual stock price movements than the representative Loughran and McDonald's (2011) financial dictionary. The sentiment extraction method proposed in this study enables efficient and objective judgment because it automatically learns the sentiment of words using both the change in target price and the cumulative abnormal returns. In addition, the dictionary can be easily updated by re-calculating conditional probabilities. The results of this study are expected to be readily expandable and applicable not only to analyst reports, but also to financial field texts such as performance reports, IR reports, press articles, and social media.

위키피디아 기반 개체명 사전 반자동 구축 방법 (A Semi-automatic Construction method of a Named Entity Dictionary Based on Wikipedia)

  • 송영길;정석원;김학수
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1397-1403
    • /
    • 2015
  • 개체명은 다양한 자연어처리 연구 및 서비스에 중요한 정보로 이용된다. 개체명 인식의 성능을 향상시키기 위한 여러 연구에서 개체명 사전을 이용한 자질이 개체명 인식 성능에 큰 영향을 준다는 것을 보이고 있다. 그러나 개체명 사전을 구축하는 것은 매우 시간 소모적이고, 인력 소모적인 작업이다. 이를 완화하기 위해서 본 논문에서는 개체명 사전을 반자동으로 구축하는 방법을 제안한다. 제안 시스템은 능동학습을 이용하여 위키피디아 분류정보로 구성된 가상 문서를 개체명 범주 당 하나씩 생성한다. 그리고 잘 알려진 정보검색 모델인 BM25를 이용하여 위키피디아 엔트리와 가상문서 사이의 유사도를 계산한다. 마지막으로 유사도를 바탕으로 각 위키피디아 엔트리를 개체명 범주로 분류한다. 서로 다른 3종류의 개체명 범주 집합에서 실험한 결과, 제안 시스템은 매크로 평균 F1-점수 0.9028, 마이크로 평균 F1-점수 0.9554이라는 높은 성능을 보였다.

과학용어에 대한 '포털 사전', '표준국어대사전', '과학교과서' 설명의 비교 분석 (Comparison of the Explanation Texts for Science Terminology in Portal Dictionary, Pyojun Korean Dictionary and Science Textbooks)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권1호
    • /
    • pp.1-8
    • /
    • 2017
  • 학생들의 과학 학습 및 일반 대중의 과학적 소양 함양 측면에서 과학용어에 대한 이해도는 매우 중요하다. 본 연구에서는 학교 교육을 통한 과학용어 교육 이외에 학생들이나 일반 대중이 직접 과학용어의 의미를 찾아보고 학습할 수 있는 보조 자료가 필요하다는 전제에서 출발하여, 학생이나 일반인들이 스스로 과학용어를 학습하기 위한 보조 자료들인 포털사전, 표준국어대사전, 과학교과서에서 과학용어를 설명하는 글의 텍스트적 특성이 학생들이 읽고 이해하기에 얼마나 용이한지, 그리고 실제 학생들은 어떻게 인식하고 있는지를 살펴보았다. 그 결과 포털사전이나 표준국어대사전에 비해 과학교과서가 상대적으로 학생들이 읽고 이해하기에 쉬운 자료로 나타나기는 했으나, 세 자료 모두 학생들의 수준에 비해 이독성이 낮은 편에 속하며 이독성을 높이기 위해 개선해야 할 사항이 있는 것으로 나타났다.

청각장애인을 위한 정보통신용어 수화해설 사전 (The Expository Dictionary using the Sign Language about Information Communication for Deaf)

  • 김호용;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권4호
    • /
    • pp.217-222
    • /
    • 2005
  • 본 연구는 청각장애자에게 정보통신용어를 이해시키기 위한 수화해설 사전을 만드는 것이다. 청각장애인이 인터넷을 사용할 때, 자신의 의지를 표현하고 다양한 정보에 접근하는데 이 사전을 통하여 도움을 얻는 것이다. 일반인과 같이 효율적으로 인터넷을 이용하기 위해서, 청각장애인들은 정보통신용어를 먼저 이해해야만 한다. 이 사전을 만들기 위하여, 먼저 청각장애인을 정의하고 특성을 정의하고 이 사전을 설계하는 원칙을 설정하고 어떤 용어를 사전에 넣을지 선정한다. 용어를 설명할 때, 청각장애자에게 일반적인 표현을 사용하도록 하지만 때때로 수화비디오를 만들 때 용어의 본래 의미를 유지하면서 약간 수정했다. 본 연구를 정보 교육 학습 목적으로 적용해서 ICT의 이해에 대해 두 번의 실험을 했다.

  • PDF

글자 영상을 위한 학습기반 초고해상도 기법 (Learning-based Super-resolution for Text Images)

  • 허보영;송병철
    • 전자공학회논문지
    • /
    • 제52권4호
    • /
    • pp.175-183
    • /
    • 2015
  • 본 논문은 글자 영상을 효과적으로 확대 (up-scaling)하기 위한 학습 기반 초고해상도 (super-resolution; SR) 기법을 제안한다. 제안 기법은 크게 학습 단계와 합성 단계로 나뉜다. 학습 단계에서 다양한 HR (high-resolution) /LR (low-resolution) 글자 영상 쌍들을 수집한다. LR영상들은 양자화를 하고, 충분히 많은 수의 HR-LR 블록쌍들을 추출한다. 양자화된 LR블록을 기준으로 블록 쌍들을 소정의 개수의 클래스들로 구분한다. 클래스 별로 최적의 2D-FIR 필터 계수를 계산하고, 양자화한 후색인용 LR 블록과 함께 사전에 저장한다. 합성 단계에서 입력 LR 영상 내 각 블록을 양자화한 후 사전 내 양자화된 LR블록들과 정합하여 가장 근사한 블록에 대응하는 FIR 필터계수를 선정한다. 마지막으로 선택된 FIR필터로 HR 블록을 합성하여 최종적인 HR영상을 생성한다. 또한, 우리는 잡음이 있는 글자 영상에 대응하기 위해 학습과정에서 잡음 세기에 따른 복수개의 사전들을 제작한다. 입력 LR 영상의 잡음 레벨에 맞는 사전을 선택하여 HR영상을 합성한다. 실험 결과는 제안 기법이 종래 기법보다 잡음이 없는 환경에서는 물론 잡음이 있는 환경에서 우수한 주관적/객관적 화질을 가짐을 보인다.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

Domain Adaptation Image Classification Based on Multi-sparse Representation

  • Zhang, Xu;Wang, Xiaofeng;Du, Yue;Qin, Xiaoyan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권5호
    • /
    • pp.2590-2606
    • /
    • 2017
  • Generally, research of classical image classification algorithms assume that training data and testing data are derived from the same domain with the same distribution. Unfortunately, in practical applications, this assumption is rarely met. Aiming at the problem, a domain adaption image classification approach based on multi-sparse representation is proposed in this paper. The existences of intermediate domains are hypothesized between the source and target domains. And each intermediate subspace is modeled through online dictionary learning with target data updating. On the one hand, the reconstruction error of the target data is guaranteed, on the other, the transition from the source domain to the target domain is as smooth as possible. An augmented feature representation produced by invariant sparse codes across the source, intermediate and target domain dictionaries is employed for across domain recognition. Experimental results verify the effectiveness of the proposed algorithm.

Efficient and Secure Authenticated Key Exchange

  • Park Jong-Min
    • Journal of information and communication convergence engineering
    • /
    • 제3권3호
    • /
    • pp.163-166
    • /
    • 2005
  • The Key exchange protocols are very crucial tools to provide the secure communication in the broadband satellite access network. They should be required to satisfy various requirements such as security, Key confirmation, and Key freshness. In this paper, Two authenticated key exchange protocols TPEKE-E(Two Pass Encrypted Key Exchange-Exchange-Efficient) and TPEKE-S(Two Pass Encrypted Key xchange-Secure) are introduced. A basic idea of the protocols is that a password can be represented by modular addition N, and the number of possible modular addition N representing the password is $2^N$. The TPEKE-E is secure against the attacks including main-in-the-middle attack and off-line dictionary attack, and the performance is excellent so as beyond to comparison with other authenticated key exchange protocols. The TPEKE-S is a slight modification of the TPEKE-E. The TPEKE-S provides computational in feasibility for learning the password without having performed off line dictionary attack while preserving the performance of the TPEKE-E.

피셔 분별 사전학습을 이용해 개선된 Sparse 표현 기반 악성 종괴 검출 (Improvement of Sparse Representation based Classifier using Fisher Discrimination Dictionary Learning for Malignant Mass Detection)

  • 김성태;이승현;민현석;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제16권5호
    • /
    • pp.558-565
    • /
    • 2013
  • X-ray를 이용한 여성의 유방암 검사인 유방조영술은 유방암의 초기 단계에서의 진단을 위한 효과적인 방법이다. 컴퓨터 지원 검출(CAD) 시스템은 유방조영술을 통한 진단 시 의사가 놓치기 쉬운 유방암의 징후인 종괴의 검출을 도와 유방암 진단율을 높이는 수단이다. 종괴는 다양한 모양을 지니며 경계가 뚜렷하지 않기 때문에 검출이 어렵고 결과적으로 비-종괴 영역을 포함한 많은 수의 종괴 후보영역이 CAD 시스템에서 검출된다. 따라서 CAD 시스템 설계 시 검출된 많은 수의 종괴 후보영역으로부터 실제 악성 종괴 영역을 분류할 수 있도록 우수한 성능의 분류기가 요구된다. 본 논문에서는 피셔 분별 사전학습을 통해 개선된 Sparse 표현(SR) 기반 분류방법을 제안한다. 개선된 SR 기반 분류기가 기존의 CAD 시스템에서 주로 사용되어온 Support Vector Machine (SVM) 분류기 보다 우수함을 비교실험을 통해 확인했다.