• Title/Summary/Keyword: 단위 신경망

Search Result 218, Processing Time 0.027 seconds

A study on the Prosody Generation of Korean Sentences using Artificial Neural networks (인공 신경망을 이용한 한국어 문장단위 운율 발생에 관한 연구)

  • 이일구;민경중;강찬구;임운천
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.105-108
    • /
    • 1999
  • TTS(Text-To-Speech) 시스템 합성음성의 자연감을 개선하기 위해 하나의 언어에 대해 존재하는 운율 법칙을 정확히 구현해야 한다. 존재하는 운율 법칙을 추출하기 위해서는 방대한 분량의 언어 자료 구축이 필요하다. 그러나 이 방법은 존재하는 운율 현상이 포함된 언어자료에 대해 완벽한 운율을 파악할 수 없으므로 합성음성의 질을 좋게 할 수 없다. 본 논문은 한국어 음성의 운율을 학습하기 위해 2개의 인공 신경망을 제안한다. 하나의 신경망으로 문장의 각 음소에 대한 피치 변화를 학습시키는 것이며, 다른 하나는 에너지 변화를 학습하도록 하였다. 신경망은 BP 신경망을 이용하며 11개의 음소를 나타내기 위해 11개의 입력과, 중간 음소의 피치와 에너지 변화곡선을 근사하는 다항식 계수를 출력하도록 하였다. 신경망시스템의 학습과 평가에 앞서, 음성학적 균형잡힌 고립단어를 기반으로 의미있는 문장을 구성하였다. 문장을 남자 화자로 하여금 읽게 하고 녹음하여 음성 DB를 구축하였다. 음성 DB에 대해 각 음소의 운율 정보를 수집하여 신경망에 맞는 목표 패턴과 훈련 패턴을 작성하였다. 이 목표 패턴은 회귀분석을 통한 추세선을 이용해 피치와 에너지에 대한 2차 다항식계수로 구성하였다. 본 논문은 목표패턴에 맞는 신경망을 학습시켜 좋은 결과를 얻었다.

  • PDF

A Study on Development of Water Quality Prediction by Artificial neural network in Watershed of Nam River Using Probability Forecast (확률예보를 이용한 남강유역에서의 수질예측 ANN모형 개발 연구)

  • Jung, Woo Suk;Kim, Young Do;Kang, Boo Sik;Kim, Sung Eun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.26-26
    • /
    • 2017
  • 우리나라는 하천 및 호수 등 지표수에 대한 수자원 의존도가 매우 높다. 지표수는 태양광에 노출되어 있고, 기온의 영향을 직접 받기 때문에 기후변화에 대해 매우 민감한 수체이다. 기후변화로 인한 이상 저온, 이상 고온, 홍수, 가뭄 등의 자연 현상은 하천, 호수의 물리화학적 및 생태학적 특성을 변화(교란)시키고 있다. 이러한 기상현상에 변동되는 수질특성을 고려하여 기상청 확률기상예보를 구축된 인공신경망 예측모형의 입력인자로 적용하여 수질예보시스템을 개발하고자 하였다. 모형구축은 실제 일어난 기상관측자료와 요인분석을 통해 분류한 수질인자를 반영하여 단위유역별 수질예측을 위한 ANN학습을 실시하였다. 각 단위유역마다 기상요인의 공간적 세밀화 적용을 위해 각각 남강A, 남강B는 산청기상대, 남강C, 남강D는 진주기상대, 남강E는 의령기상대 자료를 이용하였으며, 수질항목은 DO, BOD, COD, TOC, T-P, SS 총 6개로 단위유역 5개에서 총 30개 예측모형 구축을 위한 자료를 수집하였다. 학습된 인공신경망 예측모형에 기상청 확률예보 값을 입력인자로 사용하여 모형평가를 실시하였다. 5개 단위유역 중 상대적으로 유역관리의 시급성을 고려하여 남강댐 하류 단위유역인 남강D, 남강E 인공신경망 모형의 입력자료로 적용하여 평가하였다.

  • PDF

Sentimental Analysis using the Phoneme-level Embedding Model (음소 단위 임베딩 모형을 이용한 감성 분석)

  • Hyun, Kyeongseok;Choi, Woosung;Jung, Soon-young;Chung, Jaehwa
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1030-1032
    • /
    • 2019
  • 형태소 분석을 통하여 한국어 문장을 형태소 단위의 임베딩 및 학습 관련 연구가 되었으나 최근 비정형적인 텍스트 데이터의 증가에 따라 음소 단위의 임베딩을 통한 신경망 학습에 대한 요구가 높아지고 있다. 본 논문은 비정형적인 텍스트 감성 분석 성능 향상을 위해 음소 단위의 토큰을 생성하고 이를 CNN 모형을 기반으로 다차원 임베딩을 수행하고 감성분석을 위하여 양방향 순환신경망 모델을 사용하여 유튜브의 비정형 텍스트를 학습시켰다. 그 결과 텍스트의 긍정 부정 판별에 있어 90%의 정확도를 보였다.

Automatic Word Spacing of the Korean Sentences by Using End-to-End Deep Neural Network (종단 간 심층 신경망을 이용한 한국어 문장 자동 띄어쓰기)

  • Lee, Hyun Young;Kang, Seung Shik
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.11
    • /
    • pp.441-448
    • /
    • 2019
  • Previous researches on automatic spacing of Korean sentences has been researched to correct spacing errors by using n-gram based statistical techniques or morpheme analyzer to insert blanks in the word boundary. In this paper, we propose an end-to-end automatic word spacing by using deep neural network. Automatic word spacing problem could be defined as a tag classification problem in unit of syllable other than word. For contextual representation between syllables, Bi-LSTM encodes the dependency relationship between syllables into a fixed-length vector of continuous vector space using forward and backward LSTM cell. In order to conduct automatic word spacing of Korean sentences, after a fixed-length contextual vector by Bi-LSTM is classified into auto-spacing tag(B or I), the blank is inserted in the front of B tag. For tag classification method, we compose three types of classification neural networks. One is feedforward neural network, another is neural network language model and the other is linear-chain CRF. To compare our models, we measure the performance of automatic word spacing depending on the three of classification networks. linear-chain CRF of them used as classification neural network shows better performance than other models. We used KCC150 corpus as a training and testing data.

Block-based Learned Image Compression for Phase Holograms (신경망 기반 블록 단위 위상 홀로그램 이미지 압축)

  • Seung Mi Choi;Su yong Bahk;Hyun Min Ban;Jun Yeong Cha;Hui Yong Kim
    • Journal of Broadcast Engineering
    • /
    • v.28 no.1
    • /
    • pp.42-54
    • /
    • 2023
  • It is an important issue to compress huge holographic data in a digital format. In particular, research on the compression of phase-only holograms for commercialization is noteworthy. Conventional video coding standards optimized for natural images are not suitable for compressing phase signals, and neural network-based compression model that can be optimized for phase signals can achieve high performance, but has a memory issue in learning high-resolution holographic data. In this paper, we show that by applying a block-based learned image compression model that can solve memory problems to phase-only holograms, the proposed method can demonstrate significant performance improvement over standard codecs even under the same conditions as block-based. Block-based learned compression model can provide compatibility with conventional standard codecs, solve memory problems, and can perform significantly better against phase-only hologram compression.

Character-Level Neural Machine Translation (문자 단위의 Neural Machine Translation)

  • Lee, Changki;Kim, Junseok;Lee, Hyoung-Gyu;Lee, Jaesong
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.115-118
    • /
    • 2015
  • Neural Machine Translation (NMT) 모델은 단일 신경망 구조만을 사용하는 End-to-end 방식의 기계번역 모델로, 기존의 Statistical Machine Translation (SMT) 모델에 비해서 높은 성능을 보이고, Feature Engineering이 필요 없으며, 번역 모델 및 언어 모델의 역할을 단일 신경망에서 수행하여 디코더의 구조가 간단하다는 장점이 있다. 그러나 NMT 모델은 출력 언어 사전(Target Vocabulary)의 크기에 비례해서 학습 및 디코딩의 속도가 느려지기 때문에 출력 언어 사전의 크기에 제한을 갖는다는 단점이 있다. 본 논문에서는 NMT 모델의 출력 언어 사전의 크기 제한 문제를 해결하기 위해서, 입력 언어는 단어 단위로 읽고(Encoding) 출력 언어를 문자(Character) 단위로 생성(Decoding)하는 방법을 제안한다. 출력 언어를 문자 단위로 생성하게 되면 NMT 모델의 출력 언어 사전에 모든 문자를 포함할 수 있게 되어 출력 언어의 Out-of-vocabulary(OOV) 문제가 사라지고 출력 언어의 사전 크기가 줄어들어 학습 및 디코딩 속도가 빨라지게 된다. 실험 결과, 본 논문에서 제안한 방법이 영어-일본어 및 한국어-일본어 기계번역에서 기존의 단어 단위의 NMT 모델보다 우수한 성능을 보였다.

  • PDF

Korean Phoneme Recognition Using Self-Organizing Feature Map (SOFM 신경회로망을 이용한 한국어 음소 인식)

  • 전용구
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1993.06a
    • /
    • pp.233-237
    • /
    • 1993
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 cluster로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사사에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means 클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해, 먼저, 우리말 음소들을 모음, 파열음, 마찰음, 파찰음, 유음 및 비음, 종성의 6개 음소군으로 분류하고 각 음소군에 대한 특징 지도를 구성하여 labeler의 기능을 수행하게 하였다. 화자 종속 인식실험 결과 87.2%의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

Modular neural network in prediction of protein function (단위 신경망을 이용한 단백질 기능 예측)

  • Hwang Doo-Sung
    • The KIPS Transactions:PartB
    • /
    • v.13B no.1 s.104
    • /
    • pp.1-6
    • /
    • 2006
  • The prediction of protein function basically make use of a protein-protein interaction map based on the concept of guilt-by-association. The method however cannot determine the functions of proteins in case that the target protein does not interact with proteins with known functions directly. This paper studies protein function prediction considering the given problem as a K-class classification problem and proposes a predictive approach utilizing a modular neural network. The proposed method uses interaction data and protein related attributes as well. The experimental results demonstrate that the proposed approach can predict the functional roles of Yeast proteins whose interaction knowledge is not known and shows better performance than the graph-based models that use protein interaction data.

MPEG Video Segmentation using Hierarchical Frame Search (계층적 프레임 탐색을 이용한 MPEG 비디오 분할)

  • 김주민;최영우;정규식
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.215-218
    • /
    • 2000
  • 디지털 비디오 데이터를 효율적으로 브라우징 하는데 필요한 비디오 분할에 관한 연구가 활발하게 진행되고 있다. 본 연구에서는 비디오 데이터를 Shot단위로 분할하고, Shot내부에서 카메라 동작과 객체 움직임 분석을 이용한 sub-shot으로 분할하고자 한다. 연구 방법으로는 I-frame의 DC 영상을 이용하여 픽쳐그룹을 Shot(장면이 바뀐 경우), Move(카메라 동작,객체움직임), Static(영상의 변화가 거의 없는 경우)로 세분화하고 해당 픽쳐 그룹의 P, B-frame을 검사하여 정확한 컷 발생 위치, 디졸브, 카메라동작, 객체 움직임을 검출하게 된다. 픽쳐그룹 분류에서 정확성을 높이기 위해 계층적 신경망과 다중 특징을 이용한다. 정확한 컷 발생위치 검출하기 위해서 P, B프레임의 메크로블럭 타입을 이용한 통계적 방법을 이용하고, 디졸브, 카메라 동작, 객체 움직임을 검출하기 위해서 P, B-frame의 메크로블럭 타입과 움직임 벡터를 이용한 신경망으로 검출한다. 본 연구에서는 계층적 탐색을 이용하여 시간을 단축할 수 있고, 계층적 신경망과 다중 특징을 이용하여 픽쳐 그룹을 세분화 할 수 있고, 메크로 블록 타입과 통계적 방법을 이용하여 정확한 컷 검출을 할수 있고, 신경망을 이용하여 디졸브, 카메라 동작, 객체움직임을 검출 할 수 있음을 확인한다.

  • PDF

Printed Name on ID Card recognition using a Hierachical Organized Neural Network (계층적 신경망을 이용한 주민등록증 성명인식)

  • 서원택;조범준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.325-327
    • /
    • 2003
  • 본 논문에서는 인쇄체 한글을 실용적으로 인식할 수 있는 계층적으로 구성한 신경망을 제안하고, 이를 이용해서 주민등록증의 성명을 인식하는데 적용하였다. 문자영상을 신경망을 이용하여 한글의 6가지 유형으로 먼저 분류한 후, 분류된 문자영상을 각 형식에 따라 자소단위로 분할해서 각 형식에 따른 신경망으로 인식하는 구조로 만들었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른것에 대해서 강인한 훈련을 할 수 있었다. 또한 입력단에서의 잡음을 줄이기 위해 히스토그램의 국부 평균을 적용하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF