통합 검색 | Korea Science

d-vector를 이용한 한국어 다화자 TTS 시스템 (A Korean Multi-speaker Text-to-Speech System Using d-vector)

김광현;권철홍
- 문화기술의 융합
- /
- 제8권3호
- /
- pp.469-475
- /
- 2022
딥러닝 기반 1인 화자 TTS 시스템의 모델을 학습하기 위해서 수십 시간 분량의 음성 DB와 많은 학습 시간이 요구된다. 이것은 다화자 또는 개인화 TTS 모델을 학습시키기 위해서는 시간과 비용 측면에서 비효율적 방법이다. 음색 복제 방법은 새로운 화자의 TTS 모델을 생성하기 위하여 화자 인코더 모델을 이용하는 방식이다. 학습된 화자 인코더 모델을 통해 학습에 사용되지 않은 새로운 화자의 적은 음성 파일로부터 이 화자의 음색을 대표하는 화자 임베딩 벡터를 만든다. 본 논문에서는 음색 복제 방식을 적용한 다화자 TTS 시스템을 제안한다. 제안한 TTS 시스템은 화자 인코더, synthesizer와 보코더로 구성되어 있는데, 화자 인코더는 화자인식 분야에서 사용하는 d-vector 기법을 적용한다. 학습된 화자 인코더에서 도출한 d-vector를 synthesizer에 입력으로 추가하여 새로운 화자의 음색을 표현한다. MOS와 음색 유사도 청취 방법으로 도출한 실험 결과로부터 제안한 TTS 시스템의 성능이 우수함을 알 수 있다.
https://doi.org/10.17703/JCCT.2022.8.3.469 인용 PDF KSCI

한·중·일 IoT홈 가전생활재의 지능형 기능성 비교연구 (Comparative Analysis on Smart Features of IoT Home Living Products among Korea, China and Japan)

장순순;이연숙;황지혜;박재현
- 디자인융복합연구
- /
- 제15권2호
- /
- pp.237-250
- /
- 2016
급속도로 발달한 정보기술은 산업환경 전반에 걸쳐 정보와 기능의 통합화를 이루며 우리 생활에 많은 영향을 미치고 있다. 특히 사물인터넷(IoT), 클라우드 컴퓨팅, 빅 데이터 분석 등 새로운 통신 환경의 출현은 인터넷을 중심으로 한 모든 전자기기들의 연결을 가능하게 함에 따라 이제는 산업 환경을 넘어 주거환경까지 변화시키는 중요한 매체로 주목받고 있다. 이에 따라 본 연구의 목적은 고도로 발전하는 기술과 함께 진화하는 주거환경의 스마트 가전의 유형과 그 특성을 파악하고자 하는 것이다. 그리고 이를 위해 한국, 중국, 일본의 대표적인 브랜드 상품((Samsung, Haier, Panasonic)을 선정하여 각 특성을 비교 분석 하였다. 선정된 브랜드는 GHA(General rules of intelligentization technology for intelligent household appliances)의 스마트 가전 적용 기준을 활용하여 각 유형을 분석하였다. 분류된 유형은 스마트 가전 사용자가 자율적(Self)으로 학습, 활용, 적용, 진단, 추론, 구성, 조절 등이 가능한 7가지의 유목으로 나누어졌으며, 이를 기준으로 나타난 각 국가별 브랜드 상품은 의(Clothing), 식(Food), 주(Housing)의 범주로 체계화 하였다. 브랜드별 나타난 주요 특성으로는 한국의 삼성은 원격제어 기능이, 중국의 하이얼은 전자기술의 적용이, 일본의 파나소닉은 에코나비(ECONAVI)인 에너지 절약 시스템으로 나타났다.

교모세포종 환자의 T1CE 영상 생성 및 암 영역분할을 위한 멀티 태스크 심층신경망 모델 (Multi-task Deep Neural Network Model for T1CE Image Synthesis and Tumor Region Segmentation in Glioblastoma Patients)

김은진;박현진
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2021년도 춘계학술대회
- /
- pp.474-476
- /
- 2021
신경 교세포에서 발생하는 가장 흔한 뇌 악성종양인 교모세포종은 조기 진단 및 치료계획 수립이 중요하다. 주로 조영제를 통해 촬영된 T1CE 영상을 통해 암의 진단이 이뤄지는데, 최근 가돌리늄 기반 조영제 주입의 위험이 보고되고 있다. 의료영상에서 새로운 영상을 합성하는 GAN 모델과 영역분할에 대한 심층신경망 모델에 대한 연구가 활발히 진행되고 있다. 본 연구에서는 교모세포종 환자의 T1CE 영상의 생성과 암의 영역분할을 동시에 학습하는 하나의 모델을 제안한다. 제안된 모델의 성능은 평균 제곱오차, 최대신호대잡음비 등의 유사성 측정을 통해 평가되어 0.002, 55dB의 평균 결과 값을 보여준다.
PDF

Visual Model of Pattern Design Based on Deep Convolutional Neural Network

Jingjing Ye;Jun Wang
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제18권2호
- /
- pp.311-326
- /
- 2024
The rapid development of neural network technology promotes the neural network model driven by big data to overcome the texture effect of complex objects. Due to the limitations in complex scenes, it is necessary to establish custom template matching and apply it to the research of many fields of computational vision technology. The dependence on high-quality small label sample database data is not very strong, and the machine learning system of deep feature connection to complete the task of texture effect inference and speculation is relatively poor. The style transfer algorithm based on neural network collects and preserves the data of patterns, extracts and modernizes their features. Through the algorithm model, it is easier to present the texture color of patterns and display them digitally. In this paper, according to the texture effect reasoning of custom template matching, the 3D visualization of the target is transformed into a 3D model. The high similarity between the scene to be inferred and the user-defined template is calculated by the user-defined template of the multi-dimensional external feature label. The convolutional neural network is adopted to optimize the external area of the object to improve the sampling quality and computational performance of the sample pyramid structure. The results indicate that the proposed algorithm can accurately capture the significant target, achieve more ablation noise, and improve the visualization results. The proposed deep convolutional neural network optimization algorithm has good rapidity, data accuracy and robustness. The proposed algorithm can adapt to the calculation of more task scenes, display the redundant vision-related information of image conversion, enhance the powerful computing power, and further improve the computational efficiency and accuracy of convolutional networks, which has a high research significance for the study of image information conversion.
https://doi.org/10.3837/tiis.2024.02.003 인용 PDF HTML

POST-TAVR ECG 기반의 PPI 예측 모델 연구 (Research of PPI prediction model based on POST-TAVR ECG)

송인서;양세모;이강윤
- 인터넷정보학회논문지
- /
- 제25권2호
- /
- pp.29-38
- /
- 2024
경피적 대동맥 판막 치환술(TAVR) 후에는 인공 심박동기 삽입술(PPI)을 비롯한 TAVR 이후 합병증에 대한 철저한 관리가 필요하며 그에 따라 정확한 예측 모델에 대한 필요성이 점점 증가하고 있다. 본 연구는 기존의 이미지 의존적 방법론에서 벗어나 ECG 정보를 중심으로 예측하는 XGBoost 기반의 최적의 PPI 예측 모델을 개발했다. 이 모델은 심전도상의 특정 신호들인 DeltaPR, DeltaQRS 등을 주요 지표로 삼아, 환자의 전도 장애 및 PPI와의 연관성을 파악하며, 기존의 이미지와 ECG 데이터를 결합한 모델과 ECG 기반의 모델 보다 뛰어난 AUC 0.91 성능을 달성하였다. 본 연구에서 제안하는 모델은 두 병원의 데이터를 기반으로 최적의 PPI 예측 모델을 구현 및 검증하였으며, 검증 결과 ECG 데이터의 특성이 PPI 예측에 큰 영향을 미치며 95.28%의 높은 유사도를 보였다. 이로써 본 연구의 예측 모델이 다양한 병원 데이터에도 효과적으로 적용될 수 있음을 확인하였다. 최적의 머신러닝 알고리즘을 사용하여 PPI와 각 특성 간의 상관관계를 명확히 했으며, 고비용의 의료 이미지에 의존하지 않고 ECG 데이터를 사용하여 높은 정확도로 PPI를 예측할 수 있음을 입증하였다. 이는 의료 결정 과정에서 인간 개입의 의존도를 줄이며, 신뢰할 수 있고 실용적인 PPI 예측 모델 개발로의 중요한 진전을 의미한다.
https://doi.org/10.7472/jksii.2024.25.2.29 인용 PDF HTML

Improving Accuracy of Chapter-level Lecture Video Recommendation System using Keyword Cluster-based Graph Neural Networks

Purevsuren Chimeddorj;Doohyun Kim
- 한국컴퓨터정보학회논문지
- /
- 제29권7호
- /
- pp.89-98
- /
- 2024
본 논문은 챕터 수준의 강의 동영상 추천 시스템에 있어서 추천의 정확도와 처리속도 간의 균형문제, 즉, 추천 정확도를 향상시키려면 처리 속도가 저하되고, 반대로 처리 속도를 높일 경우 정확도가 감소하는 문제에 대하여 연구한다. 본 논문에서는 이의 해결을 위하여 TF-IDF, K-Means++ Clustering, Graph Neural Network(GNN) 등 다양한 기법을 복합적으로 활용하는 방법을 제안한다. 즉, 챕터들의 유사성을 바탕으로 클러스터를 사전에 구성함으로써 검색 시의 계산량을 줄여 속도를 향상시키면서도, 클러스터를 노드로 하는 그래프에 대하여 GNN을 적용함으로써 추천의 정확도를 향상시키는 방법을 제안한다. 실험 결과 GNN을 사용한 경우 추천의 정확도가 MRR 지표에서 약 19.7% 증가하였으며, 유사도 기반의 정밀도에 있어서 약 27.7% 증가하는 결과를 확인할 수 있었다. 이를 통해 학습자의 질의에 보다 적합한 동영상 챕터를 추천하는 학습시스템 구축에 기여할 것으로 기대한다.
https://doi.org/10.9708/jksci.2024.29.07.089 인용 PDF HTML

머신러닝을 이용한 탄성파 반사법 자료의 해저면 겹반사 제거 (Removal of Seabed Multiples in Seismic Reflection Data using Machine Learning)

남호수;임보성;권일룡;김지수
- 지구물리와물리탐사
- /
- 제23권3호
- /
- pp.168-177
- /
- 2020
해저면 탄성파 겹반사는 발파점 모음자료와 겹쌓기 단면에서 모두 일차 반사파의 해석에 잘못된 결과를 초래할 수 있다. 따라서, 해저면 겹반사는 자료처리를 통해 제거해야 한다. 전통적인 자료처리 과정에서 겹반사 제거는 예측오차 곱풀기와 라돈 필터링 등과 같은 모델-기반 기법과 지표관련-겹반사제거와 같은 데이터-기반 기법에 의해 이루어져 왔다. 그러나 대다수의 자료처리 과정들은 방대한 컴퓨터 자원과 전문적인 자료처리 기법뿐만 아니라 자료처리 변수들을 테스트하고 선택하는데 많은 시간을 필요로 한다. 이 논문에서는 머신러닝 시스템을 활용한 해저면 겹반사의 제거효과를 살펴보기 위해 Marmousi2 속도모델에 대한 수치모델링으로 겹반사가 포함된 입력데이터와 겹반사가 포함되지 않은 레이블데이터를 생성하였다. 수직시간차가 보정된 공통중간점 모음자료로 훈련데이터를 구성하였으며 인공신경망은 U-Net 모델을 적용하였다. 해저면 겹반사를 제거하기 위해 훈련된 모델은 레이블데이터에 거의 근접하는 예측 결과를 만들어내며, 현장자료에 대한 예측 테스트에서 해저면 겹반사를 효과적으로 제거하는 것으로 나타났다.
https://doi.org/10.7582/GGE.2020.23.3.00168 인용 PDF KSCI

적대적생성신경망을 이용한 연안 파랑 비디오 영상에서의 빗방울 제거 및 배경 정보 복원 (Raindrop Removal and Background Information Recovery in Coastal Wave Video Imagery using Generative Adversarial Networks)

허동;김재일;김진아
- 한국컴퓨터그래픽스학회논문지
- /
- 제25권5호
- /
- pp.1-9
- /
- 2019
본 논문에서는 강우시 빗방울로 인해 왜곡된 연안 파랑 비디오 영상에서 빗방울 제거와 제거된 영역에 대한 배경 정보를 복원하기 위한 적대적생성신경망을 이용한 영상 강화 방법을 제안하고자 한다. 영상 변환에 널리 사용되는 Pix2Pix 네트워크와 현재 단일 이미지에 대한 빗방울 제거에 좋은 성능을 보여주고 있는 Attentive GAN을 실험 대상 모델로 구현하고, 빗방울 제거를 위한 공개 데이터 셋을 이용하여 두 모델을 학습한 후 빗방울 왜곡 연안 파랑 영상의 빗방울 제거 및 배경 정보 복원 성능을 평가하였다. 연안 파랑 비디오에 영상에 대한 빗방울 왜곡 보정 성능을 향상시키기 위해 실제 연안에서 빗방울 유무가 짝을 이룬 데이터 셋을 직접 획득한 후 사전 학습된 모델에 대하여 전이 학습에 사용하여 빗방울 왜곡 보정에 대한 성능 향상을 확인하였다. 모델의 성능은 빗방울 왜곡 영상으로부터 파랑 정보 복원 성능을 최대 신호 대 잡음비와 구조적 유사도를 이용하여 평가하였으며, 전이 학습을 통해 파인 튜닝된 Pix2Pix 모델이 연안 파랑 비디오 영상의 빗방울 왜곡에 대한 가장 우수한 복원 성능을 보였다.
https://doi.org/10.15701/kcgs.2019.25.5.1 인용 PDF KSCI

워드넷 기반 특징 추상화를 통한 웹문서 자동분류시스템의 성능향상 (Improving Hypertext Classification Systems through WordNet-based Feature Abstraction)

노준호;김한준;장재영
- 한국전자거래학회지
- /
- 제18권2호
- /
- pp.95-110
- /
- 2013
본 논문은 기계학습 기법에 기반한 웹문서 자동분류 시스템의 성능을 높이기 위한 새로운 형태의 특징가공 기법을 제안한다. 제안 기법은 하이퍼텍스트 웹문서에 대한 자동분류를 효과적으로 수행하기 위해 하이퍼링크 관계를 활용하여 특징 집합을 확장시킨다. 웹문서는 하이퍼링크 관계를 통해 서로 연결된 구조를 가지며, 그 관계는 많은 경우 연관도가 높은 문서들 간에 존재한다. 이러한 링크 정보가 분류모델의 주요 인자가 되는 특징 집합의 질을 높이는 중요한 역할을 수행할 수 있다. 제안 기법의 기본 아이디어는 워드넷 온톨로지를 기반으로 분류 대상 문서와 인접 문서들에 포함된 단어(특징)들 간의 의미적 유사도를 평가함으로써 다수의 특징들로 구성된 추상화된 개념적 특징을 생성하는 것이다. 여기서 유사도 함수는 워드넷 안에서 특징들 간의 상/하위어 관계 정보를 정량적으로 계산하게 된다. 분류모델의 구축시 추상화된 개념 특징은 일반 특징과 동일하게 간주하여 보다 정확한 분류 모델을 구축하는데 기여한다. Web-KB 문서집합을 이용한 실험을 통해 제안 기법이 기존 기법 보다 우수함을 보였다.
https://doi.org/10.7838/jsebs.2013.18.2.095 인용 PDF KSCI

확장된 RNN을 활용한 사람재인식 시스템에 관한 연구 (A Study on Person Re-Identification System using Enhanced RNN)

최석규;허문걸
- 한국인터넷방송통신학회논문지
- /
- 제17권2호
- /
- pp.15-23
- /
- 2017
사람의 빈번한 자세 변화, 그리고 background clutter과 occlusion으로 인해 Person Re-identificatio는 컴퓨터 비전 분야에서 가장 어려운 부분이다. 비겹침 카메라의 이미지는 어떤 사람을 다른 사람과 구별하기 어렵게 한다. 더욱 나은 성능 일치를 달성하기 위해 대부분의 방법은 특징 선택과 거리 메트릭을 개별적으로 사용한다. 그렇게 차별화된 표현과 적절한 거리를 얻을 수 있고, 사람과 중요한 특징의 무시 사이의 유사성을 설명할 수 있다. 이러한 상황은 우리가 이 문제를 다루는 새로운 방법을 고려하도록 한다. 본 논문에서는 Person Re-identification를 위한 3단 계층네트워크를 갖는 향상되고 반복적인 신경 회로망을 제안하였다. 특히 RNN(Revurrent Neural Network) 모델은 반복적인 EM(Expectation Maximum) 알고리즘과 3단 계층 네트워크를 포함하고, 차별적 특징과 지표 거리를 공동으로 학습한다. 반복적인 EM 알고리즘은 RNN 이전에 연속해 있는 CNN(Convoutional Neural Network)의 특징 추출 능력을 충분히 사용할 수 있다. 자율 학습을 통해 EM 프레임 워크는 패치의 레이블을 변경하고 더 큰 데이터 세트를 훈련할 수 있다. 네트워크를 더 잘 훈련시키기 위해 3단 계층 네트워크를 통해 CNN, RNN 및 풀링 계층이 공동으로 특징 추출을 할 수 있다. 실험 결과에 따르면 비전처리 분야에서 다른 연구자의 접근 방식과 비교할 때 이 방법은 경쟁력 있는 정확도를 얻을 수 있다. 이 방법에 대한 다른 요소의 영향은 향후 연구에서 분석되고 평가될 것이다.
https://doi.org/10.7236/JIIBC.2017.17.2.15 인용 PDF KSCI

검색결과 499건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)