통합 검색 | Korea Science

효과적인 복소 스펙트럼 기반 음성 향상을 위한 시간과 주파수 영역 손실함수 조합에 관한 연구 (A study on loss combination in time and frequency for effective speech enhancement based on complex-valued spectrum)

정재희;김우일
- 한국음향학회지
- /
- 제41권1호
- /
- pp.38-44
- /
- 2022
잡음에 오염된 음성의 명료도와 음질을 향상시키고자 음성 향상을 수행한다. 본 연구에서는 복소값 스펙트럼을 이용한 마스크기반 음성 향상에서 시간 영역 손실함수와 주파수 영역 손실함수에 따른 학습 결과를 비교하였다. 시간 영역의 음성 파형과 주파수 영역의 스펙트럼의 세부정보를 고려해 두 영역의 장점을 활용할 수 있도록 손실함수 조합에 관해 연구를 진행하였다. 시간 영역 손실함수는 Scale Invariant-Source to Noise Ratio(SI-SNR)을 이용해 계산하고, 주파수 영역 손실함수는 복소값 스펙트럼과 크기 스펙트럼을 Mean Squared Error(MSE)로 계산하여 사용하였고, sin 함수를 이용해 위상에 대한 손실함수를 계산하였다. 손실함수 조합은 시간 영역 손실함수인 SI-SNR과 각 주파수 영역 손실함수를 조합하였다. 또한 크기 값과 위상 값을 모두 고려할 수 있도록 SI-SNR과 크기 스펙트럼, 위상에 관련된 손실함수들도 조합하여 실험을 진행하였다. 음성 향상 결과는 Source-to-Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를이용해 성능 비교 평가를 진행하였다. 음성 향상 결과를 확인해보기 위해 스펙트럼 상에서 비교를 진행하였다. TIMIT 데이터베이스를 이용한 실험 결과, 시간 영역 또는 주파수 영역 손실함수보다 SI-SNR과 크기 스펙트럼을 조합한 손실함수를 사용하여 음성 향상을 학습했을 때 가장 높은 성능을 보였다.
https://doi.org/10.7776/ASK.2022.41.1.038 인용 PDF KSCI

유사도를 활용한 맞춤형 보험 추천 시스템 (Personalized insurance product based on similarity)

김준성;조아라;오하영
- 한국정보통신학회논문지
- /
- 제26권11호
- /
- pp.1599-1607
- /
- 2022
저출산과 노령화로 보험 수요가 지속해서 감소하고 있다. 나아가 언택트 소비가 주류가 되면서 기존의 대면 서비스를 중심으로 한 보험상품 마케팅은 실효성이 크게 떨어지고 있다. 그러므로 보험업계는 비대면 서비스를 기반으로 한 새로운 마케팅이 절실한 시점이다. 확보된 내 외부 및 공공데이터를 바탕으로 보험 트렌드를 반영한 맞춤형 전략을 통해 기존 고객의 로열티를 강화하고 신규 고객을 확보할 수 있는 개인 맞춤형 보험 상품 추천시스템을 제안하고자 한다. 보험회사 데이터베이스에 등록된 고객을 대상으로 공공 데이터(시군구별 총인구수, 건강생활 실천율, 고령 인구 비율, 출생률, 노인여가복지 수, 연령대별 경제활동참가율 등), 고객 개인정보 및 기 계약 정보를 사용하여 인구통계학 기반과 모델 기반 추천시스템을 설계하였다. 인구통계학 기반 추천시스템은 군집화된 고객 내 코사인 유사도를 계산하여 유사도가 높은 고객들이 많이 가입한 보험상품을 추천하였다. K-means를 이용한 군집화 방식과 고객의 지역, 성별 및 연령대 기준의 Segmentation 방식으로 각각 수행하였다. 모델 기반 추천시스템은 Decision Tree, Random Forest Classifier를 사용하여 각각 추천시스템을 설계하였다. 본 연구 결과 군집 된 고객 간 코사인 유사도를 활용한 인구통계학 기반 추천시스템의 성능이 가장 우수하였다. 이는 개인의 특성(성별, 나이 등) 및 환경적인(경제력, 직업 거주지역 등) 요소에 따라 보험 상품을 선택하기 때문에 고객 간 유사도가 보험 추천시스템의 성능에 주요 요소인 것을 보여준다.
https://doi.org/10.6109/jkiice.2022.26.11.1599 인용 PDF KSCI

첨단 지상파항법시스템(eLoran) 시범서비스의 LDC 메시지 변조기법에 따른 수신성능 분석 (Analysis of LDC Message Reception Performance of Korean eLoran Pilot Service according to Modulation Methods)

손표웅;이삭;황태현;서기열
- 한국항해항만학회지
- /
- 제46권6호
- /
- pp.525-529
- /
- 2022
eLoran 시스템에서 보다 높은 정확도로 시각 및 위치 정보를 제공하기 위해 별도의 데이터 채널인 Loran Data Channel (LDC)를 사용한다. LDC 메시지는 기존의 8개의 Loran 펄스 중 항법에 사용하지 않는 3-8번째 펄스의 전송시각을 변조하여 송출하는 Eurofix 방식과 9번째 추가 펄스를 이용해 데이터를 변조하는 9^th 펄스 방식으로 변조될 수 있다. 본 논문에서는 eLoran 송신국에서 송출하는 LDC 메시지의 변조방법에 따른 수신 성능을 분석하였다. 인천에 설치하여 시범운영 중인 eLoran 시험 송신국에서 9^th 펄스 변조방법과 Eurofix 변조방법으로 동시에 LDC 메시지를 송출할 수 있도록 설정하고, 인천과 평택의 eLoran 보정기준국의 데이터베이스 내 저장된 LDC 메시지를 분석해 변조방법에 따른 LDC 메시지 수신률을 분석하였다. 또한 항로표지 관리선 인성 1호를 이용해 인천항 인근에서 실제 사용자의 LDC 메시지 수신률을 분석하였다. 본 연구결과는 향후 정식 eLoran 서비스 과정에서 공식적인 LDC 방송 메시지를 확정하기 위한 기술자료로 활용될 수 있을 것이다.
https://doi.org/10.5394/KINPR.2022.46.6.525 인용 PDF KSCI

기계학습을 통한 토양오염물질 농도 예측 및 분포 매핑 (Predicting Concentrations of Soil Pollutants and Mapping Using Machine Learning Algorithms)

강혜원;박상진;이동근
- 환경영향평가
- /
- 제31권4호
- /
- pp.214-225
- /
- 2022
본 연구는 사업시행이 환경에 미치는 부정적 영향을 최소화할 수 있는 방안을 강구하기 위해 환경영향평가 토양 부문을 강조하였다. 영향평가 절차에 대한 일련의 노력으로서 도시개발사업을 대상으로 하는 국가 인벤토리 기반 데이터베이스를 구축하였으며, 세 가지 기계학습 모델 성능 평가 및 토양오염물질 농도분포 매핑을 진행하였다. 여기에서, 가장 우수한 성능을 보여준 Random Forest 모델을 사용하여 대한 민국 수도권 지역을 대상 9가지 토양오염물질을 매핑하였다. 본 연구의 결과는 도시화가 가장 활발한 서울지역에서 아연(Zn), 불소(F) 및 카드뮴(Cd) 농도가 상대적으로 우려되는 것을 발견하였다. 또한, 수은(Hg)과 크롬(Cr6+)의 경우 농도가 기준 이하로 검출되었는데, 이는 중금속 농도에 영향을 미치는 산업 및 공업단지와 같은 오염원 부족이 원인으로 도출되었다. 토양오염물질 공간분포 매핑을 통해 토양특성 및 토지이용 유형과 오염물질 간의 유의한 상관관계를 유추하였다. 이를 통해 사업 현장 위치에 관한 토양오염 최소화 및 계획 결정에 대한 효율적인 토양관리 방안을 구축할 수 있을 것으로 기대한다.
https://doi.org/10.14249/eia.2022.31.4.214 인용 PDF KSCI

전통적인 통계와 기계학습 기반 중국 문화산업 기업의 재무적 곤경 예측모형 연구 (Research on Financial Distress Prediction Model of Chinese Cultural Industry Enterprises Based on Machine Learning and Traditional Statistical)

원도;왕콘;란희;배기형
- 한국콘텐츠학회논문지
- /
- 제22권2호
- /
- pp.545-558
- /
- 2022
본 연구의 목적은 전통적인 통계과 기계학습(Machine Learning)을 통해 중국 문화산업 기업의 재무적 곤경을 정확하게 예측하는 분석 모형을 탐색하는 데 있다. 예측모형을 구축하기 위하여 중국 128개 문화산업상장 기업의 데이터를 수집하였다. 25개 설명변수로 이뤄진 데이터베이스를 토대로 판별분석과 로지스틱 회귀(Logistic) 등 전통적인 통계 방법과 서포트 벡터 기계(SVM), 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest) 등 기계학습을 이용한 예측모형을 구축하고 각 모형의 성능 평가를 위해 Python 소프트웨어를 사용한다. 분석 결과, 예측 성능이 가장 좋은 모형은 랜덤 포레스트(Random Forest) 모형으로 95%의 정확도를 보였다. 그 다음은 서포트 벡터 기계(SVM) 모형으로 93%의 정확도를 보였다. 그 다음은 결정 트리(Decision Tree) 모형으로 92%의 정확도를 보였다. 그 다음은 판정분석 모형으로 89%의 정확도를 보였다. 예측 효과가 가장 낮은 모형은 로지스틱 회귀(Logistic) 모형으로 88%의 정확도를 보였다. 이는 중국 문화산업 기업의 재무적 곤경을 예측하면서 기계학습 모형이 전통적인 통계 모형보다 더 좋은 예측 효과를 얻을 수 있음을 설명한다.
https://doi.org/10.5392/JKCA.2022.22.02.545 인용 PDF KSCI HTML

균등거리 기준 조명 맵과 색 상관성을 이용한 조명 색도 추정 (Estimation of Illuminant Chromaticity by Equivalent Distance Reference Illumination Map and Color Correlation)

김정엽
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제12권6호
- /
- pp.267-274
- /
- 2023
본 논문에서는 입력 영상에 대한 촬영 장면의 조명 색도를 추정하는 방법을 제안한다. 조명 기준영역을 이용하여 입력영상의 촬영 장면에 가장 근접한 조명 색도를 추정한다. 기존의 방법은 일정한 수의 기준조명 정보를 이용한다. 입력 영상으로부터 화소의 색도분포 정보와 기준 조명에 대한 미리 준비된 색도 집합을 대조하여 겹치는 면적이 가장 큰 기준 조명을 해당 입력 영상에 대한 장면 조명으로 간주한다. 겹치는 면적을 계산하는 과정에서 각 기준 조명에 대한 가중치를 가우시안 분포 형태로 적용하였으나, 분산 값에 대하여 명확한 기준을 제시하지 못하였다. 제안한 방법은 주어진 기준조명으로부터 독립적인 기준색도 영역을 추출하고, 입력영상의 모든 화소에 대하여 RGB 칼라좌표계의 r-g 색도 평면에서의 특징치를 계산한 다음, 독립적인 색도영역과 입력영상으로부터의 특징치를 이용하여 유사도를 평가한다. 유사도가 가장 높게 나타나는 조명을 해당 영상의 조명 색도 성분으로 추정하였다. 데이터베이스의 영상과 기준조명 색도를 이용한 성능평가에서 제안한 방법은 기존의 기본 방법에 비하여 평균 60% 정도의 개선을 보였고, 기존의 가우시안 분산 값이 0.1인 경우에 비하여 53% 내외의 개선 성능을 보였다.
https://doi.org/10.3745/KTSDE.2023.12.6.267 인용 PDF

빅데이터 분석 시스템 구현을 위한 데이터 구조의 복잡성에 따른 MongoDB 환경 구성 연구 (Study of MongoDB Architecture by Data Complexity for Big Data Analysis System)

이협건;김영운;이진우;이승현
- 한국정보전자통신기술학회논문지
- /
- 제16권5호
- /
- pp.354-361
- /
- 2023
빅데이터 분석 시스템들은 다양한 형태의 방대한 데이터를 저장 및 처리, 분석을 위해 MongoDB와 같은 NoSQL 데이터베이스를 적용한다. MongoDB는 환경 구성에 따라 분산 처리 및 데이터 복제를 통해 확장성과 빠른 데이터 처리 속도를 제공한다. 본 논문에서는 구현하는 빅데이터 분석 시스템에 적합한 MongoDB 환경 구성에 대해 연구한다. 성능 평가를 위한 환경은 크게 싱글 노드와 다중 노드 환경으로 구성하였으며, 다중 노드 환경은 데이터 노드의 수를 2대에서 3대까지 확장하여 각 환경별 성능을 측정하였다. 분석 결과, 3차원 이상의 복잡한 데이터 구조의 데이터 처리 속도는 싱글 노드 환경이 2개의 데이터 노드 환경에 비해 약 5.75% 빠르게 처리하지만,3개의 데이터 노드 환경은 싱글 노드 환경에 비해 약 25.15% 이상 빠르게 처리한다. 그러나 데이터 구조가 단순한 1차원 데이터 구조는 다중 노드 환경이 싱글 노드 환경에 비해 약 28.63% 빠르게 처리한다. 향후 본 연구를 기반으로 다양한 데이터 구조 및 방대한 양의 데이터를 통한 실질적인 검증이 필요하다.
https://doi.org/10.17661/jkiiect.2023.16.5.354 인용 PDF HTML

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

홍주표;고태영
- 터널과지하공간
- /
- 제33권6호
- /
- pp.594-609
- /
- 2023
TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.
https://doi.org/10.7474/TUS.2023.33.6.594 인용 PDF

ART2 기반 RBF 네트워크와 얼굴 인증을 이용한 주민등록증 인식 (Recognition of Resident Registration Card using ART2-based RBF Network and face Verification)

김광백;김영주
- 지능정보연구
- /
- 제12권1호
- /
- pp.1-15
- /
- 2006
우리나라의 주민등록증은 주소지, 주민등록번호, 얼굴사진, 지문 등 개인의 다양한 정보를 가진다. 현재의 플라스틱형 주민등록증은 위조 및 변조가 쉽고 그 수법이 날로 전문화 되어가고 있다. 따라서 육안으로 위조 및 변조 사실을 쉽게 확인하기가 어려워 사회적으로 문제를 일으키고 있다. 이에 본 논문에서는 개선된 ART2 기반 RBF 네트워크에 이용한 주민등록번호 인식과 얼굴 인증을 통한 주민등록증 자동 인식 방법을 제안한다. 제안된 방법은 주민등록증 영상으로부터 주민등록번호와 발행일을 추출하기 위하여 주민등록증 영상에 소벨 마스킹와 미디언 필터링을 적용한 후에 수평 스미어링을 적용하여 주민등록번호와 발행일 영역을 추출한다. 그리고 원영상에 대해 고주파 필터링을 적용하여 영상 전체를 이진화하고, 이진화된 영상에 CDM 마스크를 적용하여 주민등록번호와 발행일 코드를 복원한 다음, 검출된 각 영역에 대해 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 문자를 추출한다. 추출된 주민등록번호 등의 개별 문자를 인식하기 위해 개선된 ART2 기반 RBF 네트워크를 제안하고 인식에 적용한다. 제안된 ART2 기반 RBF 네트워크는 학습 성능을 개선하기 위하여 중간층과 출력층의 학습에 퍼지 제어 기법을 적용하여 학습률을 동적으로 조정한다. 얼굴 인증은 템플릿 매칭 알고리즘을 이용하여 얼굴 템플릿 데이터베이스를 구축하고 주민등록증에서 추출된 얼굴 영역과의 유사도를 측정하여 주민등록증 얼굴 영역의 위조여부를 판별한다. 제안된 주민등록증 인식 방법의 성능을 평가하기 위해 원본 주민등록증 영상에 대해 얼굴 영역 위조, 노이즈추가, 대비 증감, 밝기 증감 그리고 영상 흐리기 등의 변형된 영상들을 생성하여 실험한 결과, 제안된 방법이 주민등록번호 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다
PDF

강수-일유출량 추정 LSTM 모형의 구축을 위한 자료 수집 방안 (Data collection strategy for building rainfall-runoff LSTM model predicting daily runoff)

김동균;강석구
- 한국수자원학회논문집
- /
- 제54권10호
- /
- pp.795-805
- /
- 2021
본 연구는 소양강댐 유역을 대상으로 LSTM 기반의 일유출량 추정 딥러닝 모형을 개발한 후, 모형구조 및 입력자료의 다양한 조합에 대한 모형의 정확도를 살폈다. 첫 12년(1997.1.1-2008.12.31) 동안의 유역평균 일강수량, 일기온, 일풍속 (이상 입력), 일평균 유량 (출력)으로 이루어진 데이터베이스를 기반으로 모형을 구축하였으며, 이후 12년(2009.1.1-2020.12.31) 동안의 자료를 사용하여 Nash-Sutcliffe Model Efficiency Coefficient (NSE)와 RMSE를 살폈다. 가장 높은 정확도를 보인 조합은 64개의 은닉유닛을 가진 LSTM 모형 구조에 가능한 모든 입력자료(12년치의 일강수량, 일기온, 일풍속)를 활용한 경우로서 검증기간의 NSE와 RMSE는 각각 0.862와 76.8 m³/s를 기록하였다. LSTM의 은닉유닛이500개를 초과하는 경우 과적합으로 인한 모형의 성능 저하가 나타나기 시작했으며, 1000개를 초과하는 경우 과적합 문제가 두드러졌다. 12년치의 일강수만 입력자료로 활용한 경우에도 매우 높은 성능(NSE=0.8~0.84)의 모형이 구축되었으며, 한 해의 자료만을 활용하여 학습한 경우에도 충분히 활용 가능한 정확도(NSE=0.63~0.85)를 가진 모형을 구축할 수 있었다. 특히 유량의 변동성이 큰 한 해의 자료만을 활용하여 모형을 학습한 경우 매우 높은 정확도(NSE=0.85)의 모형이 구축되었다. 학습자료가 중유량과 양극한의 유량을 모두 포함한 경우라면 5년 이상의 입력자료는 모형의 성능을 크게 개선시키지 못했다.
https://doi.org/10.3741/JKWRA.2021.54.10.795 인용 PDF KSCI

검색결과 1,856건 처리시간 0.028초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)