• 제목/요약/키워드: Models, statistical

검색결과 3,026건 처리시간 0.026초

TeGCN:씬파일러 신용평가를 위한 트랜스포머 임베딩 기반 그래프 신경망 구조 개발 (TeGCN:Transformer-embedded Graph Neural Network for Thin-filer default prediction)

  • 김성수;배준호;이주현;정희주;김희웅
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.419-437
    • /
    • 2023
  • 국내 씬파일러(Thin Filer)의 수가 1200만명을 넘어서며, 금융 업계에서 씬파일러의 신용을 정확히 평가하여 우량고객을 선별해 대출을 공급하는 시도가 많아지고 있다. 특히, 차주의 신용정보에 존재하는 비선형성을 반영하여 채무불이행을 예측하기 위해서 다양한 머신러닝 알고리즘을 활용한 연구가 진행되고 있다. 그 중 그래프 신경망 구조(Graph Neural Network)는 일반적인 신용정보 외에 대출자 간의 네트워크 정보를 반영할 수 있다는 점에서 데이터가 부족한 씬파일러의 채무 불이행 예측에서 주목할 만하다. 그러나, 그래프 신경망을 활용한 기존의 연구들은 신용정보에 존재하는 다양한 범주형 변수를 적절히 처리하지 못했다는 한계가 있었다. 이에 본 연구는 범주형 변수의 맥락적 정보를 추출할 수 있는 트랜스포머 메커니즘(Transformer mechanism)과 대출자 간 네트워크 정보를 반영할 수 있는 그래프 합성곱 신경망(Graph Convolutional Network)를 결합하여 효과적으로 씬파일러의 채무 불이행 예측이 가능한 TeGCN (Transformer embedded Graph Convolutional Network)를 제안한다. TeGCN는 일반 대출자 데이터셋과 씬파일러 데이터셋에 대하여 모두 베이스 라인 모델 대비 높은 성능을 보였으며, 특히 씬파일러 채무 불이행 예측에 우수한 성능을 달성했다. 본 연구는 범주형 변수가 많은 신용정보와 데이터가 부족한 씬파일러의 특성에 적합한 모델 구조를 결합하여 높은 채무 불이행 예측 성능을 달성했다는 시사점이 있다. 이는 씬파일러의 금융소외문제를 해결하고 금융업계에서 씬파일러를 대상으로 추가적인 수익을 창출하는데 기여할 수 있을 것이다.

뇨중 파라벤 농도에 영향을 미치는 요인에 관한 연구: 제3기 국민환경보건기초조사 자료 분석 (A Study on the Factors Affecting Urinary Paraben Concentration: An Analysis of the Third Korean National Environmental Health Survey (KoNEHS) Data)

  • 김재민;이경무
    • 한국환경보건학회지
    • /
    • 제49권1호
    • /
    • pp.37-47
    • /
    • 2023
  • Background: Paraben is a widely used substance with a preservative effect found in various materials such as food, medicine, personal care products, and cosmetics. Objectives: This study was conducted to identify the level of urinary paraben concentrations (i.e., methyl-, ethyl-, and propyl-) among Korean adults and to explore the factors related with the exposure levels. Methods: We analyzed the third period (2015~2017) of the Korean National Environmental Health Survey (KoNEHS). R statistical software (version 4.1.1) was used to estimate representative values for the whole population with weight variables to reflect sampling design. Whether urinary concentrations tended to increase as the level of paraben exposure-related characteristics increased was tested and Ptrend was calculated using general linear models. Results: Urinary concentrations of all three parabens (i.e., methyl-, ethyl- and propyl-) were higher in women than in men (Ptrend<0.0001, 0.008, and <0.0001), and the values of methylparaben and propylparaben tended to increase as the age of subjects increased (Ptrend<0.0001, and <0.0001). Urinary concentrations of methylparaben and propylparaben were associated with intensity of exercise (Ptrend<0.001, and 0.004), and that of propylparaben was higher in non-smokers (Ptrend=0.01). In terms of paraben exposure-related variables, urinary concentrations of parabens (i.e., methyl-, ethyl- and propyl-) increased as the daily average frequency of teeth-brushing (Ptrend<0.0001, 0.03 and 0.0001), the frequency of use of hair products (Ptrend=0.005, 0.05 and 0.04), the frequency of use of makeup products (Ptrend<0.001, 0.001 and <0.001), and the frequency of use of antibacterial products (Ptrend=0.005, 0.02 and 0.02) increased. Conclusions: In our study, urinary concentrations of all three parabens are associated with gender, teethbrushing, hair products, make-up products, and antibacterial products. Methyl- and proyl-parabens were associated with age and intensity of exercise, and propyl-paraben was associated with smoking.

유니폼의 감염인식, 세탁 규정 인식, 감염병 예방 의도에 관한 융합연구: 개인주의, 집단주의, 자아존중감 중심으로 (Convergence Research on Infection Awareness of Uniforms, Recognition of Laundry Rules, and Intention to Prevent Infectious Diseases: Focusing on Individualism, Collectivism, and Self-esteem)

  • 손은교;박일순
    • 산업융합연구
    • /
    • 제21권3호
    • /
    • pp.139-148
    • /
    • 2023
  • 본 연구는 강원도 일개 대학 4년제 치위생학과 276명을 대상으로 2021년 11월 24일부터 11월 26일까지 구글 온라인설문을 통하여 연구하였다. 본 연구의 목적은 유니폼의 감염인식과 세탁 규정 인식, 감염병 예방 의도를 개인주의 및 집단주의 자아존중감을 통해 알아보는 것으로, 향후 감염병 시기에 학생의 감염 교육 방법 모색을 위해 시행되었다. 통계는 SPSS Statistics 24.0, AMOS 21.0을 사용하여 빈도 분석, 탐색적 요인분석, 확인적 요인분석, 신뢰도 분석, 구조방정식, ANOVA 분석을 시행하였다. 연구결과 유니폼 감염인식, 유니폼 세탁 규정 인식, 자아존중감, 개인주의, 집단주의 감염병 예방 의도의 모형이 적합함을 확인하였고(p<.001), 구조방정식 결과 자아존중감은 개인주의, 집단주의 감염병 예방 의도에 영향을 미치는 것으로 나타났다(p<.001). 집단주의는 유니폼 감염인식, 유니폼 세탁 규정 인식, 감염병 예방 의도에 영향을 미치는 것으로 나타나 감염예방을 위한 인식 변화에 자아존중감과 집단주의가 영향을 미치는 것을 확인하였다. 향후 치위생학과의 감염관리 교육시 집단주의를 고려한 유니폼 세탁 방법에서 활용이 가능할 것이다.

하수관로 특성에 따른 지반함몰 발생 예측을 위한 기계학습 모델 비교 (Comparison of Machine Learning Models to Predict the Occurrence of Ground Subsidence According to the Characteristics of Sewer)

  • 이성열;김진영;강재모;백원진
    • 한국지반환경공학회 논문집
    • /
    • 제23권4호
    • /
    • pp.5-10
    • /
    • 2022
  • 최근 도심지에서는 지반침하가 지속적으로 발생하여 시민의 안전을 위협하고 있다. 상하수도관, 통신관 등 각종 지하시설물이 도로 밑에 매설되어 있다. 지반침하의 원인으로는 도심지에 매설되어 있는 각종 시설물의 노후화와 급격한 도시화로 인한 지하 난개발로 인한 것으로 보고되고 있다. 특히 지반침하의 가장 큰 원인은 하수관로의 노후화로 알려져 있다. 이와 관련된 기존 연구로는 하수관로의 대표적인 몇 가지 요인을 선정하여 통계분석을 통해 지반침하 위험을 예측하는 연구가 진행되었다. 본 연구에서는 OO시의 하수관 특성과 지반침하 데이터를 이용하여 데이터셋을 구축하고, OO시의 하수관 특성과 지반함몰 발생 위치 데이터로 구축된 데이터셋으로 기계학습을 통한 하수관 특성에 따른 지반함몰 발생 분류 모델들을 비교하여 적절한 모델을 선정하고자 하였으며, 선정된 모델에서 도출된 지반함몰에 영향을 미치는 하수관 특성별 중요도를 산정하고자 하였다.

Bayesian Markov Chain Monte Carlo 기법을 통한 NWS-PC 강우-유출 모형 매개변수의 최적화 및 불확실성 분석 (Parameter Optimization and Uncertainty Analysis of the NWS-PC Rainfall-Runoff Model Coupled with Bayesian Markov Chain Monte Carlo Inference Scheme)

  • 권현한;문영일;김병식;윤석영
    • 대한토목학회논문집
    • /
    • 제28권4B호
    • /
    • pp.383-392
    • /
    • 2008
  • 수공구조물을 설계하거나 수자원계획을 수립할 때 제한된 수문자료로 인해 수문모형의 매개변수를 추정하는데 어려움이 따르며 추정된 결과에 신뢰성을 부여하기 위해서 필수적으로 불확실성 분석이 필요하다 하겠다. 이러한 관점에서 본 연구에서는 국내외에서 주로 이용되고 있는 NWS-PC 강우-유출 모형을 대상으로 보다 진보된 매개변수 추정과 불확실성 분석이 가능한 Bayesian Markov Chain Monte Carlo 기법과 결합하여 국내 소양강댐 유역 일유입량 모의에 적용하였다. 실측 일유입량 자료를 대상으로 모형의 검정과정을 수행하였으며 NWS-PC 모형의 총 13개의 매개변수에 대한 사후분포를 추정하여 유출수문곡선의 불확실성 구간을 추정하였다. 검정 및 검증 모두에서 Bayesian Markov Chain Monte Carlo 기법이 모형의 적합성 측면에서 기존 방법론과 비교해보면 다소 우수하거나 비슷한 결과를 나타내었다. 실제로 유역에 발생하는 유출은 다양한 요인에 따라 변화될 수 있으며 이러한 점에서 Bayesian 방법은 강우-유출 관계에서 발생하는 이러한 불확실성을 매개변수의 불확실성으로 인지함으로서 우리가 예상치 못한 유출 사상에 대한 형태를 고려할 수 있는 장점이 있다. 따라서 댐 설계와 같은 대규모 수공 구조물 설계 시에 이러한 불확실성이 접목된 강우-유출 분석이 이루어진다면 보다 합리적인 방법으로 홍수 위험도 분석이 가능하며 더욱이 댐 규모 결정에 있어서 신뢰성 있는 의사 결정 수단을 제공할 수 있을 것으로 사료된다.

유전자 알고리즘과 신경망 이론의 결합에 의한 신호교차로 위험도 예측모형 개발에 관한 연구 (Development of Hazard-Level Forecasting Model using Combined Method of Genetic Algorithm and Artificial Neural Network at Signalized Intersections)

  • 김중효;신재만;박제진;하태준
    • 대한토목학회논문집
    • /
    • 제30권4D호
    • /
    • pp.351-360
    • /
    • 2010
  • 2010년 말 현재 우리나라의 자동차등록대수는 1,748만 대에 육박할 정도로 비약적인 증가를 보이고 있다. 자동차의 급격한 증가는 오늘날 우리가 직면한 심각한 사회문제 중 하나인 교통사고를 증가시키고, 이로 인해 인명피해 및 경제적 손실을 초래하고 있다. 이에 본 연구는 유전자 알고리즘과 신경망 이론의 결합에 의한, 향상된 신호교차로 위험도를 예측하는 모형을 개발하여, 장래 교통사고 안전대책 수립시 근간이 되는 기초자료를 제공함으로써, 교통사고를 줄이는데 도움이 되고자 한다. 본 연구에서는, 첫 번째로 교통사고와 교통혼잡이 빈번하게 발생하는 신호교차로를 대상으로 접근로별 교통량과 도로 기하구조 요소를 파악하였고, 교통사고와 교통상충간의 순위상관관계분석을 실시하여 통계적 유의성을 파악하였으며, 교통사고와 교통상충을 적용한 선형회귀모형을 구축하였다. 두 번째로, 유전자 알고리즘과 신경망 이론의 결합에 의한 신호교차로 위험도 예측모형은 신호교차로 교통량 및 도로 기하구조 요소, 교통상충의 특성변수를 적용하여 개발하였다. 마지막으로, 신호교차로 교통사고건수 실측값과 개발모형의 예측값에 대한 적합도 분석을 통해 신뢰수준을 검증한 결과, 개발모형의 신뢰도와 정확도가 기존의 모형에 비해 우수한 것으로 나타났다. 결론적으로, 향후 본 연구를 통해 개발된 교통사고위험도 예측모형을 신호교차로 교통안전정책 수립과 교통안전개선사업에 사용할 경우, 전반적으로 교통안전관련사업의 비용/효율성을 극대화할 수 있을 것으로 기대된다.

Informative Role of Marketing Activity in Financial Market: Evidence from Analysts' Forecast Dispersion

  • Oh, Yun Kyung
    • Asia Marketing Journal
    • /
    • 제15권3호
    • /
    • pp.53-77
    • /
    • 2013
  • As advertising and promotions are categorized as operating expenses, managers tend to reduce marketing budget to improve their short term profitability. Gauging the value and accountability of marketing spending is therefore considered as a major research priority in marketing. To respond this call, recent studies have documented that financial market reacts positively to a firm's marketing activity or marketing related outcomes such as brand equity and customer satisfaction. However, prior studies focus on the relation of marketing variable and financial market variables. This study suggests a channel about how marketing activity increases firm valuation. Specifically, we propose that a firm's marketing activity increases the level of the firm's product market information and thereby the dispersion in financial analysts' earnings forecasts decreases. With less uncertainty about the firm's future prospect, the firm's managers and shareholders have less information asymmetry, which reduces the firm's cost of capital and thereby increases the valuation of the firm. To our knowledge, this is the first paper to examine how informational benefits can mediate the effect of marketing activity on firm value. To test whether marketing activity contributes to increase in firm value by mitigating information asymmetry, this study employs a longitudinal data which contains 12,824 firm-year observations with 2,337 distinct firms from 1981 to 2006. Firm value is measured by Tobin's Q and one-year-ahead buy-and-hold abnormal return (BHAR). Following prior literature, dispersion in analysts' earnings forecasts is used as a proxy for the information gap between management and shareholders. For model specification, to identify mediating effect, the three-step regression approach is adopted. All models are estimated using Markov chain Monte Carlo (MCMC) methods to test the statistical significance of the mediating effect. The analysis shows that marketing intensity has a significant negative relationship with dispersion in analysts' earnings forecasts. After including the mediator variable about analyst dispersion, the effect of marketing intensity on firm value drops from 1.199 (p < .01) to 1.130 (p < .01) in Tobin's Q model and the same effect drops from .192 (p < .01) to .188 (p < .01) in BHAR model. The results suggest that analysts' forecast dispersion partially accounts for the positive effect of marketing on firm valuation. Additionally, the same analysis was conducted with an alternative dependent variable (forecast accuracy) and a marketing metric (advertising intensity). The analysis supports the robustness of the main results. In sum, the results provide empirical evidence that marketing activity can increase shareholder value by mitigating problem of information asymmetry in the capital market. The findings have important implications for managers. First, managers should be cognizant of the role of marketing activity in providing information to the financial market as well as to the consumer market. Thus, managers should take into account investors' reaction when they design marketing communication messages for reducing the cost of capital. Second, this study shows a channel on how marketing creates shareholder value and highlights the accountability of marketing. In addition to the direct impact of marketing on firm value, an indirect channel by reducing information asymmetry should be considered. Potentially, marketing managers can justify their spending from the perspective of increasing long-term shareholder value.

  • PDF

Effects of zinc oxide and calcium-doped zinc oxide nanocrystals on cytotoxicity and reactive oxygen species production in different cell culture models

  • Gabriela Leite de Souza ;Camilla Christian Gomes Moura ;Anielle Christine Almeida Silva ;Juliane Zacour Marinho;Thaynara Rodrigues Silva ;Noelio Oliveira Dantas;Jessica Fernanda Sena Bonvicini ;Ana Paula Turrioni
    • Restorative Dentistry and Endodontics
    • /
    • 제45권4호
    • /
    • pp.54.1-54.16
    • /
    • 2020
  • Objectives: This study aimed to synthesize nanocrystals (NCs) of zinc oxide (ZnO) and calcium ion (Ca2+)-doped ZnO with different percentages of calcium oxide (CaO), to evaluate cytotoxicity and to assess the effects of the most promising NCs on cytotoxicity depending on lipopolysaccharide (LPS) stimulation. Materials and Methods: Nanomaterials were synthesized (ZnO and ZnO:xCa, x = 0.7; 1.0; 5.0; 9.0) and characterized using X-ray diffractometry, scanning electron microscopy, and methylene blue degradation. SAOS-2 and RAW 264.7 were treated with NCs, and evaluated for viability using the MTT assay. NCs with lower cytotoxicity were maintained in contact with LPS-stimulated (+LPS) and nonstimulated (-LPS) human dental pulp cells (hDPCs). Cell viability, nitric oxide (NO), and reactive oxygen species (ROS) production were evaluated. Cells kept in culture medium or LPS served as negative and positive controls, respectively. One-way analysis of variance and the Dunnett test (α = 0.05) were used for statistical testing. Results: ZnO:0.7Ca and ZnO:1.0Ca at 10 ㎍/mL were not cytotoxic to SAOS-2 and RAW 264.7. +LPS and -LPS hDPCs treated with ZnO, ZnO:0.7Ca, and ZnO:1.0Ca presented similar NO production to negative control (p > 0.05) and lower production compared to positive control (p < 0.05). All NCs showed reduced ROS production compared with the positive control group both in +LPS and -LPS cells (p < 0.05). Conclusions: NCs were successfully synthesized. ZnO, ZnO:0.7Ca and ZnO:1.0Ca presented the highest percentages of cell viability, decreased ROS and NO production in +LPS cells, and maintenance of NO production at basal levels.

낙동강권역의 지하수 산출 유망도 평가 (A Groundwater Potential Map for the Nakdonggang River Basin)

  • 유순영;정재훈;박길택;문희선;석희준;김용철;고동찬;고경석;김형찬;문상호;신제현;심병완;최한나;하규철
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제28권6호
    • /
    • pp.71-89
    • /
    • 2023
  • A groundwater potential map (GPM) was built for the Nakdonggang River Basin based on ten variables, including hydrogeologic unit, fault-line density, depth to groundwater, distance to surface water, lineament density, slope, stream drainage density, soil drainage, land cover, and annual rainfall. To integrate the thematic layers for GPM, the criteria were first weighted using the Analytic Hierarchical Process (AHP) and then overlaid using the Technique for Ordering Preferences by Similarity to Ideal Solution (TOPSIS) model. Finally, the groundwater potential was categorized into five classes (very high (VH), high (H), moderate (M), low (L), very low (VL)) and verified by examining the specific capacity of individual wells on each class. The wells in the area categorized as VH showed the highest median specific capacity (5.2 m3/day/m), while the wells with specific capacity < 1.39 m3/day/m were distributed in the areas categorized as L or VL. The accuracy of GPM generated in the work looked acceptable, although the specific capacity data were not enough to verify GPM in the studied large watershed. To create GPMs for the determination of high-yield well locations, the resolution and reliability of thematic maps should be improved. Criterion values for groundwater potential should be established when machine learning or statistical models are used in the GPM evaluation process.

MLOps를 위한 효율적인 AI 모델 드리프트 탐지방안 연구 (A Study on Efficient AI Model Drift Detection Methods for MLOps)

  • 이예은;이태진
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술이 발전하면서 실용성이 증가함에 따라 실생활 속 다양한 응용 분야에서 널리 활용되고 있다. 이때 AI Model은 기본적으로 학습 데이터의 다양한 통계적 속성을 기반으로 학습된 후 시스템에 배포되지만, 급변하는 데이터의 상황 속 예상치 못한 데이터의 변화는 모델의 성능저하를 유발한다. 특히 보안 분야에서 끊임없이 생성되는 새로운 공격과 알려지지 않은 공격에 대응하기 위해서는 배포된 모델의 Drift Signal을 찾는 것이 중요해짐에 따라 모델 전체의 Lifecycle 관리 필요성이 점차 대두되고 있다. 일반적으로 모델의 정확도 및 오류율(Loss)의 성능변화를 통해 탐지할 수 있지만, 모델 예측 결과에 대한 실제 라벨이 필요한 점에서 사용 환경의 제약이 존재하며, 실제 드리프트가 발생한 지점의 탐지가 불확실한 단점이 있다. 그 이유는 모델의 오류율의 경우 다양한 외부 환경적 요인, 모델의 선택과 그에 따른 파라미터 설정, 그리고 새로운 입력데이터에 따라 크게 영향을 받기에 해당 값만을 기반으로 데이터의 실질적인 드리프트 발생 시점을 정밀하게 판단하는 것은 한계가 존재하게 된다. 따라서 본 논문에서는 XAI(eXplainable Artificial Intelligence) 기반 Anomaly 분석기법을 통해 실질적인 드리프트가 발생한 시점을 탐지하는 방안을 제안한다. DGA(Domain Generation Algorithm)를 탐지하는 분류모델을 대상으로 시험한 결과, 배포된 이후 데이터의 SHAP(Shapley Additive exPlanations) Value를 통해 Anomaly score를 추출하였고, 그 결과 효율적인 드리프트 시점탐지가 가능함을 확인하였다.