• 제목/요약/키워드: Models, statistical

검색결과 3,012건 처리시간 0.03초

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.

고해상도 규모상세화모델 KMAPP의 농업지역 기온 및 일사량 예측 성능: 맑은 날 철원 및 전북 사례 연구 (Temperature and Solar Radiation Prediction Performance of High-resolution KMAPP Model in Agricultural Areas: Clear Sky Case Studies in Cheorwon and Jeonbuk Province)

  • 신설은;이승재;노일석;김수현;소윤영;이서연;민병훈;김규랑
    • 한국농림기상학회지
    • /
    • 제22권4호
    • /
    • pp.312-326
    • /
    • 2020
  • KMAPP은 규모상세화 과정을 통해 100 m 단위의 초고해상도 기상 예측을 산출하는 체계로써 최근 수문, 농업, 신재생에너지 등 다양한 분야에서 활용되기 시작됨에 따라 각 분야별로 예측성능을 검증할 필요가 있다. 철원 지역과 전북 지역은 산지가 많은 우리나라에서 비교적 넓은 범위에 걸쳐서 수평면을 보유하고 있으며, 특히 철원은 대규모 벼 논 재배지역 중에서 실측 및 원격탐사 생물계절 자료가 많은 지역으로 KMAPP 예측 성능을 검증하는데 필요한 관측자료를 사용하기에 적절한 지점으로 판단된다. 이번 연구에서는 철원 내 농경지역의 생태적 변화에 따라 변화하는 KMAPP 기온 예측 성능을 AWS와 ASOS 관측자료를 이용하여 비교 검증하였다. 그리고 전북지역 폭염 기간 동안 가축 고온스트레스 모델과 같은 응용모델에 KMAPP 예측 자료를 입력자료로 활용하는 것을 검토하고자 일사량 예측을 ASOS 자료를 이용하여 검증하였다. 더 많은 사례의 수집과 선정이 필요하다는 한계가 있지만 농경지역에서 추수 후 기온 예측 성능이 일반 주택지 에서보다 더 크게 향상된 것을 통해 생물리적 효과가 예측 정확도에 미치는 영향을 간접적으로 추측해 볼 수 있었다. 한편, 일사량 예측의 경우 단위 변환에 따른 오차가 발생하지만 관측값과 일치하는 경향을 보여 KMAPP 자료가 지역규모의 상세 예측 자료로 응용모델에 활용될 수 있을 것으로 기대된다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

국가별 기술경쟁력이 유니콘기업 증가에 미치는 영향에 관한 연구 (The Effects of Technological Competitiveness by Country on The Increase of Unicorn Companies)

  • 조규훈;양동우
    • 벤처창업연구
    • /
    • 제19권1호
    • /
    • pp.55-73
    • /
    • 2024
  • 유니콘기업은 혁신적인 비즈니스 모델로 단기간 내 높은 기업가치를 인정받으며 전 세계적으로 주목을 받고 있다. 이들의 성장 과정은 스타트업 생태계에 좋은 교훈을 제시해주고 있고 국가 경제발전과 고용 창출 측면에서도 긍정적인 영향을 미치고 있다. 그러나 유니콘기업과 관련한 선행연구들은 이미 유니콘으로 인정받은 기업의 창업자 특성, 환경요인, 비즈니스 모델, 성공·실패 사례 등 다면적 접근보다는 '이벤트 스터디', '사례연구' 중심으로 이루어지고 있고 유니콘기업 발생과 관련한 요인에 대한 거시적 분석은 부족한 실정이다. 이러한 배경에서 본 연구는 선행연구를 통해 살펴본 유니콘의 특성 및 기술기업 비중이 높은 유니콘기업의 현황을 고려하여 '기술인적자원 지표', 'R&D 지표', '기술 인프라 지표' 등 국가의 기술경쟁력이 유니콘기업 증가에 미치는 영향을 분석하는 것을 목적으로 하였다. 통계분석을 위해 2017년부터 2020년까지 다양한 국제기구, 통계청에서 발표되는 자료와 CB Insights에서 집계한 유니콘기업 데이터를 44개 분석 대상 국가의 패널데이터로 활용하여 다중 회귀분석으로 검정하였다. 연구 결과 기술 인적자원 지표의 경우 과학 전공자 수가 유니콘기업 증가에 정(+)의 영향을 미치는 것으로 확인되었고 R&D 지표의 경우 R&D 투자총액은 유니콘기업 증가에 정(+)의 영향을 미치는 반면, 삼극 특허 건수(Triad Patent Families), 과학기술논문 발표 수는 유니콘기업 증가에 부(-)의 영향을 미치는 것으로 나타났다. 마지막으로 기술인프라 지표의 경우 세계 랭킹 500위 대학 수가 유니콘기업 증가에 정(+)의 영향을 미치는 것으로 확인되었다. 본 연구는 선행연구에서 미비하게 다루었던 국가별, 시계열 실증 데이터를 기반으로 국가 기술경쟁력과 유니콘기업 증가 간에 인과관계를 처음으로 밝혔다는 데 학술적 의미가 있으며 UN의 글로벌 산업경쟁력 지수 순위, OECD의 국가별 R&D 투자총액 비교 시 우리나라는 기술력, 성장잠재력이 있는 것으로 평가받고 있는 반면에 혁신경제의 리더로 성장을 견인하고 있는 유니콘기업 수는 상대적으로 적은 상황에 있어 향후 유니콘기업의 발굴, 육성을 위한 정책 수립 시 연구 결과를 활용할 수 있다는 실무적 의의를 가진다.

  • PDF

Perceptional Change of a New Product, DMB Phone

  • Kim, Ju-Young;Ko, Deok-Im
    • 마케팅과학연구
    • /
    • 제18권3호
    • /
    • pp.59-88
    • /
    • 2008
  • Digital Convergence means integration between industry, technology, and contents, and in marketing, it usually comes with creation of new types of product and service under the base of digital technology as digitalization progress in electro-communication industries including telecommunication, home appliance, and computer industries. One can see digital convergence not only in instruments such as PC, AV appliances, cellular phone, but also in contents, network, service that are required in production, modification, distribution, re-production of information. Convergence in contents started around 1990. Convergence in network and service begins as broadcasting and telecommunication integrates and DMB(digital multimedia broadcasting), born in May, 2005 is the symbolic icon in this trend. There are some positive and negative expectations about DMB. The reason why two opposite expectations exist is that DMB does not come out from customer's need but from technology development. Therefore, customers might have hard time to interpret the real meaning of DMB. Time is quite critical to a high tech product, like DMB because another product with same function from different technology can replace the existing product within short period of time. If DMB does not positioning well to customer's mind quickly, another products like Wibro, IPTV, or HSPDA could replace it before it even spreads out. Therefore, positioning strategy is critical for success of DMB product. To make correct positioning strategy, one needs to understand how consumer interprets DMB and how consumer's interpretation can be changed via communication strategy. In this study, we try to investigate how consumer perceives a new product, like DMB and how AD strategy change consumer's perception. More specifically, the paper segment consumers into sub-groups based on their DMB perceptions and compare their characteristics in order to understand how they perceive DMB. And, expose them different printed ADs that have messages guiding consumer think DMB in specific ways, either cellular phone or personal TV. Research Question 1: Segment consumers according to perceptions about DMB and compare characteristics of segmentations. Research Question 2: Compare perceptions about DMB after AD that induces categorization of DMB in direction for each segment. If one understand and predict a direction in which consumer perceive a new product, firm can select target customers easily. We segment consumers according to their perception and analyze characteristics in order to find some variables that can influence perceptions, like prior experience, usage, or habit. And then, marketing people can use this variables to identify target customers and predict their perceptions. If one knows how customer's perception is changed via AD message, communication strategy could be constructed properly. Specially, information from segmented customers helps to develop efficient AD strategy for segment who has prior perception. Research framework consists of two measurements and one treatment, O1 X O2. First observation is for collecting information about consumer's perception and their characteristics. Based on first observation, the paper segment consumers into two groups, one group perceives DMB similar to Cellular phone and the other group perceives DMB similar to TV. And compare characteristics of two segments in order to find reason why they perceive DMB differently. Next, we expose two kinds of AD to subjects. One AD describes DMB as Cellular phone and the other Ad describes DMB as personal TV. When two ADs are exposed to subjects, consumers don't know their prior perception of DMB, in other words, which subject belongs 'similar-to-Cellular phone' segment or 'similar-to-TV' segment? However, we analyze the AD's effect differently for each segment. In research design, final observation is for investigating AD effect. Perception before AD is compared with perception after AD. Comparisons are made for each segment and for each AD. For the segment who perceives DMB similar to TV, AD that describes DMB as cellular phone could change the prior perception. And AD that describes DMB as personal TV, could enforce the prior perception. For data collection, subjects are selected from undergraduate students because they have basic knowledge about most digital equipments and have open attitude about a new product and media. Total number of subjects is 240. In order to measure perception about DMB, we use indirect measurement, comparison with other similar digital products. To select similar digital products, we pre-survey students and then finally select PDA, Car-TV, Cellular Phone, MP3 player, TV, and PSP. Quasi experiment is done at several classes under instructor's allowance. After brief introduction, prior knowledge, awareness, and usage about DMB as well as other digital instruments is asked and their similarities and perceived characteristics are measured. And then, two kinds of manipulated color-printed AD are distributed and similarities and perceived characteristics for DMB are re-measured. Finally purchase intension, AD attitude, manipulation check, and demographic variables are asked. Subjects are given small gift for participation. Stimuli are color-printed advertising. Their actual size is A4 and made after several pre-test from AD professionals and students. As results, consumers are segmented into two subgroups based on their perceptions of DMB. Similarity measure between DMB and cellular phone and similarity measure between DMB and TV are used to classify consumers. If subject whose first measure is less than the second measure, she is classified into segment A and segment A is characterized as they perceive DMB like TV. Otherwise, they are classified as segment B, who perceives DMB like cellular phone. Discriminant analysis on these groups with their characteristics of usage and attitude shows that Segment A knows much about DMB and uses a lot of digital instrument. Segment B, who thinks DMB as cellular phone doesn't know well about DMB and not familiar with other digital instruments. So, consumers with higher knowledge perceive DMB similar to TV because launching DMB advertising lead consumer think DMB as TV. Consumers with less interest on digital products don't know well about DMB AD and then think DMB as cellular phone. In order to investigate perceptions of DMB as well as other digital instruments, we apply Proxscal analysis, Multidimensional Scaling technique at SPSS statistical package. At first step, subjects are presented 21 pairs of 7 digital instruments and evaluate similarity judgments on 7 point scale. And for each segment, their similarity judgments are averaged and similarity matrix is made. Secondly, Proxscal analysis of segment A and B are done. At third stage, get similarity judgment between DMB and other digital instruments after AD exposure. Lastly, similarity judgments of group A-1, A-2, B-1, and B-2 are named as 'after DMB' and put them into matrix made at the first stage. Then apply Proxscal analysis on these matrixes and check the positional difference of DMB and after DMB. The results show that map of segment A, who perceives DMB similar as TV, shows that DMB position closer to TV than to Cellular phone as expected. Map of segment B, who perceive DMB similar as cellular phone shows that DMB position closer to Cellular phone than to TV as expected. Stress value and R-square is acceptable. And, change results after stimuli, manipulated Advertising show that AD makes DMB perception bent toward Cellular phone when Cellular phone-like AD is exposed, and that DMB positioning move towards Car-TV which is more personalized one when TV-like AD is exposed. It is true for both segment, A and B, consistently. Furthermore, the paper apply correspondence analysis to the same data and find almost the same results. The paper answers two main research questions. The first one is that perception about a new product is made mainly from prior experience. And the second one is that AD is effective in changing and enforcing perception. In addition to above, we extend perception change to purchase intention. Purchase intention is high when AD enforces original perception. AD that shows DMB like TV makes worst intention. This paper has limitations and issues to be pursed in near future. Methodologically, current methodology can't provide statistical test on the perceptual change, since classical MDS models, like Proxscal and correspondence analysis are not probability models. So, a new probability MDS model for testing hypothesis about configuration needs to be developed. Next, advertising message needs to be developed more rigorously from theoretical and managerial perspective. Also experimental procedure could be improved for more realistic data collection. For example, web-based experiment and real product stimuli and multimedia presentation could be employed. Or, one can display products together in simulated shop. In addition, demand and social desirability threats of internal validity could influence on the results. In order to handle the threats, results of the model-intended advertising and other "pseudo" advertising could be compared. Furthermore, one can try various level of innovativeness in order to check whether it make any different results (cf. Moon 2006). In addition, if one can create hypothetical product that is really innovative and new for research, it helps to make a vacant impression status and then to study how to form impression in more rigorous way.

  • PDF

중년후기 여성의 건강증진행위 모형구축 (A Model for Health Promoting Behaviors in Late-middle Aged Woman)

  • 박재순
    • 여성건강간호학회지
    • /
    • 제2권2호
    • /
    • pp.298-331
    • /
    • 1996
  • Recent improvements in living standard and development in medical care led to an increased interest in life expectancy and personal health, and also led to a more demand for higher quality of life. Thus, the problem of women's health draw a fresh interest nowadays. Since late-middle aged women experience various physical and socio-psychological changes and tend to have chronic illnesses, these women have to take initiatives for their health control by realizing their own responsibility. The basic elements for a healthy life of these women are understanding of their physical and psychological changes and acceptance of these changes. Health promoting behaviors of an individual or a group are actions toward increasing the level of well-being and self-actualization, and are affected by various variables. In Pender's health promoting model, variables are categorized into cognitive factors(individual perceptions), modifying factors, and variables affecting the likelihood for actions, and the model assumes the health promoting behaviors are affected by cognitive factors which are again affected by demographic factors. Since Pender's model was proposed based on a tool broad conceptual frame, many studies done afterwards have included only a limited number of variables of Pender's model. Furthermore, Pender's model did not precisely explain the possibilities of direct and indirect paths effects. The objectives of this study are to evaluate Pender's model and thus propose a model that explains health promoting behaviors among late-middle aged women in order to facilitate nursing intervention for this group of population. The hypothetical model was developed based on the Pender's health promoting model and the findings from past studies on women's health. Data were collected by self-reported questionnaires from 417 women living in Seoul, between July and November 1994. Questionnaires were developed based on instruments of Walker and others' health promotion lifestyle profile, Wallston and others' multidimensional health locus of control, Maoz's menopausal symptom check list and Speake and others' health self-rating scale. IN addition, items measuring self-efficacy were made by the present author based on past studies. In a pretest, the questionnaire items were reliable with Cronbach's alpha ranging from .786 to .934. The models for health promoting behaviors were tested by using structural equation modelling technique with LISREL 7.20. The results were summarized as follows : 1. The overall fit of the hypothetical model to the data was good (chi-square=4.42, df=5, p=.490, GFI=.995, AGFI=.962, RMSR=.024). 2. Paths of the model were modified by considering both its theoretical implication and statistical significance of the parameter estimates. Compared to the hypothetical model, the revised model has become parsimonious and had a better fit to the data (chi-square =4.55, df=6, p=.602, GFI=.995, AGFI=.967, RMSR=.024). 3. The results of statistical testing were as follows : 1) Family function internal health locus of control, self-efficacy, and education level exerted significant effects on health promoting behaviors(${\gamma}_{43}$=.272, T=3.714; ${\beta}_[41}$=.211, T=2.797; ${\beta}_{42}$=.199, T=2.717; ${\gamma}_{41}$=.136, T=1.986). The effect of economic status, physical menopausal symptoms, and perceived health status on health promoting behavior were insignificant(${\gamma}_{42}$=.095, T=1.456; ${\gamma}_{44}$=.101, T=1.143; ${\gamma}_{43}$=.082, T=.967). 2) Family function had a significance direct effect on internal health locus of control (${\gamma}_{13}$=.307, T=3.784). The direct effect of education level on internal health locus of control was insignificant(${\gamma}_{11}$=-.006, T=-.081). 3) The directs effects of family functions & internal health locus of control on self-efficacy were significant(${\gamma}_{23}$=.208, T=2.607; ${\beta}_{21}$=.191, T=2.2693). But education level and economic status did not exert a significant effect on self-efficacy(${\gamma}_{21}$=.137, T=1.814; ${\beta}_{22}$=.137, T=1.814; ${\gamma}_{22}$=.112, T=1.499). 4) Education level had a direct and positive effect on perceived health status, but physical menopausal symptoms had a negative effect on perceived health status and these effects were all significant(${\gamma}_{31}$=.171, T=2.496; ${\gamma}_{34}$=.524, T=-7.120). Internal health locus and self-efficacy had an insignificant direct effect on perceived health status(${\beta}_{31}$=.028, T=.363; ${\beta}_{32}$=.041, T=.557). 5) All predictive variables of health promoting behaviors explained 51.8% of the total variance in the model. The above findings show that health promoting behaviors are explained by personal, environmental and perceptual factors : family function, internal health locus of control, self-efficacy, and education level had stronger effects on health promoting behaviors than predictors in the model. A significant effect of family function on health promoting behaviors reflects an important role of the Korean late-middle aged women in family relationships. Therefore, health professionals first need to have a proper evaluation of family function in order to reflect the family function style into nursing interventions and development of strategies. These interventions and strategies will enhance internal health locus of control and self-efficacy for promoting health behaviors. Possible strategies include management of health promoting programs, use of a health information booklets, and individual health counseling, which will enhance internal health locus of control and self-efficacy of the late-middle aged women by making them aware of health responsibilities and value for oneself. In this study, an insignificant effect of physical menopausal symptoms and perceived health status on health promoting behaviors implies that they are not motive factors for health promoting behaviors. Further analytic researches are required to clarify the influence of physical menopausal symptoms and perceived health status on health promoting behaviors with-middle aged women.

  • PDF

UV 공정을 이용한 N-Nitrosodimethylamine (NDMA) 광분해 및 부산물 생성에 관한 연구: 박스-벤켄법 실험계획법을 이용한 통계학적 분해특성평가 및 반응모델 수립 (A study on the Degradation and By-products Formation of NDMA by the Photolysis with UV: Setup of Reaction Models and Assessment of Decomposition Characteristics by the Statistical Design of Experiment (DOE) based on the Box-Behnken Technique)

  • 장순웅;이시진;조일형
    • 대한환경공학회지
    • /
    • 제32권1호
    • /
    • pp.33-46
    • /
    • 2010
  • 본 연구는 광분해 산화공정으로 난분해성 물질인 N-Nitrosodimethylamine (NDMA)인 제거 및 부산물 생성 특성을 파악하기 위한 3개의 독립변수 (자외선 강도($X_1:\;1.5{\sim}4.5\;mW/cm^2$, 초기 NDMA 농도($X_2:\;100{\sim}300\;uM$), pH(X3:3~9))와 4개의 종속변수(NDMA 제거율($Y_1$), dimethylamine (DMA) 생성농도($Y_2$), dimethylformamide (DMF) 생성농도($Y_3$) 및 $NO_2$-N 생성농도($Y_4$))로 구성된 박스-벤켄 설계를 이용한 실험계획을 적용시켜 예측 모델과 광분해 산화 최적조건을 수립하였다. 실험결과 2시간 광분해 후 NDMA는 거의 완전히 제거되었으며 DMA, DMF와 $NO_2$-N은 NDMA 광분해와 동시에 부산물로 생성되었다. 광분해 최적의 조건을 얻기 위해 정준분석을 수행하여 최적 점 (반응값, 독립변수 조건)과 예측반응모델을 수립한 결과, 다음과 같은 결과를 얻었다 ($Y_1=117+21X_1-0.3X_2-17.2X_3+{2.43X_1}^2+{0.001X_2}^2+{3.2X_3}^2-0.08X_1X_2-1.6X_1X_3-0.05X_2X_3$ ($R^2$ = 96%, Adjusted $R^2$ = 88%)와 99.3% ($X_1:\;4.5\;mW/cm^2$, $X_2:\;190\;uM$, $X_3:\;3.2$), $Y_2=-101+18.5X_1+0.4X_2+21X_3-{3.3X_1}^2-{0.01X_2}^2-{1.5X_3}^2-0.01X_1X_2-0.07X_1X_3-0.01X_2X_3$ ($R^2$= 99.4%, 수정 $R^2$ = 95.7%)와 35.2 uM ($X_1:\;3\;mW/cm^2$, $X_2:\;220\;uM$, $X_3:\;6.3$), $Y_3=-6.2+0.2X_1+0.02X_2+2X_3-{0.26X_1}^2-{0.01X_2}^2-{0.2X_3}^2-0.004X_1X_2+0.1X_1X_3-0.02X_2X_3$ ($R^2$= 98%, 수정 $R^2$ = 94.4%)와 3.7 uM ($X_1:\;4.5\;mW/cm^2$, $X_2:\;290\;uM$, $X_3:\;6.2$), $Y_4=-25+12.2X_1+0.15X_2+7.8X_3+{1.1X_1}^2+{0.001X_2}^2-{0.34X_3}^2+0.01X_1X_2+0.08X_1X_3-3.4X_2X_3$ ($R^2$= 98.5%, 수정 $R^2$ = 95.7%)와 74.5 uM ($X_1:\;4.5\;mW/cm^2$, $X_2:\;220\;uM$, $X_3:\;3.1$). 반응표면분석법 중 하나인 박스-벤켄법은 UV 광분해에 의한 NDMA 분해 및 부산물 생성에 대한 통계학적 및 수학적인 결과 및 최적의 운전조건을 제시하였다. 예측모델의 검정을 통하여 박스-벤켄법은 매우 높은 신뢰성을 보였다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

산지사면(山地斜面)의 붕괴위험도(崩壞危險度) 예측(豫測)모델의 개발(開發) 및 실용화(實用化) 방안(方案) (Studies on Development of Prediction Model of Landslide Hazard and Its Utilization)

  • 마호섭
    • 한국산림과학회지
    • /
    • 제83권2호
    • /
    • pp.175-190
    • /
    • 1994
  • 산지사면붕괴(山地斜面崩壞)에 의(依)한 피해(被害)를 예방(豫防) 또는 극소화(極小化)하기 위(爲)하여 산사태(山沙汰)가 자주 발생(發生)하는 지역(地域)을 중심(中心)으로 각(各) 조사(調査) 단위사면(單位斜面)에 대(對)하여 산지사면붕괴(山地斜面崩壞)에 영향(影響)하리라고 예상(豫想)되는 12개(個) 환경요인(環境要因)을 현지조사(現地調査)하고 붕괴(崩壞)와 환경인자(環境因子)와의 관계(關係)를 수량화(數量化) 이론(理論)에 의(依)한 방법(方法)으로 분석(分析)하여 산사태발생(山沙汰發生)의 위험도(危險度)를 평가(評價)할 수 있는 예측(豫測)모델을 도출(導出)하였으며, 또한 이를 기초(基礎)로 하여 위험도(危險度)를 각(各) 급별(級別)로 구분(區分)하고 예지(豫知)모델을 검토(檢討)하였던 바 그 결과(結果)을 요약(要約)하면 다음과 같다. 산지붕괴발생면적(山地崩壞發生面積)에 영향(影響)을 주는 인자(因子)는 강우(降雨), 령급(齡級), 표고(標高), 토성(土性), 경사(傾斜), 사면위치(斜面位置), 임상(林相), 곡차수(谷次數), 종단사면형(縱斷斜面形), 모암(母岩), 토심(土深), 방위(方位)의 순(順)이었으며, 편상관계수(偏相關係數)에 의(依)한 인자(因子)는 령급(令級), 강우(降雨), 토성(土性), 모암(母岩), 경사(傾斜), 사면위치(斜面位置), 표고(標高), 종단사면형(縱斷斜面形), 곡차수(谷次數), 임상(林相), 토심(土深), 방위(方位)의 순(順)으로 나타났다. 또한 산지붕괴발생빈도(山地崩壞發生頻度)에 의(依)한 인자(因子)의 순위(順位)는 령급(令級), 표고(標高), 토성(土性), 경사도(傾斜度), 식생(植生), 강우(降雨), 종단사면(縱斷斜面), 곡차수(谷次數), 모암(母岩), 토심(土深)이었으며 사면위치(斜面位置) 및 방위(方位)는 기여도(寄與度)가 낮게 나타났다. 산지사면붕괴위험(山地斜面崩壞危險) 예지(豫知)를 위(爲)하여 붕괴발생면적(崩壞發生面積)에 의(依)한 예측(豫測)모델에서 위험도(危險度) 예측점수표(豫測點數表)를 작성(作成)할 수 있었으며, 점수합계(點數合計)가 9.1636이면 붕괴발생위험(崩壞發生危險)이 높은 것으로 평가(評價)되었으며 산지(山地) 사면붕괴(斜面崩壞)가 발생(發生)한 사면(斜面)과 발생(發生)하지 않은 사면(斜面)에 의(依)한 예측(豫測)모델에서 우사면(雨斜面)에 대(對)한 사면판별(斜面判別) 구분치(區分値)는 -0.02였고, 그 적중율(適中率)은 73%로 높았다. 또한 판별구분치(判別區分値)를 기준(基準)으로 한 산지사면붕괴발생(山地斜面崩壞發生) 위험도별(危險度別) 점수(點數)는 A급(級)은 0.3132 이상(以上)이었고, B급(級)은 0.3132~-0.1051, C급(級)은 -0.1050~-0.4195, D급(級)은 -0.4195 이하(以下)였다. 그리고 산지사면붕괴발생(山地斜面崩壞發生)의 예지(豫知)는 판별구분치(判別區分値)를 기준(基準)으로 위험도(危險度)을 A, B, C, D의 4등급(等級)으로 구분(區分)할 수 있었으며, 총(總) 300개(個) 사면(斜面) 중(中) A급사면(級斜面) 68개(個), B급사면(級斜面) 115개(個), C급사면(級斜面) 65개, D급사면(級斜面) 52개(個)였다. 위험도(危險度) A, B급(級)에서의 산사태발생(山沙汰發生)은 150개(個) 붕괴지(崩壞地) 중 125개(個)로서 약(約) 83.3%의 높은 적중율(適中率)을 보여 예측(豫測)모델로서 응용(應用) 가능성(可能性)이 높게 나타났다. 따라서 이러한 예지방법(豫知方法)에 의(依)하여 선정(選定)한 위험(危險)한 지역(地域)에 대(對)하여 산지재해위험도(山地災害危險度) 지도(地圖)를 작성(作成)하여 토지이용(土地利用) 계획(計劃) 및 재해위험지(災害危險地) 선정기준(選定基準)의 행정지표(行政指標)로서 활용(活用)할 수 있을 것이다. 또한 산지재해(山地災害)에 대(對)한 종합(綜合) 대책(對策)에 유용(有用)하게 활용(活用)함으로써 막대(莫大)한 재산(財産) 피해(被害)와 인명(人命) 손실(損失)을 사전(事前)에 방지(防止)할 수 있을 것이다.

  • PDF

감정예측모형의 성과개선을 위한 Support Vector Regression 응용 (Application of Support Vector Regression for Improving the Performance of the Emotion Prediction Model)

  • 김성진;유은정;정민규;김재경;안현철
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.185-202
    • /
    • 2012
  • 오늘날 정보사회에서는 정보에 대한 가치를 인식하고, 이를 위한 정보의 활용과 수집이 중요해지고 있다. 얼굴 표정은 그림 하나가 수천개의 단어를 표현할 수 있듯이 수천 개의 정보를 지니고 있다. 이에 주목하여 최근 얼굴 표정을 통해 사람의 감정을 판단하여 지능형 서비스를 제공하기 위한 시도가 MIT Media Lab을 필두로 활발하게 이루어지고 있다. 전통적으로 기존 연구에서는 인공신경망, 중회귀분석 등의 기법을 통해 사람의 감정을 판단하는 연구가 이루어져 왔다. 하지만 중회귀모형은 예측 정확도가 떨어지고, 인공신경망은 성능은 뛰어나지만 기법 자체가 지닌 과적합화 문제로 인해 한계를 지닌다. 본 연구는 사람들의 자극에 대한 반응으로서 나타나는 얼굴 표정을 통해 감정을 추론해내는 지능형 모형을 개발하는 것을 목표로 한다. 기존 얼굴 표정을 통한 지능형 감정판단모형을 개선하기 위하여, Support Vector Regression(이하 SVR) 기법을 적용하는 새로운 모형을 제시한다. SVR은 기존 Support Vector Machine이 가진 뛰어난 예측 능력을 바탕으로, 회귀문제 영역을 해결하기 위해 확장된 것이다. 본 연구의 제안 모형의 목적은 사람의 얼굴 표정으로부터 쾌/불쾌 수준 그리고 몰입도를 판단할 수 있도록 설계되는 것이다. 모형 구축을 위해 사람들에게 적절한 자극영상을 제공했을 때 나타나는 얼굴 반응들을 수집했고, 이를 기반으로 얼굴 특징점을 도출 및 보정하였다. 이후 전처리 과정을 통해 통계적 유의변수를 추출 후 학습용과 검증용 데이터로 구분하여 SVR 모형을 통해 학습시키고, 평가되도록 하였다. 다수의 일반인들을 대상으로 수집된 실제 데이터셋을 기반으로 제안모형을 적용해 본 결과, 매우 우수한 예측 정확도를 보임을 확인할 수 있었다. 아울러, 중회귀분석이나 인공신경망 기법과 비교했을 때에도 본 연구에서 제안한 SVR 모형이 쾌/불쾌 수준 및 몰입도 모두에서 더 우수한 예측성과를 보임을 확인할 수 있었다. 이는 얼굴 표정에 기반한 감정판단모형으로서 SVR이 상당히 효과적인 수단이 될 수 있다는 점을 알 수 있었다.