• 제목/요약/키워드: over-sampling

검색결과 1,283건 처리시간 0.035초

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

감지추구자적매체습관(感知追求者的媒体习惯) (Media Habits of Sensation Seekers)

  • Blakeney, Alisha;Findley, Casey;Self, Donald R.;Ingram, Rhea;Garrett, Tony
    • 마케팅과학연구
    • /
    • 제20권2호
    • /
    • pp.179-187
    • /
    • 2010
  • 对营销和广告经理来说, 理解消费者的偏好和使用的媒体类型是非常有必要的, 尤其是在如今市场细分的情况下. 清晰的理解能帮助经理更有效的选择合适的媒体. 而且由于性格特征的不同, 个人对媒体类型的选择和使用都不相同. 本文测试了一个性格特征, 即感知追求. 这是在测试 "新" 媒体偏好和使用的文献中尚未出现的. 感知追求是被定义为 "一种对变化, 新颖和复杂的感觉的需要和经历. 以及为承担这些经历愿意承受生理的和社会的风险" (Zuckerman 1979). 根据文献回顾, 我们提出了6个假设. 我们尤其关注使用与满足理论(Katz 1959), 这个理论解释了为什么人们选择媒体类型和他们使用不同媒体类型的动机的原因. 目前的理论表明高感知追求者(HSS), 由于他们对新颖, 激励和非传统的内容和想象的需要, 他们会更多的使用新媒体. 因此, 我们假设高感知追求者比低感知追求者(LSS)(H2a)或中等感知追求者(MSS)(H2b)会更多的使用网络而不是广播(H1a)或印刷媒体(H1b). 另外, 高感知追求者有更多的社交活动及朋友, 因此他们会比低感知追求者(a) 和中等感知追求者(b)更多的使用社交网络网页例如Facebook/MySpace(H3) 以及聊天室(H4). 感知追求者可以显示出一系列的行为包括抑制解除. 我们认为具有高水平去抑制的人们比低水平或中等水平的人们会更多的使用社交网络如Facebook/MySpace (H5) 和聊天室(H6). 我们的数据来源于对参加极限运动的参与者的网上调查. 为得到这个群组的信息, 我们使用雪球样本技术的提高版, 即连锁推荐方法来选择应答者. 这种方法被认为是对隐藏人群进行有效估算的方法(Heckathorn, 1997). 最终的有效样本包括1108名应答者. 主要是年轻人(56.36%在34岁以下), 男性(86.1%)和中产阶级(58.7%的家庭收入超过50,000美元). 我们用这个样本来进行感知追求的研究. 我们用简要感知追求量表来测试感知追求(Hoyle et al. 2007). 我们用自我报告使用过的不同媒体类型来测量媒体使用. 结果并不支持H1a和b. 高感知追求者并没有更多的使用网络这样的媒体. 事实上, 同其他的媒体类型相比, 这个平均水平是较低的. 高感知追求者使用最多的媒体类型时印刷媒体, 这说明了一种对主流的反抗. 结果支持H2a和b. 高感知追求者比低感知或中等感知追求者更多的使用网络. 进一步的分析揭示了在高感知和低感知追求者之间在使用印刷媒体方面有显著不同. 高感知追求者在他们感兴趣的极限运动方面会追求更专业的印刷出版物. 假设3a和b 揭示了高感知追求者比低感知或中等感知追求者更多的使用Facebook/MySpace. 在使用聊天室方面低感知和高感知追求者之间没有显著差距. 所以结果也不支持假设H4a, 但是H4b的结果是显著的. 不同抑制解除水平的应答者被认为使用Facebook/MySpace 和聊天室的水平也不同. 去抑制水平高比低水平或中等水平的使用Facebook/MySpace的水平高. 所以H5a和b 被支持. 类似的, H6b也被支持. 去抑制水平高的人们使用聊天室的概率显著多于中等水平的但并不多于低水平的人们(H6a). 这些结果为管理者提供了一些有趣的见解. 第一, 尽管高感知追求者比低感知或中等感知追求者更多的使用在线媒体, 但他们使用在线媒体仍然少于印刷或广播媒体. 广告执行者们不应该对这个重要的客户群过分的强调在线媒体. 第二, 社交媒体, 例如Facebook/MySpace和聊天室会是接近这个群体的有潜力的方法. 最后, 对去抑制水平高的群体, 有公共关系方面的启示. 这些个体更倾向于一些社会风险的行为. 这些直接的启示包括因特网捕食者和未来的雇主. 本研究的一个不足是受访者都是参与极限运动的. 这本身就是一个高感知追求者活动. 更大范围的人群需要被测试.

계획된 간호 정보가 수면량에 미치는 영향에 관한 연구 -개심술 환자를 중심으로- (The Effect of Structured Information on the Sleep Amount of Patients Undergoing Open Heart Surgery)

  • 이소우
    • 대한간호학회지
    • /
    • 제12권2호
    • /
    • pp.1-26
    • /
    • 1982
  • The main purpose of this study was to test the effect of the structured information on the sleep amount of the patients undergoing open heart surgery. This study has specifically addressed to the Following two basic research questions: (1) Would the structed in formation influence in the reduction of sleep disturbance related to anxiety and Physical stress before and after the operation? and (2) that would be the effects of the structured information on the level of preoperative state anxiety, the hormonal change, and the degree of behavioral change in the patients undergoing an open heart surgery? A Quasi-experimental research was designed to answer these questions with one experimental group and one control group. Subjects in both groups were matched as closely as possible to avoid the effect of the differences inherent to the group characteristics, Baseline data were also. collected on both groups for 7 days prior to the experiment and found that subjects in both groups had comparable sleep patterns, trait anxiety, hormonal levels and behavioral level. A structured information as an experimental input was given to the subjects in the experimental group only. Data were collected and compared between the experimental group and the control group on the sleep amount of the consecutive pre and post operative days, on preoperative state anxiety level, and on hormonal and behavioral changes. To test the effectiveness of the structured information, two main hypotheses and three sub-hypotheses were formulated as follows; Main hypothesis 1: Experimental group which received structured information will have more sleep amount than control group without structured information in the night before the open heart surgery. Main hypothesis 2: Experimental group with structured information will have more sleep, amount than control group without structured information during the week following the open heart surgery Sub-hypothesis 1: Experimental group with structured information will be lower in the level of State anxiety than control group without structured information in the night before the open heart surgery. Sub-hypothesis 2 : Experimental group with structured information will have lower hormonal level than control group without stuctured information on the 5th day after the open heart surgery Sub-hypothesis 3: Experimental group with structured information will be lower in the behavioral change level than control group without structured information during the week after the open heart surgery. The research was conducted in a national university hospital in Seoul, Korea. The 53 Subjects who participated in the study were systematically divided into experimental group and control group which was decided by random sampling method. Among 53 subjects, 26 were placed in the experimental group and 27 in the control group. Instruments; (1) Structed information: Structured information as an independent variable was constructed by the researcher on the basis of Roy's adaptation model consisting of physiologic needs, self-concept, role function and interdependence needs as related to the sleep and of operational procedures. (2) Sleep amount measure: Sleep amount as main dependent variable was measured by trained nurses through observation on the basis of the established criteria, such as closed or open eyes, regular or irregular respiration, body movement, posture, responses to the light and question, facial expressions and self report after sleep. (3) State anxiety measure: State Anxiety as a sub-dependent variable was measured by Spi-elberger's STAI Anxiety scale, (4) Hormornal change measure: Hormone as a sub-dependent variable was measured by the cortisol level in plasma. (5) Behavior change measure: Behavior as a sub-dependent variable was measured by the Behavior and Mood Rating Scale by Wyatt. The data were collected over a period of four months, from June to October 1981, after the pretest period of two months. For the analysis of the data and test for the hypotheses, the t-test with mean differences and analysis of covariance was used. The result of the test for instruments show as follows: (1) STAI measurement for trait and state anxiety as analyzed by Cronbachs alpha coefficient analysis for item analysis and reliability showed the reliability level at r= .90 r= .91 respectively. (2) Behavior and Mood Rating Scale measurement was analyzed by means of Principal Component Analysis technique. Seven factors retained were anger, anxiety, hyperactivity, depression, bizarre behavior, suspicious behavior and emotional withdrawal. Cumulative percentage of each factor was 71.3%. The result of the test for hypotheses show as follows; (1) Main hypothesis, was not supported. The experimental group has 282 minutes of sleep as compared to the 255 minutes of sleep by the control group. Thus the sleep amount was higher in experimental group than in control group, however, the difference was not statistically significant at .05 level. (2) Main hypothesis 2 was not supported. The mean sleep amount of the experimental group and control group were 297 minutes and 278 minutes respectively Therefore, the experimental group had more sleep amount as compared to the control group, however, the difference was not statistically significant at .05 level. Thus, the main hypothesis 2 was not supported. (3) Sub-hypothesis 1 was not supported. The mean state anxiety of the experimental group and control group were 42.3, 43.9 in scores. Thus, the experimental group had slightly lower state anxiety level than control group, howe-ver, the difference was not statistically significant at .05 level. (4) Sub-hypothesis 2 was not supported. . The mean hormonal level of the experimental group and control group were 338 ㎍ and 440 ㎍ respectively. Thus, the experimental group showed decreased hormonal level than the control group, however, the difference was not statistically significant at .05 level. (5) Sub-hypothesis 3 was supported. The mean behavioral level of the experimental group and control group were 29.60 and 32.00 respectively in score. Thus, the experimental group showed lower behavioral change level than the control group. The difference was statistically significant at .05 level. In summary, the structured information did not influence the sleep amount, state anxiety or hormonal level of the subjects undergoing an open heart surgery at a statistically significant level, however, it showed a definite trends in their relationships, not least to mention its significant effect shown on behavioral change level. It can further be speculated that a great degree of individual differences in the variables such as sleep amount, state anxiety and fluctuation in hormonal level may partly be responsible for the statistical insensitivity to the experimentation.

  • PDF

보길도(甫吉島) 붉가시나무림(林)의 군락생태학적(群落生態學的) 연구(硏究) (Community Ecological Study on the Quercus acuta Forests in Bogildo-Island)

  • 김종영;이정석;오광인;장석기;박진홍
    • 한국산림과학회지
    • /
    • 제89권5호
    • /
    • pp.618-629
    • /
    • 2000
  • 난대림(暖帶林) 육림(育林)에 필요한 기초 자료를 제공(提供)하고자 붉가시나무군락(群落)이 가장 발달되어 있는 보길도(甫吉島)에서 1998년 7월부터 1998년 10월에 걸쳐 붉가시나무가 우점(擾古)하는 임분(林分)을 대상으로 군락생태(群落生態)를 조사하였으며, 본 연구(硏究)에 의해 얻어진 결과(結果)는 다음과 같다. 1. 붉가시나무군락지(群落地)의 종구성(種構成)은 54과(科) 91속(屬) 113종(種) 9변종(變種) 1품종(品種) 등 모두 123종류(種類)가 출현(出現)하였고, 이중 상록성(常綠性) 식물종(植物種)은 모두 45종(種)이었으며, 모든 조사구(調査區)에서 공통(共通)으로 출현(出現)한 종(種)으로는 동백나무, 광나무, 사스레피나무, 청미래덩굴, 마삭줄 및 그늘사초의 6종(種)이었고, 생달나무, 자금우, 보춘화, 족제비고사리, 덜꿩나무 등 5종(種)의 출현빈도(出現頻度)가 80% 이상으로 가장 높게 나타났다. 2. 임관(林冠) 상층(上層)의 교목층(喬木層) 식피율(植被率)은 85% 이상으로 붉가시나무, 잣밤나무류(類), 참가시나무, 곰솔, 산벚나무의 순(順)으로, 아교목층(亞喬木層)에서는 동백나무, 광나무, 붉가시나무, 사스레피나무, 잣밤나무류(類)의 순(順)으로, 하층(下層)의 관목층(灌木層) 식피율(植被率)은 20% 내외로 동백나무, 광나무, 청미래덩굴, 생달나무, 덜꿩나무의 순(順)으로, 초본층(草本層)에서는 마삭줄, 자금우, 그늘사초, 동백나무(치수(稚樹)), 붉가시나무(치수(稚樹))의 순(順)으로 각각 중요치(重要値)가 높게 나타났다. 3. 붉가시나무군락(群落)은 평균(平均) 토양산도(土壤酸度)(pH) 5.00, 평균(平均) 유기물함량(有機物含量) 6.42%인 토양환경에서 군락이 발달하고 있었으며, 본(本) 도(島)의 남사면(南斜面), 서사면(西斜面), 북사면(北斜面) 및 동사면(東斜面)의 분포(分布) 순(順)으로 생장(生長)이 양호하게 나타난 것으로 보아 양수(陽樹)의 특성(特性)을 갖고있는 것으로 사료(思料)된다. 4. 임내(林內)의 평균(平均) 상대조도(相對照度)(RI)는 0.89%로서 미명(未明)의 상태를 유지하고 있는 것으로 나타났는데, 이는 붉가시나무의 엽면적(葉面積)이 다른 상록활엽수(常綠闊葉樹)들에 비해 크고, 분지(分技)된 맹아(萌芽)의 발달로 임관(林冠) 상층(上層)의 피복율(被覆率) 높아짐에 따라 임내(林內) 수광량(受光量)이 현저히 낮아져 나타난 결과이며, 지표층(地表層) 식생(植生)의 분포(分布)를 결정하는 가장 중요한 요인(要因)으로 작용하고 있는 것으로 사료(思料)된다. 5. 군락(群落) 내(內) 붉가시나무의 흉고직경(胸高直徑) 분포(分布)를 분석한 결과 교목층(喬木層), 아교목층(亞喬木層)모두 역J자형(逆J字形)의 분포(分布)를 보이고 있어 군락의 유지가능성(維持可能性)이 불투명(不透明)한 것으로 판단(判斷)된다. 6. 붉가시나무의 연륜폭(年輪幅)을 분석한 결과 년평균(年平均) 직경생장량(直徑生長量)은 2.44mm로, 맹아지(萌芽枝)의 발생초기(發生初期)인 1~12년 사이에는 완만하게 생장(2.04mm)하다 맹아지가 임관(林冠) 상층(上層)에 도달하는 13년 이후부터 22년까지 가장 높은 생장량(2.95mm)을 기록하였고, 이후부터는 생장량이 완만하게 감소(減少)하거나 정체(停滯)되는 경향(2.41mm)을 나타냈다.

  • PDF

중국 프랜차이즈 시스템에서의 본부와 가맹점간 신뢰의 영향요인 (The Determination of Trust in Franchisor-Franchisee Relationships in China)

  • 신건철;마요곤
    • 마케팅과학연구
    • /
    • 제18권2호
    • /
    • pp.65-88
    • /
    • 2008
  • 본 연구는 중국 프랜차이즈 시스템에 참여하는 본부와 가맹점 사이의 신뢰에 영향을 미치는 요인에 대해서 규명하고자 하였다. 중국의 외식 프랜차이즈 산업 가맹점을 조사대상으로 한 실증분석 결과, 프랜차이즈 시스템에서는 신뢰의 형성이 매우 중요하며, 이를 위하여 본부의 가맹점에 대한 지원의 강화, 양자 간의 원활한 커뮤니케이션, 가맹점의 과거결과에 대한 만족의 증진, 양자 간의 갈등 예방 및 해소가 필요하며, 이러한 본부의 가맹점에 대한 지원과 원활한 커뮤니케이션이 가맹점의 과거결과에 대한 만족을 증가시킬 수 있고, 원활한 커뮤니케이션이 양자 간의 갈등을 감소시킬 수 있는 것으로 나타났다.

  • PDF

직장암의 방사선치료에 대한 Patterns of Care Study: $1998{\sim}1999$년도 수술 후 방사선치료 환자들의 특성 및 치료내용에 대한 분석결과 (Postoperative Radiotherapy in the Rectal Cancers Patterns of Care Study for the Years of $1998\~1999$)

  • 김종훈;오도훈;강기문;김우철;김원동;김정수;김준상;김진희;길학재;서창옥;손승창;안용찬;양대식
    • Radiation Oncology Journal
    • /
    • 제23권1호
    • /
    • pp.22-31
    • /
    • 2005
  • 목적 : 전국의 각 병원 방사선종양학과에서 1998년과 1999년도의 2년간 직장암 진단 하에 수술 후 방사선치료를 시행한 환자들의 자료를 분석하여 한국인 직장암 환자의 전체적인 구성과 특성을 파악하고 치료 내용에 대한 현황을 조사하여 국가적인 자료로 활용하고자 하였다. 대상 및 방법 : 대상 환자의 기준은 1998년부터 1999년 사이에 직장 선암의 수술 후 방사선치료를 시작한 환자로서 육안적 잔여 병소 없이 근치적으로 수술이 이루어진 환자를 대상으로 했으며 직장암이외의 다른 암의 병력이 있거나 과거에 골반에 방사선치료를 받은 병력이 있는 환자는 제외하였다. 각 병원별 치료환자 수에 비례하여 해당 병원의 입력 환자수를 정한 후 PCS본부의 무작위 추출 과정을 통하여 입력할 환자를 선정하였다. 선정된 환자는 웹 기반 PCS시스템을 이용하여 각 병원에서 직접 자료를 입력하였다. 결과 : 전국의 19개 병원에서 총 309명의 환자 자료가 입력되었다. 남녀 성비는 59 : 41이었으며 하단연 기준 종양의 위치는 항문연 6 cm 이내가 $46\%$로 가장 많았다. 수술 전 CEA검사는 $79\%$에서 시행되었으며 이 중 $43\%$에서 6 ng/ml 이상인 것으로 나타났다 수술 전 직장내초음파검사는 50명($16\%$)에서만 시행되었으며 CT 등을 이용한 임상적 병기판정은 274명에서 가능하였으며 stage II가 $32\%$, III가 $48\%$를 차지하였다. 수술 후 조직소견에 의한 병리학적 병기는 stage II가 $34\%$, III가 $63\%$였다. 수술의 방법은 복회음부절제수술이 $38\%$, 저위전방절제술이 $59\%$였으며, 5명의 환자에서는 원격전이가 있었으나 원발병소와 함께 절제되었다. 절제연에서 종양세포가 발견된 경우가 13예였으며, 수술 후 항암화학치료를 받은 환자는 전체의 $91\%$였고 $80\%$의 환자는 정맥주사, $9\%$의 환자는 경구항암제를 투여한 것으로 나타났다. 항암제는 5FU와 leucovorine의 조합이 212명($69\%$)으로 가장 많았고 시행횟수는 6회가 140예($45\%$)로 가장 많았다. 환자의 치료자세는 복와위자세가 251예($81.2\%$)로 나타났고, 치료 조사야 수는 박스형 4문조사가 75예($24.3\%$)로 가장 많았으며 3문조사(후방-양측방)가 201예($65.0\%$)로 그 뒤를 이었다. 치료 시 소장을 조사야 외부로 이동시키기 위한 장치나 소변을 참는 등의 조치는 $40.1\%$의 환자에서 시행되었다. 선량의 처방점은 회전중심점이 140예($45.3\%$), 등선량곡선이 123예로 비슷하게 나타났다. 실제 치료된 조사선량은 $180\~7,740$cGy의 분포를 보였으며 목표선량의 $90\%$이상이 투여된 경우가 287예($92.9\%$)였다. 결론 : 전국 각 병원들의 환자를 종합하여 관찰된 내용은 문헌상 권장되는 것과 비슷한 결과를 보였으며 수술의 범위와 항암화학치료의 방법은 병원에 따라 비교적 다양한 형태로 시행되고 있는 것으로 나타났다. 각 병원의 방사선치료 내용은 환자의 상태에 따라 결정되는 탓에 방사선량과 조사야의 선택에 있어 차이가 관찰되었으며 처방된 치료에 대한 환자의 순응도는 $90\%$ 이상으로 높게 나타났다.

성인 여성들의 스트레스와 소화불량 및 수면장애와의 관련성 (A Study on Relationship between Degree of Stress and Dyspepsia, Sleeping, Satisfaction of Adult Women in Rural Area)

  • 김영희;조수열;강복수;이경수;김석범;김상규;강영아;황영록
    • 농촌의학ㆍ지역보건
    • /
    • 제25권1호
    • /
    • pp.51-63
    • /
    • 2000
  • 경상북도 고령군 동 단위를 계통적 집락 표본추출에 의해 10개 동을 선정하여, 30-69세 여성 571명을 대상으로 설문조사를 실시하였다. 1차 조사는 1999년 8월 27일부터 9월 1일까지 6일간 실시하였고 조사율은 60.3%였으며, 2차 조사는 11월에 실시하였으며 조사 완료율은 91.8%였다. 조사내용은 대상자의 인구사회학적 특성, 건강행위, 소화불량증상, 수면유도시간 및 수면만족도, 스트레스 정도 등이다. 스트레스는 Cohen이 개발한 Perceived Stress Scale을 이용하였으며, 소화불량 증상 정도의 설문은 ulcer-like 4문항, reflux-like 2문항, motility-like 4문항, non-specific 1문항으로 총 11개 문항으로 측정하였다. 수면유도 시간은 분으로, 수면만족도는 10점 척도로 측정하였다. 연령별 소화불량 정도, 수면유도시간, 수면 만족도, 스트레스 정도에서 소화불량 정도는 44점 만점에 평균 13.4점이었으며, 수면유도시간은 평균 35분이었고, 수면만족도는 평균 7.9점이었으며, 50-59세 연령군에서 소화불량 정도가 가장 높고, 수면유도시간이 가장 길고, 수면만족도는 가장 낮았다. 스트레스 정도는 평균 18.3점이었으며, 40대와 50대가 18.7점으로 가장 높았다. 수면유도시간과 수면만족도는 연령군에 따라 통계적으로 유의한 차이가 있었으나(p<0.05), 소화불량 정도와 스트레스 정도는 연령에 따라 차이가 없었다. 스트레스 정도를 3분위 구분하여 소화불량 정도, 수면유도시간, 수면만족도를 비료하여 보았을 때, 50대에서 소화불량 정도와 수면유도시간이 가장 높고 길게 나타났으며, 수면 만족도는 가장 낮았다. 또한 스트레스 3분위 군간에 통계적으로 유의한 차이가 있었다(p<0.01). 스트레스 정도와 수면만족도, 소화불량 정도간의 상관관계를 분석한 결과 스트레스와 수면만족도는 음의 상관관계가 있었고(p<0.01), 스트레스와 소화불량 정도간에는 양의 상관관계가 있었다(p<0.01). 또한 수면만족도와 소화불량 정도간에는 음의 상관관계가 있었다(p<0.01). 연령군별로 보면, 40대 이상에서 40대 미만보다 스트레스 정도와 소화불량 정도, 수면만족도간에 유의한 상관관계가 있었다. 교육수준별로는 중졸이하가 고졸이상에 비하여 스트레스 정도와 수면만족도, 소화불량과의 상관관계가 높았다. 소화불량 정도에 영향을 미치는 요인을 다중회귀분석을 이용하여 분석한 결과 스트레스 정도와 만성질환이 유의한 변수로 채택되었으며, 수면만족도에 영향을 미치는 요인을 분석한 결과 수면유도시간, 만성질환 보유 여부, 스트레스가 유의한 변수로 채택되었다. 농촌지역 성인 여성들은 50대에서 스트레스 수준이 가장 높으며, 수면 만족도는 가장 낮고, 소화불량을 많이 겪고 있는 것으로 나타나 이들 연령층에 대한 스트레스 관리가 필요한 것으로 판단되며, 또한 스트레스가 소화불량이나 수면만족도에 영향을 미치는 유의한 변수로 나타나 스트레스 관리를 통한 건강증진이 가능하다고 판단된다. 향후 스트레스에 대한 대응을 강화할 수 있는 대응자원에 대한 연구는 추가적으로 시행되어야 할 과제이며, 지역주민을 대상으로 한 스트레스 및 관련요인에 대한 연구가 시행되어 지역주민의 정신건강증진을 위한 방안들이 개발되어야 할 것이다.

  • PDF

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.

한정된 O-D조사자료를 이용한 주 전체의 트럭교통예측방법 개발 (DEVELOPMENT OF STATEWIDE TRUCK TRAFFIC FORECASTING METHOD BY USING LIMITED O-D SURVEY DATA)

  • 박만배
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1995년도 제27회 학술발표회
    • /
    • pp.101-113
    • /
    • 1995
  • The objective of this research is to test the feasibility of developing a statewide truck traffic forecasting methodology for Wisconsin by using Origin-Destination surveys, traffic counts, classification counts, and other data that are routinely collected by the Wisconsin Department of Transportation (WisDOT). Development of a feasible model will permit estimation of future truck traffic for every major link in the network. This will provide the basis for improved estimation of future pavement deterioration. Pavement damage rises exponentially as axle weight increases, and trucks are responsible for most of the traffic-induced damage to pavement. Consequently, forecasts of truck traffic are critical to pavement management systems. The pavement Management Decision Supporting System (PMDSS) prepared by WisDOT in May 1990 combines pavement inventory and performance data with a knowledge base consisting of rules for evaluation, problem identification and rehabilitation recommendation. Without a r.easonable truck traffic forecasting methodology, PMDSS is not able to project pavement performance trends in order to make assessment and recommendations in the future years. However, none of WisDOT's existing forecasting methodologies has been designed specifically for predicting truck movements on a statewide highway network. For this research, the Origin-Destination survey data avaiiable from WisDOT, including two stateline areas, one county, and five cities, are analyzed and the zone-to'||'&'||'not;zone truck trip tables are developed. The resulting Origin-Destination Trip Length Frequency (00 TLF) distributions by trip type are applied to the Gravity Model (GM) for comparison with comparable TLFs from the GM. The gravity model is calibrated to obtain friction factor curves for the three trip types, Internal-Internal (I-I), Internal-External (I-E), and External-External (E-E). ~oth "macro-scale" calibration and "micro-scale" calibration are performed. The comparison of the statewide GM TLF with the 00 TLF for the macro-scale calibration does not provide suitable results because the available 00 survey data do not represent an unbiased sample of statewide truck trips. For the "micro-scale" calibration, "partial" GM trip tables that correspond to the 00 survey trip tables are extracted from the full statewide GM trip table. These "partial" GM trip tables are then merged and a partial GM TLF is created. The GM friction factor curves are adjusted until the partial GM TLF matches the 00 TLF. Three friction factor curves, one for each trip type, resulting from the micro-scale calibration produce a reasonable GM truck trip model. A key methodological issue for GM. calibration involves the use of multiple friction factor curves versus a single friction factor curve for each trip type in order to estimate truck trips with reasonable accuracy. A single friction factor curve for each of the three trip types was found to reproduce the 00 TLFs from the calibration data base. Given the very limited trip generation data available for this research, additional refinement of the gravity model using multiple mction factor curves for each trip type was not warranted. In the traditional urban transportation planning studies, the zonal trip productions and attractions and region-wide OD TLFs are available. However, for this research, the information available for the development .of the GM model is limited to Ground Counts (GC) and a limited set ofOD TLFs. The GM is calibrated using the limited OD data, but the OD data are not adequate to obtain good estimates of truck trip productions and attractions .. Consequently, zonal productions and attractions are estimated using zonal population as a first approximation. Then, Selected Link based (SELINK) analyses are used to adjust the productions and attractions and possibly recalibrate the GM. The SELINK adjustment process involves identifying the origins and destinations of all truck trips that are assigned to a specified "selected link" as the result of a standard traffic assignment. A link adjustment factor is computed as the ratio of the actual volume for the link (ground count) to the total assigned volume. This link adjustment factor is then applied to all of the origin and destination zones of the trips using that "selected link". Selected link based analyses are conducted by using both 16 selected links and 32 selected links. The result of SELINK analysis by u~ing 32 selected links provides the least %RMSE in the screenline volume analysis. In addition, the stability of the GM truck estimating model is preserved by using 32 selected links with three SELINK adjustments, that is, the GM remains calibrated despite substantial changes in the input productions and attractions. The coverage of zones provided by 32 selected links is satisfactory. Increasing the number of repetitions beyond four is not reasonable because the stability of GM model in reproducing the OD TLF reaches its limits. The total volume of truck traffic captured by 32 selected links is 107% of total trip productions. But more importantly, ~ELINK adjustment factors for all of the zones can be computed. Evaluation of the travel demand model resulting from the SELINK adjustments is conducted by using screenline volume analysis, functional class and route specific volume analysis, area specific volume analysis, production and attraction analysis, and Vehicle Miles of Travel (VMT) analysis. Screenline volume analysis by using four screenlines with 28 check points are used for evaluation of the adequacy of the overall model. The total trucks crossing the screenlines are compared to the ground count totals. L V/GC ratios of 0.958 by using 32 selected links and 1.001 by using 16 selected links are obtained. The %RM:SE for the four screenlines is inversely proportional to the average ground count totals by screenline .. The magnitude of %RM:SE for the four screenlines resulting from the fourth and last GM run by using 32 and 16 selected links is 22% and 31 % respectively. These results are similar to the overall %RMSE achieved for the 32 and 16 selected links themselves of 19% and 33% respectively. This implies that the SELINICanalysis results are reasonable for all sections of the state.Functional class and route specific volume analysis is possible by using the available 154 classification count check points. The truck traffic crossing the Interstate highways (ISH) with 37 check points, the US highways (USH) with 50 check points, and the State highways (STH) with 67 check points is compared to the actual ground count totals. The magnitude of the overall link volume to ground count ratio by route does not provide any specific pattern of over or underestimate. However, the %R11SE for the ISH shows the least value while that for the STH shows the largest value. This pattern is consistent with the screenline analysis and the overall relationship between %RMSE and ground count volume groups. Area specific volume analysis provides another broad statewide measure of the performance of the overall model. The truck traffic in the North area with 26 check points, the West area with 36 check points, the East area with 29 check points, and the South area with 64 check points are compared to the actual ground count totals. The four areas show similar results. No specific patterns in the L V/GC ratio by area are found. In addition, the %RMSE is computed for each of the four areas. The %RMSEs for the North, West, East, and South areas are 92%, 49%, 27%, and 35% respectively, whereas, the average ground counts are 481, 1383, 1532, and 3154 respectively. As for the screenline and volume range analyses, the %RMSE is inversely related to average link volume. 'The SELINK adjustments of productions and attractions resulted in a very substantial reduction in the total in-state zonal productions and attractions. The initial in-state zonal trip generation model can now be revised with a new trip production's trip rate (total adjusted productions/total population) and a new trip attraction's trip rate. Revised zonal production and attraction adjustment factors can then be developed that only reflect the impact of the SELINK adjustments that cause mcreases or , decreases from the revised zonal estimate of productions and attractions. Analysis of the revised production adjustment factors is conducted by plotting the factors on the state map. The east area of the state including the counties of Brown, Outagamie, Shawano, Wmnebago, Fond du Lac, Marathon shows comparatively large values of the revised adjustment factors. Overall, both small and large values of the revised adjustment factors are scattered around Wisconsin. This suggests that more independent variables beyond just 226; population are needed for the development of the heavy truck trip generation model. More independent variables including zonal employment data (office employees and manufacturing employees) by industry type, zonal private trucks 226; owned and zonal income data which are not available currently should be considered. A plot of frequency distribution of the in-state zones as a function of the revised production and attraction adjustment factors shows the overall " adjustment resulting from the SELINK analysis process. Overall, the revised SELINK adjustments show that the productions for many zones are reduced by, a factor of 0.5 to 0.8 while the productions for ~ relatively few zones are increased by factors from 1.1 to 4 with most of the factors in the 3.0 range. No obvious explanation for the frequency distribution could be found. The revised SELINK adjustments overall appear to be reasonable. The heavy truck VMT analysis is conducted by comparing the 1990 heavy truck VMT that is forecasted by the GM truck forecasting model, 2.975 billions, with the WisDOT computed data. This gives an estimate that is 18.3% less than the WisDOT computation of 3.642 billions of VMT. The WisDOT estimates are based on the sampling the link volumes for USH, 8TH, and CTH. This implies potential error in sampling the average link volume. The WisDOT estimate of heavy truck VMT cannot be tabulated by the three trip types, I-I, I-E ('||'&'||'pound;-I), and E-E. In contrast, the GM forecasting model shows that the proportion ofE-E VMT out of total VMT is 21.24%. In addition, tabulation of heavy truck VMT by route functional class shows that the proportion of truck traffic traversing the freeways and expressways is 76.5%. Only 14.1% of total freeway truck traffic is I-I trips, while 80% of total collector truck traffic is I-I trips. This implies that freeways are traversed mainly by I-E and E-E truck traffic while collectors are used mainly by I-I truck traffic. Other tabulations such as average heavy truck speed by trip type, average travel distance by trip type and the VMT distribution by trip type, route functional class and travel speed are useful information for highway planners to understand the characteristics of statewide heavy truck trip patternS. Heavy truck volumes for the target year 2010 are forecasted by using the GM truck forecasting model. Four scenarios are used. Fo~ better forecasting, ground count- based segment adjustment factors are developed and applied. ISH 90 '||'&'||' 94 and USH 41 are used as example routes. The forecasting results by using the ground count-based segment adjustment factors are satisfactory for long range planning purposes, but additional ground counts would be useful for USH 41. Sensitivity analysis provides estimates of the impacts of the alternative growth rates including information about changes in the trip types using key routes. The network'||'&'||'not;based GMcan easily model scenarios with different rates of growth in rural versus . . urban areas, small versus large cities, and in-state zones versus external stations. cities, and in-state zones versus external stations.

  • PDF