• 제목/요약/키워드: 카이제곱 검증

검색결과 65건 처리시간 0.024초

Support Vector Machine을 이용한 온라인 리뷰의 용어기반 감성분류모형 (Terms Based Sentiment Classification for Online Review Using Support Vector Machine)

  • 이태원;홍태호
    • 경영정보학연구
    • /
    • 제17권1호
    • /
    • pp.49-64
    • /
    • 2015
  • SNS의 확산으로 온라인 상점에서는 상품에 대한 주관적인 의견이 내포되어 있는 고객리뷰 정보가 빠르게 생성되고 확산되어 다른 고객들에게 큰 영향을 미치고 있다. 이와 더불어, 고객들의 긍정적 또는 부정적 의견을 분석하여 개선방안을 모색하려는 오피니언마이닝(opinion mining)이 주목 받고 있다. 고객리뷰에 내포된 감성정보를 가진 용어들은 감성분류를 하는데 가장 중요한 역할을 하기 때문에 영향력이 높은 용어를 선별하는 것이 가장 중요하다. 본 연구에서는 품사태깅을 이용하여 최적의 용어들을 선별하고 용어정보에 기반한 문서수준에서의 감성분류모형을 제안하고자 한다. 고객리뷰의 감성분류모형에 대표적인 기계학습기법인 SVM을 적용하고, SVM의 입력변수 선정과정에 품사태깅 방식과 용어추출기법을 다르게 조합하고 사용하여 긍정적/부정적 문서를 분류하였다. 본 연구에서 제안한 감성분류모형의 성과를 검증하기 위해 아마존(Amazon.com)의 영화와 도서에 대한 고객리뷰 80,000개를 수집하여 불필요한 용어들을 제거한 후 품사태깅을 통해 용어를 추출하였다. 추출된 용어는 문서빈도, TF-IDF, 정보획득량, 카이제곱 통계량의 값을 산출하여 값을 통해 용어들을 순위화하고, 각 상위 20개에 해당하는 최적의 용어를 선정한 후 SVM을 이용하였다. 제안된 감성분류모형을 통해 기존 연구에서 언급한 형용사만을 사용한 예측변수와 4품사를 사용한 예측변수에서의 실험결과를 통해 비교 분석하였다. 카이제곱 통계량 기반의 감성분류모형이 다른 모형보다 예측성과가 가장 우수하게 나타나는 것을 확인할 수 있었다. 본 연구에서 제안된 문서수준에서의 용어기반 감성분류모형을 이용함으로써 온라인 상점에서의 서비스 개선과 경쟁력 확보에 많은 도움이 될 것으로 기대된다.

학교급식에 대한 급식품질, 급식이미지, 만족도에 관한 연구: 배식형태의 조절효과를 중심으로 (A Study on the Quality and Image of School Meal Service and Student Satisfaction with the Service: Focused on Moderating Effect of Distribution Types)

  • 임희랑;김학선
    • 한국조리학회지
    • /
    • 제19권5호
    • /
    • pp.11-22
    • /
    • 2013
  • 본 연구는 고등학생을 대상으로 한 학교급식의 서비스 품질속성, 급식 이미지 및 급식만족에 대한 영향관계를 규명하고 배식형태의 조절효과를 알아보았다. 연구 가설을 검증하기 위하여 통계 프로그램 SPSS 18.0, AMOS 18.0을 활용하여 빈도분석, 요인분석, 신뢰도 분석, 요인분석, 경로분석 및 카이제곱 적합성 검증을 실시하였다. 분석결과, 요인적재값이 0.4이상이고, ${\chi}^2$=258.831, d.f.=98, RMR=0.059, GFI=.884, AGFI=.839, NFI=0.908, IFI=0.941, CFI=0.940으로 척도가 타당도와 신뢰도가 있음을 보여 주었다. 가설검증을 위하여 구조 모형분석을 실시, 첫째, 급식 서비스품질은 급식이미지에 유의한 영향을 미칠 것으로 나타나 4개의 하위가설 모두 채택되었다. 둘째, 급식이미지는 급식만족에 유의한 영향을 미치는 것으로 나타났고 셋째, 급식이미지와 급식만족과의 관계에서 배식형태에 따른 조절효과가 있는 것으로 나타났다.

  • PDF

언어의 공기관계 분석을 위한 임의화검증의 응용 (Applying Randomization Tests to Collocation Analyses in Large Corpora)

  • 양경숙;김희영
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.583-595
    • /
    • 2005
  • 언어의 공기관계를 파악하는 데는 여러 가지 연관성 통계량들이 이용된다. 그러나 일부 통계량을 제외한 나머지 통계량들은 분포가 알려져 있지 않아 정작 통계량 값을 구하고도 명확한 설명을 하지 못하는 경우가 있다. 따라서 언어의 공기관계 분석을 위해서 정규근사나 t통계량을 이용하여 가설검증을 하는 경우가 많다. 그러나 공기관계에 있는 어휘빈도가 전체 빈도에서 차지하는 백분율이 매우 작기 때문에 정규근사에는 무리가 있어 보인다. 따라서 본 논문은 여러 논문에서 자주 언급되는 연관성 통계량의 특성을 임의화검증(randomization test)을 통해 고찰함으로써 계량언어학의 연어분석에서 데이터의 특성을 고려하여 보다 정확하게 언어의 공기관계를 이해할 수 있도록 도모하고자한다.

급성 충수 돌기염 환자의 대기시간 분석 (Analysis of The Delayed Time in Patients with Acute Appendicitis)

  • 박승익;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.889-892
    • /
    • 2013
  • 본 논문에서는 급성 복증을 주소로 야간 응급실 내원 시 영상의학과 전문의 부재 등과 관련된, 급성 충수 돌기염 진단을 위한 복부 초음파 검사의 환자 대기 시간과 충수 돌기 절제술 시행까지 환자 대기 시간을 분석한다. 응급실 내원 환자 41.5%에서 초음파 검사 대기 시간은 10시간 이상으로 나타났고, 외래 내원 환자의 45.2%는 수술 대기 시간이 18시간 이상으로 나왔다. 이는 초음파 검사의 대기 시간이 수술 대기 시간에 영향을 미치는 것으로 카이제곱검증에서 유의하게 나왔다(p<0.05). 따라서 본 논문에서는 환자들의 대기 시간을 감소시키기 위한 방법으로 응급실 의료진의 초음파 검사 시행에 따른 유익성과 급성 충수 돌기염의 특징을 이용한 의료 영상 분석, 연구의 필요성을 제안한다.

  • PDF

자동차 사고 경상환자의 장기입원 예측 모델 개발 (Development of Long-Term Hospitalization Prediction Model for Minor Automobile Accident Patients)

  • 이덕규;남동현;허성필
    • 한국산업정보학회논문지
    • /
    • 제28권6호
    • /
    • pp.11-20
    • /
    • 2023
  • 자동차보험 교통사고 진료비는 매년 증가하고 있다. 본 연구는 교통사고 진료비용 상승의 주요 항목인 경상환자 중 장기입원환자(18일 이상)를 예측하는 모델을 decision tree 등 5개 알고리즘을 이용하여 생성하고, 장기입원에 영향을 미치는 요인을 분석했다. 그 결과, 예측 모델의 정확도는 91.377 ~ 91.451이며 각 모델 사이에 큰 차이점은 없었으나 random forest와 XGBoost 모델이 91.451로 가장 높았다. 설명변수 중요도에 있어서 병원 소재지, 상병명, 병원 종류 등 장기환자군과 비 장기입원 환자군 사이에 모델마다 상당한 차이가 있었다. 모델 평가는 훈련 데이터의 교차검증(10회)한 모델별 평균 정확도와 실험 데이터의 정확도를 상호 비교한 결과로 검정했다. 설명변수 유의성 검증을 위해 범주형 변수는 카이제곱 테스트를 실시하였다. 본 논문의 연구 결과는 경상 환자들의 과잉진료 및 사회적 보험료 비용을 줄이는 진료행태 분석에 도움이 될 것이다.

제주지역 렌터카 및 비사업용 승용차 사고특성 비교분석 (A Comparative Analysis of the Rental-car and non-Commercial Passenger Car Accident Characteristics in Jeju Island)

  • 권영민;장기태;손상훈
    • 대한교통학회지
    • /
    • 제35권2호
    • /
    • pp.105-115
    • /
    • 2017
  • 지난 10년간 대한민국에서 발생한 전체 교통사고 수는 감소했지만, 사업용 차량의 교통사고는 꾸준히 증가하는 추세를 보이고 있다. 특히, 연중 많은 관광객이 방문하고 렌터카를 주 교통 수단으로 이용하는 제주도의 경우 렌터카 사고 문제로 심각한 인명 피해와 사회적 비용이 야기되고 있다. 이에 본 연구는 제주지역에서 발생한 렌터카 사고의 특성을 비사업용 일반승용차 사고 특성과 비교 분석하였고, 사고 감소 방안을 제시하였다. 본 연구에서는 지난 2년간(2014-2015년) 제주지역에서 발생한 918건의 렌터카 사고와 4,201건의 일반승용차 사고 데이터를 카이제곱검정 및 z-검정 등의 통계적 방법론을 활용하여 분석하였다. 분석결과 렌터카 사고와 일반승용차 사고의 특성은 상이한 것으로 나타났다. 렌터카 사고는 20-30대 젊은 운전자와 면허를 취득한지 얼마 되지 않은 운전자 비율이 높은 것으로 나타났으며, 인적 및 환경적 요인에 관련된 사고특성이 일반승용차와 유의한 수준 하에서 통계적으로 다르게 나타났다. 특히 운전 미숙, 낯선 지리, 익숙하지 않은 차량 등은 렌터카 사고를 유발하는 주요 원인으로 판단된다. 반면, 렌터카 사고 분석결과 차량적 요인에 대한 명확한 특징은 나타나지 않았다. 본 연구의 결과는 제주지역 뿐만 아니라 렌터카 운행이 증가하는 지역, 관광지 특성이 강한 지역에서 교통사고 특성 분석 및 교통안전대책 수립과정에서 유용하게 활용될 수 있을 것으로 판단된다.

상관관계가 존재하는 등급별 동질성 검정방법 (Class homogeneous tests with correlation)

  • 홍종선;이나영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.73-83
    • /
    • 2013
  • 신용평가방법에서 등급의 계량화 중 신용등급 변화 검정방법은 등급별로 추정된 예측부도율과 실제부도율과의 동질성을 검정하는 방법으로 한 시점에 대한 이항검정과 카이제곱검정 등이 있고, 여러시점의 정확성을 검증하는 방법으로 정규성검정, 확장된 신호등검정 등이 있다. 본 연구에서는 현실적인 상황을 고려하여 이런 검정방법들이 상관관계가 존재하는 경우에 등급별 동질성 검정방법을 소개하고 이 방법들을 신용평가 이외에 다양한 분야의 자료에 활용할 수 있음을 알아본다.

상관관계를 반영한 신용등급 계량화 검정기법 연구 (Study on the validation methods of calibration considering correlations)

  • 김은나;하정철
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.407-417
    • /
    • 2010
  • 신BIS협약에서는 자본적정성 규제에 있어서 자율성 확대를 위해 내부등급시스템을 허용하였고, 이에 따라 시스템의 적합성 검증의 중요성을 더욱 강조하게 되었다. 적합성검증은 양적 질적 검증으로 나뉘며 이 때 양적 검증은 변별력, 안정성, 등급의 계량화로 구별된다. 본 논문에서는 양적 검증의 등급의 계량화 중 신용등급 변화 검정기법에 대하여 연구하려고 한다. 등급의 계량화 검정은 등급별로 추정된 부도율과 실제 부도율과의 차이를 검정하는 방법으로 한 시점에 대한 검정으로 이항검정과 카이제곱검정, Brier score, 신호등 검정이 있고, 여러 시점의 정확성을 검증하는 방법으로 정규성 검정, 확장된 신호등 검정이 있다. 신용평가시스템의 정확성을 높이고, 현실 상황에 반영이 가능하려면 상관관계를 고려하지 않을 수 없다. 본 논문에서는 부도상관관계를 고려한 확장된 신호등 검정을 제안하고자 한다.

계량분석을 통한 폭탄테러사건의 패턴분석 (A quantitative study on patterns of terrorist bombing incidents)

  • 윤민우
    • 시큐리티연구
    • /
    • 제36호
    • /
    • pp.317-347
    • /
    • 2013
  • 이 연구는 계량분석을 통해 아프가니스탄 지역에서 발생한 폭탄테러 사건의 주요한 특성을 살펴보고 빈도수와 사상자 수에 영향을 미치는 주요한 요인을 탐구한다. 이를 위해 미국 START 프로그램의 Global Terrorism Database의 폭탄테러사건 데이터 중 아프가니스탄에서 2002년 1월 1일에서 2011년 12 월 31일 사이에 발생한 케이스들을 분석했다. 기술적 통계분석과 카이제곱 검증, 그리고 로지스틱 회귀분석기법을 사용하여 폭탄테러 사건을 계량 분석하였다. 분석결과에 따르면 테러사건의 경향성이 뚜렷이 나타난다. 이를 유추하면 테러리스트는 무작위가 아니라 어떤 상황조건의 영향을 받아 합리적 사고를 통해 폭탄테러를 수행한다. 예를 들면, 폭탄테러 사건은 최근으로 올수록 더 증가하였으며 특히 시골지역과 비파슈툰 부족지역에서 더욱 가파르게 증가하였다. 한편, 테러사건이 최근 들어 증가하는 추세에 반해 사건 당 사상자수는 오히려 감소하는 경향을 보여주었다. 이 밖에도 마약생산수준이 높은 지역에서는 사상자수가 낮게 나타났으나 마약생산지역이라도 파슈툰 부족지역에서는 사상자수가 더 높게 나타났다. 또한, 정부와 군, 경찰 같은 적대적인 목표물에 대한 공격사건에서는 사상자가 더 높게 나타났다. 결국 이러한 분석결과는 폭탄테러가 어떤 특성과 경향성을 띠며 빈도수와 사상자수에 영향을 미치는 주요한 예측요인들이 존재한다는 가설을 지지한다.

  • PDF

30-79세 한국 성인의 비만과 치주염의 관계에 대한 융합연구 (A convergence study on the association between obesity and periodontitis in Korean adults aged 30-79)

  • 한수진
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.95-103
    • /
    • 2020
  • 본 연구는 성인의 비만과 치주염 사이의 연관성을 확인하고, 비만의 각 단계에서 치주질환과 건강행동의 융합적 관계를 확인하는 것이었다. 국민건강영양조사 제7기 원시자료를 활용하여 30-79세 성인 10,056명을 추출하였으며, 가중치를 적용한 복합표본설계를 반영하여 카이제곱 검증과 다변량 로지스틱 회귀분석을 수행하였으며, 인구사회학적 특성과 건강상태로 보정하였다. 비만단계가 높아질수록 치주염 위험이 증가되는 것을 확인하였다. 흡연과 구강관리용품 사용, 구강검진 비수검이 치주염과 유의한 관련이 있었으며, 비만의 단계에 따라 영향요인에 차이가 있는 것을 확인하였다. 비만 단계의 증가는 치주염 유병에 부정적인 영향을 미친다. 따라서 구강건강프로그램은 비만관리 과정에 적용되어야 한다.