• 제목/요약/키워드: 음이항회귀분석

검색결과 89건 처리시간 0.024초

온라인 리뷰의 감성과 독해 용이성이 리뷰 유용성에 미치는 영향: 가산형 리뷰 유용성 정보 활용 (The Effects of Sentiment and Readability on Useful Votes for Customer Reviews with Count Type Review Usefulness Index)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.43-61
    • /
    • 2016
  • 온라인 쇼핑몰의 상품에 대한 고객 리뷰는 구매자들의 구매 의사결정에 영향을 미치고 있으며 중요한 구전효과의 원천과 의사결정의 정보 원천의 역할을 하고 있다. 한 제품에 대한 리뷰가 무척 많기에 온라인 쇼핑몰들은 고객 리뷰 평가 방안을 도입하였고, 이를 통해 고객들에게 유용하리라고 판단되는 리뷰들을 걸러서 보여주거나 강조할 수 있게 되었다. 리뷰 평가 방안은 해당 리뷰가 도움이 되었는지 혹은 도움이 되지 않았는 지를 리뷰를 읽은 고객이 평가하게 하는 방안이다. Amazon.com은 고객 평가를 바탕으로 총 투표 수 중에서 유용하다는 투표 수의 비율을 리뷰 유용성 지표로 삼고 있으며, Yelp.com은 유용하다는 투표 수 자체를 유용성 지표로 삼고 있다. 본 연구는 고객 리뷰의 감성과 독해 용이성이 리뷰의 유용성에 미치는 영향을 파악하고자 한다. Amazon.com의 고객 리뷰 자료를 활용하여 비율형 유용성 지표를 종속변수로 하는 유사한 연구들이 수행되어 왔다. 본 연구에서는 Yelp.com의 리뷰 자료를 활용하여 가산형 리뷰 유용성 지표인 경우에도 동일한 효과가 존재하는지를 검토하고자 한다. Yelp.com의 음료와 음식 카테고리에 해당하는 업종에 대한 리뷰를 자료로 활용하였으며, 점포의 명성과 인기도 데이터를 파악할 수 있는 170,294개의 리뷰를 분석에 활용하였다. 분석결과는 리뷰의 긍정 정도는 유용 투표수를 늘리는데 음의 영향을 미쳤다. 평가가 긍정적인 리뷰에서는 음의 영향관계가 유의 하였으나, 평가가 부정적인 리뷰에서는 리뷰의 긍정 정도가 유용 투표 수에 미치는 영향은 유의하지 않았다. 독해 용이성은 리뷰가 읽기 어려울 수록 높은 값을 갖으며, 독해의 어려운 정도는 유용 투표수 획득에 음의 영향을 미쳤다. 독해 용이성은 긍정 리뷰, 부정 리뷰 관계없이 모두 음의 영향을 미치는 것으로 분석되었다. 이 결과는 유용 투표수가 0인 리뷰를 포함하여 영과잉 음이항 회귀분석을 수행한 경우와 유용 투표수가 0인 리뷰를 제외하고 음이항 회귀분석을 수행한 경우 모두 동일하게 파악되었다.

주거지역 가로환경 및 일상 걷기가 정신 건강에 미치는 영향 - 서울시 대상으로 - (Estimation of the Effects of Daily Walking Hours and Days on the Mental Health of Urban Residents - The Case in Seoul -)

  • 구본유;백승주;윤희연
    • 한국조경학회지
    • /
    • 제52권1호
    • /
    • pp.87-100
    • /
    • 2024
  • 본 연구는 도시민의 가로환경 이용을 매개로 하여 주거지역 가로환경 질이 도시민의 정신 건강에 미치는 영향을 밝히고자 하였다. 영과잉 음이항 회귀모형을 통해 보행 활동과 가로환경이 도시민의 우울 증세에 미치는 영향을 확인하였다. 연구 범위는 2017년 대한민국 서울특별시로 한정하였으며, 우울 유병 증세를 종속 변수, 가로환경 변수 및 보행 변수, 개인 특성을 독립 변수로 이용하였다. 나아가, 가로 녹지와 보행 빈도의 상호작용 효과를 살펴, 녹지에서 걷는 행위가 정신 건강에 미치는 상승효과를 분석하였다. 연구 결과, 가로 녹지 면적 비율이 높을수록 우울증세가 나타나지 않았다. 보행 빈도가 높을수록 우울 증세가 나타나지 않거나, 우울 증세가 존재할 경우에도 약하게 나타났다. 또한, 가로 녹지에서의 보행 빈도가 늘어날수록 우울 증세가 약하게 나타나는 상호작용 효과를 확인하였다. 시각적 복잡성은 낮을수록 우울 증세가 나타나지 않았다. 본 연구는 도시민의 정신 건강 문제를 지역사회차원에서 다루는 데에 기여하며, 가로 녹지와 보행 빈도의 시너지 효과를 발견함으로써 주거지역 가로 녹지 환경이 도시민 정신 건강 증진에 미치는 중요성을 강조하였다.

임의효과를 고려한 도심지 교차로 교통사고모형 개발에 관한 연구 (A Study on Developing Crash Prediction Model for Urban Intersections Considering Random Effects)

  • 이상혁;박민호;우용한
    • 한국ITS학회 논문지
    • /
    • 제14권1호
    • /
    • pp.85-93
    • /
    • 2015
  • 기존의 교통사고모형은 수집된 데이터에 대한 추정된 모수가 고정되어있다고 가정하여 교통량이나 기하구조의 길이와 폭 등은 설치형태와 관계없이 동일한 값을 적용하는 고정효과모형을 이용하여 개발하였다. 하지만 고정효과를 이용한 모형은 모형을 통해 추정된 계수의 표준오차 값이 과소 추정되거나 각 계수의 t-값이 과도하게 산정되어 모형의 설명력이 낮아지게 된다. 이를 극복하기 위하여 교통량, 기하구조, 그리고 관측되지 않은 다른 요인 등에 대한 이질성을 고려한 임의효과모형을 활용하여 모형을 개발할 수 있다. 본 연구에서는 임의효과모형의 효용성을 파악하고자 대전광역시 주요 89개 교차로를 대상으로 데이터를 수집하여 임의효과와 고정효과를 이용한 음이항 회귀모형을 개발하고 이를 비교 분석하였다. 모형개발 결과 년평균일교통량, 제한속도, 차로수, 우회전 전용차로 설치유무, 전방신호등 설치유무 등이 유효한 설명변수로 나타났으며 모형의 설명력을 비교해보면 로그-우도함수값이 임의효과에서 -1537.802로 고정효과의 로그-우도함수값 -1691.327보다 모형 설명력이 좋은 것으로 나타났으며 우도비의 경우 임의효과에서 0.279로 고정효과의 0.207보다 개선된 것으로 나타나 임의효과를 이용한 모형이 고정효과를 이용한 모형보다 우수한 것으로 나타났다.

영-과잉 회귀모형을 활용한 폭염자료분석 (Heat-Wave Data Analysis based on the Zero-Inflated Regression Models)

  • 김성태;박만식
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2829-2840
    • /
    • 2018
  • 음이 아닌(non-negative) 측정값을 가지는 확률변수에 있어서, 영(0)이 과도하게 측정되는 자료를 반연속형(semi-continuous) 자료와 영-과잉(zero-inflated) 자료로 구분한다. 이러한 자료에서는 특정 확률 분포(probability distribution) 하에서의 확률보다 훨씬 큰 확률로 0을 관측하게 되는데, 연속형(continuous) 확률분포를 고려하는 경우에는 반연속형으로, 이산형(discrete) 확률분포를 고려하는 경우에는 영-과잉이라고 한다. 본 연구에서는 경계값(0)의 측정 여부에 관한 모형과 0보다 큰 확률변수에 대한 확률분포를 활용한 모형 등 두 개의 부문으로 이루어진 모형, 즉 2-부문 모형(two-part model)을 소개하고자 한다. 특히, 이산형 확률분포 중 포아송 분포와 음이항 분포를 고려한 영-과잉 회귀모형(regression model)을 설명하고 그 특성을 파악하고자 한다. 실증연구에서는 이러한 영-과잉 회귀모형을 활용하여 지난 10년(2009년부터 2018년) 간 한국의 여름철(6-8월) 폭염주의보(heat-wave advisory) 및 폭염경보(heat-wave warning) 발생일수를 적합하였다. 또한 공간예측기법 중 하나인 범용크리깅(universal kriging)을 이용하여 적합결과를 바탕으로 한 폭염 발생일수에 대한 예측지도를 작성하였다.

영과잉 음이항 회귀모형을 적용한 농촌지역 성인 신체활동의 지역사회환경 요인 분석 (Neighborhood Environment Associated with Physical Activity among Rural Adults: Applying Zero-Inflated Negative Binominal Regression Modeling)

  • 김봉정
    • 한국보건간호학회지
    • /
    • 제29권3호
    • /
    • pp.488-502
    • /
    • 2015
  • Purpose: This study was conducted to determine the neighborhood environmental factors associated with physical activity among adults living in rural communities. Methods: A cross-sectional descriptive survey was conducted with a convenience sample of 201 adults living in three Ri in Y-city, Gyeonggi-do. Data were collected from face-to-face interview by trained interviewers and were analyzed using a zero-inflated negative binominal regression model. Results: Participants reported engaged in moderate or vigorous physical activity was 76.1%; 10.5% of participants reported that they met moderate physical activity recommendations and 14.5% of participants reported that they met vigorous physical activity recommendations. Zero-inflated negative binominal regression analysis showed association of increasing days of physical activity with social cohesion (${\beta}=.130$, p=.005), social network (${\beta}=-.096$, p=.003), and safety for crime (${\beta}=-.151$, p=.036), and no days of physical activity was associated with no attainment of education and marginally associated with increasing BMI. Conclusion: Neighborhood environmental factors including social cohesion, social network, and crime for safety were significantly associated with physical activity of rural adults. Community health nurses should expand an approach for individual behavior change to incorporate rural adults' specific neighborhood environmental factors into physical activity interventions.

서울시 자전거 교통사고와 사고 심각도에 영향을 미치는 근린환경 요인 분석 (Analysis of Neighborhood Environmental Factors Affecting Bicycle Accidents and Accidental Severity in Seoul, Korea)

  • 황선근;이수기
    • 국토계획
    • /
    • 제53권7호
    • /
    • pp.49-66
    • /
    • 2018
  • The purpose of this study is to analyze neighborhood environmental factors affecting bicycle accidents and accidental severity in Seoul, Korea. The use of bicycles has increased rapidly as daily transportation means in recent years. As a result, bicycle accidents are also steadily increasing. Using Traffic Accident Analysis System (TAAS) data from 2015 to 2017, this study uses negative binomial regression analysis to identify neighborhood environmental factors affecting bicycle accidents and accidential severity. The main results are as follows. First, bicycle accidents are more likely to occur in commercial and mixed land use areas where pedestrians, bicycle and vehicles are moving together. Second, bicycle accidents are positively associated with road structures such as four-way intersection. In contrast, three-way intersection is negatively associated with serious bicycle accidents. The density of speed hump or street tree is negatively associated with bicycle accidents and accidential severity. This finding indicates the effect of speed limit or street trees on bicycle safety. Fourth, bicycle infrastructures are also important factors affecting bicycle accidents and accidential severity. Bicycle-exclusive roads or bicycle-pedestrian mixed roads are positively associated with bicycle accidents and accidential severity. Finally, this study suggests policy implications to improve bicycle safety.

지체와 사고를 고려한 신호교차로 서비스수준 산정에 관한 연구 (Level of Service of Signalized Intersections Considering both Delay and Accidents)

  • 박제진;박성용;하태준
    • 대한교통학회지
    • /
    • 제26권3호
    • /
    • pp.169-178
    • /
    • 2008
  • 서비스수준은 통행속도, 통행시간, 통행자유도, 안락감 그리고 교통안전 등 도로의 운행상태를 설명하는 개념으로 도로시설별로 효과척도에 따른 서비스수준이 등급화되어 있고, 이를 이용하여 도로시설의 수행능력을 평가하고 있다. 그러나 도로시설의 안전성에 대한 문제가 대두되어지면서 신호교차로의 ${\upsilon}/c$ 비와 교통사고율은 기존 연구에서 U 자형의 2차함수 형태로 나타남을 제시하고 있다. 이는 교통소통에 의한 서비스수준이 우수하다고 하여 교통사고의 위험 측면에서도 안전하다고 말할 수 없음을 시사해 주고 있는 것이다. 즉, 현재 신호교차로 평가는 도로용량과 관련한 효과척도인 서비스수준 개념에 교통안전은 내포되어 있지 않음을 보여주고 있다. 따라서 본 연구에서는 신호교차로를 대상으로 교통소통(지체)과 교통안전(사고)을 동시에 고려한 서비스수준을 개발하여 신호교차로에 대한 새로운 평가과정 및 평가방법을 제시하고자 한다. 첫째, 광주광역시 신호교차로 50개 지점을 대상으로 2002${\sim}$2004년에 발생한 교통사고와 교통사고관련 자료를 수집하여 평균제어지체시간-EPDO 와 평균제어지체시간-사고율의 관계를 분석한 결과, 지체시간이 클수록 EPDO 와 사고율은 음지수함수 형태로 감소하는 것으로 나타나 현 신호교차로 수행평가 기준인 서비스수준에 교통안전 측면을 포함시켜 새로운 서비스수준을 개발해야 할 필요성이 있음을 증명하였다. 둘째, 교통류에 따른 사고유형별 사고건수가 음이항분포로 추론됨에 따라 교통사고예측모형으로 차대차의 경우 16개, 차대사람의 경우 4개의 음이항회귀모형을 개발하였다. 셋째, 지점별 연간지체비용과 연간사고비용을 이용하여 운영비용에 대한 확률밀도함수를 추정한 후, 서비스수준 등급에 대한 백분율을 적용시켜 서비스수준 기준을 제시하였다. 마지막으로, 본 연구에서 도출된 교통사고예측모형과 새로운 서비스수준을 활용하여 임의의 신호교차로에 대한 평가과정을 분석표로 제시하였다.

빅데이터(POS)를 활용한 백화점 방문수요 결정요인에 관한 연구 (A Study on the Determinants of Demand for Visiting Department Stores Using Big Data (POS))

  • 신성윤;박정아
    • 토지주택연구
    • /
    • 제13권4호
    • /
    • pp.55-71
    • /
    • 2022
  • 최근 국내 백화점 산업은 소비패턴의 변화에 의해 고급화와 차별화된 복합쇼핑문화공간으로 성장하고 있으며, 5개 대규모 회사를 중심으로 70개소가 운영되며 경쟁이 가속화되고 있다. 본 연구는 빅데이터 개념의 차량 자동입출차 시스템(pos)를 활용하여 백화점의 방문수요 결정요인을 분석하고, 백화점 산업의 경쟁력 강화를 위한 방안을 제시하고자 하였다. 분석방법은 2021년 신규개점으로 인하여 연간 매출액이 완전치 않은 지점 3곳을 제외한 67개의 지점을 대상으로 어떠한 사건이나 방문에 대한 빈도를 예측할 때 사용되는 음이항 회귀분석을 수행하였다. 분석결과 백화점 방문수요에 양(+)의 영향을 미치는 변수들은 공항·터미널·기차역 여부, 대지면적, 주차대수, VIP라운지수, 명품매장비율, F&B매장 수, 경기·인천지역인 것으로 나타났으며, 비상업지역 여부, 호텔은 음(-)의 영향을 미치는 것으로 분석되었다. 국내 백화점의 경쟁력 강화방안을 제시하면 다음과 같다. 첫째, 백화점 소비자들은 명품 브랜드에 대한 선호가 높다. 따라서 백화점은 자체적으로 해외 바이어팀을 구성하여 새로운 명품 브랜드를 발굴하여 유치하고, 고객들의 수요가 높은 명품 브랜드를 유치하는 전략이 필요하다. 또한, 구매력과 충성도 높은 소비자들을 유치하기 위해서는 기존 보다 더 차별화된 VIP 고객들을 위한 상품과 서비스를 제공할 필요성이 높다. 둘째, 신규 백화점 입점은 경기·인천 지역의 기차역, 공항, 터미널과 같은 교통거점 지역을 중심으로 추진하는 것이 바람직하다. 셋째, 백화점은 고급화된 쇼핑센터라는 측면에서 핵심임차인이 중요하므로 소비자의 수준과 선호에 부합하는 테넌트의 유치 전략이 필수적이다. 마지막으로 최고급 쇼핑센터인 백화점은 2021년 개점한 '더 현대'와 같이 차별화된 쇼핑, 문화, 외식과 여가서비스가 함께 제공되는 공간으로 개발되어야 향후 성장가능성이 담보될 수 있다.

외부기술이전 기업의 기술이전·사업화 전문기관의 활용이 기업의 기술성과 및 경영성과에 미치는 영향에 관한 연구 -기술이전·사업화 전문기관의 복합활용을 중심으로- (A Study on the Influence of the Use of Specialized Organizations for Technology Transfer and Commercialization on Corporate Performance -Focusing on the complex use of specialized institutions-)

  • 이정수;박명준;지성철;박민정;손동섭
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.189-197
    • /
    • 2021
  • 우리나라는 기술사업화 활성화를 위하여 기술이전·사업화 전문기관을 지속적으로 육성하고 있으며 다양한 형태로 구성되고 있다. 하지만 이러한 전문기관의 유형과 지원형태에 따른 성과에 대한 연구가 제한적으로 이루어지고 있다. 이에 본 연구는 기술이전·사업화 전문기관의 유형을 구분하여 복합활용성과와 기술을 수용한 기업의 성과를 측정하고자 한다. 이를 위하여 기업 외부기술 도입 및 활용을 추진한 380개기업을 대상으로 OLS 및 NBR 회귀분석 방법을 활용하여 가설검증을 실시하였다. 분석결과 기술이전·사업화 전문기관을 복합 활용 할수록 기업성과에 긍정적인 영향을 주고, 외부기술도입의 항목에 따라 기업성과에 상이한 영향을 주는 것으로 나타났다. 또한 산업성장단계가 초기일수록 산업이 안정화되는 영역의 기업성과가 높은 것으로 나타났다. 이를 통해 기업차원에서 기술이전·사업화 전문기관의 활용과 기업의 외부기술을 도입전략 시사점을 제시하였다.

리뷰어 평점 이력이 리뷰 조작에 대한 인식 및 리뷰 유용성에 미치는 영향: 여행플랫폼을 중심으로

  • 장문경;이새롬;백현미
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2022년도 추계학술대회
    • /
    • pp.181-185
    • /
    • 2022
  • 고객들은 조작된 온라인 리뷰가 범람하는 가운데 진정성과 가치를 지닌 리뷰를 보고자한다. 귀인 이론(Attribution theory)의 관점에서, 사람들은 리뷰어의 과거 평가 이력을 바탕으로 리뷰가 진정성 있는지를 판단하는 경향이 있다. 이러한 배경에서 본 연구의 목적은 리뷰어의 과거 평점 이력이 조작된 리뷰로 인식하는 것에 어떠한 영향을 미치며, 최종적으로 리뷰 유용성이 어떠한 영향을 미치는지 알아보는 것이다. 제안된 가설을 검증하기 위해 2차 데이터 분석(연구1)과 실험(연구2)을 수행했으며, 두 연구는 일관된 결과를 보여준다. 연구 1은 리뷰어의 과거 평가 이력이 리뷰 유용성에 미치는 영향을 분석하였다. 귀인이론에 근거하면, 사람들은 리뷰를 다른 목적을 가지고 작성되었다고 인식할 경우에 리뷰가 조작되었다고 생각하고, 그 리뷰가 물건이나 서비스의 진정한 가치를 평가하지 않았다고 간주한다. 따라서 해당 리뷰는 유용성이 낮게 평가되는 경향이 있다. 2차 데이터를 분석하기 위해 우리는 Python을 이용한 웹 스크레이퍼를 개발하여 TripAdvisor(TripAdvisor.com)에서 호텔 정보, 리뷰, 리뷰 정보 등의 연구 데이터를 수집하였다. 수집한 890명 리뷰어에 대한 100,621개의 리뷰를 분석하기 위해 음이항 회귀 분석을 수행하였다. 분석 결과, 평균 평점을 낮게 주는 리뷰어의 경우에 리뷰 유용성에 유의미한 영향을 미치지 않는 것으로 나타났다. 사람들은 극단적인 평점을 거의 주지 않는 리뷰어가 작성한 리뷰가 더 도움이 된다고 평가했다. 연구 2는 리뷰어의 과거 평점 이력을 기준으로 리뷰가 조작되었다고 평가하는 사람들의 인식 프로세스를 실험하였다. 실험 결과, 사람들은 리뷰어의 과거 평점 이력이 평균적으로 평점을 낮게 주는 경우에는 리뷰가 의심스럽다고 판단하지 않는 것으로 나타났다. 그리고 사람들은 리뷰어가 대부분 극단적인 평점을 주는 이력이 있다면 해당 리뷰어가 작성한 리뷰가 의심스럽다고 판단하는 것으로 나타났다. 연구2는 사람들이 리뷰어의 과거 평점 이력을 바탕으로 리뷰가 조작되었는지 또는 리뷰가 도움이 되는지 판단하는 경향이 있음을 보여준다. 본 연구는 귀인이론을 바탕으로 리뷰어의 과거 평점 이력이 리뷰 조작성에 대한 인식과 리뷰 유용성에 미치는 영향을 분석하여, 해당 연구분야에 새로운 관점을 추가한 기여점이 있다.

  • PDF