• Title/Summary/Keyword: 변수 중요도

검색결과 5,016건 처리시간 0.026초

데이터마이닝과 텍스트마이닝을 활용한 영화 흥행 예측 (Box Office Hit Prediction Using Data mining and Text mining)

  • 조효정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.316-318
    • /
    • 2021
  • 영화 수익에 있어 영화의 흥행 여부는 중요한 영향을 끼친다. 영화 흥행 요인은 영화 산업의 규모가 커지면서 많은 제작사들 및 투자자들이 고려해야 하는 사항이 되었다. 따라서 영화의 흥행을 예측하기 위한 많은 모델이 연구되었다. 본 연구의 목적은 선행연구에서 흥행에 유의미한 영향을 끼친다고 밝혀진 스크린 수, 감독명, 제작사명 등의 내재적인 속성과 더불어 온라인 구전 변수를 사용하여 영화 흥행 예측 모델을 만드는 것이다. 이때 기사 수, 블로그 수와 같이 온라인 구전의 크기를 나타내는 변수들을 사용하는 대신 개봉 후 첫 주간의 관람객 리뷰를 텍스트마이닝을 이용하여 전체 리뷰 중 긍정 리뷰의 비율에 따라 점수를 매긴 후 독립변수로 사용한다. 그 후, 데이터 마이닝 기법을 활용하여 만든 모델에 앞서 언급한 독립변수를 입력 값으로 사용하여 영화의 흥행을 예측한다. 최종적으로 의사결정트리와 로지스틱회귀를 수행한 결과 영화 흥행에 영향을 주는 독립변수를 찾고 모델의 성능을 평가하였다. 로지스틱회귀의 결과 관객 수, 평점이 영화의 흥행에 특히 유의한 영향을 끼치는 변수로 선정되었고 리뷰 역시 유의한 변수로 선정되었다. 이때 만들어진 모델은 약 90%의 높은 수준의 정확도를 보여주었다. 의사결정트리의 결과 관객 수가 가장 중요한 변수로 선정되었다.

그릿과 실책관리문화가 스타트업 구성원의 혁신행동에 미치는 영향

  • 김준성;이채원
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2024년도 춘계학술대회
    • /
    • pp.111-117
    • /
    • 2024
  • 본 연구는 스타트업이라 구분되는 기업의 구성원을 대상으로 그들의 혁신행동에 미치는 영향 요소를 파악하고자 하였다. 이를 위해 긍정심리학에서 중요한 변수로 다뤄지는 그릿(Grit)과 스타트업에서 특히 중요시 여겨지는 실책관리문화 변수를 중심으로 혁신행동에 미치는 영향을 살펴보았다. 그릿은 스타트업 구성원의 인내에 대한 노력, 조화열정, 상황적응력의 세 변수로 정의하였으며 실책관리문화와 더불어 스타트업 구성원의 혁신행동에 미치는 영향을 살펴보았다. 본 연구를 위해 기술창업 기반 7년 이내 스타트업 재직자를 대상으로 2023년 12월부터 2024년 1월까지 설문조사를 진행해 유효한 305개의 샘플을 확보하였다. 연구모델 분석을 위해 SPSS 24 통계 패키지를 활용하여 그릿과 혁신행동과의 관계 및 실책관리문화와 혁신행동 관계를 분석하였다. 분석결과 그릿의 3가지 변수인 인내에 대한 노력, 조화열정, 상황적응력은 스타트업 구성원의 혁신행동에 정(+)의 영향을 미쳤으며 실책관리문화 또한 스타트업 구성원의 혁신행동에 정(+)의 효과를 나타냈다. 하지만 통제변수로 활용된 성별과 연령은 혁신행동에 유의미한 영향을 미치지 않았다. 본 연구는 스타트업에게 매우 중요한 혁신행동에 영향을 미치는 변수들을 규명하고, 스타트업 구성원의 개인적 특성과 문화적 특성이 혁신에 어떤 영향을 미치는지 파악한데 의의가 있다고 하겠다. 본 연구 결과의 의의는 스타트업 혁신행동에 미치는 새로운 변수들을 규명했다는데 있다. 하지만 7년 이내 초기 창업 기업을 대상으로 305명이라는 제한된 표본으로 연구를 진행했다는 점이 향후 스타트업 범주 및 표본 확대를 보완하여 후속 연구의 확장이 필요하다고 판단된다. 또한, 그릿과 실책관리문화 외에 혁신행동에 대한 영향 변수의 규명이 필요할 것으로 사료된다.

  • PDF

국가정보화가 국가경제 성장에 미치는 영향분석 - 패널데이터 분석을 중심으로 - (An Analysis of the Impact of National ICT Development on Economic Growth)

  • 진상기;조정문
    • 정보화정책
    • /
    • 제19권3호
    • /
    • pp.64-93
    • /
    • 2012
  • 본 연구는 국가 경제발전에 있어 이론적으로 중요시되고 있는 국가 정보화 요소가 실제로(Empirically) 국가경제 발전에 영향을 미치는 지를 통계적 검정을 통해 밝히고자 '수요공급균형모형' 에 따라 IT 공급 변수, IT 수요 변수, IT 정책(투자) 변수로 연구 모형을 구성하였다. 더 나아가 경제적, 사회적으로 강조되고 있는 국가 발전 중요 요인들을 조절 변수로 설정하여 국가정보화 변수의 종속변수에 대한 조절효과의 여부 및 그 의미를 교차분석을 통해 보여 주었다. 이를 통해 본 연구에서는 정치적 사회적으로 국가발전에 중요한 요인으로 강조되었던 국가 투명성과 소비자물가 변화, 국가교육지수가 국가 정보화 변수가 국가경제발전에 미치는 효과를 조절하고 있음을 알 수 있었다. 즉 독립변수인 국가정보화가 국가경제력 발전에 긍정적이고 효과적인 기여를 할 수 있도록 하기 위해서는 국가투명성을 제고하고, 소비자물가를 적정한 수준에서 관리할 필요가 있음을 분석 결과 알 수 있었고 국가 경제력발전에 있어 정보화 교육이 지식정보사회에 있어 매우 중요함을 통계적으로 밝힐 수 있었다. 마지막으로 향후 지식정보사회에서 개별국가들이 국가경제발전을 도모하기 위한 국가정보화정책을 수립함에 있어 참고해야 할 정책적 시사점을 도출해 봄으로서 연구를 마무리하였다.

  • PDF

다중회귀에서 회귀계수 추정량의 특성 (Comments on the regression coefficients)

  • 강명욱
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.589-597
    • /
    • 2021
  • 단순회귀와 다중회귀에서 회귀계수의 의미는 차이가 있고 회귀계수의 추정값은 같지 않을 뿐 아니라 그 부호가 서로 다른 경우도 발생한다. 회귀모형에서 설명변수의 상대적 기여도의 파악은 회귀분석의 수행의 중요한 부분이다. 표준화 회귀모형에서 표준화 회귀계수는 해당 설명변수를 제외한 나머지 설명변수의 값이 고정되어있는 상황에서 설명변수가 표준편차만큼 증가하였을 때 반응변수가 표준편차를 기준으로 얼마나 변화했는가로 해석할 수 있지만 표준화 회귀계수의 크기가 각 설명변수의 상대적 중요도를 나타내는 척도라고 할 수 없음은 잘 알려져 있다. 본 논문에서는 다중회귀에서 회귀계수의 추정량을 상관계수와 결정계수의 함수로 나타내고 이를 추가적인 설명력과 추가적인 결정계수의 관점에서 생각해 본다. 또한 다양한 산점도에서의 상관계수와 회귀계수 추정값의 관계를 알아보고 설명변수가 두 개인 경우에 구체적으로 적용해 본다.

농업벤처기업의 빅데이터 사용의도에 미치는 영향요인과 기대편익에 대한 연구: 농업벤처 사업분야별 차이에 대한 비교를 중심으로

  • 안문형;허철무
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2020년도 추계학술대회
    • /
    • pp.47-53
    • /
    • 2020
  • 빅데이터 기술은 기업의 경쟁력을 높일 수 있는 혁신 기술 중 하나로 급성장하고 있는 가운데 농업 분야 또한 빅데이터를 활용한 경쟁력 제고와 미래 산업으로의 발전이 중요 당면과제로 부상하고 있다. 해외의 경우 농업 빅데이터를 활용한 스타트업이 빠른 속도로 증가하며 성장하는 반면 국내의 경우 생산 분야 일부 농업 벤처 외에는 빅데이터 활용이 미흡한 실정이다. 또한 기업의 빅데이터 활용수준이나 활용의도에 영향을 미치는 요인에 대한 연구가 대기업이나 특정 산업에 국한되어 이루어지고 있으며, 연구마다 영향요인 변수의 검증결과가 상이하게 나타나 산업/기업특성에 따라 연구가 필요하다. 본 연구의 목적은 농업벤처기업에서 새로운 ICT인 빅데이터를 도입하고 사용하는 데 영향을 미치는 요인을 파악하고, 이를 통해 기대하는 편익에 대해 파악함으로써 활용을 촉진할 수 있는 방안을 제시하는 데 있다. 본 연구는 빅데이터가 조직의 프로세스를 변화시키고, 최고경영층의 지원이 필수적이며, 기업이 처한 환경적 압박에 대응할 수 있는 수단으로 보고 기술·조직·환경(TOE: Technology-Organization-Environment) 프레임워크를 기반으로 혁신확산이론(Diffusion of Innovation Theory) 모형을 결합하여 본 연구에 적합한 변수들을 도출한 후 이들 변수간의 인과관계를 설정하여 연구모형을 구성하였다. 이에 따라 TOE모형의 기술적 요인에 관한 변수로는 혁신확산이론 변수인 상대적이점, 호환성, 복잡성을 채택하였고, 조직적 요인에 관한 변수로 최고경영층 지원, 비용부담능력을, 환경적 요인에 관한 변수로는 법적·정책적 지원, 경쟁자 압력을 채택하였다. 이들 3가지 요인에 속한 7가지 변수들과 빅데이터 사용의도와 기대편익 간의 관련성, 그리고 농업벤처 사업분야의 조절효과에 대한 8개의 가설을 설정하였다. 본 연구는 실제 농업벤처기업 종사자 대상 설문을 통한 실증연구를 통해 벤처 현장에서의 빅데이터 활용수준을 높이기 위한 기술적, 조직적, 환경적 관점의 정책 개선방안을 제시하고, 생산/가공/유통 등 사업분야별 비교를 통해 영향요인의 중요도 차이를 규명해 영역별로 차별적이고 효과적인 정책 방향성을 도출하는 데 시사점을 제시하고자 한다.

  • PDF

AutoML을 이용한 산사태 예측 및 변수 중요도 산정 (Prediction of Landslides and Determination of Its Variable Importance Using AutoML)

  • 남경훈;김만일;권오일;왕파우;정교철
    • 지질공학
    • /
    • 제30권3호
    • /
    • pp.315-325
    • /
    • 2020
  • 이 연구는 도로 비탈면에서 발생하는 산사태의 확률론적 예측에 기반된 산사태 발생에 영향을 미치는 인자의 중요도 산정 및 예측 모델을 개발하는 것이다. 산사태 예측 모델을 개발하기 위해 한반도 전 지역을 대상으로 2007년부터 2020년까지 조사된 30,615사면의 현장조사 자료를 활용하였다. 전체 131개의 변수 인자 중 지형인자 17개, 지질인자 114개(기반암 89개를 포함), 도로와의 이격거리를 사용하였다. 산사태 발생에 영향을 미치는 인자를 자동화된 머신러닝인 AutoML을 실시하여 예측 성능이 뛰어난 XRT(extremely randomized trees)를 선정하였다. 변수 중요도 분석결과 지형적 요인 10개, 지질인자 9개, 사회적 영향성인 도로와의 이격 거리와 관련된 항목순으로 급경사지 불안정에 가장 많은 영향을 주는 것으로 분석되었다. 개발된 모델의 신뢰성 검증을 수행한 결과 AUC 83.977%의 예측율을 확보한 것으로 나타났다. 이 모델은 산사태 이력을 기반으로 한 현장조사 자료만을 이용하여 변수 중요도의 순위를 도출함으로써 그에 따른 산사태 발생 가능성을 확률적 및 정량적으로 평가하였다. 향후 의사 결정자들에게 현장조사를 통한 사면진단 안전평가 시 신뢰성 있는 근거를 제공하리라 판단된다.

학습자 중심의 수준별 학습을 위한 웹기반 지능형 교수 시스템 (A Web-based Intelligent Tutoring System for Learner-centered learning by Level)

  • 양형정;최숙영
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.248-259
    • /
    • 2002
  • 최근의 새로운 교수 학습 형태인 웹기반 교육에서의 가장 중요한 요소는 시.공간적으로 떨어져 있는 학습자의 학습 상황을 파악하고 분석하여, 학습자에게 적절한 학습내용과 과정을 제시하는 하는 것이 무엇보다도 중요하다. 본 연구에서는 웹기반 교수 시스템에서 학습자의 수준에 맞는 적합한 학습 내용과 평가 문제를 제공하고, 그 평가 결과를 분석하여 반복학습 및 심화학습을 효과적으로 제공하고, 차기 학습을 할 경우에 이에 기초하여 적절한 학습이 이루어질 수 있도록 한다. 이를 위해 코스웨어를 설계시 학습목표의 중요도, 학습내용의 난이도, 학습목표와 학습내용과의 관련성과 각 항목의 가중치를 고려한 퍼지 함수에 의해 퍼지 소속성을 가진 퍼지 언어 변수로 각 프레임에 대한 수준을 표현한다. 또한, 학습의 평가도 문제의 난이도, 관련학습 자료의 난이도, 관련 학습목표의 중요도, 각각의 관련성을 고려하여 퍼지 함수에 의해 언어 변수로 평가된다. 이와 같이 퍼지 함수를 이용함으로써 학습자의 수준을 분석하고, 이에 적절한 학습 및 평가 내용을 제공하는데 여러가지 다양하고 불확실한 요소들을 고려하여 처리함으로써 보다 융통성 있고 효과적인 교수 학습 방법이 될 수 있다.

  • PDF

소비자의 친환경농산물 구매에 있어서 가격변수의 중요도 및 영향인자에 관한 분석 (The Effects of Price on Consumers' Purchasing Behavior for Eco-Friendly Foods)

  • 진현정;금석헌
    • 한국유통학회지:유통연구
    • /
    • 제16권3호
    • /
    • pp.105-133
    • /
    • 2011
  • 본 연구는 친환경농산물 구매에 있어서 소비자들이 생각하는 가격변수의 중요도를 살펴보고 가격수준에 대한 소비자의 의견에 영향을 미치는 요인들을 분석하는데 그 목적이 있다. 연구의 결과를 보면, 직접질문 결과 현재 친환경농산물 구매에 있어서 소비자들은 '제품에 대한 상세한 설명', '유통채널', '친환경식품 표기에 대한 신뢰' 등을 가격보다 더 중요하게 생각하고 있는 것으로 나타났다. 다음으로 서열로짓분석 결과가 제시하는 바는 '어린 자녀의 수'나 '가족 중 환자 유무' 등 상황적 요인이 친환경농산물의 가격수준에 대한 소비자들의 의견에 가장 큰 영향을 미치는 변수로 나타났다. 그리고 마지막으로 컨조인트분석 결과를 보면 '유통채널'이 가장 중요한 속성으로 나타났으며, 다음으로 '표기에 대한 신뢰' 그리고 가격 순으로 나타났다. 이는 첫 번째 직접질문방식의 결과가 제시하는 바와 비슷한 결과로 풀이된다. 즉 '친절한 설명'이라는 변수는 컨조인트분석에 포함하지 않았음을 감안할 때, 주어진 상품프로파일 상의 선택을 이용한 간접적인 분석 결과와 직접적으로 질문한 결과가 같은 의미를 제공하고 있음을 알 수 있다.

  • PDF

구조방정식(SEM)을 활용한 교통약자 이동편의시설의 중요도 분석 (Importance Factor Analysis on Mobility Facilities for the Transportation Disabled by Using Structural Equation Model)

  • 안우영;최리라
    • 대한토목학회논문집
    • /
    • 제34권3호
    • /
    • pp.939-945
    • /
    • 2014
  • 현재 수립된 대부분의 교통약자관련 이동편의증진계획에서는 투자우선순위를 결정함에 있어 교통약자 이동편의시설의 설치율과 만족도간의 중요도(요인 적재량)에 대한 분석 없이 설치율 또는 만족도가 낮은 항목을 우선적으로 고려하여 투자우선순위를 결정하고 있다. 따라서 본 연구에서는 구조방정식(SEM: Structural Equation Model)을 이용하여 외생잠재변수(Exogenous Latent Variables)와 내생잠재변수(Endogenous Latent Variables)간의 인과관계를 통계적으로 검증하고 설치율과 만족도를 동시에 고려한 교통약자 이동편의시설의 투자우선순위 결정모형을 제시하였다. 분석결과 이동편의 시설가운데 이용자 만족도에 가장 큰 영향을 주는 시설로는 버스정류장, 횡단보도, 보도 순으로 분석되었다. 버스정류장시설 중 정류장연석의 높이, 보도시설 중 보도의 평탄성 그리고 횡단보도시설 중 보행신호등 설치에 대한 중요도가 높게 분석되었다.

영상 데이터베이스 검색을 위한 Temporal texture 모델링의 성능분석 (Performance Analysis of Temporal Texture Modeling for Image Database Retrieval)

  • 홍지수;김도년;김영복;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1661-1664
    • /
    • 2000
  • 내용 기반의 비디오 검색에 있어 텍스처는 중요한 변수로 사용될 수 있다. 모든 물체의 표면은 독특한 성질을 보유하고 있으므로, 텍스처는 형상이나 색과 더불어 중요한 변수로 사용될 수 있다. 어떤 영상의 특징을 올바르게 추출하고 잘 분류하여 표현하는 것은 비디오 검색에 있어서 매우 중요하다. Temporal texture는 무한한 시공간적 범위의 복잡하고, 추상적인 움직임 패턴이며 자연 세계에 흔히 나타난다. 그러므로 이를 특징화시킬 수 있고, temporal texture 패턴을 얼마나 잘 이용할 수 있느냐는 비디오 검색의 성능에 많은 영향을 끼칠 수 있다. 본 논문은 temporal texture 모델링들 중 서로 다른 특징을 가진 세 가지의 모델을 선정하여 비교, 분석한다. 특히, 특징 추출의 분류가 정확하게 이루어지느냐에 초점을 맞추어서 분석하였다. 분류의 성능은 두 가지 변수 즉, 어떤 성질의 모델이며 비디오 데이터인가에 따라 달라지게 된다. 이들 모델링이 분류하기까지 걸리는 시간의 차이는 무시할 수 있을 정도의 시간차이므로, 정확도를 위주로 성능을 분석했다.

  • PDF