• 제목/요약/키워드: 기업 정보시스템

검색결과 4,045건 처리시간 0.037초

Support Vector Regression에서 분리학습을 이용한 고객의 구매액 예측모형 (The Prediction of Purchase Amount of Customers Using Support Vector Regression with Separated Learning Method)

  • 홍태호;김은미
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.213-225
    • /
    • 2010
  • 본 연구에서는 기업의 마케팅 프로모션에 따른 반응고객의 구매액 예측을 위한 방법을 제시하고 SVR의 효과적인 학습방법을 제시하였다. 프로모션에 의한 고객의 구매액을 기반으로 고객을 5등급으로 등급화하고 각 등급 내에서 SVR을 적용하여 고객의 구매액을 예측하였다. 본 연구에서 제안하는 예측된 고객의 등급 내에서 고객 구매액을 예측하는 분리데이터 학습법이 프로모션에 반응한 모든 고객을 대상으로 구매액을 예측하는 전체데이터 학습법보다 높은 예측성과를 보여주었다. 일반적으로 세분화된 고객집단을 하나의 집단으로 보고 동일한 마케팅 전략을 제시하나 본 연구를 통해 구매액에 따라 등급화 된 고객의 등급 내에서 다시 고객의 거래 구매액을 예측하여 동일한 집단 내에서도 차별화된 마케팅 전략을 제시할 수 있는 기반을 제시하였다. 즉 동일한 등급에서도 고객 구매액에 따라 고객의 우선순위를 정할 수 있으며, 이는 마케팅 담당자가 프로모션을 제시할 고객을 선정할 때 유용한 정보로 활용될 수 있다.

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.

일반영향요인과 댓글기반 콘텐츠 네트워크 분석을 통합한 유튜브(Youtube)상의 콘텐츠 확산 영향요인 연구 (A Study on the Impact Factors of Contents Diffusion in Youtube using Integrated Content Network Analysis)

  • 박병언;임규건
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.19-36
    • /
    • 2015
  • 대표적 소셜미디어인 유튜브는 기존 폐쇄형 콘텐츠 서비스와는 다르게 개방형 콘텐츠 서비스로 이용자들의 참여와 공유를 통하여 많은 인기를 유지하고 있다. 콘텐츠 산업에서 중요한 위치를 차지하고 있는 유투브 상의 콘텐츠 확산 요인에 관한 기존의 연구들은 댓글 수 등과 같은 일반적 정보 특성 요인과 조회 수 간에 상관관계 등을 분석하는 것이 대부분이었다. 최근 네트워크 구조를 기반으로 한 연구들도 진행되었으나 대부분 콘텐츠를 이용하는 대상인 구독자나 지인 등을 중심으로 한 인적 관계 네트워크 구조 연구가 대부분이었다. 이에 본 연구에서는 실질적인 콘텐츠를 중심으로 한 네트워크 구조와 일반요인을 통합한 모델을 제시하고 확산요인을 분석하고자 한다. 이를 위해 통합 모델 인과관계 분석과 함께 21,307개의 유튜브 콘텐츠를 콘텐츠 기반 네트워크 구조로 분석하였다. 본 연구를 통해 기존에 알려진 일반적 요인과 네트워크 요인들이 모두 조회수에 영향을 주는 인과관계를 통계적으로 재검증하였으며 통합적으로는 등록자의 구독자 수, 경과시간, 매개 중심성, 댓글 수, 근접 중심성, 클러스터링 계수, 평균 평점 순으로 조회 수에 긍정적인 영향을 미치는 것으로 분석되었다. 하지만 네트워크 요인중 연결정도 중심성과 고유벡터 중심성은 부정적 영향을 주는 것으로 분석되었다. 본 연구를 통하여 유튜브 콘텐츠 확산에 대한 일반영향요인과 구조적인 현상을 함께 규명하였다. 본 연구는 기업들이 유튜브와 같은 콘텐츠 서비스를 통한 온라인 마케팅 활동 시 콘텐츠들의 구조적인 면을 고려할 수 있는 근거를 제공하였으며 음반산업의 수요예측이나 콘텐츠 제작 업체들의 원활한 서비스 제공을 위한 설명력있는 영향요인 및 모델이 될 수 있을 것이다.

Are you a Machine or Human?: 소셜 로봇의 인간 유사성과 소비자 해석수준이 의인화에 미치는 영향 (Are you a Machine or Human?: The Effects of Human-likeness on Consumer Anthropomorphism Depending on Construal Level)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.129-149
    • /
    • 2021
  • 최근 인간과 사회적으로 상호작용할 수 있는 소셜 로봇(Social Robot)에 대한 관심이 커지고 있다. ICT 기술 발전에 힘입어 소셜 로봇이 개인에게 맞춤형 서비스와 정서적 교감을 제공하기 쉬워졌으며, 현대의 사회문제들과 이로 인한 개인의 삶의 질 저하를 해소하기 위한 수단으로 소셜 로봇의 역할이 주목받고 있다. 소셜 로봇에 대한 관심에 힘입어 소셜 로봇 보급 또한 크게 늘고 있다. 많은 기업이 다양한 목표시장을 겨냥하기 위한 로봇 제품들을 시장에 선보이고 있으나, 현재까지 시장을 선도하는 명확한 흐름은 부재하다. 이에 따라 소셜 로봇의 디자인을 통해 로봇을 차별화하고자 하는 시도가 늘고 있다. 특히 의인화는 소셜 로봇 디자인에서 중요하게 연구되고 있으며, 소셜 로봇을 의인화하여 긍정적인 효과를 발현하려는 접근이 많이 시도되었다. 그러나 소셜 로봇에 대한 의인화가 형성되는 메커니즘을 체계적으로 설명하는 연구는 부족하다. 의인화에 대한 모호한 이해는 소셜 로봇의 의인화를 형성하기 위한 디자인 최적점의 도출을 어렵게 하고 있다. 본 연구는 소셜 로봇의 의인화가 형성되는 메커니즘을 검증하는 것을 목적으로 한다. 본 연구는 3×2 Mixed Design의 실험 연구를 통해 소셜 로봇의 인간 유사성(Human-likeness)과 개인의 해석수준(Construal Level)이 의인화 형성에 미치는 영향을 확인하였다. 의인화가 형성되는 메커니즘에 대한 6개의 연구 가설을 제시하고, 206명 표본의 데이터를 분석하여 가설을 검증하였다. 분석 결과 소셜 로봇의 인간 유사성 수준에 따라 로봇 의인화 수준이 높아지며, 소비자 해석수준에 따라 인간 유사성이 의인화에 미치는 영향이 다르게 나타남을 확인하였다. 본 연구는 소셜 로봇의 디자인 속성인 인간 유사성과 개인의 사고방식인 해석수준을 함께 고려하여 의인화가 형성되는 메커니즘을 설명하였다는 점에서 시사점이 있다. 본 연구의 결과를 소셜 로봇 의인화 형성을 위한 디자인 최적화의 기준으로 활용할 수 있을 것으로 기대한다.

T맵 검색지와 썸트랜드 데이터를 이용한 관광인기도분석: 강원도 춘천을 중심으로 (Analysis of Tourism Popularity Using T-map Search andSome Trend Data: Focusing on Chuncheon-city, Gangwon-province)

  • 김태우;조재희
    • 서비스연구
    • /
    • 제12권1호
    • /
    • pp.25-35
    • /
    • 2022
  • 2020년 1월 국내 최초 환자가 발생한 코로나19(COVID 19)는 다양한 분야에 영향을 끼쳤다. 그중에서도 가장 타격을 받은 곳은 관광 분야라 하겠다. 특히 강원도 지역은 관광 기반의 산업 구조가 지역의 근간을 이루고 있고 관광산업이 소상공인 및 소기업의 주요 소득원이므로 그 피해가 크다. 이와 같은 피해 상황 및 정도를 확인하고자 강원권 지역 중에서 대중적 접근성이 가장 편리하며 서울 및 수도권 등에서 대중교통을 이용하여 당일 관광이 가능하고, 일반적인 이미지가 적은 비용을 사용한 관광이 가능하다고 인식되고 있는 춘천 지역을 대상으로 데이터 분석을 통하여 실증분석을 하였다. 이를 위하여 관광지식정보시스템에서 제공하는 춘천의 방문객 데이터를 기준으로 일반적인 지역 현황을 확인하였고 코로나 이전인 2019년도와 이후인 2020년도의 관심도 확인을 위하여 키워드 수집 전문 기업인 (주)바이브컴퍼니의 웹서비스 썸트랜드에서 수집한 키워드와 차량용 내비게이션 서비스와 통신 서비스 제공을 병행하는 SK텔레콤의 T맵 검색지 데이터를 함께 비교해 봄으로써 춘천에 대한 일반적인 지역 이미지를 분석하였다. 또한 키워드와 T맵 검색지 데이터를 적용한 관광 인기도 지수를 개발하여 2개 연도의 데이터를 비교해 봄으로써 코로나 상황이 춘천 지역 방문객들의 관심도가 실제 방문으로 이어지는 것에 얼마나 영향을 미쳤는지를 데이터 분석적인 접근 방법으로 고찰하였다. 데이터 마트 설계를 거친 후 관광인기도 지수를 적용한 빅데이터 분석 결과를 확인한 바에 의하면, 코로나19 상황은 강원도 춘천 지역 관광 인기도에 미치는 영향이 크지 않다는 것을 확인하였고, 해당 지역이 가지고 있는 지역별 특수성에 기반한 관광지 이미지 등을 확인하였다. 이와 같은 연구 분석 결과가 관광경제정책 입안에 유용한 참고 자료로 활용될 수 있을 것이다.

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

인공지능 기술에 관한 가트너 하이프사이클의 네트워크 집단구조 특성 및 확산패턴에 관한 연구 (Structural features and Diffusion Patterns of Gartner Hype Cycle for Artificial Intelligence using Social Network analysis)

  • 신선아;강주영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.107-129
    • /
    • 2022
  • 기술경쟁이 심화되고 있는 오늘날 신기술에 대한 선도적 위치의 선점이 중요하다. 선도적 위치의 선점과 적정시점에 기술 획득·관리를 위해 이해관계자들은 지속적으로 기술에 대한 탐색활동을 수행한다. 이를 위한 참고 자료로서 가트너 하이프 사이클(Gartner Hype Cycle)은 중요한 의미가 있다. 하이프 사이클은 기술수명주기(S-curve)와 하이프 수준(Hype Level)을 결합하여 새로운 기술에 대한 대중의 기대감을 시간의 흐름에 따라 나타낸 그래프이다. 새로운 기술에 대한 기대는 기술사업화뿐만 아니라 연구개발 투자의 정당성, 투자유치를 위한 기회의 발판이 된다는 점에서 연구개발 담당자 및 기술투자자의 관심이 높다. 그러나 산업계의 높은 관심에 비해 실증분석을 시도한 선행연구는 다양하지 못하다. 선행문헌 분석결과 데이터 종류(뉴스, 논문, 주가지수, 검색 트래픽 등)나 분석방법은 한정적이었다. 이에 본 연구에서는 확산의 주요한 채널이 되어가고 있는 소셜네트워크서비스의 데이터를 활용하여 'Gartner Hype Cycle for Artificial Intelligence, 2021'의 단계별 기술들에 대한 집단구조(커뮤니티)의 특성과 커뮤니티 간 정보 확산패턴을 분석하고자 한다. 이를 위해 컴포넌트 응집규모(Component Cohesion Size)를 통해 각 단계별 구조적 특성과 연결중심화(Degree Centralization)와 밀도(Density)를 통해 확산의 방식을 확인하였다. 연구결과 기술을 수용하는 단계별 집단들의 커뮤니케이션 활동이 시간이 지날 수록 분절이 커지며 밀도 역시 감소함을 확인하였다. 또한 새로운 기술에 대한 관심을 촉발하는 혁신태동기 집단의 경우 정보확산을 촉발하는 외향연결(Out-degree) 중심화 지수가 높았으며, 이후의 단계는 정보를 수용하는 내향연결(In-degree) 중심화 지수가 높은 것으로 나타났다. 해당 연구를 통해 하이프 사이클에 관한 이론적 기초를 제공할 것이다. 또한 인공지능기술에 대한 기술관심집단들의 기대감을 반영한 정보확산의 특성과 패턴을 소셜데이터를 통해 분석함으로써 기업의 기술투자 의사결정에 새로운 시각을 제공할 것이다.

지능형 온라인 뉴스 추천시스템 개발을 위한 체계적 속성간 상대적 중요성 분석: PWYW 지불모델을 중심으로 (An Analysis of the Comparative Importance of Systematic Attributes for Developing an Intelligent Online News Recommendation System: Focusing on the PWYW Payment Model)

  • 이형주;정누리;양성병
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.75-100
    • /
    • 2018
  • 최근 웹툰, 음원, 동영상, 게임, 교육, 앱 등 많은 콘텐츠 기업에서 콘텐츠 유료화 정책을 추진하고 있으나, 무료 콘텐츠에 익숙한 독자들의 문화적 관성이 온라인 콘텐츠의 유료화 전환에 많은 어려움을 주고 있다. 특히 온라인 뉴스 콘텐츠는 포털 사이트를 통해 무료로 배포되고 있어 유료화에 대한 독자들의 거부감이 다른 온라인 콘텐츠 보다 더욱 심한 실정이다. 이러한 문제 해결을 위해 학계 및 산업계에서 온라인 콘텐츠의 유료화 방안에 대한 연구가 다양한 차원에서 진행되었다. 최근에는 일부 온라인 뉴스 매체를 중심으로 독자들이 자발적으로 마음에 드는 뉴스 콘텐츠에 대해 원하는 만큼의 구독료를 지불하게 하는 Pay-What-You-Want (PWYW) 지불모델을 적용하는 시도가 이뤄지고 있다. 이에 본 연구는 PWYW 모델의 성공적인 정착을 위한 선결요인으로 독자의 자발적 독자구독료 지불행위에 영향을 미치는 온라인 뉴스 콘텐츠의 체계적 속성을 도출하고, 각 속성 및 하위 속성의 상대적 중요도를 비교 분석하였다. 좀 더 구체적으로, 선행연구 분석을 통해 기사제목 유형, 기사 이미지 자극성, 기사 가독성, 기사 유형, 기사 지배적 정서, 기사 내용-이미지 유사성 등 총 여섯 가지의 온라인 뉴스 콘텐츠의 체계적 속성을 도출하였으며, 내용분석(content analysis)을 통해 각 기사의 속성값을 측정하고 이를 기반으로 컨조인트 분석(conjoint analysis)을 실시하여 속성 간 상대적 중요도를 계산 및 검증하였다. PWYW 모델이 적용된 온라인 뉴스 콘텐츠 379개에 대한 컨조인트 분석 결과, 기사 가독성, 기사 내용-이미지 유사성, 기사제목 유형 등의 순으로 자발적 독자구독료에 큰 영향을 주는 것으로 분석된 반면, 기사 유형, 기사 지배적 정서, 기사 이미지 자극성 등은 상대적으로 낮은 중요도를 보이는 것으로 조사되었다. 본 연구는 내용분석과 컨조인트 분석을 동시에 실시하여 온라인 뉴스 콘텐츠에 대한 자발적 지불의도에 영향을 미치는 체계적 요인을 도출하고, 그 상대적 중요도까지 살펴보았다는 점에서 학술적 의의가 있으며, 온라인 뉴스 콘텐츠 제작자 및 사이트 운영자들로 하여금 독자들의 자발적 지불을 유도할 수 있는 가이드라인을 제시하였다는 점에서 그 실무적 의의가 있다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.