• 제목/요약/키워드: 리뷰데이터

검색결과 313건 처리시간 0.025초

농업기상 빅데이터를 활용한 스마트 식물병 관리 (Smart Plant Disease Management Using Agrometeorological Big Data)

  • 김광형;이준혁
    • 식물병연구
    • /
    • 제26권3호
    • /
    • pp.121-133
    • /
    • 2020
  • 기후변화와 이상기후, 급변하는 사회경제적 환경 하에 식량안보를 확보하고 지속가능한 성장을 위해서는 기존의 관행농업을 벗어나 빅데이터와 인공지능을 활용한 스마트농업으로의 전환이 시급하다. 스마트농업을 통해 식물병을 효율적으로 관리하기 위해서는 다양한 첨단기술과 융합할 수 있는 농업 빅데이터가 우선 확보되어야 한다. 본 리뷰에서는 스마트식물병관리를 위해 식물병리학 분야에서 기여할 수 있는 기상환경 및 농업 빅데이터에 대해 알아보고 이를 활용한 식물병의 예측, 모니터링 및 진단, 방제, 예방 및 위험관리의 각 단계별로 현재 우리가 어느 위치에 있는지를 살펴보았다. 이를 바탕으로 현재까지 스마트식물병관리를 위해 준비해온 것과 미흡했던 부분, 앞으로 나아가야 할 방향을 제시하고자 한다.

대규모 콘텐츠 추천을 지원하기 위한 UCI 메타데이터와 변환서비스의 기능 개선 (Improvement of UCI Metadata and Resolution Service for Massive Contents Recommendation)

  • 나문성;이재동
    • 한국멀티미디어학회논문지
    • /
    • 제13권3호
    • /
    • pp.475-486
    • /
    • 2010
  • 콘텐츠 추천 시스템은 콘텐츠에 대한 사용자의 선호도를 예측하고, 예측된 선호도가 높은 콘텐츠를 추천하는 시스템을 말한다. 디지털 식별자는 디지털 네트워크 환경에서 추상적인 작품(Work)이나 디지털 형태로 제작된 콘텐츠 등을 식별하는 역할을 한다. 디지털 식별자는 콘텐츠 추천 시스템에서 주로 이용되는 내용기반여과 기법과 협업여과 기법에서 효과적으로 활용될 수 있다. 본 논문에서는 UCI 국가표준 디지털 식별자를 대규모 콘텐츠 추천 분야에 효과적으로 활용할 수 있도록 기존 UCI 메타데이터를 확장하고 변환서비스를 개선하는 방안을 제시한다. UCI 메타데이터의 개선은 콘텐츠 추천에 필요한 요약, 키워드, 장르, 연령구분, 평점, 리뷰 항목을 추가하는 것이며, 변환서비스의 개선은 결과페이지에 콘텐츠에 대한 선호도 정보를 입력하는 부분을 포함함으로써 콘텐츠에 대한 선호도 정보를 수집할 수 있도록 하는 것이다. 개선된 UCI를 운용하는 시스템을 설계하고 구현함으로써 본 논문에서 제안한 개선 방안이 콘텐츠 추천에 활용될 수 있음을 보인다.

기계학습 접근법에 기반한 유전자 선택 방법들에 대한 리뷰 (A review of gene selection methods based on machine learning approaches)

  • 이하정;김재직
    • 응용통계연구
    • /
    • 제35권5호
    • /
    • pp.667-684
    • /
    • 2022
  • 유전자 발현 데이터는 각 유전자에 대해 mRNA 양의 정도를 나타내고, 그러한 유전자 발현량에 대한 분석은 질병 발생에 대한 메커니즘을 이해하고 새로운 치료제와 치료 방법을 개발하는데 중요한 아이디어를 제공해오고 있다. 오늘날 DNA 마이크로어레이와 RNA-시퀀싱과 같은 고출력 기술은 수천 개의 유전자 발현량을 동시에 측정하는 것을 가능하게 하여 고차원성이라는 유전자 발현 데이터의 특징을 발생시켰다. 이러한 고차원성으로 인해 유전자 발현 데이터를 분석하기 위한 학습 모형들은 과적합 문제에 부딪히기 쉽고, 이를 해결하기 위해 차원 축소 또는 변수 선택 기술들이 사전 분석 단계로써 보통 사용된다. 특히, 사전 분석 단계에서 우리는 유전자 선택법을 이용하여 부적절하거나 중복된 유전자를 제거할 수 있고 중요한 유전자를 찾아낼 수도 있다. 현재까지 다양한 유전자 선택 방법들이 기계학습의 맥락에서 개발되어왔다. 본 논문에서는 기계학습 접근법을 사용하는 최근의 유전자 선택 방법들을 집중적으로 살펴보고자 한다. 또한, 현재까지 개발된 유전자 선택 방법들의 근본적인 문제점과 앞으로의 연구 방향에 대해 논의하고자 한다.

Travel Route Recommendation Utilizing Social Big Data

  • Yu, Yang Woo;Kim, Seong Hyuck;Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.117-125
    • /
    • 2022
  • 최근 여행에 대한 관심이 높아지면서, 번거로운 여행 일정을 대신 수립해주는 여행 일정 추천 서비스에 대한 연구가 활발히 진행되고 있다. 여행 일정 추천에 있어 가장 중요하면서도 공통적으로 제시되는 목표는 여행 목적지 근처의 인기 관광지를 포함한 최단 거리 여행 경로를 제공하는 것이다. 다수의 기존 연구에서는 개인 맞춤형 스케줄 제공에 초점을 맞추었으며, 사용자의 여행 이동 경로 이력이나 SNS 리뷰가 존재하지 않을 경우 설문 조사가 필요한 문제점이 있었다. 또한 최단 거리를 계산할 때 발생할 수 있는 현실적인 문제점도 명확히 지적되지 않았다. 이와 관련하여, 본 논문에서는 소셜 빅데이터를 활용하여 인기 관광지를 알아내기 위한 정량화된 방법을 소개하고, 최단 거리 알고리즘 적용시 발생할 수 있는 문제점과 이를 해결하기 위한 휴리스틱 알고리즘을 함께 제시한다. 제안 방법을 검증하기 위해, 경상남도를 대상으로 63,000여 개의 플레이스 정보를 수집하고 빅데이터 분석을 수행했으며, 실험을 통해 제안한 휴리스틱 스케줄링 알고리즘이 실제 데이터 상에서 실시간 처리가 가능함을 확인하였다.

통계와 시각화를 결합한 데이터 분석: 예측모형 대한 시각화 검증 (Data analysis by Integrating statistics and visualization: Visual verification for the prediction model)

  • 문성민;이경원
    • 디자인융복합연구
    • /
    • 제15권6호
    • /
    • pp.195-214
    • /
    • 2016
  • 예측 분석은 패턴인식(Pattern recognition) 혹은 기계학습(Machine learning)으로 불리는 확률적 학습 알고리즘을 기반으로 하기 때문에 사용자가 분석 과정에 개입하여 더 많은 정보를 얻어내기 위해서는 높은 통계적 지식수준이 요구된다. 또한 사용자는 분석 결과외의 다른 정보를 확인 할 수 없고 데이터의 특성 변화와 데이터 하나하나의 특징을 파악하기 힘들다는 단점이 있다. 본 연구는 이러한 예측분석의 단점을 보완하고자 통계적인 데이터 분석 방법과 시각화 분석 방법을 결합하여 데이터 분석을 진행하였으며 통계적인 분석 방법만을 진행 할 경우 발생하는 단점을 보완하고 데이터에서 더 많은 정보를 도출해 내기 위한 방법론을 제시 하고자하였다. 이를 위해 본 연구는 영화 리뷰에서 추출한 감정 어휘가 독립변인이고 영화의 흥행 값이 종속변인인 데이터를 예제 데이터로 활용하여 진행하였다. 본 연구의 연구 방법론을 적용하였을 때의 이점은 다음과 같다. 첫째, 의사결정나무 분석에서 제시된 분할 기준이 적용될 때 마다 변하는 데이터의 패턴을 파악할 수 있다. 둘째, 제시된 최종 예측모형에 포함된 데이터들의 특성을 확인 할 수 있다. 본 연구의 시사점은 예측모형의 단점을 보완하고 데이터로부터 더 많은 정보를 추출하기 위해 통계적인 데이터 분석과 시각적인 데이터 분석을 결합하여 시행하였다는 것이다. 통계적인 분석 방법을 통해 각 변수의 관계를 파악하고 높은 예측 값을 가지는 모형을 도출하였으며, 시각화 분석에서는 인터랙션 기능을 제공함으로서 통계적으로 제시된 예측모형을 검증하고 더 다양한 정보를 도출 할 수 있게 하였다.

딥러닝을 사용하는 IoT빅데이터 인프라에 필요한 DNA 기술을 위한 분산 엣지 컴퓨팅기술 리뷰 (Distributed Edge Computing for DNA-Based Intelligent Services and Applications: A Review)

  • ;조위덕
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권12호
    • /
    • pp.291-306
    • /
    • 2020
  • 오늘날 데이터 네트워크 AI (DNA) 기반 지능형 서비스 및 애플리케이션은 비즈니스의 삶의 질과 생산성을 향상시키는 새로운 차원의 서비스를 제공하는 것이 현실이 되었다. 인공지능(AI)은 IoT 데이터(IoT 장치에서 수집한 데이터)의 가치를 높이며, 사물 인터넷(IoT)은 AI의 학습 및 지능 기능을 촉진한다. 딥러닝을 사용하여 대량의 IoT 데이터에서 실시간으로 인사이트를 추출하려면 데이터가 생성되는 IoT 단말 장치에서의 처리능력이 필요하다. 그러나 딥러닝에는 IoT 최종 장치에서 사용할 수 없는 상당 수의 컴퓨팅 리소스가 필요하다. 이러한 문제는 처리를 위해 IoT 최종 장치에서 클라우드 데이터 센터로 대량의 데이터를 전송함으로써 해결되었다. 그러나 IoT 빅 데이터를 클라우드로 전송하면 엄청나게 높은 전송 지연과 주요 관심사인 개인 정보 보호 문제가 발생한다. 분산 컴퓨팅 노드가 IoT 최종 장치 가까이에 배치되는 엣지 컴퓨팅은 높은 계산 및 짧은 지연 시간 요구 사항을 충족하고 사용자의 개인 정보를 보호하는 실행 가능한 솔루션이다. 본 논문에서는 엣지 컴퓨팅 내에서 딥러닝을 활용하여 IoT 최종 장치에서 생성된 IoT 빅 데이터의 잠재력을 발휘하는 현재 상태에 대한 포괄적인 검토를 제공한다. 우리는 이것이 DNA 기반 지능형 서비스 및 애플리케이션 개발에 기여할 것이라고 본다. 엣지 컴퓨팅 플랫폼의 여러 노드에서 딥러닝 모델의 다양한 분산 교육 및 추론 아키텍처를 설명하고 엣지 컴퓨팅 환경과 네트워크 엣지에서 딥러닝이 유용할 수 있는 다양한 애플리케이션 도메인에서 딥러닝의 다양한 개인 정보 보호 접근 방식을 제공한다. 마지막으로 엣지 컴퓨팅 내에서 딥러닝을 활용하는 열린 문제와 과제에 대해 설명한다.

편향된 의견 문서 검출을 위한 이상치 탐지 기법 (Outlier Detection Techniques for Biased Opinion Discovery)

  • 연종흠;심준호;이상구
    • 한국전자거래학회지
    • /
    • 제18권4호
    • /
    • pp.315-326
    • /
    • 2013
  • 소셜 미디어에서는 상품평, 영화평 등의 다양한 종류의 의견이 표현되고 있으며, 사용자들이 물품 구매 등에 있어 이러한 의견을 참고로 하여 결정을 내리는 것은 일반적이 되었다. 하지만 의견 정보의 활용도가 높아질수록 이를 부적절하게 왜곡하는 사례 또한 증가하고 있다. 예를 들어, 홍보를 목적으로 과도하게 긍정적인 의견이 포함된 리뷰를 작성하거나, 반대로 일반적인 평가에서 벗어나 과도하게 부정적인 의견을 게시하는 경우 등이다. 편향된 의견은 소셜 미디어의 신뢰성과 연결 되기 때문에 이를 검출하는 것은 점차 중요한 문제로 대두되고 있다. 기존의 오피니언 마이닝 혹은 감성 분석은 문서를 분석하여 그 문서가 가지고 있는 의견의 성향을 판단하는 기법이다. 하지만 기존의 연구는 의견을 단순히 긍정/부정으로만 분류하는 방향으로 연구가 이루어져 왔으며, 특히 사전에 의견 성향에 따라 분류된 충분한 양의 학습 데이터가 필요하다는 단점이 있다. 본 논문에서는 학습데이터가 없는 경우에, 전체 문서의 의견 성향 분포에서 벗어난 의견 문서를 검출하는 기법을 제안한다. 여기에는 각도기반 이상치 탐지와, 개인화된 페이지랭크 방법을 활용한다. 또한 영화 리뷰 문서를 대상으로 실험을 수행하여 제안한 방법들의 성능을 분석하였다.

감성분석 기반의 게임 소비자 온라인 구전효과 연구 (A Study on the Effects of Online Word-of-Mouth on Game Consumers Based on Sentimental Analysis)

  • 정근웅;김종욱
    • 디지털융복합연구
    • /
    • 제16권3호
    • /
    • pp.145-156
    • /
    • 2018
  • 배급사가 소매점을 통해 게임을 유통했던 과거와 다르게 현재는 디지털 콘텐츠인 게임을 온라인 기반의 유통채널을 활용하여 판매를 실시하고 있다. 본 연구는 온라인 디지털 콘텐츠 유통 채널인 스팀(Steam)에서 판매되는 게임의 판매량에 대해서 eWOM(전자구전효과)의 요인들이 어떤 영향을 미치는지 분석한다. 최근 빅데이터 기반의 데이터 마이닝 기법을 이용한 연구가 많이 진행되고 있는데, 본 연구에서 eWOM의 요인 중 각 리뷰의 감성을 분석할 수 있는 텍스트 마이닝 기법인 감성분석을 실시하여 eWOM의 감성지수를 도출한다. 감성분석은 나이브 베이즈(Naive Bayes)와 지지벡터기(SVM) 분류기를 활용하고, 정확도가 높은 지지벡터기(SVM) 분류기를 통해 감성지수를 산출한다. 도출한 감성지수와 eWOM의 크기인 각 게임의 리뷰의 수, eWOM의 평점인 각 게임의 유저점수를 독립변수로 하여 종속변수인 판매변화량에 대해서 회귀분석을 실시한다. 회귀분석 결과, 독립변수인 eWOM의 크기와 eWOM의 감성지수가 종속변수인 판매변화량에 영향을 미치는 것을 확인하였다. 본 연구는 연구결과를 통해 국내 게임 기업들이 스팀을 기반으로 해외진출 시 판매량에 영향을 미치는 eWOM의 요인들을 제시할 수 있는 시사점을 가진다.

리뷰-피드백 프로세스를 통한 고객 이탈률 추정: 텍스트 마이닝, 계량경제학, 준실험설계 방법론을 활용한 실증적 연구 (Estimate Customer Churn Rate with the Review-Feedback Process: Empirical Study with Text Mining, Econometrics, and Quai-Experiment Methodologies)

  • 김초이;김재민;정가현;박재홍
    • 경영정보학연구
    • /
    • 제23권3호
    • /
    • pp.159-176
    • /
    • 2021
  • 기존 연구들은 주로 사용자의 게임 참여 동기나 사회적 욕구에 따른 이탈 요인을 연구하였다. 하지만, 기존 연구들은 게임 참여 동기 관점에서 집중하다 보니, 사용자 불만 사항 개선에 따른 사용자 이탈에 관한 분석은 비교적 적게 이루어져왔다. 게임에 대한 사용자 불만 사항과 그에 따른 게임 품질 개선은 사용자가 게임에 참여하는 요인 중 하나이다. 따라서, 본 연구는 사용자 불만 요인이 사용자 이탈에 미치는 영향을 실증적으로 분석하여 그 관계를 살펴보고자 한다. 본 연구는 최근 유행했던 "PUBG - 배틀그라운드 게임"을 분석하여 제품 품질에 대한 불만 사항 피드백이 얼마나 사용자 이탈에 영향을 주는지 실증적으로 분석 한다. 텍스트 마이닝(Text Mining) 분석을 통해, 사용자들의 품질에 대한 불만요인을 도출하였고, 콕스모델(Cox Model)을 통해 불만 요인에 따른 사용자의 이탈률을 추정하였다. 또한 준실험설계 방법을 통해 실제 불만사항 개선 패치에 따라 사용자 수가 어떻게 변화하는지 살펴봄으로 본 연구 결과를 검증하였다. 분석 결과, 불만 사항 중 게임의 재미와 관련된 요인들이 사용자 이탈에 가장 큰 영향을 주었고, 반면 게임 사용 편의성과 관련된 불만 사항들은 비교적 사용자 이탈에 적은 영향을 준다는 것을 실증적으로 보였다. 본 연구결과에 따르면, 게임 불만 요인 개선에 따라 사용자들의 이탈 정도가 달라질 수 있으며, 이에 따라 게임 사용자 관리를 할 수 있다는 것을 밝혀냈다. 본 연구는 게임 개발 및 운영사 입장에서 사용자들의 불만 사항 개선에 대한 우선 순위를 제공해 줌으로서 실증적인 공헌을 제시한다.

오피니언마이닝을 이용한 사용자 맞춤 장소 추천 시스템 (Location Recommendation Customize System Using Opinion Mining)

  • 최은정;김동근
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2043-2051
    • /
    • 2017
  • 최근 빅데이터 분야의 높아진 관심과 더불어 빅데이터의 처리를 통한 응용 분야에 대한 관심도 높아지고 있다. 개인의 감성을 파악할 수 있는 오피니언마이닝은 사용자 개인 맞춤 서비스 제공 분야에서 많이 이용되고 있는 빅데이터 처리 기법이다. 이를 바탕으로 본 논문에서는 사용자들의 장소에 대한 텍스트 형태의 리뷰를 오피니언마이닝 기법으로 처리하고 k-means 클러스터링 작업을 통해 사용자의 감성을 분석하였다. 클러스터링 작업으로 분류된 비슷한 범주의 감성을 가진 사용자들끼리 동일한 수치 값을 부여한다. 부여된 수치 값으로 협업 필터링 추천 시스템을 이용해 선호도를 예측하고 예측 값이 높은 장소 순으로 지도위에 마커와 함께 내용을 표시하여 사용자에게 추천내용을 보여줄 수 있는 방안을 제안하였다.