• 제목/요약/키워드: 리뷰 데이터

검색결과 315건 처리시간 0.03초

챗봇 형태로 구현한 사용자 맞춤형 레시피 추천 시스템 (Customized Recipe Recommendation System Implemented in the form of a Chatbot)

  • 안예진;조하영;강신재
    • 한국산학기술학회논문지
    • /
    • 제21권5호
    • /
    • pp.543-550
    • /
    • 2020
  • 음식의 레시피에 대한 관심도가 높아지고 있는 요즘 대부분의 레시피 검색 시스템들은 요리명, 또는 음식 재료명으로 검색하는 정도로 구현이 되어 있으며, 레시피마다 상이한 계량 단위로 식재료의 양에 대한 정보를 제공하기 때문에 자신이 원하는 인분에 맞춰 식재료의 양을 다시 계산해야 하는 불편함이 있다. 이에 본 논문에서는 이러한 불편 사항을 해결하고 메신저 대화에 익숙한 사용자들에게 맞춤형 서비스를 제공하기 위해 챗봇 형태의 사용자 맞춤형 레시피 추천 시스템을 구현하였다. 레시피에 대한 사용자의 리뷰와 별점, 조회 수 등을 기반으로 인기 있는 레시피들을 선별하고 전처리를 통해 해당 레시피별로 주요 단어와 식재료 양, 조리 순서 등 필요한 정보들만을 추출, 가공한 뒤, 그를 통해 얻은 약 10만 개의 데이터를 기반으로 사용자가 입력한 레시피명, 식재료명, 제외할 식재료명 등을 분석해 레시피를 필터링하고, 사용자가 입력한 인분을 기준으로 재계량하여 레시피를 추천하는 시스템을 구현하였다. 사용자의 요구에 따른 레시피 추천 결과물에 대한 만족도를 평가하여 90.5%의 결과를 얻을 수 있었다.

BI기술을 적용한 약물부작용감시시스템 개발 (Development of Adverse Drug Event Surveillance System using BI Technology)

  • 이영호;강운구;박래웅
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.106-114
    • /
    • 2009
  • 본 연구에서는 국내 약물부작용감시시스템 연구의 활성화 및 상용화를 목표로 약물부작용 시스템 사례를 분석하고 비즈니스인텔리전스(BI) 기술을 적용하여 약물부작용감시시스템의 기술구조를 제시한다. 최근에는 전자적과정(electronic review)과 수동적 리뷰과정(manual review process)을 병행하는 방법으로 약물부작용을 탐지하는 추세이며, 본 연구에서는 BI 기술중 ETL(Extract, Transform, Loading)을 적용하여 CDW(Clinical DataWarehouse)구축하였다. 부작용 판별 결과 처방의사 701명, 대상 환자는 남자 1,528명, 여자 1,531명으로 기간 내 환자는 총 3059명 이었으며 이중에서 약물부작용으로 의심되는 사례는 전체 318,222건 중에서 약 0.6%에 해당하는 2,085건으로 확인되었다. 이를 신호별로 분류하면 단순유형의 T.Bilirubin> 3mg/dL(부작용 유형-LabR0005)가 전체 2085건에서 548건으로 가장 높았다.

트위터를 활용한 감성 기반의 영화 유사도 측정 (Measuring Similarity Between Movies Based on Sentiment of Tweets)

  • 김경민;김동윤;이지형
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.292-297
    • /
    • 2014
  • 최근 소셜 네트워크 서비스가 보편화되면서, 이를 활용하여 사람들의 의견이나 감성 등을 파악하기 위한 감성분석 연구가 다양한 분야 진행되고 있다. 기존의 영화 관련 연구의 경우, 대부분이 영화평에 대해 단순 긍/부정으로 감성분석을 하여, 영화에 대한 선호도를 파악하는 데 그쳤다. 사람의 감성은 단순 긍/부정이 아닌 다양한 감성으로 분류될 수 있는데 반해, 이분법적 감성분석은 영화의 평점 정보에서 손쉽게 얻을 수 있는 선호도와 유사한 분석을 하는데 그친다. 따라서 영화의 평점보다 다양하고 유용한 정보를 얻기 위해서는, 영화 리뷰를 세분화된 감성으로 분석하여 영화에 대해 느낀 감성을 다양한 기준으로 분류할 필요가 있다. 본 논문에서는 Thayer 모델을 기반으로 감성 분류 기준을 세우고, 수집한 영화 관련 트윗을 이용하여 각 영화에 대해 대중이 느끼는 감성을 분석한다. 분석된 영화에 대한 감성 비율을 유클리드거리, 코사인유사도, 피어슨 상관계수를 이용하여 영화간의 유사도를 측정하였다. IMDB에서 제공하는 유사 영화 정보를 바탕으로 본 논문에서 제안하는 방식의 유용성을 검증하였다.

인터넷 감정기호를 이용한 긍정/부정 말뭉치 구축 및 감정분류 자동화 (Automatic Construction of a Negative/positive Corpus and Emotional Classification using the Internet Emotional Sign)

  • 장경애;박상현;김우제
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.512-521
    • /
    • 2015
  • 네티즌은 인터넷을 통해서 상품을 구매하고 상품에 대한 감정을 긍정 혹은 부정으로 상품평에 표현한다. 상품평에 대한 분석은 잠재적 소비자뿐만 아니라 기업의 의사결정에 중요한 자료가 된다. 따라서 인터넷의 대량 리뷰에서 의미 있는 정보를 분석하여 의견을 도출하는 오피니언 마이닝 기술의 중요성이 증대되고 있다. 기존의 연구는 대부분이 영어를 기반으로 진행되었고 아직 한글에 대한 상품평 분석은 활발히 이루어 지지 않고 있다. 또한 한글은 영어와 달라 꾸미는 말과 어미가 복잡한 특성을 갖고 있다. 그리고 기존의 연구는 통계적 기법, 사전 기법, 기계학습 기법 등을 사용하여 연구되었으나 인터넷 언어의 특성을 감안하지는 못하였다. 본 연구에서는 감정이 포함된 인터넷 언어의 특성을 분석하여 감정분석의 정확률을 높이는 감정분류 방법을 제안한다. 이를 통해 데이터에 독립적인 인터넷 감정기호를 이용해서 자동으로 긍정 및 부정 상품평을 분류할 수 있었고 높은 정확률, 재현율, Coverage 결과를 통해서 제안 알고리즘의 유효성을 확인할 수 있었다.

2년 장기 발암성 검색법의 이슈 (Issues in 2-year Long-term in vivo Carcinogenicity Assay)

  • 손우찬;김배환;장동덕;한범석;김종춘;이제봉;신진섭;김형진
    • 농약과학회지
    • /
    • 제8권4호
    • /
    • pp.239-254
    • /
    • 2004
  • 2년 발암성 독성시험의 실시와 평가에 대해서는 많은 논란이 있었다. 2년 발암성 시험의 유용성에 대한 많은 비판에도 불구하고 설치류를 이용한 발암성 시험은 사람의 발암성을 예측 할 수 있는 유일한 평가 시스템으로 인식되어 있으며, 아직 이를 대체할 만한 평가 방법은 없다고 할 수도 있다. 그간 규제기관과 학계에서는 다양한 발암성 평가모델을 제시해 왔지만 이런 시험 모델들이 과학적 타당성과 검증된 데이터에 근거하는지에 대해서는 논란이 있다. 2년 설치류 발암성 시험에 제기되는 문제들 즉, 종 및 품종의 선택, 용량설정, 시험기간, 군당 동물의 수, 배경병변, 검사항목, 시험 종료시 측정항목, 병리의 피어리뷰, 통계, 대체시험 모델, 종양의 평가, 그리고 위해성 평가 등에 대하여 검토하였다.

비격식 문서 분류 성능 개선을 위한 LDA 단어 분포 기반의 자질 확장 (Feature Expansion based on LDA Word Distribution for Performance Improvement of Informal Document Classification)

  • 이호경;양선;고영중
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.1008-1014
    • /
    • 2016
  • 트위터, 페이스북, 온라인 고객 리뷰 등은 신문기사처럼 정제된 글이 아닌 자유롭게 기술되는 비격식(informal) 텍스트 문서에 속한다. 이러한 비격식 문서에서 일관된 규칙이나 패턴을 찾는 일은 격식(formal) 문서 경우에 비해 용이하지 않기 때문에, 비격식 문서 분석을 위해서는 성능 개선을 위한 추가적인 접근 방법 필요다고 판단된다. 본 연구에서는 대표적 비격식 문서인 트위터 데이터를 열 가지 카테고리로 분류함에 있어 LDA(Latent Dirichlet allocation) 단어 분포를 사용하여 자질(feature)을 교정하고 확장한다. 토픽별로 상위에 랭크된 단어 자질들을 기반으로 다른 단어 자질들을 분해 및 병합하는 방식으로 유용한 자질 집합을 반복적으로 확장시킨다. 이렇게 생성된 자질로 문서 분류를 수행한 결과 자질 확장 이전에 비해 마이크로 평균 F1-score 7.11%p의 성능 개선 효과를 확인할 수 있었다.

웹2.0에서 의견정보의 실시간 모니터링을 위한 웹 콘텐츠 마이닝 시스템 (Web Contents Mining System for Real-Time Monitoring of Opinion Information based on Web 2.0)

  • 김영춘;주해종;최혜길;조문택;김영백;이상용
    • 한국지능시스템학회논문지
    • /
    • 제21권1호
    • /
    • pp.68-79
    • /
    • 2011
  • 본 연구에서 제안하는 시스템은 인터넷 상에 존재하는 여러 웹사이트들에 흩어져 있는 웹 콘텐츠에서 사용자 의견 정보들을 자동 추출 및 분석함으로써, 긍정/부정 의견별로 검색 및 통계를 확인할 수 있는 의견 검색 서비스를 제공한다. 그 결과 의견 검색 사용자들은 특정 키워드에 대하여 다른 사용자들의 의견을 손쉽게 한눈에 검색 및 모니터링하는 시스템을 용이하게 사용할 수 있으며, 웹 콘텐츠에서의 의견 추출 및 분석하는 기능을 제공받는다. 제안한 기법들은 다른 기법들과의 비교 실험을 수행하여 실제 성능이 우수함을 증명하였다. 성능 평가는 긍정/부정 의견 정보를 추출하는 기능의 성능 평가, 다국어 정보 검색을 위한 동적 윈도우 기법과 토크나이저 기법을 적용한 성능 평가, 그리고 정확한 다국어 음차표기를 추출 기법에 성능 평가를 실시하였다. 그 적용 사례로 대표적인 영화 리뷰 문장과 위키디피아 실험 데이터를 대상으로 실험하고 그 결과를 분석하였다.

대규모 복잡 정보에서 신뢰 클러스터를 이용한 추천 정확도 향상기법 설계 (Design a Method Enhancing Recommendation Accuracy Using Trust Cluster from Large and Complex Information)

  • 노기섭;오하영;이재훈
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.17-25
    • /
    • 2018
  • 최근 ICT기술의 발전과 스마트 기기의 급격한 보급으로 엄청난 양의 정보가 생성되고 있다. 추천 시스템은 과도한 정보제공(information overload)으로부터 정보 수용자의 적절한 판단을 도와주고, 정보 제공자에게는 기업의 이윤과 업체홍보 효과를 증대 시킬 수 있는 해결책으로 등장하였다. 추천 시스템은 다양한 접근법으로 구현이 가능하지만, 소셜 네트워크 정보로 성능을 향상시킬 수 있는 방법으로 제시되었다. 그러나 추천 시스템 내의 사용자간에 형성되는 신뢰 클러스터의 정보를 활용하는 방안은 연구되지 못하였다. 본 논문에서는 온라인 리뷰에서 생성되는 클러스터에서 클러스터 내부 객체 간 영향성과 트러스터-트러스티 간 정보를 이용하여 추천 시스템의 성능을 향상시키는 방식을 제안하였다. 제안하는 방식을 구현하고 실제 데이터를 활용하여 실험한 결과 기존의 방식들보다 예측 정확도가 향상됨을 확인하였다.

삼성헬스 사용자의 혜택 및 비용에 대한 연구: 앱 리뷰와 소셜미디어 데이터를 중심으로 (Samsung Health Application Users' Perceived Benefits and Costs Using App Review Data and Social Media Data)

  • 김민석;이유림;정재은
    • Human Ecology Research
    • /
    • 제58권4호
    • /
    • pp.613-633
    • /
    • 2020
  • This study identifies consumers' perceived benefits and costs when using Samsung Health (a healthcare app) based on consumer reviews from Google Play Store's app and social media discourse. We examine the differences in the benefits and the costs of Samsung Health using these two sources of data. We conducted text frequency analysis, clustering analysis, and semantic network analysis using R programming. The major findings are as follows. First, consumers experience benefits and costs on several functions of the app, such as step counting, device interlocking, information acquisition, and competition with global consumers. Second, the results of semantic network analysis showed that there were eight benefit factors and three cost factors. We also found that the three costs correspond to the benefits, indicating that some consumers gained benefits from certain functions while others gained costs from the same functions. Third, the comparison between consumer app review and social media discourse showed that the former is appropriate to assess the performance of app functions, while the latter is appropriate to examine how the app is used in daily life and how consumers feel about it. The current study suggests managerial implications to healthcare app service providers regarding what they should strengthen and improve to enhance consumers' satisfaction. It also suggests some implications from the two media, which can be mutually complementary, for researchers who study consumer opinions.

암 건강정보문해력과 암 조기진단행위: 체계적 문헌고찰 (Cancer Health Literacy and Cancer Screening Behaviors: A Systematic Review)

  • 곽영여;김현리
    • 한국융합학회논문지
    • /
    • 제12권9호
    • /
    • pp.373-385
    • /
    • 2021
  • 글로벌 데이터를 사용하여 암 건강정보문해력과 암 조기진단 행위 사이의 관계를 체계적으로 평가하고자 하였다. PRISMA 리뷰 가이드라인에 따라 2021년 1월31일까지 PubMed, CINAHL, Embase, Cochrane Library 4개의 웹 데이터베이스에 발표된 원문을 검색하였으며, 참고문헌 목록을 통해 추가로 검색하였다. 18세 이상의 참여자, 암 건강정보문해력과 암 조기진단 행위를 포함하여 측정하였다. 포함 기준에 충족되는 17건의 원문은 암 건강정보문해력을 측정했고 암 조기진단 행위에는 유방 촬영술, 임상 유방암 검진, Papanicolaou 검사, 대장 내시경 검사, PSA 검진 등이 포함되었다. 그중에 11건의 원문에서 암 건강정보문해력과 암 조기진단 행위 사이는 통계적으로 높은 긍정적인 상관관계를 확인하였다. 이러한 결과를 바탕으로 추후 연구에서는 암 건강 지식에 대한 효과적인 중재프로그램과 가이드라인을 개발하는 것에 초점을 맞추어야 한다. 연구결과를 근거로 암 조기진단율 과 공중 보건 향상을 위해서 암 건강정보문해력과 암 조기진단 행위에 관한 모든 영역으로 연구 범위를 확대하여야 한다.