• 제목/요약/키워드: 온라인 마이닝

검색결과 242건 처리시간 0.024초

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

상품 리뷰 요약에서의 문맥 정보를 이용한 의견 분류 방법 (A Sentiment Classification Method Using Context Information in Product Review Summarization)

  • 양정연;명재석;이상구
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.254-262
    • /
    • 2009
  • e비즈니스가 활발히 이루어지면서 소비자들은 온라인 쇼핑몰올 통해 수많은 상품을 접할 수 있게 되었고, 상품구매 시 다른 사람들의 리뷰를 참고하게 되었다. 하지만, 리뷰의 수도 많아짐에 따라 소비자가 모든 리뷰들을 살펴보기가 힘들다는 문제점이 대두되었으며 이를 해결하기 위해서 리뷰의 상품에 대한 평가를 요약하고 성향을 파악하는 오피니언 마이닝 연구가 나타나게 되었다. 본 논문에서는 상품리뷰를 대상으로 오피니언 마이닝을 수행하는 경우 어휘의 의견 성향을 파악할 때, 문맥정보를 활용하여 기존의 의견분류방법 보다 좀 더 정확한 의견 판단이 가능한 방법에 대해 다루고 있다. 이를 위해, 어휘가 사용될 때의 문맥정보를 정의하고 이를 의견분류에 적용하는 방법을 제안하였으며, 실험을 통하여 기존 연구 보다 상황별 알맞은 의견분류가 가능함을 보였다. 또한 수작업으로 말뭉치의 핵심 어휘들을 정의했던 기존 연구들에서의 방식에서 벗어나, 리뷰본문과 리뷰점수를 활용하여 자동으로 상황에 맞는 말뭉치를 구축하는 방법도 제안하였다. 이를 통해 상품리뷰에 나타난 어휘들의 문맥에 맞는 의미 성향을 정확하고 쉽게 판별해 낼 수 있게 되었다.

텍스트마이닝 기법을 활용한 한국인의 행복과 불행 탐색연구 (An Exploratory Study of Happiness and Unhappiness Among Koreans based on Text Mining Techniques)

  • 박상현;도강혁;김학영;박가은;윤진혁;김경일
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.10-27
    • /
    • 2018
  • 본 연구에서는 텍스트 마이닝 분석을 통해 한국 사회에서 행복과 불행이 갖는 의미를 탐색하였다. 자료수집 및 분석을 위하여 온라인 뉴스 포털에서 Word2Vec과 TF-IDF 방법을 사용하여 '행복' 및 '불행' 키워드와 유사한 단어를 추출했다. 또한 K-LIWC 사전을 사용하여 행복 및 불행과 연관된 단어들의 감성 속성에 대해 알아보았다. TF-IDF 분석 결과, 행복과 불행은 사회적 요인과 해당 년도의 사회적 이슈들과 각각 높은 관련성이 있는 것으로 관찰됐다. Word2Vec 분석에서는 '희망'이 6년 연속으로 행복과 유사성이 높은 단어로 나타났다. K-LIWC 분석에서 '돈재정적이슈', '학교', '의사소통'은 행복 및 불행과 모두 관련성이 높았다. 그밖에 '몸 상태와 증상'이 불행과 높은 관련성이 있는 범주로 나타났다. 이러한 결과를 바탕으로 본 연구의 의의, 제한점 및 후속연구에 대한 필요성을 논의하였다.

빅데이터 기반 시민의견 모니터링 방안 연구 : "경기지역화폐"를 중심으로 (A Study on Monitoring Method of Citizen Opinion based on Big Data : Focused on Gyeonggi Lacal Currency (Gyeonggi Money))

  • 안순재;이새미;유승의
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.93-99
    • /
    • 2020
  • 본 연구에서는 비정형적인 대용량의 텍스트 자료로부터 유의미한 정보를 추출하는 빅데이터 분석방법 중 텍스트 마이닝을 이용하여 시행 중인 정책과 제도에 대한 시민의견을 모니터링 할 수 있는지 확인하였다. '경기지역화폐'와 관련된 5,108건의 신문기사와 748건의 온라인 카페글을 수집하여 빈도분석, TF-IDF분석, 연관분석, 워드트리 시각화 분석을 수행하였다. 그 결과로 기사에서는 지역화폐의 도입 목적, 제공되는 혜택, 사용방법에 관련된 내용이 많았고 카페글에서는 지역화폐의 실사용과 관련된 내용 위주로 작성이 되어있음을 확인하였다. 또한 지역화폐 활성화를 위해서 뉴스는 정보전달자로서 지역화폐의 홍보에 관여하고 있었고 카페글은 지역화폐 사용자인 시민들의 의견으로 이루어져 사용과 관련된 실제적인 정보 교환의 장으로 기능하고 있었다. 지역화폐뿐만 아니라 다양한 정책과 제도에 관해서도 SNS와 텍스트 마이닝을 통해 시민들의 의견을 수렴하여 효과적으로 활성화시킬 수 있을 것으로 보인다.

텍스트 마이닝을 활용한 '가상관광'의 코로나19 전후 트렌드 분석 및 방향성 제언 (A Suggestion and an analysis on Changes on trend of the 'Virtual Tourism' before and after the Covid 19 Crisis using Textmining Method)

  • 성윤아
    • 한국융합학회논문지
    • /
    • 제13권4호
    • /
    • pp.155-161
    • /
    • 2022
  • 코로나19의 확산으로 '가상관광'이 주목받고 있다. 포털 뉴스를 대상으로 '가상관광'을 키워드로 검색하여 데이터 마이닝 기법인 로그오즈비 분석, 명사 빈도분석, 의미망 분석을 통해 추이와 방향성을 고찰하였다. 그 결과, 코로나19 이전부터 '체험'과 '기술'기반의 '가상관광'에 주목하고 있었으며, '콘텐츠의 다양성 확보'에서 코로나19 이후 '지역 경제의 회복을 위한 사업'으로 바뀌었다는 점과 '온라인' 기반의 '상호작용'이 가능한 '가상현실' '확장현실' 등의 정보통신기술 의존성이 커졌다는 점을 명확히 할 수 있었다. 메타버스 등 '가상공간'에 대한 수요가 확대되고 있으므로 정부는 조사결과에 기초한 지원계획과 정책을 수립하고, 지자체와 기업은 AISAS(Attension, Interest, Search, Action, Share)에 주목하여 차별적 콘텐츠를 기획·제작하며, 대학과 연구기관은 콘텐츠에 맞는 기술을 개발하여 적용, 평가, 실용화함으로써 경제적, 체계적, 순환적 구조가 이루어질 수 있도록 해야 한다.

치킨 리뷰의 이면: 텍스트 마이닝을 통한 리뷰의 탐색적 분석을 중심으로 (BEHIND CHICKEN RATINGS: An Exploratory Analysis of Yogiyo Reviews Through Text Mining)

  • 김준겸;최은솔;윤수현;이유빈;김동환
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.30-40
    • /
    • 2021
  • 코로나 19의 영향으로 배달앱 시장이 빠르게 성장하며, 리뷰와 평점이 더욱 중요해지고 있다. 그러나 급격하게 늘어난 리뷰와 평점의 신뢰도에 의문이 제기되고 있다. 따라서 본 연구는 리뷰와 평점을 탐색적으로 분석하여 배달앱 리뷰의 신뢰도와 유용성을 파악하고, 이를 높일 방법을 탐구하였다. 텍스트 마이닝 기법을 사용하여 도출한 결과는 다음과 같다. 첫째, 요기요와 네이버 지도, 구글 지도의 음식점 평점을 분석한 결과, 요기요는 가장 우편향된 평점 분포를 보여주었다. 둘째, 요기요의 세부 평점 요인(맛, 양, 배달)간에는 모두 강한 양의 상관관계가 있었고, 이는 부정 리뷰의 단어 분석에서도 드러났다. 셋째, 리뷰의 극성에 따라 사용되는 품사와 형태소의 비율이 달랐다. 넷째, 전체 리뷰 데이터에서 367개의 부정어를 선별한 후, 이를 분류하여 치킨 전용 부정어 사전을 제작하였다. 본 연구는 치킨 리뷰의 탐색적 분석을 통해 앞으로 배달앱 리뷰에 대한 연구가 나아가야 할 방향을 제시하였다.

온라인 뉴스 웹사이트의 로그를 이용한 연관규칙 발견에 관한 연구 (Mining Association Rules from the Web Access Log of an Online News website)

  • 황현석;유기동
    • 한국산업정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.47-57
    • /
    • 2013
  • 인터넷의 활용으로 기업활동의 많은 영역이 온라인을 통해 이루어지고 있다. 온라인 쇼핑몰에서는 고객이 웹사이트 방문 후에 어떤 활동을 하는지를 파악하고 이를 경영활동의 성과로 연계하기 위해 웹 로그를 분석하고 있다. 온라인 뉴스 사이트에서도 방문자의 활동을 파악하고 어떤 기사에 관심이 많은지, 어떤 분야의 기사를 많이 보는지 등을 파악하여 독자에게 서비스하는 것이 필요하다. 그러나 언론사의 웹사이트 로그를 분석하는 연구는 충분히 이루어지지 않고 있다. 본 연구에서는 온라인 뉴스 웹사이트에서 수집된 로그를 이용하여 방문자의 웹사이트 내에서의 활동을 파악하고 뉴스 기사간 연관규칙을 도출한다. 연구는 크게 방문자의 세션(session)을 파악하는 첫 번째 단계와 방문자가 읽은 뉴스 기사간의 연관규칙을 살펴보는 두 번째 단계로 이루어져 있으며 두 차례에 걸쳐 수집된 웹사이트 로그를 이용하여 분석하였다. 최종적으로 도출된 규칙의 의미와 온라인 뉴스 사이트에서 고려해야 하는 함의를 제시하였다.

토픽모델링을 활용한 한국과 미국의 산업수학 이슈 비교 (Comparison of Industrial Mathematics Issues between Korea and the US Using Topic Modeling)

  • 김성연
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.30-45
    • /
    • 2022
  • 본 연구에서는 텍스트마이닝을 활용해 한국과 미국의 온라인 뉴스와 포럼에서 산업수학과 관련한 이슈를 파악하고, 그 결과를 비교 분석하였다. 이를 위해 한국의 주요 포털 사이트인 네이버의 뉴스 기사, 클리앙의 게시글과 댓글, 그리고 미국의 New York Times와 CNN의 뉴스 기사, Reddit의 게시글과 댓글에서 산업수학과 관련한 텍스트 데이터를 수집하여 구조적 토픽모델링 분석을 수행하였다. 주요 분석결과는 다음과 같다. 첫째, 한국의 뉴스는 산업수학의 필요성과 정부의 지원 측면에 대해, 미국에서는 산업수학이 활용되는 다양한 분야에 대해 다루는 것으로 나타났다. 둘째, 한국에서는 온라인 뉴스와 포럼에서 각기 다른 주제로 동일한 개수의 이슈가 나타났지만, 미국에서는 온라인 포럼보다 뉴스 기사에서 더 많은 이슈를 다루고 있는 것으로 나타났다. 이를 토대로 한국에서 산업수학이 정착하는 데 있어 연구자들에게는 학술적, 그리고 정부에는 실무적 시사점을 제시하였다.

온라인 쇼핑 플랫폼의 개인화 추천 시스템이 소비자의 구매의도에 미치는 영향 (The Effect of the Personalized Recommendation System of Online Shopping Platform on Consumers' Purchase Intention)

  • 로영영;김종기
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.67-87
    • /
    • 2023
  • 온라인 쇼핑 플랫폼은 개인화 추천 시스템을 활용하여 소비자의 개인 정보와 행동 데이터를 수집, 분석 및 마이닝을 통해 소비자에게 맞춤형 추천 서비스를 제공함으로써 소비자의 잠재적인 쇼핑 욕구를 자극한다. 본 연구는 S-O-R 모델을 기반으로 온라인 쇼핑 추천이 구매의도에 미치는 영양을 분석하기 위하여 시스템 품질인 다양성과 정확성, 정보 품질인 설득력과 완전성을 외부 자극으로 설정하고, 신뢰 및 지각된 가치에 따른 소비자의 심리상태 하 유기체로 설정하여 구매의도 간에 관계를 탐구하였다. 온라인 쇼핑 플랫폼을 이용하는 소비자를 대상으로 설문조사를 실시하였다. 분석결과는 개인화 추천 시스템의 품질과 정보 품질이 신뢰와 지각된 가치에 미치는 영향에 대한 가설이 모두 채택되었다. 신뢰가 시스템 품질, 정보 품질에 대한 구매의도와의 관계에서 매개역할을 확인하였으며 지각된 가치는 정보 품질에 대한 구매의도와의 관계에서 매개역할을 확인하였다. 추천 시스템이 제공하는 콘텐츠는 소비자 경험을 개선하고 소비자의 수용 정도를 높일 수 있는 방향으로 설계되어야 한다는 시사점을 도출하였다.

데이터베이스 시스템에서 연관 규칙 탐사 기법을 이용한 비정상 행위 탐지 (Anomaly Intrusion Detection based on Association Rule Mining in a Database System)

  • 박정호;오상현;이원석
    • 정보처리학회논문지C
    • /
    • 제9C권6호
    • /
    • pp.831-840
    • /
    • 2002
  • 컴퓨터와 통신 기술의 발달고 사용자에게 많은 정보가 편리하게 제공되는 반면, 컴퓨터 침입 및 범죄로 인한 피해가 증가하고 있다. 특히, 고객 개인 정보, 기업 기밀과 같은 주요 정보가 저장되어 있는 데이터베이스의 보안을 위해서 데이터베이스 관리 시스템의 기본적인 보안 기능 및 기존의 오용 탐지 모델이 사용되고 있다. 하지만, 다양한 시스템 침입 유형에 대한 분석 격과에 따르면 외부 침입자에 의한 시스템 파괴보다는 내부 사용자에 의한 기밀 정보 유출과 같은 권한 오용 행위에 의한 손실이 더 큰 문제가 되고 있다. 따라서, 효과적으로 데이터베이스 보안을 유지하기 위해서 사용자의 비정상 행위 판정 기술에 대한 연구가 필요하다. 본 논문에서는, 연관 규칙 마이닝 방법을 이용하여 데이터베이스 로그로부터 사용자 정상 행위 프로파일을 생성하는 방법을 제안한다. 이를 위해서 데이터베이스 로그를 의미적인 패턴 트리로 구조화하여 생성된 정상 행위 프로파일을 온라인에서 발생된 해당 사용자의 트랜잭션과 비교하여 온라인 데이터베이스 작업에 대한 비정상 행위 여부를 탐지할 수 있다. 다양한 실험을 통해 제시된 알고리즘의 효용성을 분석하고 결과를 제시하였다