• 제목/요약/키워드: Web contents mining

검색결과 71건 처리시간 0.022초

전자상거래에서의 협업 추천을 위한 고객 프로필 모델 (A Customer Profile Model for Collaborative Recommendation in e-Commerce)

  • 이석기;조현;천성용
    • 한국콘텐츠학회논문지
    • /
    • 제11권5호
    • /
    • pp.67-74
    • /
    • 2011
  • 협업 추천은 전자상거래 기업들이 고객별로 개인화 된 상품추천을 하기 위하여 널리 활용하는 추천기법이다. 추천 행위는 고객들이 상품에 대해 가지고 있는 선호도를 분석하고 이를 프로필화 하는 것을 전제로 한다. 전통적인 명시적 평가법은 취급하는 상품이 매우 다양한 전자상거래 기업의 고객들에게 구매활동외에 추가적 부담을 준다는 점에서 한계를 가진다. 따라서 고객의 개입 없이 간접적으로 선호도를 파악할 수 있는 묵시적 평가법이 보다 바람직하다고 볼 수 있는데, 여기에도 추정된 선호도의 지표화에 주로 사용하는 카디널 척도가 추정 오차를 증가 시킨다는 점에서 문제점이 있다. 따라서 본 연구에서는 이러한 문제의 개선을 위해 웹 마이닝과 사전식 컨센서스 기법에 근간하여 서열 척도 기반의 고객 프로필을 생성, 활용하는 협업 추천 기법을 제안하고자 한다. 실제 온라인 쇼핑몰의 거래 데이터를 이용한 실험을 통해 제안된 기법의 우수성을 입증 하였다.

소설 등장인물의 텍스트 거리를 이용한 사회 구성망 분석 (Analysis of Social Network According to The Distance of Characters Statements)

  • 박경미;김성환;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제13권4호
    • /
    • pp.427-439
    • /
    • 2013
  • 복잡계 과학의 발달에 따라 많은 사회 네트워크들이 분석되고 있다. 사회 네트워크는 현재 인문, 경제, 웹 사이언스 등 다양한 분야에 응용되고 있다. 최근, 소설의 등장인물을 이용한 네트워크와 실제 사회 네트워크의 특성을 비교하는 다양한 연구가 진행되고 있다. 그러나 기존의 등장인물 네트워크는 대부분 미리 정리된 인명사전을 이용하므로 주요한 몇몇 인물들 사이의 연관성은 밝힐 수 있으나, 한번 이상 등장한 모든 인물의 전체적인 사회적 구조는 설명하지 못하고 있다. 본 연구에서는 소설로부터 등장인물을 직접 추출하고, 등장인물 사이의 거리를 사용하여 상관관계를 설정하여 네트워크를 구축한다. 제안방법은 소설 텍스트로부터 등장인물의 출현빈도와 등장인물들 사이의 연관성의 발생 빈도를 이용하여 연관성 가중치를 구할 수 있으며, 이 연관성 가중치를 사용하여 노드의 수를 조절하여 K-critical 네트워크를 구성한다. 제시한 K-critical 네트워크는 분석대상 소설에 등장하는 인물들끼리 얼마나 긴밀하게 연관되어 있는지를 정량적으로 파악하는 매우 중요한 정보를 줄 수 있음을 실험을 통하여 제시할 수 있었다.

중고거래 어플리케이션 <당근마켓> 리뷰텍스트에 나타난 소비자의 인성 함축단어 텍스트마이닝 분석 (Analysis of Text Mining of Consumer's Personality Implication Words in Review of Used Transaction Application )

  • 정예린;주영애
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.1-10
    • /
    • 2021
  • 본 연구는 중고거래 어플리케이션 <당근마켓>의 리뷰텍스트에 나타난 소비자의 인성 함축단어의 사용실태를 분석하였다. 데이터 수집은 2021년 5월로부터 과거 6개월간 서울과 경기권을 대상으로 하였다. 이는 웹 크롤러를 개발하여 무작위 추출 총 1368건을 수집 후, 최종 570건을 전처리하여 사용하였다. 결과는 다음과 같다. 첫째, 제품의 상거래 플랫폼임에도 리뷰텍스트의 48.2%는 소비자의 인성 관련 내용이었다. 둘째, 리뷰 텍스트는 긍정적 반응이 주를 이루며 이는 감사라는 키워드를 기반으로 텍스트 네트워크 구조를 형성하였다. 셋째, 소비자 인성을 함축하는 리뷰 텍스트는 소비자의 '대타적 인성'과' 대내적 인성'으로 그룹화되었고, 이는 플랫폼에서 통합적으로 작용하였다. 결론적으로 인성 관련 요인들이 플랫폼 거래 과정의 상호작용에서 중요한 역할을 함을 확인하였고, 앞으로 플랫폼의 서비스 품질에도 소비자의 인성이 경쟁력으로 작용할 것이므로, 이에 대해 다각도에서 연구되어야 할 것임을 제언하였다.

소셜미디어 분석을 통한 삭카린나트륨 소비자 인식 조사 (Consumers Perceptions on Sodium Saccharin in Social Media)

  • 이수연;이원성;문일철;권훈정
    • 한국식품위생안전성학회지
    • /
    • 제30권4호
    • /
    • pp.329-342
    • /
    • 2015
  • 본 연구에서는 소셜미디어 콘텐츠를 소프트웨어 시스템을 이용하거나 정성적으로 분석함으로써 삭카린나트륨에 대한 소비자 인식도를 조사하고자 하였다. 첫 번째로, 1년(2013.7~2014.6)의 기간 동안 네이버와 카페에서 작성된 글들을 수집하였으며, 수집된 글들은 무료 텍스트 분석 소프트웨어인 TONK를 사용하여 분석되었다. 블로그와 카페에서 작성된 글들은 주로 삭카린나트륨을 사용하지 않은 제품에 대한 것으로 파악되었으며, 기타 높은 단맛과 낮은 열량을 보이는 삭카린나트륨의 특성, 식품첨가물 제거법에 대한 내용이 있는 것으로 파악되었다. 두 번째로, 네이버 트렌드 검색 서비스를 이용하여 삭카린나트륨에 대한 검색량 증가 구간에 발생한 언론보도 사건을 조사하였다. PC 검색량의 경우 총 11개 증가 구간 중 6개의 구간에서, 모바일 검색량의 총 12개 증가 구간 중 8개의 구간에서 뉴스에서 삭카린나트륨 사용허용 품목 확대에 대해 보도한 것으로 나타났다. 세 번째로 식품의약품안전처의 삭카린나트륨 사용 허용품목 확대 발표를 보도한 연합뉴스의 댓글을 분석하였다. 공감수 100개 이상인 댓글의 내용을 분석 결과 정부 불신을 비판하는 댓글들이 가장 많았으며, 그 외 관련 제품의 가격 비판 댓글과 기업 불신을 드러내는 댓글들이 파악되었다. 시판 제품들의 표시사항 분석 결과, 삭카린나트륨을 첨가하지 않은 제품들은 삭카린나트륨 무첨가라는 표시를 강조하고 있는 것으로 조사되었다. 본 연구 결과 소비자들은 삭카린나트륨의 사용 확대에 관심이 있으며, 사용 확대 보도시에 검색량이 증가하였다. 따라서, 매체들은 삭카린나트륨 사용 확대에 관하여 보도를 할 때에 과학적인 근거에 바탕하여 확대배경이나 적정 섭취량 등을 함께 알리는 것이 소비자의 올바른 인식에 도움을 줄 것이다.

오피니언 마이닝을 이용한 지능형 VOC 분석시스템 (Intelligent VOC Analyzing System Using Opinion Mining)

  • 김유신;정승렬
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.113-125
    • /
    • 2013
  • 기업 경영에 있어서 고객의 소리(VOC)는 고객 만족도 향상 및 기업의사결정에 매우 중요한 정보이다. 이는 비단 기업뿐만 아니라 대고객, 대민원 업무를 처리하는 모든 조직에 있어서도 동일하다. 때문에 최근에는 기업뿐만 아니라 공공, 의료, 금융, 교육기관 등 거의 모든 조직이 VOC를 수집하여 활용하고 있다. 이러한 VOC는 방문, 전화, 우편, 인터넷게시판, SNS 등 다양한 채널을 통해 전달되지만, 막상 이를 제대로 활용하기는 쉽지 않다. 왜냐하면, 고객이 매우 감정적인 상태에서 고객의 주관적 의사를 음성 또는 문자로 표출하기 때문에 그 형식이나 내용이 정형화되어 있지 않고 저장하기도 어려우며 또한 저장하더라도 매우 방대한 분량의 비정형 데이터로 남기 때문이다. 본 연구는 이러한 비정형 VOC 데이터를 자동으로 분류하고 VOC의 유형과 극성을 판별할 수 있는 오피니언 마이닝 기반의 지능형 VOC 분석 시스템을 제안하였다. 또한 VOC 오피니언 분석의 기준이 되는 주제지향 감성사전 개발 프로세스와 각 단계를 구체적으로 제시하였다. 그리고 본 연구에서 제시한 시스템의 효용성을 검증하기 위하여 의료기관 홈페이지에서 수집한 4,300여건의 VOC 데이터를 이용하여 병원에 특화된 감성어휘와 감성극성값을 도출하여 감성사전을 구축하고 이를 통해 구현된 VOC분류 모형의 정확도를 비교하는 실험을 수행하였다. 그 결과 "칭찬, 친절함, 감사, 무사히, 잘해, 감동, 미소" 등의 어휘는 매우 높은 긍정 오피니언 값을 가지며, "퉁명, 뭡니까, 말하더군요, 무시하는" 등의 어휘들은 강한 부정의 극성값을 가지고 있음을 확인하였다. 또한 VOC의 오피니언 분류 임계값이 -0.50일 때 가장 높은 분류 예측정확도 77.8%를 검증함으로써 오피니언 마이닝 기반의 지능형 VOC 분석시스템의 유효성을 확인하였다. 그러므로 지능형 VOC 분석시스템을 통해 VOC의 실시간 자동 분류 및 대응 우선순위를 도출하여 고객 민원에 대해 신속히 대응한다면, VOC 전담 인력을 효율적으로 운용하면서도 고객 불만을 초기에 해소할 수 있는 긍정적 효과를 기대해 볼 수 있을 것이다. 또한 VOC 텍스트를 분석하고 활용할 수 있는 오피니언 마이닝 모형이라는 새로운 시도를 통해 향후 다양한 분석과 실용 프레임워크의 기틀을 제공할 수 있을 것으로 기대된다.

광산업의 B2B 공적 e-Marketplace 프레임워크 구축에 관한 연구 (A Public-oriented e-marketplace Framework for the Mining Industry)

  • 박기남
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.53-61
    • /
    • 2006
  • 우리나라는 지하자원이 부족한 반면 가공무역과 수출을 경제성장의 주요한 동력으로 하기 때문에 항상 산업원자재의 수급에 신경을 곤두세울 수밖에 없다. 이러한 현실은 국내 외 산업원료광물의 조기확보와 효율적인 상거래를 지원하기 위한 기업 간 전자상거래의 중요성을 크게 부각시킬 수 있다. 우리나라는 세계적 정보통신 강국으로 간주되지만 산업별 정보화 수준의 편차가 매우 크며 비금속 산업원료 광물 분야의 경우 정보화수준이 매우 낮다. 비금속 산업원료광불 분야는 아직까지 시장의 효율성이나 다양성 그리고 원가절감을 위한 노력이 매우 부족하며 원료광물의 대부분을 수입하면서 아직까지도 시장의 효율성을 이용하지 못하여 낭비되는 외화가 매우 많은 것으로 나타났다. 따라서 본 연구는 정보기술의 활용수준이 매우 낮은 비금속 광산업분야에 B2B 공적 e-Marketplace 를 구축하여 국내에서 생산이 가능하고 품질이 뛰어나며, 부가가치가 높은 광물들은 국내의 수요처 발굴을 통해 거래활성화를 도모하고 국내에서 생산되지 않거나 품질이 낮아 부가가치를 기대할 수 없는 광물들은 시장정보와 다양한 수입처 정보를 활용하여 효율적 시장거래를 지원할 수 있는 e-Marketplace 프레임워크를 제공하는 것을 목적으로 한다.

  • PDF

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

전문가 제품 후기가 소비자 제품 평가에 미치는 영향: 텍스트마이닝 분석을 중심으로 (The Effect of Expert Reviews on Consumer Product Evaluations: A Text Mining Approach)

  • 강태영;박도형
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.63-82
    • /
    • 2016
  • 최근 정보기술의 발달로 인해 소비자들은 온라인상에서 많은 정보를 쉽고 빠르게 획득할 수 있다. 소비자가 제품 구매시에는 소비자들이나 전문가들이 작성한 제품 후기 정보를 주로 탐색한다. 기존의 연구들이 소비자들이 창출한 제품 후기 중심으로 주로 진행되어 왔기 때문에, 전문가 제품 후기의 영향력에 대해서는 상대적으로 소수의 연구들만 존재하고 있다. 본 연구는 전문가가 생성하는 제품 후기에 초점을 맞추어, 방대한 실제 비정형데이터인 전문가의 후기를 어떻게 언어학적인 차원과 심리학적인 차원으로 나눌 수 있는지의 방법론을 제안하며, 실제 전문가 제품 후기를 사용하여 의미 있는 다섯 가지 차원의 새로운 변수들을 도출하였다. 그 결과 소비자들이 전문가 후기에서 반응하고 있는 언어적 특성은 제품에 대한 깊이 있는 정보의 양이나 충분한 설명을 나타내는 변수인 Review Depth, 그리고 전문가가 기술하는 방식이 제품에 대한 확신이 없는 듯한 말투를 나타내는 변수인 Lack of Assurance는 소비자의 전반적인 제품평가에 유의한 상관관계가 있는 것으로 밝혀졌다. 또한, 제품에 대한 칭찬이나 긍정적인 면을 서술하는 방식인 Positive Polarity가 소비자의 제품 평가에 영향을 미치지 않았지만, 전문가가 하는 제품에 대한 비관적인 평가인 Negative Polarity는 소비자들의 평가와 유의한 음의 상관관계가 있었다는 점이다. 전문가가 스토리텔링 관점에서 자주 사용하는 Social Orientation 특성은 유의한 관계를 미치지 못함이 밝혀졌다. 본 연구는 새로운 방법론을 제안하고 이를 실제로 활용한 결과를 보여준다는 차원에서 이론적이고 실무적인 공헌을 가진다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

소셜미디어 분석을 통한 소비자들의 L-글루타민산나트륨에 대한 인식 조사 (Consumers Perceptions on Monosodium L-glutamate in Social Media)

  • 이수연;이원성;문일철;권훈정
    • 한국식품위생안전성학회지
    • /
    • 제31권3호
    • /
    • pp.153-166
    • /
    • 2016
  • 본 연구에서는 소셜미디어 콘텐츠를 소프트웨어 시스템을 이용하거나 정성적으로 분석함으로써 L-글루타민산나트륨에 대한 소비자 인식도를 조사하고자 하였다. 첫 번째로, 1년 (2013.7~2014.6)의 기간 동안 네이버와 카페에서 작성된 글들을 수집하였으며, 수집한 문서들을 무료 텍스트 분석 소프트웨어인 TONK를 사용하여 분석하였다. 블로그와 카페에서 작성된 글들은 주로 L-글루타민산나트륨의 사용과 관련된 음식점 후기 및 MSG (L-글루타민산나트륨)-무첨가 제품에 대한 홍보 내용을 담은 글들로 파악되었으며, 기타 L-글루타민산나트륨의 안전성 또는 식품첨가물 제거법에 대한 내용으로 파악되었다. 두 번째로, 네이버 트렌드 검색 서비스를 이용하여 L-글루타민산나트륨에 대한 검색량 증가 구간에 발생한 언론보도 사건을 조사하였다. PC 검색량의 경우 총 5개 증가 구간 중 3개의 구간에서, 모바일 검색량의 총 9개 증가 구간 중 6개의 구간에서 시사 프로그램에서 L-글루타민산나트륨에 대해 보도한 것으로 나타났다. 나머지 구간에서는 일간지나 TV 뉴스로 기사를 보도한 구간들로 나타났다. 세 번째로 식품의약품안전처의 L-글루타민산나트륨의 안전성 발표를 보도한 연합뉴스의 댓글을 분석하였다. 공감수 100개 이상인 댓글의 내용을 분석한 결과, L-글루타민산나트륨의 안전성, 질 낮은 재료의 사용 지적, MSG (L-글루타민산나트륨) 과다사용에 대한 우려, 정부 불신을 표현하는 댓글들이 파악되었다. 시판 제품들의 표시사항을 분석한 결과, 일일섭취허용량을 설정할 필요가 없을 정도로 안전한 식품첨가물임에도 불구하고 L-글루타민산나트륨을 첨가하지 않은 제품들은 L-글루타민산나트륨 무첨가라는 표시를 강조하고 있는 것으로 조사되었다. 이는 국가기관, 교육청과 지방자치단체에서 MSG 미사용을 원칙으로 제도를 운용하고 있어 이러한 정책이 산업계와 소비자 인식에 영향을 미쳤을 가능성도 고려해볼 수 있다. 본 연구 결과 소비자들은 대체로 소셜 미디어를 이용하여 검색하거나 관련 제품을 구매하고자 할 때 L-글루타민산나트륨을 사용하지 않는 것이 좋다는 인식을 하게 될 가능성이 있는 것으로 파악되며, L-글루타민산나트륨의 과다 사용에 관심이 있는 것으로 나타났다. TV 시사 프로그램에서 방송하거나 일간지 또는 TV 뉴스에서 기사를 보도할 경우 네이버 검색량이 증가하였으며, 검색량 증가구간은 PC 환경에서보다는 모바일 환경에서 더욱 증가하는 것으로 나타났다. 따라서 L-글루타민산나트륨과 관련한 커뮤니케이션 수단으로 소비자들이 관심있어 하는 방송프로그램, 뉴스 프로그램 등 언론을 활용하고, PC보다는 모바일을 통하여 소비자에게 접근한다면 효과적으로 소비자에게 정보를 전달할 수 있을 것이다.