• 제목/요약/키워드: 포스팅 데이터 분석

검색결과 12건 처리시간 0.021초

시각장애인을 위한 SNS 관리 시스템의 설계 및 구현 (Design and Implementation of a SNS Management System for Visually Impaired Persons)

  • 박준호;류은경;손인국;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.277-278
    • /
    • 2013
  • 최근 사회적으로 이슈가 되고 있는 소셜 네트워크 서비스 활용하는 시각 장애인의 수가 점차 증가하고 있으나, 시각 장애인들에 대한 배려 및 접근성은 낙제 수준에 머물고 있다. 이는 보편적인 활용성의 측면보다는 일반인만을 대상으로 제작된 것으로 시각장애인이 원활하게 이용하기에 어려움이 존재한다. 본 논문에서는 시각장애인의 SNS 활용을 지원하기 위한 SNS 관리 시스템을 설계하고 구현한다. 제안하는 시스템은 현재 가장 많은 활용도를 보이는 세 개의 SNS의 공통 특성 분석을 통한 통합 포스팅 관리 및 포스팅 공유 기능을 제공하여 개별 관리 도구 개발에서 발생하는 개발 비용을 감소시키는 것이 가능하다. 또한, 수집 데이터를 시각 장애인의 특성을 고려한 인터페이스로 제공함으로써 시각 장애인의 활용성을 극대화 하였다. 뿐만 아니라, 제안하는 시스템은 독립적인 프로그램의 형태로 제공되기 때문에, 기존의 시각 장애인이 보유하고 있는 보조 기기에 탑재하여 활용하는 것이 가능하다.

  • PDF

블로그에서 포스팅 성향 분석과 갱신 가능성 예측 (Analysis of Posting Preferences and Prediction of Update Probability on Blogs)

  • 이범석;황병연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.258-266
    • /
    • 2010
  • 메타 블로그에 등록된 RSS(Really Simple Syndication)의 수는 수십만 개 또는 수백만 개에 이른다. 따라서 이들에 대한 갱신 확인을 수행하는 것은 상당히 긴 시간과 네트워크 자원을 필요로 한다. 메타 블로그나 블로그 검색엔진은 제한된 자원을 가지고 있기 때문에 하루에 방문할 수 있는 블로그의 수가 제한적이다. 하지만 블로그 검색엔진의 성능향상을 위해 새로운 데이터를 최대한 수집하는 것이 필요하기 때문에, 우리는 이 논문에서 수집 효율을 높이기 위한 새로운 방법을 제안한다. 제안하는 방법은 블로그의 포스팅 성향을 분석하여 그것을 토대로 향후 갱신 가능성에 대해 예측하고 갱신 가능성이 높은 시점에만 갱신 확인을 수행한다. 이 연구는 블로그의 입장에서는 분산 서비스 거부 공격(DDoS Attack: Distributed Denial-of-Service Attack)만큼이나 빈번한 갱신확인을 줄이는데 도움이 되고, 인터넷 전체로 보아서는 트래픽을 감소시키는데 기여할 수 있다. 본 논문에서는 블로거들의 포스팅이 이루어지는 요일과 시간에 특정한 패턴이 존재할 것이라는 가정을 하고, 15119개의 실제 블로그에 작성된 포스트에 대해 요일과 시간의 선호도를 분석하였다. 그리고 과거의 포스팅 이력과 요일에 대한 선호도를 바탕으로 갱신 가능성을 예측하기 위한 방법을 제안하고, 12115개의 실제 블로그에 적용하여 그 정확도를 확인하였다. 성능평가를 통해 약 93.06%의 블로그에서 0.5 이상의 정확도를 가짐을 확인하였다.

SNS 데이터를 활용한 관광지 혼잡도 및 방문자 특성 분석에 관한 연구 (A Study on the Analysis of the Congestion Level of Tourist Sites and Visitors Characteristics Using SNS Data)

  • 이상훈;김수연
    • 한국산업정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.13-24
    • /
    • 2022
  • SNS는 일상생활에 매우 밀접한 서비스가 되었다. SNS를 통해 마케팅이 이루어지면서 흔히 핫플레이스라 불리는 장소가 생겨나고, 이곳으로 사용자들이 몰리고 있다. 하지만 단기간 많은 사람이 몰리며 혼잡한 경우가 빈번하게 발생하여 방문자와 서비스 제공자 모두 부정적인 경험을 하게 되는 경우가 많다. 이러한 문제를 개선하기 위해 혼잡도를 파악해야 하지만 개인적 수준에서 특정 지역의 혼잡도를 알아볼 방법은 매우 한정적이다. 이에 본 연구에서는 SNS상의 데이터를 활용하여 특정 관광지에 대한 혼잡도 정보 및 방문자들의 특성을 파악할 수 있는 시스템을 제시하고자 하였다. 이를 위해 사용자들이 업로드한 포스팅 데이터와 이미지 분석을 사용하였으며 네이버 DataLab 시스템을 이용하여 제안 시스템의 성능을 검증하였다. 관광지 유형별로 3개 장소를 선정하여 비교 검증한 결과 본 연구에서 산출한 결과와 DataLab에서 제공하는 혼잡도 수준이 유사한 것으로 나타났으며, 특히 본 연구는 특정 기업이나 서비스에 종속되지 않는 사용자의 실 데이터에 기반한 혼잡도를 제공하였다는 것에 의의가 있다.

온라인 정보 보호: 소셜 미디어 내 정보 유출 반응 분석 (Online Privacy Protection: An Analysis of Social Media Reactions to Data Breaches)

  • 서승우;고영준;이홍주
    • 지식경영연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2024
  • 최근 개인 정보 유출 사건이 빈번히 발생하고 빈도가 갈수록 증가하는 추세이지만, 개인 정보 유출 사건에 대한 사회나 정보주체인 시민들의 반응은 크게 대두되고 있지 않다. 또한, 개인 정보 유출 사건들에 대한 정보 주체의 반응을 여러 해 기간동안의 데이터에 기반하여 비교하는 연구는 많이 수행되어 있지 않다. 따라서, 본 연구는 2014년 1월부터 2022년 10월까지 국내에서 발생한 주요 개인정보 유출 사건들에 대한 정보주체의 소셜미디어 반응 변화를 분석하였다. 각 사건들이 발생한 직후 일주일간의 기간 동안 네이버 블로그에 작성된 총 1,317건의 포스팅을 수집하였다. 이 포스팅들에 대해 LDA 토픽 모델링 기법을 적용하여 주제를 분석한 결과, 개인정보 유출, 해킹, 정보기술 등 5개의 주요 토픽이 도출되었다. 토픽 분포의 시간변화를 분석한 결과, 개인정보 유출 사건 직후에는 해당 사건에 대한 직접적인 언급 토픽의 비중이 가장 높았으나, 시간이 지나면서 개인정보 유출과 간접적으로 관련된 토픽의 언급 비중이 증가하는 것을 확인하였다. 이는 개인정보 유출 사건 발생 후 정보주체의 관심이 시간이 지남에 따라 해당 사건에서 벗어나 관련 토픽으로 옮겨지고, 개인정보 보호에 대한 관심 또한 줄어든다는 것을 의미한다. 본 연구 결과는 향후 개인정보 유출 사건 이후 정보주체의 프라이버시 인식 변화에 대한 연구의 필요성을 시사한다.

온라인 고객 리뷰를 활용한 제품 효과 분석 기법 (A Technique for Product Effect Analysis Using Online Customer Reviews)

  • 임영서;이소영;이지나;류보경;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권9호
    • /
    • pp.259-266
    • /
    • 2020
  • 본 논문에서는 온라인 고객 리뷰를 활용하여 건강 보조제, 화장품 등 현재의 상태를 개선하기 위해 사용되는 제품을 대상으로 그 효과를 알아보기 위한 제품 효과 분석 기법을 제시하였다. 제안하는 제품 효과 분석 기법은 블로그 포스팅에 존재하는 광고를 자동 제거하고, 효과 분석을 위한 증상, 효과, 증가, 및 감소로 이루어진 단어 사전을 구축하며, 제안하는 알고리즘을 통해 제품의 효과를 측정한다. 제품 효과 분석 기법을 검증하기 위해 정답 레이블이 존재하는 네이버 쇼핑 리뷰 데이터셋을 대상으로 성능평가를 실시하였으며, 전통적인 긍부정 사전과 RNN 모델과 성능을 비교하였다. 실험 결과, 본 논문에서 제안하는 효과 분석 기법이 다른 두가지 방법보다 정확도가 뛰어남을 보여주었다. 또한, 아토피 피부염, 여드름 치료제에 제안하는 기법을 적용하여 소셜 미디어에 나타난 효과적인 치료법을 소개하였다. 본 논문에서 제시한 알고리즘은 블로그를 포함한 여러 매체의 리뷰로부터 제품의 효과를 점수화할 수 있으므로 다양한 제품군과 소셜 미디어에 적용될 수 있을 것으로 보인다.

SNS 빅데이터 분석을 활용한 국립과학관에 대한 이미지 분석과 경영전략 제안 (Image Analysis and Management Strategy for The National Science Museum Utilizing SNS Big Data Analysis)

  • 신성연
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.81-89
    • /
    • 2020
  • 본 연구의 목적은 대중들이 지각하는 과학관에 대한 인식의 분석을 바탕으로 효과적인 과학관 경영전략을 제시하는 것이며, 이를 위해 연구문제들을 설정하여 분석을 진행하였다. 자료의 수집과 분석은 질적연구방법과 양적연구방법을 융합하여 이미지 분석에 대한 새로운 접근방식을 통해 진행되었다. 먼저 면담(Interviewing)을 통한 질적연구방법을 통해 면접 대상자들(대학생, 대학원생 및 일반인)로부터 과학이라는 개념에 대한 이미지를 도출한 후 텍스트 분석을 실시하였다. 그리고 국립과학관과 관련하여 국내 대형 포털사이트 검색결과 중 블로그 포스팅 12,920건의 제목에서 추출한 63,987개의 단어에 대한 LDA기반 토픽 모델링(Latent Dirichlet Allocation Topic modeling)을 통한 양적연구방법을 융합하여 연구가 진행되었다. 분석결과, 응답자 특성에 따라 과학에 대한 인식은 차이가 있는 것으로 확인되었다. 국립과학관에 대한 포털사이트 검색결과는 20개의 토픽으로 도출되었고 7개의 요인으로 분류되었다. 본 연구의 결론에는 이에 대한 논의와 과학관 경영전략을 제시하고 있다.

토픽 모델링 및 바이그램 네트워크 분석 기법을 통한 여대생의 건강관리 및 웨어러블 디바이스 인식에 관한 연구 (Analyzing Female College Student's Recognition of Health Monitoring and Wearable Device Using Topic Modeling and Bi-gram Network Analysis)

  • 정우경;신동희
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.129-152
    • /
    • 2021
  • 본 연구는 토픽 모델링 및 네트워크 분석 기법을 활용하여 여대생들의 웨어러블 디바이스에 대한 인식 및 선호도 분석, 건강관리에 대한 요구를 분석함으로써 여대생에게 맞는 웨어러블 디바이스 개발 방안을 제시하였다. 이를 위하여 S여자대학교 재학생들이 사용하는 커뮤니티에서 건강관리 및 웨어러블 디바이스와 관련된 게시글 2,457건을 수집하였고. 수집된 게시글과 댓글 데이터를 전처리한 뒤 LDA 기반의 토픽 모델링을 실시하였다. 토픽 모델링 기법을 통해 건강관리 및 웨어러블 디바이스와 관련하여 여대생들의 주요 쟁점들을 도출하고, 관련 키워드가 포함된 포스팅에 대해 바이그램 분석과 네트워크 분석을 수행하여 여대생들이 웨어러블 기기에 대해 가지고 있는 견해를 파악하고자 한다.

블로그 텍스트 데이터를 활용한 1, 2기 신도시 공원의 이용자 경험 분석 연구 (A Study on the Analysis of Park User Experiences in Phase 1 and 2 Korea's New Towns with Blog Text Data)

  • 심주영;이민수;최혜영
    • 한국조경학회지
    • /
    • 제52권3호
    • /
    • pp.89-102
    • /
    • 2024
  • 본 연구의 목적은 신도시 근린공원 이용자 경험의 특징을 고찰하고 도시공원의 경험을 다양하게 하는 이슈를 탐색하는 것이다. 다량의 공원 이용자 경험을 정량적으로 분석하기 위하여 소셜 미디어 가운데 텍스트를 기반으로 하는 네이버 블로그 리뷰를 수집하여 분석하였다. 분석 대상은 1, 2기 신도시 가운데 가장 이용자 경험 포스팅이 높은 공원을 도시별로 하나씩 선정하였다. 수집 기간은 2003년 5월 20일부터 2022년 5월 31일까지이며, 일산호수공원, 분당율동공원, 광교호수공원, 동탄호수공원을 대상으로 분석을 실시하였다. 주요 연구 결과는 다음과 같다. 첫째, 공원 이용자는 네 개 공원 모두에서 일상적인 휴식과 레크리에이션이 중심 활동으로 나타났다. 둘째, 주거지 주변 근린공원임에도 가족단위뿐 아니라 친구, 연인 등 다양한 사용자 그룹이 확인되었다. 셋째, 공원 주변의 도시 프로그램 또한 공원 이용에 영향을 미쳤다. 넷째, 각 공원별 고유의 시설과 프로그램이 공원에 대한 설명력을 높였다. 마지막으로, 공원별 사용자 특성이 네 가지 유형으로 나타났으며, 공원에 따라 네 가지 유형의 네트워크가 다르게 나타났다. 본 연구는 다음 두 가지 시사점을 제공한다. 첫째, 공원의 자연주의적 특성뿐 아니라 각 공원 고유의 시설과 프로그램의 차별성은 대중의 인식을 크게 향상시키고 개별 공원 경험을 풍부하게 한다. 둘째, 텍스트 분석뿐 아니라 공간정보를 기반으로 한 공원 주변 맥락에 대한 분석이 함께 수행된다면 텍스트 데이터 분석 결과에 대한 해석의 정확성을 높일 수 있다. 본 연구의 결과는 현재 진행 중인 3기 신도시의 공원 및 녹지공간 계획 및 설계에 활용될 수 있다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.

토픽 모델링과 머신 러닝 방법을 이용한 온라인 C2C 중고거래 시장에서의 사기 탐지 연구 (A Study on the Fraud Detection in an Online Second-hand Market by Using Topic Modeling and Machine Learning)

  • 이동우;민진영
    • 경영정보학연구
    • /
    • 제23권4호
    • /
    • pp.45-67
    • /
    • 2021
  • 온라인 C2C 중고거래에 대한 수요가 증가하고 있으나 물품을 보내지 않거나 명시한 것과 다른 물건을 보내는 방식으로 부당한 금전적 이득을 챙기려는 사기 행위자들의 수도 증가하고 있다. 본 연구는 이러한 사기를 미연에 방지하기 위한 머신 러닝 방법을 이용한 사기 탐지 모델을 구축하였다. 이를 위해 대표적 C2C 중고거래 플랫폼인 중고나라에서 145,536건의 거래 게시글을 수집하였다. 이후 이들 게시글에서 토픽 모델링 기법을 이용하여 상품 설명 내용의 주제를 추출하였으며, 상품 설명의 언어적 특성, 준언어적 특성, 상품의 특성, 게시글의 포스팅 특성, 구매자 특성, 거래 특성들을 추출하였다. 이를 XGBoost 방법에 기반한 머신 러닝 모델을 구축하여 사기 게시글을 탐지하였다. 분석 결과, 사기 게시글은 글 자체의 길이가 대체로 짧고, 제공하는 정보가 적고 상대적으로 구체적이지 않은 것으로 나타났으며 명사를 상대적으로 적게 쓰고 이미지도 사용하지 않거나 적게 사용하는 글이 대부분인 것으로 나타났다. 또한 상대적으로 숫자와 공백의 비율이 높게 나타났으며 정상 게시글의 경우 명사의 경우 상품의 정보, 동사의 경우 전달, 형용사의 경우는 행위와 관련된 단어들이 사용되었으나 사기 게시글은 뚜렷한 주제를 가지지 못하는 것으로 나타났다. 본 연구는 전화번호나 계좌번호를 사용한 기존의 방법과 달리 다양한 게시글의 특성으로 사기 여부를 탐지하는 모델을 구축했다는 점에서 학술적, 실무적 시사점을 가지고 있다.