• 제목/요약/키워드: Blog Contents

검색결과 96건 처리시간 0.026초

단어 반복 특징을 이용한 스팸 문서 분류 방법에 관한 연구 (A Study on Spam Document Classification Method using Characteristics of Keyword Repetition)

  • 이성진;백종범;한정석;이수원
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.315-324
    • /
    • 2011
  • 인터넷 환경에서 스팸의 범람은 개인 정보의 유출, 피싱에 의한 금전적 손해, 무분별한 유해 콘텐츠의 유통 등 심각한 사회 문제를 야기하고 있다. 또한 사회적 통제를 필요로 하는 유해 정보를 무차별적으로 유통시키는 스팸의 형태와 기술이 갈수록 다양해지고 있다. Bag-of-Words 모델을 이용한 학습 기반 스팸 분류 방법은 현재까지의 연구 중에서 가장 일반적으로 사용되는 방법이다. 그러나 이 방법은 분류 모델 학습 과정에서 사용된 키워드의 출현 정보만으로 스팸 문서를 분류하기 때문에 최근 흔히 발견할 수 있는 스팸 차단 회피 방법에 대한 대처 능력이 부족하다. 본 논문에서는 이러한 문제를 해결하기 위해 문서에서 등장하는 반복 단어의 특징을 이용한 스팸 문서 탐지 방법을 제안한다. 최근 대부분의 스팸 문서에서는 노출하고자 하는 스팸 문구를 반복하는 경향이 있으며, 이는 스팸 문서를 판별하는 기준으로 사용될 수 있다. 본 논문에서는 단어 반복의 특징을 표현할 수 있는 6개의 변수를 정의하고 이를 분류 모델 생성을 위한 속성으로 사용한다. 본 논문에서 제안하는 스팸 탐지 방법의 성능 평가를 위해 블로그 포스트 데이터와 이메일 데이터를 이용하여 기존 방법들과의 비교 실험을 진행하였고, 결과 분석을 통해 제안 방법이 우수함을 확인하였다.

이미지 객체 및 메타정보 기반 GPT 활용 SNS 문장 작성 보조 시스템 (GPT-enabled SNS Sentence writing support system Based on Image Object and Meta Information)

  • 이동희;문미경;최봉준
    • 융합신호처리학회논문지
    • /
    • 제24권3호
    • /
    • pp.160-165
    • /
    • 2023
  • 본 연구에서는 SNS와 같이 이미지와 함께 글을 작성하는 활동을 보조하기 위해 YOLO와 GPT를 활용한 SNS 문장 작성 보조 시스템을 제안한다. YOLO 모델을 활용하여 글 작성 시 삽입되는 이미지에서 객체를 추출하고 메타정보인 GPS 정보, 생성 시간 정보도 추출하여 함께 GPT의 프롬프트 값으로 사용한다. YOLO 모델을 사용하기 위해 양식 이미지 데이터로 학습하여 사용했으며 해당 모델의 mAP score는 평균 약 0.25이다. GPT는 '맛집 리뷰' 주제의 1,000개의 블로그 텍스트 데이터를 학습하였으며, 본 연구에서 학습된 모델을 사용하여 이미지에서 추출한 2가지 타입의 키워드로 문장을 생성하였다. 생성된 문장의 실용성을 평가하기 위해 설문을 진행하였으며 설문 결과의 명확한 분석을 위해 폐쇄형 설문을 진행하였다. 삽입한 이미지와 키워드 문장을 제공하여 질문에 대해 3가지 평가 항목을 두어 진행하였다. 설문 결과 이미지의 핵심 키워드 경우 유의미한 문장을 생성한다는 결과를 얻을 수 있었다. 본 연구를 통해서 이미지 기반 문장 생성 시 이미지 키워드와 GPT 학습 내용과의 관계에 따라 결과물의 정확성이 달라진다는 결과를 얻을 수 있었다.

기업용 마이크로블로그의 사용행태에 대한 사례연구: 지식경영전략을 중심으로 (Case Study on the Enterprise Microblog Usage: Focusing on Knowledge Management Strategy)

  • 강민수;박아름;이경전
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.47-63
    • /
    • 2015
  • 지식경영전략은 코드화(Codification) 전략과 대인화(Personalization) 전략으로 대별할 수 있으며(Hansen et al., 1999), 성공적인 지식경영의 도입과 활용을 위한 두 전략의 운영 방안에 대한 연구가 계속되어 왔다. 그리고 지식경영 시스템에 대한 기존 연구는 주로 대기업의 일부 조직에서 활용한 사례를 대상으로 하고 있어, 중소 규모의 기업 전체를 대상으로 하는 연구는 미비한 실정이다. 본 논문은 중소 규모의 기업에 적합한 지식경영 시스템으로 기업용 마이크로블로그를 특정하고, 기업용 마이크로블로그를 활용한 중소기업의 지식경영전략을 코드화 전략과 대인화 전략의 관점에서 검토한다. 지식경영전략과 기업용 마이크로블로그에 대한 선행연구를 통하여 "기업의 성장에 따라 기업용 마이크로블로그의 활용은 코드화 전략에서 대인화 전략 중심으로 변화한다"는 가설을 설정하였다. 이 가설을 확인하기 위하여 창업 초기부터 현재까지 '야머'(Yammer)라는 기업용 마이크로블로그를 사용하고 있는 소규모 기업을 대상으로 사례연구를 진행하였다. 사례연구는 기업용 마이크로블로그의 사용 기간을 창업 '초기', 현재의 조직 형태를 갖추게 된 '중기', 그리고 연구가 진행된 '현재' 등 세 시점으로 나누고 콘텐츠를 분석하는 종단 분석을 실시하였다. 그리고 각 시점별 야머에 등록된 콘텐츠의 커뮤니케이션 유형을 분석하여 사례기업의 기업용 마이크로블로그 사용행태를 분석하고, 지식경영전략의 변화를 확인하는 방법을 사용하였다. 연구의 결과로 소규모 기업에서 지식경영전략의 운영과 그에 적합한 지식경영 시스템의 활용에 대한 실질적인 시사점을 제시하고자 한다.

소셜미디어 데이터를 활용한 태안해안국립공원 방문객의 경관인식 파악 - 꽃지해수욕장·신두리해안사구·만리포해수욕장을 대상으로 - (Identifying Landscape Perceptions of Visitors' to the Taean Coast National Park Using Social Media Data - Focused on Kkotji Beach, Sinduri Coastal Sand Dune, and Manlipo Beach -)

  • 이성희;손용훈
    • 한국조경학회지
    • /
    • 제46권5호
    • /
    • pp.10-21
    • /
    • 2018
  • 실제 이용자의 경험을 파악하는 것은 경관관리에 있어서 중요한 관점 중 하나이다. 본 연구는 이점에서 착안하여 블로그 글을 대상으로 텍스트마이닝을 활용하여 이용자들이 자발적으로 올린 글을 바탕으로 그 안에 담긴 경관인식을 파악하였다. 연구 대상지는 태안해안국립공원으로 하였다. '태안 여행'으로 검색하여 나타난 장소는 대부분 태안해안국립공원에 해당되는 곳이었고, 도출된 장소 중 상위 세 곳을 대상으로 에고네트워크 분석을 실시하고, 각 장소 명칭과 연결된 경관인식에 관련한 키워드(장소, 이미지, 활동, 경관대상물)를 추출하였다. 마지막으로, 중심성 분석과 응집성 분석을 통해 각 장소에 대한 사람들의 경관인식과 주요이슈를 도출하고 의미를 해석하였다. 연구결과로 태안 여행에서 인지되는 주요 장소, 그리고 구체적인 장소에서의 개별적인 경관체험과 경관인식을 파악할 수 있었다. 꽃지해수욕장은 장소 관련 키워드가, 신두리해안사구는 경관이미지에 대한 키워드가, 그리고 만리포해수욕장은 경관요소와 관련된 키워드가 주로 나타나고 있어, 방문객이 인식하는 세 장소의 경관 특성이 상이함을 유추할 수 있다. 구체적으로는 꽃지해수욕장은 일몰경관 감상의 명소이자 태안해안국립공원 트래킹 코스의 거점으로서 인식되고 있으며, 신두리해안사구는 비일상적 경관을 보유한 곳이자 생태적으로 가치가 높은 공간으로 보존의 대상으로 인식되고 있는 것으로 나타났다. 마지막으로 만리포해수욕장은 천리포수목원과 인접하고 있어 높은 방문이 이루어지며, 해변 자체의 모습이 인상적인 곳으로 인식되고 있었다. 소셜미디어 데이터는 이용자 관점에서의 분석자료이므로, 전문가의 관점에서 미처 보지 못했던 다양한 내용을 분석할 수 있어서 매우 유용한 자료이다. 본 연구에서는 경관인식 연구에 소셜미디어 데이터를 활용하여 경관대상, 경관이미지, 활동 등의 여러 내용을 종합하여 사람들이 어떻게 경관을 인식하고 향유하는지를 다각적으로 분석하였다. 다만 소셜미디어 데이터는 작성자의 기억과 인식이 증폭되거나 왜곡될 가능성이 있기 때문에, 보다 정확한 분석을 위해서는 추후 현장에서 설문조사 등을 실시하여 본 연구의 결과와 비교, 검증하는 후속 연구가 필요하다.

인터넷 커뮤니티에서 사용자 참여가 밀착도와 지속적 이용의도에 미치는 영향 (A Study on the Effects of User Participation on Stickiness and Continued Use on Internet Community)

  • 고미현;권순동
    • Asia pacific journal of information systems
    • /
    • 제18권2호
    • /
    • pp.41-72
    • /
    • 2008
  • The purpose of this study is the investigation of the effects of user participation, network effect, social influence, and usefulness on stickiness and continued use on Internet communities. In this research, stickiness refers to repeat visit and visit duration to an Internet community. Continued use means the willingness to continue to use an Internet community in the future. Internet community-based companies can earn money through selling the digital contents such as game, music, and avatar, advertizing on internet site, or offering an affiliate marketing. For such money making, stickiness and continued use of Internet users is much more important than the number of Internet users. We tried to answer following three questions. Fist, what is the effects of user participation on stickiness and continued use on Internet communities? Second, by what is user participation formed? Third, are network effect, social influence, and usefulness that was significant at prior research about technology acceptance model(TAM) still significant on internet communities? In this study, user participation, network effect, social influence, and usefulness are independent variables, stickiness is mediating variable, and continued use is dependent variable. Among independent variables, we are focused on user participation. User participation means that Internet user participates in the development of Internet community site (called mini-hompy or blog in Korea). User participation was studied from 1970 to 1997 at the research area of information system. But since 1997 when Internet started to spread to the public, user participation has hardly been studied. Given the importance of user participation at the success of Internet-based companies, it is very meaningful to study the research topic of user participation. To test the proposed model, we used a data set generated from the survey. The survey instrument was designed on the basis of a comprehensive literature review and interviews of experts, and was refined through several rounds of pretests, revisions, and pilot tests. The respondents of survey were the undergraduates and the graduate students who mainly used Internet communities. Data analysis was conducted using 217 respondents(response rate, 97.7 percent). We used structural equation modeling(SEM) implemented in partial least square(PLS). We chose PLS for two reason. First, our model has formative constructs. PLS uses components-based algorithm and can estimated formative constructs. Second, PLS is more appropriate when the research model is in an early stage of development. A review of the literature suggests that empirical tests of user participation is still sparse. The test of model was executed in the order of three research questions. First user participation had the direct effects on stickiness(${\beta}$=0.150, p<0.01) and continued use (${\beta}$=0.119, p<0.05). And user participation, as a partial mediation model, had a indirect effect on continued use mediated through stickiness (${\beta}$=0.007, p<0.05). Second, optional participation and prosuming participation significantly formed user participation. Optional participation, with a path magnitude as high as 0.986 (p<0.001), is a key determinant for the strength of user participation. Third, Network effect (${\beta}$=0.236, p<0.001). social influence (${\beta}$=0.135, p<0.05), and usefulness (${\beta}$=0.343, p<0.001) had directly significant impacts on stickiness. But network effect and social influence, as a full mediation model, had both indirectly significant impacts on continued use mediated through stickiness (${\beta}$=0.11, p<0.001, and ${\beta}$=0.063, p<0.05, respectively). Compared with this result, usefulness, as a partial mediation model, had a direct impact on continued use and a indirect impact on continued use mediated through stickiness. This study has three contributions. First this is the first empirical study showing that user participation is the significant driver of continued use. The researchers of information system have hardly studies user participation since late 1990s. And the researchers of marketing have studied a few lately. Second, this study enhanced the understanding of user participation. Up to recently, user participation has been studied from the bipolar viewpoint of participation v.s non-participation. Also, even the study on participation has been studied from the point of limited optional participation. But, this study proved the existence of prosuming participation to design and produce products or services, besides optional participation. And this study empirically proved that optional participation and prosuming participation were the key determinant for user participation. Third, our study compliments traditional studies of TAM. According prior literature about of TAM, the constructs of network effect, social influence, and usefulness had effects on the technology adoption. This study proved that these constructs still are significant on Internet communities.

TV 시청률과 마이크로블로그 내용어와의 시간대별 관계 분석 (Analysis of the Time-dependent Relation between TV Ratings and the Content of Microblogs)

  • 최준연;백혜득;최진호
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.163-176
    • /
    • 2014
  • 소셜미디어 확산으로 많은 사용자들이 SNS를 통해 자신의 생각과 의견을 표출하며 다른 사용자들과 상호작용하고 있다. 특히 트위터와 같은 마이크로블로그는 짧은 문장을 통해 영화, TV, 사회 현상 등과 같은 공통의 주제에 대해 많은 사람이 즉각적으로 의견을 표출하고 교환하는 플랫폼의 역할을 수행하고 있다. TV방송 프로그램에 대해서도 의견과 감정을 마이크로블로그를 통해 표출하고 있는데, 본 연구에서는 마이크로블로그의 내용과 시청률과의 관계를 살펴보기 위해, 지난 공중파 방송 프로그램에 대한 트윗을 수집하고 부적절한 트윗들을 제거한 후 형태소 분석을 수행하였다. 추출된 형태소뿐 아니라 이모티콘, 신조어 등 사용자가 입력한 모든 단어들을 후보 자질로 삼아 시청률과의 상관관계를 분석하였다. 실험을 위해 2013년 1월부터 10개월간의 예능프로그램 트윗의 데이터를 수집하여 전국 시청률 데이터와 비교 분석을 수행하였다. 트윗의 발생량은 일주일 중 방송된 요일에 가장 많았으며, 특히 방송시간 부근에서 급격히 증가하는 모습을 보였다. 이것은 전국에 동시간에 방송되는 공중파 프로그램의 특성상 공통된 관심 주제를 제공하기 때문에 나타나는 현상으로 여겨진다. 횟수 기반 자질로 방송 일의 총 트윗 수와 리트윗 수, 방송시간 중의 트윗 수와 리트윗 수와 시청률과의 상관 관계를 분석하였으나 모두 낮은 상관 계수를 나타냈다. 이것은 단순한 트윗 발생 빈도는 방송 프로그램의 만족도 또는 시청률을 제대로 반영하고 있지 못함을 의미한다. 내용 기반 자질로 추출한 단어들 중에는 높은 상관관계를 보여주는 단어들이 발견되었으며, 표준어가 아닌 이모티콘과 신조어 중에도 높은 상관관계를 보여주는 자질이 나타났다. 또한 방송시작 전과 후에 따라 상관계수가 높은 단어가 상이함을 발견하였다. 매주 같은 시간에 방송되는 TV 프로그램의 특성상, 방송을 기다리고 기대하는 내용의 트윗과 방송 후 소감을 표현하는 트윗의 내용에 차이가 존재하였다. 이러한 분석결과는 단어에 따라 시청률과 연관성이 높은 시간대가 달라짐을 의미하며, 시청률을 측정하고자 할 때 각 단어들의 시간대를 고려해서 사용해야 함을 의미한다. 본 연구에서 제안한 방법은 기존의 표본 추출을 통해 이루어지는 TV 시청률 측정을 보완할 수 있는 방법에 활용할 수 있으리라 기대된다.