• 제목/요약/키워드: social tagging

검색결과 63건 처리시간 0.031초

컴포넌트 그리드: 개발자 친화적인 국방 소프트웨어 재사용 지원 환경 (Component Grid: A Developer-centric Environment for Defense Software Reuse)

  • 고인영;구형민
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제23권4호
    • /
    • pp.151-163
    • /
    • 2010
  • 국방 소프트웨어 개발 분야는 응용 도메인이 다양하며 각 도메인의 규모도 다른 분야보다 커서 소프트웨어 자산의 재사용이 중요시 되고 있고, 재사용 되는 자산의 품질 및 신뢰성이 강조된다. 국방 분야에서 이러한 중요성을 인식하고 재사용 방법론들을 개발하여 사용하려는 시도가 많았지만 체계적인 재사용이 이루어지지 않아 재사용 이익을 극대화 하지 못하였다. 본 연구에서는 실질적으로 재사용이 왜 잘 이루어지지 않는지에 대한 문제점들을 분석하고, 이러한 문제점들을 해결할 수 있는 요구사항들을 정리하였다. 이러한 요구사항을 만족하며 전군적 소프트웨어 재사용을 지원하는 개발자 친화적인 재사용 지원 환경인 컴포넌트 그리드 시스템을 개발하고 있다. 컴포넌트 그리드 시스템 개발을 위해 아키텍처를 설계하였고, 아키텍처를 구성하는 세부적인 핵심 요소들과 그 역할을 정의하였다. 개발자 부담의 감소를 위한 시맨틱 태깅(Semantic Tagging) 기반의 요구사항 추적 기술을 개발하였고, 재사용 지식 표현 모델을 개발하였다. 또한 개발자들 간의 자유로운 의사소통 과 자산 및 지식의 교류를 지원하기 위해 웹 기반의 자산 관리 환경과 소셜 네트워크 기반의 자산 검색 및 커뮤니티 추천 기법, 위키(Wik) 기반의 참여적, 협력적 지식 정제 및 증식 환경을 개발하였다. 이러한 접근법들을 통합하여 재사용을 지원할 수 있는 웹 기반 컴포넌트 그리드 시스템의 프로토타입을 구현하였다. 본 연구를 통해 국방 소프트웨어 개발 분야에서 개발자들이 소프트웨어 자산들을 투명하고 효율적으로 공유 및 재사용이 가능하게 하여 국방 소프트웨어의 재사용성 및 품질을 향상시킬 수 있으리라 기대한다.

  • PDF

품사별 출현 빈도를 활용한 코로나19 관련 한국어 가짜뉴스 탐지 (COVID-19-related Korean Fake News Detection Using Occurrence Frequencies of Parts of Speech)

  • 김지혁;안현철
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.267-283
    • /
    • 2023
  • 2019년 12월부터 현재까지 지속되고 있는 코로나19 팬데믹으로 인해 대중들은 감염병 대응을 위한 정보를 필요로 하게 되었다. 하지만 소셜미디어에서 유포되는 코로나19 관련 가짜뉴스로 인해 대중들의 건강이 심각하게 위협받고 있다. 특히 코로나19와 관련된 가짜뉴스가 유사한 내용으로 대량 유포될 경우 사실인지 거짓인지 진위를 가리기 위한 검증에 소요되는 시간이 길어지게 되어 우리 사회의 전반에 심각한 위협이 될 수 있다. 이에 학계에서는 신속하게 코로나19 관련 가짜뉴스를 탐지할 수 있는 지능형 모델에 대한 연구를 활발하게 수행해 오고 있으나, 대부분의 기존 연구에 사용된 데이터는 영문으로 구성되어 있어 한국어 가짜뉴스 탐지에 대한 연구는 매우 드문 실정이다. 이에 본 연구에서는 소셜 미디어 상에서 유포되는 한국어로 작성된 코로나19 관련 가짜뉴스 데이터를 직접 수집하고, 이를 기반으로 한 지능형 가짜뉴스 탐지 모델을 제안한다. 본 연구의 제안모델은 언어학적 특성 중 하나인 품사별 빈도 정보를 추가적으로 활용하여, 기존 연구에서 주로 사용되어 온 문서 임베딩 기법인 Doc2Vec 기반 가짜뉴스 탐지 모델의 예측 성능을 제고하고자 하였다. 실증분석 결과, 제안 모델이 비교 모델에 비해 Recall 및 F1 점수가 높아져 코로나19 관련 한국어 가짜뉴스를 보다 정확하게 판별함을 확인하였다.

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.

이용자 생성 도서정보 태그에 기반한 소설 검색의 패싯 유형 개발 (Developing Facets for Fiction Retrieval Based on User-generated Book Tags)

  • 심지영
    • 정보관리학회지
    • /
    • 제37권2호
    • /
    • pp.225-249
    • /
    • 2020
  • 본 연구는 소설 검색 환경을 개선하기 위해, 도서태그로부터 소설 이용자가 소설 탐색 상황에서 요구하는 다양한 패싯 요소를 식별하고 체계화하는 것을 목적으로 한다. 소설의 기본 패싯 체계를 랑가나단의 PMEST 기본 패싯에 기반하여, 1) 소설 자료를 형성하는 주체, 2) 소설을 구성하는 내용적, 외형적 성질, 3) 독자가 책과 상호작용하는 행위, 4) 소설 및 독서활동과 관련된 공간 정보, 5) 소설 및 독서활동과 관련된 시간 정보로 정의하고, 소설 7,174건에 부여된 약 31만 건의 태그 중 핵심 태그 3,730건을 선별하여 내용분석하였다. 그 결과, 소설 패싯의 상위범주 25개를 중심으로 다양한 속성을 체계화하였다. 본 연구의 결과는 향후 도서관 OPAC이나 소설 DB에 패싯 내비게이션 형태로 적용될 수 있을 것으로 기대된다.

잠재 요인 모델의 원리를 이용한 협업 태그 기반 추천 방법 (Collaborative Tag-Based Recommendation Methods Using the Principle of Latent Factor Models)

  • 김형도
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.47-57
    • /
    • 2009
  • 협업에 의한 태그 작성 시스템은 소셜 네트워크에서 다양한 공유 콘텐츠에 사용자가 태그를 부착할 수 있도록 허용하는데, 이러한 태그들은 본인뿐만 아니라 모든 커뮤니티 사용자들이 콘텐츠를 이용하는데 유용함을 준다. 협업 태그 기반의 추천에서는 사용자와 항목, 그리고 태그로 이루어진 3차원 데이터를 이용하는데, 이 데이터는 일반적으로 사용자와 항목으로 이루어진 2차원 데이터에 비하여 더 방대한 반면, 희소성(Sparsity)이 더 높다. 따라서 기존의 협업 필터링 기법을 바로 적용하는데 어려움이 많다. 잠재 요인 모델(Latent Factor Model)은 관찰된 값을 설명하는 잠재된 특징(요인)들을 밝히고, 이를 이용해서 문제를 해결하기 위한 모델로서 최근 협업 필터링에서도 성공적으로 적용되고 있으나, 모델을 학습하거나 개선하는 단계에서는 많은 시간과 노력이 필요하다는 단점이 있다. 이러한 잠재 요인 모델을 3차원 협업 태그 데이터에 적용하기 위해서는, 계산이 복잡한 협업 필터링 모델 수립의 어려움을 극복해야 한다. 이 논문에서는 사용자가 항목에 대해 사용한 태그들을 사용자 및 항목에 대한 잠재요인으로 간주하여 직관적인 모델을 수립하고, 사용자의 아이템에 대한 선호도를 결정하는 여러 가지 방법들을 제안하고, 실제 협업 태그 데이터를 이용하여 이들을 비교 평가한다.

  • PDF

주제 접근의 다양성과 국립중앙도서관 주제명 표목의 활용가능성에 관한 연구 (A Study on Varieties of Subject Access and Usabilities of the National Library of Korea Subject Headings)

  • 정연경
    • 한국비블리아학회지
    • /
    • 제25권4호
    • /
    • pp.171-185
    • /
    • 2014
  • 본 연구는 급격히 변화하는 도서관 환경 속에서 이루어지고 있는 주제 접근 방식의 다양성을 살펴보고 국립중앙도서관의 주제명표목에 관한 분석과 평가를 통해 주제 접근의 미래에 관해 제시하였다. 먼저 주제 접근의 현황과 문제점을 살펴보고 대표적인 주제명 표목인 미의회도서관 주제명표목의 장점과 단점을 바탕으로 주제명 표목의 검색 효율성을 증진하는 방법에 관해 다루었다. 소셜북마킹, 폭소노미, 태깅, 패싯 적용, 저자부여 키워드, 시소러스, 분류표, 자동완성기능 부여로 주제 접근성을 높일 수 있는 방법으로 제안하였고 국립중앙도서관의 주제명 표목의 현황과 향후 주제 접근 활용성을 높이기 위한 방안을 제시하였다.

사용자 청취 습관과 태그 정보를 이용한 하이브리드 음악 추천 시스템 (A Hybrid Music Recommendation System Combining Listening Habits and Tag Information)

  • 김현희;김동건;조진남
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.107-116
    • /
    • 2013
  • 본 연구에서는 소셜 음악 사이트에서 사용자들이 음악 아이템을 청취한 횟수와 생성한 태그 정보를 혼합하여 음악을 추천하는 시스템을 제안한다. 현재, 상용화된 음악 추천 시스템들은 주로 사용자의 청취 습관과 외부적인 선호도 입력값을 기반으로 음악을 추천하고 있다. 그러나 이 방식은 아직 음악을 청취한 사용자가 많지 않은 새로운 음악이나 청취 정보가 없는 새로운 사용자의 경우 추천하는 데 어려움이 있다. 이 문제를 해결하기 위해서 본 논문에서는 사용자가 선정한 키워드를 아이템에 부여하는 협업 태깅으로 생성된 태그 정보를 활용하였다. 태그의 의미를 파악하여 감정 표현의 정도에 따라 가중치를 부여한 뒤, 태그 점수와 청취 횟수를 혼합하여 음악 아이템의 선호도를 산출하였다. 이를 기반으로 사용자 프로파일을 생성하고 협업 필터링 알고리즘을 수행하였다. 제안하는 추천 방법의 효율성을 평가하기 위해서, 청취 습관 기반 추천, 태그 점수 기반 추천, 하이브리드 추천 방법의 세 가지 추천 방법에 대해서 정확도, 재현율, 그리고 F-measure를 계산하였다. 실험 결과에 대해 통계적 검증을 시행한 결과, 하이브리드 추천 방법이 다른 두 가지 방식보다 통계적으로 유의한 차이를 보여 성능이 우수한 것으로 나타났다.

태그간 의미관계를 이용한 효율적인 이미지 태그 랭킹 기법 (An Efficient Technique for Image Tag Ranking using Semantic Relationship between Tags)

  • 홍현기;허지욱;정진우;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.31-36
    • /
    • 2010
  • 최근 대두되고 있는 웹2.0의 특징은 일반 사용자들이 능동적으로 정보를 생산해내고 공유하는데 있다. 웹 2.0의 참여형 아키텍쳐를 구성하는 핵심요소로 인식되고 있는 폭소노미(Folksonomy)는 과거 택소노미(Taxonomy)와 같이 전문가에 의하여 구축되는 분류 체계가 아닌 사용자들이 협동적으로 태그(Tag)들을 만들고 관리하는 소셜 태깅(Social Tagging)에 의한 분류 시스템이다. 최근 이러한 폭소노미를 활용하여 이미지를 공유하고 검색하고자 하는 다양한 시도들이 진행되고 있다. 그러나 Flickr와 같은 태그 기반 이미지 공유 시스템에서는 태그의 문법적, 의미적 모호성과 이미지에 대한 태그들의 중요성 또는 상관관계를 고려하지 않아 태그 기반 검색 시 정확성 및 신뢰성을 보장할 수 없다. 이러한 문제를 해결하기 위해 폭소노미에 기반한 이미지 공유 데이터베이스에서 적합한 태그들을 태그 전달(Tag Propagation)하거나 확률 및 출현빈도에 기반하여 태그 랭킹을 수행하기 위한 연구들이 활발히 진행되고 있지만 여전히 만족할만한 성능을 보이지 못하고 있다. 본 논문에서는 이미지 공유 데이터베이스에서 유사한 이미지들로부터 이미지에 보다 적합한 태그들을 부여하기 위해서, WordNet을 활용하여 태그들 간의 의미관계에 기반한 효율적인 태그 랭킹 기법을 제안한다. 또한, 신뢰성 있는 태그 기반 검색을 위하여 제안한 태그 랭킹 기법이 현재 이미지 공유 시스템의 랭킹 결과보다 정확성을 높일 수 있음을 실험 예제를 통하여 확인하였다.

  • PDF

SNS 이용자의 성격이 SNS 이용유형과 SNS 몰입에 미치는 영향에 관한 연구: 페이스북을 중심으로 (Effects of SNS user's Personality on Usage patterns and SNS commitment: A case study of Facebook)

  • 최예나;황하성
    • 인터넷정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.95-106
    • /
    • 2016
  • 본 연구는 페이스북 이용자의 성격특성이 페이스북 이용유형과 어떠한 관련이 있으며, 페이스북을 실제로 이용하면서 이용자들의 성격에 따라 페이스북 몰입의 정도가 다르게 나타나는 지를 실증적으로 알아보고자 하였다. 페이스북을 가장 활발히 이용하는 대학생들을 대상으로 설문조사를 실시하였으며, 이들의 성격 5요인, 페이스북 이용유형, 그리고 SNS 몰입 척도를 이용하여 측정하였다. 분석결과 외향성과 친화성은 이용유형의 하위요인 중 정보확산에 정적인 영향을 미쳤으며, 개방성, 성실성, 신경증은 정보생산에 유의미한 영향을 미치는 것으로 드러났다. 또한 이용자의 성격 요인이 몰입에 미치는 영향을 살펴본 결과, 외향성은 지속적, 규범적 몰입에 영향을 미치는 것으로 나타났으며, 신경증은 지속적, 규범적, 정서적 몰입 모두에 정적인 영향력을 미치는 것으로 나타났다. 이러한 본 연구의 결과는 페이스북 이용에 있어 이용자의 성격특성에 따라 SNS 이용유형과 몰입의 종류와 정도가 각각 달라질 수 있음을 시사한다.

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.