• 제목/요약/키워드: 소셜 태깅

검색결과 39건 처리시간 0.023초

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.

감성 강도를 고려한 감성 분석 평가집합 구축 (Constructing an Evaluation Set for Korean Sentiment Analysis Systems Incorporating the Category and the Strength of Sentiment)

  • 김도연;오영;박혁로
    • 한국콘텐츠학회논문지
    • /
    • 제12권11호
    • /
    • pp.30-38
    • /
    • 2012
  • 감성 분석은 블로그와 트위터 같은 다양한 소셜 미디어에서 사용자들이 표현하는 감정의 종류를 분석하고 추출하는 연구이다. 현재 감성 분석 연구는 꾸준히 계속되고 있지만, 한국어의 감성 분석 평가 집합은 아직 없다. 본 논문에서는 감성 분석을 평가할 수 있는 평가집합을 구축한다. 평가집합에서는 사용자의 감성에 대한 극성뿐만 아니라 감성의 종류와 강도까지 고려한 평가집합을 구축하였다. 이를 위해 감성의 종류는 긍정에서 7가지의 범주와 부정에서 15가지의 범주를 나누고, 각 범주별로 1~3까지의 강도를 설정하였다. 또한 각 범주에 속하는 어휘에 대해서도 1~3까지의 강도를 설정하였다. 평가집합의 데이터는 다양한 소셜 미디어에서 3,270 문장을 추출하여 구축하였으며, 각 문장에 대해 5 명이 감성의 종류와 강도를 태깅하였다. 구축한 평가집합에서 5명의 일치도는 극성의 경우 93 %, 감성의 종류는 70 %, 강도는 58 % 로 나타났다. 이는 독일어와 스페인어의 평가 집합 보다 일치도가 높게 나타났다. 이 결과는 제안한 평가 집합이 신뢰할 만한 자원으로 다른 감성 분석 시스템의 평가데이터로 사용될 수 있음을 보여준다.

이용자 생성 도서정보 태그에 기반한 소설 검색의 패싯 유형 개발 (Developing Facets for Fiction Retrieval Based on User-generated Book Tags)

  • 심지영
    • 정보관리학회지
    • /
    • 제37권2호
    • /
    • pp.225-249
    • /
    • 2020
  • 본 연구는 소설 검색 환경을 개선하기 위해, 도서태그로부터 소설 이용자가 소설 탐색 상황에서 요구하는 다양한 패싯 요소를 식별하고 체계화하는 것을 목적으로 한다. 소설의 기본 패싯 체계를 랑가나단의 PMEST 기본 패싯에 기반하여, 1) 소설 자료를 형성하는 주체, 2) 소설을 구성하는 내용적, 외형적 성질, 3) 독자가 책과 상호작용하는 행위, 4) 소설 및 독서활동과 관련된 공간 정보, 5) 소설 및 독서활동과 관련된 시간 정보로 정의하고, 소설 7,174건에 부여된 약 31만 건의 태그 중 핵심 태그 3,730건을 선별하여 내용분석하였다. 그 결과, 소설 패싯의 상위범주 25개를 중심으로 다양한 속성을 체계화하였다. 본 연구의 결과는 향후 도서관 OPAC이나 소설 DB에 패싯 내비게이션 형태로 적용될 수 있을 것으로 기대된다.

UniTag 온톨로지를 이용한 태그 기반 음악 추천 기법 (A Tag-based Music Recommendation Using UniTag Ontology)

  • 김현희
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권11호
    • /
    • pp.133-140
    • /
    • 2012
  • 본 논문에서는 소셜 음악 사이트에서 사용자들이 생성한 태그를 바탕으로 음악을 추천하는 기법을 제안한다. 협력적 태깅 시스템은 사용자가 직접 선정한 단어를 콘텐츠에 부여할 수 있도록 하므로, 사용자의 선호도를 구체적으로 파악할 수 있는 정보를 제공한다. 특히, 감정을 표현하는 감정 태그들은 음악 장르나 음악가와 같이 사실을 나타내는 사실 태그들과는 다르게 선호도를 훨씬 직접 표현하고 있다. 따라서 태그의 의미를 파악하여 감정 태그와 사실 태그로 분류하고, 감정 태그는 감정표현의 정도에 따라 가중치를 부여하기 위해서 UniTag라고 하는 태그 온톨로지를 개발하였다. UniTag 온톨로지를 이용하여 정제된 태그 집합은 사용자 프로파일 생성에 사용되며, 태그 기반 사용자 프로파일을 바탕으로 음악 추천 알고리즘을 수행하였다. 제안하는 추천 방법의 효율성을 평가하기 위해서, 전통적인 청취 횟수 기반 추천, 감정 태그 가중치를 고려하지 않은 추천, 그리고 감정 태그 가중치를 고려한 추천의 세 가지 추천 방법의 정확도와 재현율을 비교하였다. 실험 결과는, 감정 태그 가중치를 고려한 추천 방식이 정확도의 측면에서 다른 두 가지 방식보다 효율적이라는 것을 보여준다.

주제 접근의 다양성과 국립중앙도서관 주제명 표목의 활용가능성에 관한 연구 (A Study on Varieties of Subject Access and Usabilities of the National Library of Korea Subject Headings)

  • 정연경
    • 한국비블리아학회지
    • /
    • 제25권4호
    • /
    • pp.171-185
    • /
    • 2014
  • 본 연구는 급격히 변화하는 도서관 환경 속에서 이루어지고 있는 주제 접근 방식의 다양성을 살펴보고 국립중앙도서관의 주제명표목에 관한 분석과 평가를 통해 주제 접근의 미래에 관해 제시하였다. 먼저 주제 접근의 현황과 문제점을 살펴보고 대표적인 주제명 표목인 미의회도서관 주제명표목의 장점과 단점을 바탕으로 주제명 표목의 검색 효율성을 증진하는 방법에 관해 다루었다. 소셜북마킹, 폭소노미, 태깅, 패싯 적용, 저자부여 키워드, 시소러스, 분류표, 자동완성기능 부여로 주제 접근성을 높일 수 있는 방법으로 제안하였고 국립중앙도서관의 주제명 표목의 현황과 향후 주제 접근 활용성을 높이기 위한 방안을 제시하였다.

사용자 청취 습관과 태그 정보를 이용한 하이브리드 음악 추천 시스템 (A Hybrid Music Recommendation System Combining Listening Habits and Tag Information)

  • 김현희;김동건;조진남
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.107-116
    • /
    • 2013
  • 본 연구에서는 소셜 음악 사이트에서 사용자들이 음악 아이템을 청취한 횟수와 생성한 태그 정보를 혼합하여 음악을 추천하는 시스템을 제안한다. 현재, 상용화된 음악 추천 시스템들은 주로 사용자의 청취 습관과 외부적인 선호도 입력값을 기반으로 음악을 추천하고 있다. 그러나 이 방식은 아직 음악을 청취한 사용자가 많지 않은 새로운 음악이나 청취 정보가 없는 새로운 사용자의 경우 추천하는 데 어려움이 있다. 이 문제를 해결하기 위해서 본 논문에서는 사용자가 선정한 키워드를 아이템에 부여하는 협업 태깅으로 생성된 태그 정보를 활용하였다. 태그의 의미를 파악하여 감정 표현의 정도에 따라 가중치를 부여한 뒤, 태그 점수와 청취 횟수를 혼합하여 음악 아이템의 선호도를 산출하였다. 이를 기반으로 사용자 프로파일을 생성하고 협업 필터링 알고리즘을 수행하였다. 제안하는 추천 방법의 효율성을 평가하기 위해서, 청취 습관 기반 추천, 태그 점수 기반 추천, 하이브리드 추천 방법의 세 가지 추천 방법에 대해서 정확도, 재현율, 그리고 F-measure를 계산하였다. 실험 결과에 대해 통계적 검증을 시행한 결과, 하이브리드 추천 방법이 다른 두 가지 방식보다 통계적으로 유의한 차이를 보여 성능이 우수한 것으로 나타났다.

태그간 의미관계를 이용한 효율적인 이미지 태그 랭킹 기법 (An Efficient Technique for Image Tag Ranking using Semantic Relationship between Tags)

  • 홍현기;허지욱;정진우;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.31-36
    • /
    • 2010
  • 최근 대두되고 있는 웹2.0의 특징은 일반 사용자들이 능동적으로 정보를 생산해내고 공유하는데 있다. 웹 2.0의 참여형 아키텍쳐를 구성하는 핵심요소로 인식되고 있는 폭소노미(Folksonomy)는 과거 택소노미(Taxonomy)와 같이 전문가에 의하여 구축되는 분류 체계가 아닌 사용자들이 협동적으로 태그(Tag)들을 만들고 관리하는 소셜 태깅(Social Tagging)에 의한 분류 시스템이다. 최근 이러한 폭소노미를 활용하여 이미지를 공유하고 검색하고자 하는 다양한 시도들이 진행되고 있다. 그러나 Flickr와 같은 태그 기반 이미지 공유 시스템에서는 태그의 문법적, 의미적 모호성과 이미지에 대한 태그들의 중요성 또는 상관관계를 고려하지 않아 태그 기반 검색 시 정확성 및 신뢰성을 보장할 수 없다. 이러한 문제를 해결하기 위해 폭소노미에 기반한 이미지 공유 데이터베이스에서 적합한 태그들을 태그 전달(Tag Propagation)하거나 확률 및 출현빈도에 기반하여 태그 랭킹을 수행하기 위한 연구들이 활발히 진행되고 있지만 여전히 만족할만한 성능을 보이지 못하고 있다. 본 논문에서는 이미지 공유 데이터베이스에서 유사한 이미지들로부터 이미지에 보다 적합한 태그들을 부여하기 위해서, WordNet을 활용하여 태그들 간의 의미관계에 기반한 효율적인 태그 랭킹 기법을 제안한다. 또한, 신뢰성 있는 태그 기반 검색을 위하여 제안한 태그 랭킹 기법이 현재 이미지 공유 시스템의 랭킹 결과보다 정확성을 높일 수 있음을 실험 예제를 통하여 확인하였다.

  • PDF

공간적 자기상관성의 정도에 따른 MAUP에서의 스케일 효과 연구 - LBSNS 데이터를 중심으로 - (A Study on Scale Effects of the MAUP According to the Degree of Spatial Autocorrelation - Focused on LBSNS Data -)

  • 이영민;권필;유기윤;허용
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.25-33
    • /
    • 2016
  • 포인트 속성의 위치 기반 소셜 네트워크 서비스(Location-Based Social Network Services, LBSNS) 데이터를 멀티스 케일의 타일맵상에 효과적으로 시각화하기 위해서는 격자 기반으로 군집화하여 표현해야 할 필요성이 있다. 이때 격자의 크기 및 개수를 결정해야 하는데, 이에 대한 기준은 정해진 것이 없으며 데이터의 종류와 분석 목적에 따라 달라지므로 연구자의 주관이 개입될 수밖에 없다. 이때 연구 결과에 영향을 끼치는 공간단위 임의성의 문제(Modifiable Areal Unit Problem, MAUP)가 발생한다. 본 연구에서는 LBSNS 중 지오태깅(geotagging)된 트위터(Twitter) 데이터를 대상으로 하여 이러한 MAUP의 영향을 스케일 효과(scale effect)의 측면에서 탐색해 보고자 하였다. 이를 위해 공간오차모델(spatial error model)을 이용하여 데이터의 공간적 자기상관성(spatial autocorrelation)의 정도를 조절하였으며, 이에 대해 격자의 크기를 달리함에 따른 공간적 자기상관성의 변화를 Moran's I를 통해 분석하였다. 실험 결과, 원 데이터에는 양의 공간적 자기상관성이 존재하는 것을 확인하였으며, 이러한 경우에는 공간오차모델의 공간자기회귀계수(spatial autoregressive coefficient)의 값이 증가할수록 공간적 자기상관성이 감소하는 것을 알 수 있었다. 이러한 특성을 이용하여 트위터 데이터의 공간적 자기상관성의 강도를 5단계로 조절하였으며, 각 단계에 대하여 격자의 크기를 9단계로 나누어 각각에서의 Moran's I를 계산하였다. 그 결과, 합역 수준이 높아질수록 공간적 자기상관성이 증가하다가 격자의 크기가 600m에서 1,000m 사이일 때 감소하는 것을 알 수 있었으며, 공간적 자기상관성이 강할수록 MAUP에서의 스케일 효과는 감소하는 경향이 있는 것을 확인하였다.

컴포넌트 그리드: 개발자 친화적인 국방 소프트웨어 재사용 지원 환경 (Component Grid: A Developer-centric Environment for Defense Software Reuse)

  • 고인영;구형민
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제23권4호
    • /
    • pp.151-163
    • /
    • 2010
  • 국방 소프트웨어 개발 분야는 응용 도메인이 다양하며 각 도메인의 규모도 다른 분야보다 커서 소프트웨어 자산의 재사용이 중요시 되고 있고, 재사용 되는 자산의 품질 및 신뢰성이 강조된다. 국방 분야에서 이러한 중요성을 인식하고 재사용 방법론들을 개발하여 사용하려는 시도가 많았지만 체계적인 재사용이 이루어지지 않아 재사용 이익을 극대화 하지 못하였다. 본 연구에서는 실질적으로 재사용이 왜 잘 이루어지지 않는지에 대한 문제점들을 분석하고, 이러한 문제점들을 해결할 수 있는 요구사항들을 정리하였다. 이러한 요구사항을 만족하며 전군적 소프트웨어 재사용을 지원하는 개발자 친화적인 재사용 지원 환경인 컴포넌트 그리드 시스템을 개발하고 있다. 컴포넌트 그리드 시스템 개발을 위해 아키텍처를 설계하였고, 아키텍처를 구성하는 세부적인 핵심 요소들과 그 역할을 정의하였다. 개발자 부담의 감소를 위한 시맨틱 태깅(Semantic Tagging) 기반의 요구사항 추적 기술을 개발하였고, 재사용 지식 표현 모델을 개발하였다. 또한 개발자들 간의 자유로운 의사소통 과 자산 및 지식의 교류를 지원하기 위해 웹 기반의 자산 관리 환경과 소셜 네트워크 기반의 자산 검색 및 커뮤니티 추천 기법, 위키(Wik) 기반의 참여적, 협력적 지식 정제 및 증식 환경을 개발하였다. 이러한 접근법들을 통합하여 재사용을 지원할 수 있는 웹 기반 컴포넌트 그리드 시스템의 프로토타입을 구현하였다. 본 연구를 통해 국방 소프트웨어 개발 분야에서 개발자들이 소프트웨어 자산들을 투명하고 효율적으로 공유 및 재사용이 가능하게 하여 국방 소프트웨어의 재사용성 및 품질을 향상시킬 수 있으리라 기대한다.

  • PDF