• 제목/요약/키워드: 어휘(詞匯)

검색결과 98건 처리시간 0.034초

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

도메인 별 감성분석을 위한 도메인 맞춤형 감성사전 구축 기법 (A Domain Adaptive Sentiment Dictionary Construction Method for Domain Sentiment Analysis)

  • 김다해;조태민;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.15-18
    • /
    • 2015
  • SNS의 확산으로 대중들은 제품, 서비스, 사회적 이슈 등 다양한 도메인에 대하여 자신의 기분이나 의견을 적극적으로 표현하고 있다. 이에 따라 SNS를 분석하여 제품의 수요, TV 시청률, 주가 등의 다양한 현상을 예측하는 데 있어 감성분석을 활용하는 연구가 활발히 진행되고 있다. 감성분석은 각 어휘에 대한 품사, 극성, 감성지수를 규정하고 있는 감성사전을 기반으로 이루어진다. 하지만 동일한 단어라도 도메인에 따라 중요도가 달라지기 때문에 도메인의 특성을 고려한 감성사전을 사용해야 할 필요성이 있다. 따라서 본 연구에서는 다양한 도메인에 대하여 각각의 특성에 맞게 더욱 정확한 감성분석을 할 수 있도록 도메인 맞춤형 감성사전을 구축하는 기법을 제안한다. 도메인 별로 긍 / 부정 평가에 있어 중요한 척도가 되는 단어들을 도메인 감성어휘로 선별하여 목록을 구축하고, 각 감성어휘의 중요도에 따라 도메인 감성지수를 새롭게 정의하였다. 실험 결과, 평가 도메인에 적합한 감성사전이 다른 도메인의 감성사전 및 범용 감성사전보다 우수한 성능을 보였다. 이를 통해 도메인 맞춤형 감성사전 구축기법의 효용성을 확인하였다.

  • PDF

사회적 이슈 리스크 유형 분류를 위한 어휘 자질 선별 (Linguistic Features Discrimination for Social Issue Risk Classification)

  • 오효정;윤보현;김찬영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.541-548
    • /
    • 2016
  • 사용자의 다양한 의견을 수렴하고 모니터링하기 위한 정보원으로써 소셜미디어의 활용은 이미 필수가 되었다. 본 논문은 소셜미디어에 나타난 다양한 이슈 중 여론 형성에 악영향을 끼치는 부정적 사건을 이슈 '리스크'로 정의, 그 세부 유형을 자동으로 분류하는 모델을 개발하고자 한다. 이를 위해 소셜미디어에 나타난 다양한 어휘 자질을 선별, 그 효과를 규명하였다. 특히 리스크 문장의 어휘 구문 특징을 표현하기 위한 자질로 워드 임베딩 학습 결과를 활용한다. 개별 어휘 자질의 특징을 분석하기 위해 언어분석 오류를 보정한 환경에서 수행한 실험 결과, 가장 효과가 큰 자질은 개체명 자질로 분석되었으며, 기본 어휘 자질을 기반으로 주요 술부의 워드 임베딩 결과와 워드 클러스터 결과를 모두 조합한 경우가 최고 성능을 보이는 것으로 파악되었다. 실제 소셜빅데이터에 적용하는 환경과 유사하도록 자동 언어분석 결과의 오류를 포함한 조건에서 실험한 결과, 고빈도 평가셋에서는 92.08%의 성능을, 전체 58개 범주 평가셋에서는 85.84%의 성능을 얻었다.

SNS내 사회감성의 어휘적 의미와 표현에 대한 유의성 (Valence of Social Emotions' Sense and Expression in SNS)

  • 현혜정;황민철
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.37-48
    • /
    • 2014
  • 사회감성은 다양한 사회적 네트워크가 형성됨으로서 우리생활에서 의사소통의 질적 관점에서 중요한 요인으로 대두되고 있다. 이러한 사회감성을 이해하기 위해서 감성의 어휘적 의미와 표현에서 보여 지는 유의성을 검증하고 분석하여 사회감성의 복합적인 의미를 이해하고자 한다. 본 연구에서 의사소통의 대표적인 채널인 SNS(Social Network Service)상에서 감성표현 결과를 이용하여 그 의미와 표현에 대한 척도를 구하고 군집분석을 통해서 그 차이를 깊이 있게 이해하려고 하였다. 분석결과 사회감성요인은 부정적 평가 요인 항목이 긍정적 요인에 비교하여 비중이 높은 반면, 사회감성 표현은 긍정적인 표현이 상당히 많이 제시되는 것으로 나타났다. 사회감성요인에 대한 분류에서 기본 감성이나 유인가로 구분이 가능한 반면에 감성표현에서는 사회감성에서 요구되는 부가적인 내용을 복합적인 의미로 내포하고 있으며 양가적 내용 특성 포함하고 있다.

중국 코퍼스 및 인터넷을 이용한 중한사전의 표제어 연구 - huan~hui일부를 중심으로

  • 박영종
    • 중국학논총
    • /
    • 제70호
    • /
    • pp.39-60
    • /
    • 2021
  • 当我们翻开中韩词典时, 就不难发现令人莫名其妙的词汇不在少数, 而且在部分词汇的解释上也存在着不少问题。本文主要探讨了这些词汇被收录于词典是否合适和词语释义是否正确的问题。为此, 先从中韩词典里筛选出在中国教育部语言文字应用研究所和北京大学中国语言学研究中心所提供的现代汉语语料库中出现频率较低的词汇。若考虑到这两个语料库为全方位收集现代汉语而做了巨大的努力, 而且肯定这一学术成果的话, 就能推测此文里筛选出的这些词汇很可能不太正规或现在不怎幺使用等事实。为了使这种推测能得到更准确的印证, 作者在百度网上又检索了是否出现它们的用例, 且对词语释义和实际用例是否一致做了详细的比较, 就发现不少词汇确实存在各种问题, 根本不适合被收录到词典, 或必须修改释义内容。

"표준형 성인 암성 통증 평가도구" 개발을 위한 시각통증등급의 최고통증강도 어휘 및 심리.사회적 평가 항목의 선정 - 델파이 방법을 이용 - (The Selection of the Most Painful Word in the Visual Analogue Scale(VAS) for Pain and the Psychosocial Factors in Association with Pain Assessment in Korean Adult Cancer Patients - for the Development of Korean Cancer Pain Assessment Tool(K-CPAT) by Delphi Method -)

  • 김진서;천병철;최윤선;송찬희;염창환;이명아;이준영;윤소영;장세권;이영희;이경욱;이철;박진노
    • Journal of Hospice and Palliative Care
    • /
    • 제6권1호
    • /
    • pp.11-21
    • /
    • 2003
  • 배경 : 통증은 암환자에서 가장 흔하고 심각한 문제이지만 국내에는 아직 적절한 암성 통증 평가도구가 없는 상태이다. 이에 표준화된 성인용 암성 통증 평가도구를 개발하는 것이 필요하며, 통증 평가 도구 개발 시 연구되어야 할 내용으로 시각통증등급 중 가장 심한 통증에 대한 어휘를 단일화할 필요성과, 암환자 통증평가 시 암성 통증에 영향을 미칠 수 있는 심리사회적 항목을 수집, 선정 및 선별할 필요성을 인식하였다. 방법 : 2002년부터 2003년까지 암성 통증조절 분야에 전문가로 알려진 전문의 10명, 간호사 10명을 델파이 설문 대상자로 무작위 선정하여 델파이 방법을 통해 3차까지 설문을 실시하였다. 시각통증등급의 가장 심한 통증에 대한 어휘는 가장 높은 빈도로 응답된 어휘를 선택하기로 하였고 심리사회적 평가 항목의 선별은 전문가의 50%를 초과하는 인원이 '관련성이 높다'고 판정하면 선정하기로 하였다. 결과 : 시각 통증등급의 최고 통증강도 어휘 선정 결과는 '참을 수 없이 심한 통증'과 '상상할 수 없을 정도의 가장 심한 통증'이 각각 27.8%로 가장 높은 빈도를 보여 실무위원회와 통증 전문가의 자문결과 '상상할 수 없을 정도의 가장 심한 통증'이 선정되었다. 심리사회적 평가 항목은 문헌조사 결과 30개 항목이 수집되었으며, 정신과 전문의와 실무위원 회의를 통해 15가지로 선정하였으며, 델파이 대상자로 선정된 전문가의 50%를 초과하는 인원 수가 선택한 항목은 '환자의 정신과적 기왕력', '약물남용 및 의존성 유무', '환자의 불안, 우울 등 환자의 현재 감정', '자기조절 능력 소실 유무', '패배감이나 좌절감 유무', '건강 소실에 대한 환자의 적응 정도', '가족의 지지', '소외감 유무', '자신의 사회적 역할 소실에 대한 감정 상태', '스트레스 해소 대처 유형', '현재 처한 환자 자신의 영적 고뇌', '진통제 복용 순응도'등 12 가지 항목이었다. 결론 : "표준형 성인 암성 통증 평가"도구에 사용할 '시각통증등급'최고 통증강도 어휘에는 '상상할 수 없을 정도의 가장 심한 통증'을, 성인 암성 통증과 관련된 심리, 사회적 12가지 항목을 채택할 수 있었다.

  • PDF

구조적 속성과 어휘적 특징에 기반한 안전기준 고찰 (A Review of Safety Standards in Korea based on Structural Attributes and Lexical Characteristics)

  • 임수정;박덕근
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.353-366
    • /
    • 2019
  • 사회발달로 인해 안전기준이 세분화 전문화되면서 관련 법령 또한 그 수가 점차 증가하여 법령 내에서 중복 또는 상충의 문제점이 나타나고 있다. 우리나라 법령에 존재하는 모든 안전기준을 수집한 후 중복 또는 상충문제를 찾아내기 위해서는 우선 안전기준이 가지는 특성들을 분석할 필요가 있다. 본 연구에서는 모든 안전기준에서 나타나는 공통요소와 특정 안전기준에서만 나타나는 특이점을 추출하면서 안전기준의 특성을 크게 구조적, 어휘적 부분으로 구분하였다. 분석결과, 안전기준의 구조적 속성은 2가지, 어휘적 특징은 4가지로 도출되었다. 이러한 특성들이 안전기준을 관리할 향후 시스템에 미치는 영향에 대해서도 추가로 검토하였다. 본 연구를 기반으로 향후 더 많은 안전기준의 구조 및 어휘적 특성들이 축적된다면 효율적인 안전기준의 수집.분석 알고리즘 개발이 가능해져 결국 법령내 안전기준의 중복 상충 문제점 해소에 도움이 될 것이다.

한국어 신조어 교육의 가치와 자료 구축을 위한시론 (Research on the Value of Korean Neologism Education and the Method of Building Data)

  • 김덕신
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.371-377
    • /
    • 2022
  • 이 연구는 그간 학습 결과, 교육적 결과물, 객체를 우선시하느라 한국어 어휘 교육에서 다루지 못한 '과정'으로서 주목해야 할 대상과 학습자는 없는지 검토한 후, 신조어의 교육적 가치를 점검하고 이에 대한 자료구축 방안을 제안하는 데 목적을 두었다. '과정' 중에 빠진 사각지대 어휘로는 신조어를, 사각지대 단계의 학습자로는 외국인 학문목적 학습자를 들고, 학문 목적 학습자에게 신조어를 가르치기 위한 학습 자료로 사전을 만들기 위한 전초 작업으로 신조어 '단층적 목록' 만들기를 제안하였다. '단층적 목록'은 신조어를 시기별로 조어, 의미, 문화 등으로 나누어 자료로 구축하는 것이다. 이러한 연구는 그간 한국어 어휘교육에서 구축한 결과물에 '과정'으로 학습으로 할 어휘를 추가하여 한국어 어휘교육을 체계적으로 하는 데 도움을 줄 것이다.

모션타이포그래피의 움직임을 통한 감성전달 (Emotion Communication through MotionTypography Based on Movement Analysis)

  • 손민정;이현주
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권4호
    • /
    • pp.541-550
    • /
    • 2011
  • 모션타이포그래피는 디지털사회가 요구하는 감성적인 커뮤니케이션에 효과적인 수단으로 활용될 수 있는 요체가 된다. 이에 따라 본 연구에서는 모션타이포그래피로 감성을 표현하기 위하여 움직임의 특성을 연구하는 것을 목적으로 사용자 감성평가를 통해 모션타이포그래피의 감성척도를 구성하고 움직임에 대한 이미지 분포를 파악하였다. 본 연구는 문헌연구와 실험조사를 통하여 감성어휘를 수집하였고 KJ법과 클러스터 분석법으로 대표어휘를 추출하였다. 연구 결과, '차분한-활동적인', '부드러운-딱딱한' 축으로 구성된 모션타이포그래피 감성척도 공간을 구성하였으며, 모션타이포그래피의 움직임은 사용자에게 특정한 감성반응을 유발한다는 것을 알 수 있었다. 향후에 본 논문의 결과와 함께 감성어휘별 시각 요소의 특성을 도출한다면 일반인도 비교적 손쉽게 모션타이포그래피를 제작할 수 있는 가이드라인이 제시될 수 있을 것이다.

기술용어(技術用語)의 국어화론(國語化論)

  • 이동한
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.49-56
    • /
    • 1990
  • 기술개발의 근원인 사고활동을 효과적으로 수행하고, 고도 정보화사회에 대응하는 국가의 지적영역을 확보하기 위해 모든 기술적 개념을 어휘 수준, 구문 수준, 의미수준에서 모국어를 확충 발전시키는 것이 기술 용어의 국어화 과제이다.

  • PDF