• 제목/요약/키워드: 채팅 데이터 분석

검색결과 26건 처리시간 0.027초

채팅 메신저 사용자 검증을 위한 그래프 랜덤 워크 분석 (Graph Random Walk Analysis for Chat Messenger User Verification)

  • 이다영;조환규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 2021
  • 메신저 사용의 증가와 함께 관련 범죄와 사고가 증가하고 있어 메시지 사용자 검증의 필요성이 대두되고 있다. 본 연구에서는 그래프 기반의 인스턴트 메세지 분석 모델을 제안하여 채팅 사용자를 검증하고자 한다. 사용자 검증은 주어진 두 개의 텍스트의 작성자가 같은지 여부를 판단하는 문제다. 제안 모델에서는 사용자의 이전 대화를 토대로 n-gram 전이 그래프를 구축하고, 작성자를 알 수 없는 메세지를 이용해 전이 그래프를 순회한 랜덤워크의 특성을 추출한다. 사용자의 과거 채팅 습관과 미지의 텍스트에 나타난 특징 사이의 관계를 분석한 모델은 10,000개의 채팅 대화에서 86%의 정확도, 정밀도, 재현율로 사용자를 검증할 수 있었다. 전통적인 통계 기반 모델들이 명시적 feature를 정의하고, 방대한 데이터를 이용해 통계 수치로 접근하는데 반해, 제안 모델은 그래프 기반의 문제로 치환함으로써 제한된 데이터 분량에도 안정적인 성능을 내는 자동화된 분석 기법을 제안했다.

  • PDF

의사 형태소 단위 채팅 시스템 (Chatting System that Pseudomorpheme-based Korean)

  • 김시형;김학수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.263-267
    • /
    • 2016
  • 채팅 시스템은 사람이 사용하는 언어로 컴퓨터와 의사소통을 하는 시스템이다. 최근 딥 러닝이 큰 화두가 되면서 다양한 채팅 시스템에 관한 연구가 빠르게 진행 되고 있다. 본 논문에서는 문장을 Recurrent Neural Network기반 의사형태소 분석기로 분리하고 Attention mechanism Encoder-Decoder Model의 입력으로 사용하는 채팅 시스템을 제안한다. 채팅 데이터를 통한 실험에서 사용자 문장이 짧은 경우는 답변이 잘 나오는 것을 확인하였으나 긴 문장에 대해서는 문법에 맞지 않는 문장이 생성되는 것을 알 수 있었다.

  • PDF

채팅 텍스트로부터의 회자 감정상태 학습 (Learning Emotional States of Chatting Partners from Text Data)

  • 문현구;장벽탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.340-342
    • /
    • 2001
  • 현재 인터넷 환경에서 텍스트는 다루기 쉽고 부하가 적어 가장 많이 사용되는 통신 수단이다. 그러나 화상 채팅과는 달리 자신의 표정이나 체스춰를 전달할 수 있는 방법이 없기 때문에 표현상의 한계가 있다. 이 글은 일상 대화를 텍스트로 입력받아, naive Bayes 알고리즘을 사용해 미리 정의된 감정 범주, 즉 울기, 웃기, 화내기 등으로 분류해 주는 방법에 관해 다루고 있다. 채팅사이트에서 수집된 학습데이터는 사람에 의해 해당 감정 범주로 태깅되고, 이렇게 태깅된 데이터가 학습엔진에 의해 통계 정보로 구축되면, 실제 채팅사이트에서 감정인식 엔진은 입력된 데이터를 분석해 해당 감정으로 분류한다. 연령별로 5개의 그룹으로 나눈 대화방에서 각각 1000문장씩 테스트해본 결과 평균 91.6%의 정확도를 얻을 수 있었다.

  • PDF

의사 형태소 단위 채팅 시스템 (Chatting System that Pseudomorpheme-based Korean)

  • 김시형;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.263-267
    • /
    • 2016
  • 채팅 시스템은 사람이 사용하는 언어로 컴퓨터와 의사소통을 하는 시스템이다. 최근 딥 러닝이 큰 화두가 되면서 다양한 채팅 시스템에 관한 연구가 빠르게 진행 되고 있다. 본 논문에서는 문장을 Recurrent Neural Network기반 의사형태소 분석기로 분리하고 Attention mechanism Encoder-Decoder Model의 입력으로 사용하는 채팅 시스템을 제안한다. 채팅 데이터를 통한 실험에서 사용자 문장이 짧은 경우는 답변이 잘 나오는 것을 확인하였으나 긴 문장에 대해서는 문법에 맞지 않는 문장이 생성되는 것을 알 수 있었다.

  • PDF

챗봇 데이터에 나타난 우울의 범주와 특성에 관한 연구 (A study on the categories and characteristics of depressive moods in chatbot data)

  • 진효진;백금희;차지영;최정회;임현승;차미영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.993-996
    • /
    • 2021
  • 챗봇의 사용 용도는 일상 대화와 소비자 응대를 넘어서 심리 상담 용도로 확장하고 있다. 이 연구에서는 챗봇-사람 채팅에서 무작위로 추출한 '우울'과 관련된 대화 데이터를 텍스트마이닝 기법으로 분석하여 채팅에서의 우울 관련 담론 주제를 파악하였다. 더불어 정성 분석을 통해 사용자들이 챗봇에 털어놓고 있는 '우울' 의 종류를 범주화하고 분류하여, 트위터의 '우울' 데이터와의 차이점을 비교하였다. 이를 통해 챗봇 데이터의 '우울' 대화만의 특징을 파악하고, 우울 증상 탐지와 그에 따른 적절한 심리지원 정보를 제공하는 서비스 디자인의 착안점을 제시한다.

감성분석 연구 동향 (Sentimental Analysis Research Trends)

  • 이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.358-361
    • /
    • 2018
  • 비정형 데이터 증가로 텍스트 마이닝을 사용해 데이터를 분석하는 연구가 주목받고 있다. 감성분석은 단어와 문맥을 분석하여 텍스트의 감정을 파악하는 기술이다. 본 논문에서는 감성분석 연구 동향, 적용분야, 방법론에 관해 분석하고 기술하려 한다. 감성분석은 2001년 채팅의 감정을 분석하면서 시작되었고, 2008년부터 본격적으로 연구가 진행되었다. 감성분석은 SNS, 상품 후기, 영화평, 뉴스 기사 등 다양한 데이터에 적용되고 있으며, 사회이슈 찬반 분석과 장소 선호도 분석 등 다양한 연구에서 사용되었다. 감성분석 방법은 감성사전을 이용하는 방식과 기계학습을 사용하는 방식으로 나누어지며 분석 방법을 발전시키기 위한 연구가 진행되고 있다.

채팅 데이터의 기분 분류 시스템 (Emotion Classification System for Chatting Data)

  • 윤영미;이영호
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.11-17
    • /
    • 2009
  • 온라인 커뮤니케이션 중 인터넷 메신저를 이용한 대화의 비중이 점점 증가하는 추세이나, 이러한 메신저 대화정보를 효율적으로 재사용할 수 있는 어플리케이션은 많지 않다. 메신저 대화 정보는 사용자의 언어 습관이 반영된다는 특성을 가진다. 이러한 언어 습관은 자주 쓰이는 단어나 이모티콘으로 나타나며, 이들로써 사용자의 기분을 잘 파악할 수 있다는 특성이 있다. 그러므로 본 연구에서는 자주 쓰이는 단어들이나, 기호 등을 이용해서 효과적으로 대화 내용 작성자의 기분 등을 분류할 수 있는 기법을 제안한다. 이러한 기법은 충분한 반복 실험을 통해서 95% 이상의 높은 정확성으로 기분을 분류할 수 있음을 보여주고 있다.

화상 회의 애플리케이션 GoToWebinar 및 GoToMeeting 아티팩트 분석 (Artifacts Analysis of GoToWebinar and GoToMeeting)

  • 강수진;김기윤;이양선
    • Journal of Platform Technology
    • /
    • 제11권1호
    • /
    • pp.11-22
    • /
    • 2023
  • 신종 바이러스 감염병의 세계적 유행으로 인해 다양한 화상회의 및 협업 애플리케이션이 등장하였다. 화상회의 애플리케이션은 실시간 화상회의 외에도 채팅과 파일 공유와 같은 기능들을 다양한 플랫폼으로 제공한다. 채팅, 파일 및 화면 공유 등의 기능으로 다양한 개인 정보가 저장되기에 이러한 화상 회의 애플리케이션은 디지털 포렌식 수사 관점에서 주요 분석 대상이다. 크로스 플랫폼을 지원하는 응용프로그램의 경우 플랫폼에 따라 저장되는 데이터의 형태가 상이하기도 하다. 따라서 화상회의 애플리케이션의 데이터를 포렌식 수사에 활용하기 위해서는 플랫폼 별 저장되는 주요 아티팩트에 대한 사전 연구가 필요하다. 본 논문에서는 화상 회의 애플리케이션인 GoToWebinar 및 GoToMeeting를 사용하고 생성되는 아티팩트를 분석하여 디지털 포렌식 수사 관점에서 주요 주요한 데이터를 나열한다. 각 애플리케이션이 제공하는 플랫폼 별로 저장되는 데이터를 식별하며, 사용자 행위를 추정할 수 있는 아티팩트를 정리한다. 그리고 화상 회의 내의 역할과 환경에 따라 획득할 수 있는 데이터를 분류한다.

  • PDF

한글 채팅 말뭉치를 이용한 크로스-텍스팅 방지 시스템 (Cross-Texting Prevention System using Korean Chat Corpus)

  • 이다영;조환규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.377-382
    • /
    • 2020
  • cross-texting은 실수로 의도하지 않은 상대방에게 메세지를 잘못 전송하는 것을 말한다. 휴대폰 메신저 사용이 활발해짐에 따라 이 같은 실수가 빈번하게 발생하는데 메신저에서 제공하는 기능은 대체로 사후 해결책에 해당하고 사용자가 사전에 실수를 발견하기는 어렵다. 본 논문에서는 사용자가 작성한 문장의 형식적 자질를 분석하여 현재 참여중인 대화에서 작성한 문장이 cross-texting인지를 판별하는 모델을 제안했다. 문장에서 높임법, 표층적 완성도 자질을 추출하고 이를 통해 특정 사용자의 대화를 모델링하여 주어진 문장이 대화에 부합하는지 여부를 판단한다. 이같은 방식은 채팅방의 이전 기록만으로도 사용자가 작성한 문장이 cross-texting인지 여부를 쉽게 판단할 수 있는 힌트를 제공할 수 있다. 실제 메신저 대화 말뭉치를 이용해 제작한 데이터에서 94% 정확도로 cross-texting을 탐지했다.

  • PDF

디지털 포렌식 관점에서의 인스타그램 사용자 행위 분석 (Instagram Users Behavior Analysis in a Digital Forensic Perspective)

  • 서승희;김역;이창훈
    • 정보보호학회논문지
    • /
    • 제28권2호
    • /
    • pp.407-416
    • /
    • 2018
  • 인스타그램(Instagram)은 사람 간의 관계망을 구축하고 취미, 일상, 유용한 정보 등을 공유하는 인터넷 서비스인 소셜 네트워크 서비스(Social Network Service:SNS)로 최근 다양한 연령층에서 각광받고 있다. 하지만 업로드한 개인 정보를 불특정 다수가 열람할 수 있고 검증되지 않은 정보가 무방비하게 공유되기 때문에 이를 악용한 각종 사기, 스토킹, 명의 도용, 저작권 침해, 악성코드 유포 등의 문제가 발생 하고 있다. 이에 따라 인스타그램에 대한 디지털 포렌식적 관점에서의 분석이 필요하나 관련한 연구는 미약한 실정이다. 따라서 본 논문에서는 안드로이드 환경에서 인스타그램에 대해 디지털 포렌식 관점에서 역 공학 및 동적 분석을 수행하였고 그 결과 채팅 내용, 채팅 대상, 게시한 사진, 쿠키 정보 등의 사용자 행위 분석이 가능한 데이터가 담긴 3개의 데이터베이스 파일과 4개의 파일 저장 경로, 다양한 데이터 저장된 xml파일을 확인하였다. 또한 위의 분석 결과를 디지털 포렌식 조사에 활용할 수 있는 방안을 제시한다.