• 제목/요약/키워드: 채팅 데이터 분석

검색결과 26건 처리시간 0.022초

인공신경망 은닉층 해석을 위한 토픽과의 비교 (Comparison Between Hidden Layers of Neural Networks and Topics for Hidden Layer Comprehension)

  • 정영섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.910-913
    • /
    • 2017
  • 데이터의 양이 증가하면서 인공신경망을 통한 데이터 분석 기술이 주목받고 있으며, 텍스트, 그림, 동영상 등에 이르기까지 다양한 종류의 데이터를 자동으로 분석하여, 번역기, 채팅봇, 그림 캡션 자동 생성 등에 대한 연구 및 서비스 개발에 활용되고 있다. 인공신경망 기반으로 수행된 많은 연구들이 공통적으로 가진 한계가 있는데, 그것은 은닉층에 대한 해석이 어렵다는 것이다. 가령, 입력층, 은닉층, 그리고 결과층으로 이루어진 인공신경망을 임의의 데이터로 학습시키면, 입력층과 은닝층 사이에 존재하는 행렬은 해당 데이터에 존재하는 패턴 정보를 내포하게 된다. 따라서, 행렬에 존재하는 패턴 정보를 직접 분석할 수 있다면, 인공신경망 결과물에 대한 해석이 가능할 뿐만 아니라 성능을 높이기 위해 어떤 조정이 필요한지에 대한 직관도 얻을 수 있을 것이다. 하지만, 이 행렬의 실체는 숫자로 이루어진 벡터이므로 사람이 직접 해석하는 것은 불가능하며, 지금까지 수행되어온 대부분의 인공신경망 연구들은 공통적으로 이러한 한계점을 가지고 있다. 본 연구는 데이터에 존재하는 패턴을 잡아내면서도 해석이 가능한 토픽 모델과 인공신경망의 결과물을 비교함으로써, 인공신경망 은닉층 해석에 대한 실마리를 찾기 위한 연구이다. 실험을 통해 토픽과 은닉층 패턴의 유사성을 검증하고, 향후 인공신경망 연구에서 은닉층에 대한 가능성을 논한다.

포렌식 관점에서의 Element 인스턴트 메신저 아티팩트 분석 (Forensic Analysis of Element Instant Messenger Artifacts)

  • 조재민;변현수;윤희서;서승희;이창훈
    • 정보보호학회논문지
    • /
    • 제32권6호
    • /
    • pp.1113-1120
    • /
    • 2022
  • 최근 개인정보보호를 목적으로 데이터를 암호화해 저장하고 보안에 초점을 맞춰 종단 간 암호화 등의 서비스를 제공하는 메신저들이 등장하면서 수사에 어려움을 겪고 있다. 이에 보안 메신저를 악용하는 범죄사례는 늘고 있지만, 보안 메신저에 대한 데이터 복호화 연구는 필요하다. Element 보안 메신저는 대화 참여자만 대화 이력을 확인할 수 있도록 종단 간 암호화 기능을 제공하고 있으나 이를 복호화하는 연구는 미흡하다. 따라서 본 논문에서는 종단 간 암호화 기능을 제공하는 인스턴트 메신저 Element를 분석하고, 사용자의 패스워드 없이 Windows 자격 증명 관리자 서비스에 저장된 복호화키를 활용하여 암호화된 보안 채팅방의 이력을 평문으로 확인하는 방안을 제안한다. 또한, 디지털 포렌식 수사관점에서 유의미한 일반 및 보안 채팅 관련 아티팩트를 분석한 결과를 정리한다.

BERT를 활용한 초등학교 고학년의 욕설문장 자동 분류방안 연구 (A Study on Automatic Classification of Profanity Sentences of Elementary School Students Using BERT)

  • 심재권
    • 창의정보문화연구
    • /
    • 제7권2호
    • /
    • pp.91-98
    • /
    • 2021
  • 코로나19로 인해 초등학생이 온라인 환경에 머무는 시간이 증가함에 따라 작성하는 게시글, 댓글, 채팅의 양이 증가하였고, 타인의 감정을 상하게 하거나 욕설을 하는 등의 문제가 발생하고 있다. 네티켓을 초등학교에서 교육하고 있지만, 교육시간이 부족할 뿐 아니라 행동의 변화까지 기대하기는 어려움이 있어 자연어처리를 통한 기술적인 지원이 필요한 상황이다. 본 연구는 초등학생이 작성하는 문장에 사전언어학습 모델에 적용하여 자동으로 욕설문장을 필터링하는 실험을 진행하였다. 실험은 온라인 학습 플랫폼에서 초등학교 4-6학년의 채팅내역을 수집하였고, 채팅 내역중에 욕설로 신고되어 판정된 욕설문장을 함께 수집하여 사전학습된 언어모델을 통해 훈련하였다. 실험결과, 욕설문장을 분류한 결과 75%의 정확률을 보이는 것으로 분석되어 학습 데이터가 충분히 보완된다면, 초등학생이 사용하는 온라인 플랫폼에서 적용할 수 있음을 보여주었다.

Long Short-Term Memory를 이용한 통합 대화 분석 (Integrated Dialogue Analysis using Long Short-Term Memory)

  • 김민경;김학수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.119-121
    • /
    • 2016
  • 최근 사람과 컴퓨터가 대화를 하는 채팅시스템 연구가 활발해지고 있다. 컴퓨터가 사람의 말에 적절한 응답을 하기 위해선 그 의미를 분석할 필요가 있다. 발화에 대한 의미 분석의 기본이 되는 연구로 감정분석과 화행분석이 있다. 그러나 이 둘은 서로 밀접한 연관이 있음에도 불구하고 함께 분석하는 연구가 시도되지 않았다. 본 연구에서는 Long Short-term Memory(LSTM)를 이용하여 대화체 문장의 감정과 화행, 서술자를 동시에 분석하는 통합 대화 분석모델을 제안한다. 사랑 도메인 데이터를 사용한 실험에서 제안 모델은 감정 58.08%, 화행 82.60%, 서술자 62.74%의 정확도(Accuracy)를 보였다.

  • PDF

Long Short-Term Memory를 이용한 통합 대화 분석 (Integrated Dialogue Analysis using Long Short-Term Memory)

  • 김민경;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.119-121
    • /
    • 2016
  • 최근 사람과 컴퓨터가 대화를 하는 채팅시스템 연구가 활발해지고 있다. 컴퓨터가 사람의 말에 적절한 응답을 하기 위해선 그 의미를 분석할 필요가 있다. 발화에 대한 의미 분석의 기본이 되는 연구로 감정분석과 화행분석이 있다. 그러나 이 둘은 서로 밀접한 연관이 있음에도 불구하고 함께 분석하는 연구가 시도 되지 않았다. 본 연구에서는 Long Short-term Memory(LSTM)를 이용하여 대화체 문장의 감정과 화행, 서술자를 동시에 분석하는 통합 대화 분석모델을 제안한다. 사랑 도메인 데이터를 사용한 실험에서 제안 모델은 감정 58.08%, 화행 82.60%, 서술자 62.74%의 정확도(Accuracy)를 보였다.

  • PDF

앱 엔진기반의 클라우드 환경에서 Python 및 Go로 작성된 웹어플리케이션의 성능 비교 (A Study on Tools for Agent System Development The Performance Comparison of Web Applications Written Using Python and Go in Google App Engine-based Cloud Environment)

  • 강민지;우별;이도영;조승현;문봉교
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.10-13
    • /
    • 2015
  • Google App Engine(GAE)은 플랫폼 서비스 형태(Platform as a Service, PaaS)의 클라우드 인프라이며 GAE를 기반으로 웹어플리케이션을 제작할 수 있도록 다양한 개발 도구를 제공해 준다. 본 논문에서는 Python 및 Go를 이용하여 GAE 상에서 구현한 클라우드 기반의 web application들의 성능을 비교하고자 한다. 각 web application의 주요 기능은 회원가입, 로그인, 채팅 등으로 구성되어 있고 특히, 회원목록이나 채팅 데이터를 처리하기 위하여 GAE에서 제공하는 Google Datastore를 사용하였다. 성능비교를 위하여 Python2.5, Python 2.7 및 Go를 사용하여 통일한 기능의 web application을 구현하였으며 각각의 메뉴에 대하여 서버 로직의 실행과 장고 (Django) 스타일의 HTML 템플릿을 렌더링하는데 걸리는 시간을 구하고 이를 비교 분석하였다.

챗봇 데이터에 나타난 우울 담론의 범주와 특성의 이해 (Understanding the Categories and Characteristics of Depressive Moods in Chatbot Data)

  • 진효진;정찬이;백금희;차지영;최정회;차미영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권9호
    • /
    • pp.381-390
    • /
    • 2022
  • 자연어처리 기술과 비대면 문화의 확산과 더불어 챗봇의 사용 증가세가 가파르며, 챗봇의 용도 또한 일상 대화와 소비자 응대를 넘어서 정신건강을 위한 용도로 확장하고 있다. 챗봇은 익명성이 보장된다는 점에서 사용자들이 우울감에 관해 이야기하기 적합한 서비스이다. 그러나 사용자가 작성한 문장들을 분석해 우울 담론의 유형과 특성을 파악하는 연구들은 주로 소셜 네트워크 데이터를 대상으로 했다는 한계점이 존재하며, 실제 환경에서 사용되는 챗봇과 상호작용한 데이터를 분석한 연구는 찾아보기 힘들다. 이 연구에서는 챗봇-사람의 상호작용 데이터에서 무작위로 추출한 '우울'과 관련된 대화 데이터를 토픽 모델링 방법과 텍스트마이닝 기법으로 분석하여 채팅에서의 우울 관련 담론의 특성을 파악하였다. 또한, 챗봇에서 빈번히 나타나는 '우울' 담론의 범주와 트위터 '우울' 담론의 범주의 차이점을 비교하였다. 이를 통해 챗봇 데이터의 '우울' 대화만의 특징을 파악하고, 적절한 심리지원 정보를 제공하는 챗봇 서비스를 위한 시사점과 향후 연구 방향에 대해 논의한다.

라이브 커머스에서의 소비자 반응 요인 도출 : 소비자 생성 텍스트 데이터를 기반으로 (Identifying Consumer Response Factors in Live Commerce : Based on Consumer-Generated Text Data)

  • 박재형;이한솔;강주영
    • 정보화정책
    • /
    • 제30권2호
    • /
    • pp.68-85
    • /
    • 2023
  • 라이브 커머스의 방송 데이터를 수집하여 채팅 활성화 정도를 기준으로 방송을 분류하고, 방송 내의 소비자가 생성한 텍스트 반응 분포 데이터를 분석하였다. 국내 라이브 커머스 시장에서 가장 점유율이 높은 '네이버 쇼핑라이브'의 총 2,282개의 방송 가운데 시청자의 반응이 가장 활발하게 나타난 200개 방송을 선별하였으며, 그 가운데 시청자의 반응이 급격하게 증감하는 구간이 존재하는 방송을 최종적으로 선별하였다. 라이브커머스 시청 의도 및 참여 동기에 관한 기존 문헌의 변수들을 종합하여 연구 목적에 맞는 변수 테이블을 생성하였고, 이를 방송 내의 장치 및 이벤트에 대입하였다. 이를 통해 본 연구는 기존 연구들에서 발견된 소비자 반응에 관한 변수들이 방송 내의 어떤 요소에 의해 자극되는지를 확인하였으며, 라이브 커머스에 참여하는 소비자의 심리를 데이터를 통해 실증적으로 확인하였다.

온라인 게임 봇 길드 탐지 방안 연구 (Research on online game bot guild detection method)

  • 김하랑;김휘강
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1115-1122
    • /
    • 2015
  • 불법 프로그램을 이용한 게임 내 봇은 개인에서 조직으로 확장되고 있으며, 불량조직인 작업장을 통해 온라인 게임 산업에 심각한 문제를 야기하고 있다. 게임 봇을 효율적으로 관리하고 많은 게임머니를 취득하기 위해, 게임 봇들을 온라인 게임 내 소셜 커뮤니티인 길드로 구성하여 봇 길드 활동을 하는 작업장이 존재한다. 게임 사업자들은 게임 봇 탐지 알고리즘을 이용해 봇을 탐지하고 있지만, 이러한 탐지 알고리즘은 작업장의 일부만 탐지가 가능하다. 본 논문에서는 일반 길드와 봇 길드의 특징을 추출하여 분석하고, 봇 길드로 활동하는 작업장을 탐지 할 수 있는 방법을 제안한다. 봇 길드와 일반 길드를 구분하기 위해 개인거래와 경매장 거래, 채팅 패턴을 분석하고, 분석한 결과를 중심으로 봇 길드를 탐지할 수 있었다. 본 논문에서 제시한 기법을 국내 유명 온라인 게임의 실제 데이터 샘플에 적용한 결과, 효율적으로 봇 길드를 탐지해 낼 수 있음을 확인 할 수 있었다.

긍정적 감정 유발을 위한 AI챗봇기반 일기 작성 시스템 (AI Chatbot-Based Daily Journaling System for Eliciting Positive Emotions)

  • 김준현;문미경
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.105-112
    • /
    • 2024
  • 현대 사회에서 감정 표현과 자기 성찰은 스트레스 관리와 정신 건강에 긍정적인 영향을 미치는 핵심 요소로 간주하며, 이에 따라 일기 작성의 중요성이 대두되고 있다. 그러나 기존의 일기 작성 방식은 시간과 공간적 제약으로 인해 많은 사람이 이를 피하거나 어렵게 느끼고 있다. 최근 챗봇 및 감정 분석 기술의 급격한 발전은 이러한 문제를 해결하기 위한 중요한 수단으로 주목받고 있다. 본 논문에서는 GPT-3 모델과 감정 분석 기술을 결합한 인공지능 챗봇을 소개하며, 이를 활용하여 사용자의 채팅 데이터를 기반으로 자동으로 일기를 작성하는 시스템을 개발하는 과정을 기술한다. 본 시스템을 통해 사용자들은 더 편리하고 효율적인 방식으로 일기를 작성할 수 있으며, 자신의 감정을 보다 깊이 이해하고 긍정적인 감정을 촉진하는 데 기여할 것으로 기대한다.