• Title/Summary/Keyword: 텍스트 연구

Search Result 3,492, Processing Time 0.039 seconds

Similarity Determination of Conversational Utterances Using Field Dataset and Deep Learning Technology (현장 데이터셋과 딥러닝 기술을 이용한 대화 utterance 유사성 판별)

  • Kim, Juhee;Lee, Eunseo;Nam, Jeehee;Koh, Nakyeong;Bae, Sanghwan;Shim, Junho
    • Annual Conference of KIPS
    • /
    • 2022.11a
    • /
    • pp.568-570
    • /
    • 2022
  • 객체 유사도를 판별하는 기술은 정보 처리의 여러 분야에서 응용되고 있다. 본 연구에서는 현장 자연어 텍스트 데이터셋과 딥러닝 모델을 이용하여 챗봇 등에서 응용되는 데이터 유사성을 판별하고, 해당 모델의 성능을 측정해보았다.

Keyword Extraction and Visualization of Movie Reviews through Sentiment Analysis (영화 리뷰 감성 분석을 통한 키워드 추출 및 시각화)

  • Jong-Chan Park;Sung Jin Kim;Young Hyun Yoon;Jai Soon Baek
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.261-262
    • /
    • 2023
  • 본 연구에서는 감성 분석 기반의 키워드 도출형 영화 리뷰 웹사이트를 개발하였다. 사용자들은 영화에 대한 리뷰를 작성할 때, 자동으로 키워드를 추출하는 기능을 활용하여 다양하면서도 빠르게 정보를 얻을 수 있다. 사용자가 작성한 리뷰를 시스템에 입력하면, 내부적으로 ChatGPT를 활용하여 텍스트를 분석하고 키워드를 추출한다. 이를 통해 사용자는 별다른 노력 없이도 키워드를 통해 영화의 장르, 감독, 배우, 플롯 요소 등 다양한 정보를 빠르게 확인할 수 있다. 추출된 키워드는 저장되어 시각화에 활용되며, 사용자들은 리뷰에 대한 원하는 정보를 쉽게 얻을 수 있다. 개발된 키워드 도출형 영화 리뷰 웹사이트는 사용자들에게 빠르고 다양한 정보를 제공하며, 영화 관련 결정을 내리는 데에 도움을 줄 것으로 기대된다.

  • PDF

Sign Language Translation Wearable Device Using Motion Recognition (모션 인식을 이용한 수화 번역 웨어러블 기기)

  • Jun-yeong Lee;Hyeon-su Kang;Sung-jun Kim;Jun-ho Son;Dong-jun Yoo;Yang-woo Park
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.453-454
    • /
    • 2023
  • 현재 선천적인 청각장애인이나 언어 장애가 있는 사람은 다른 사람과의 대화에 많은 불편을 겪고 있다. 매장을 이용하기 어려움은 물론 언어전달 능력이 떨어지기 때문에 간단한 의사소통을 통한 서로 간의 교류 또한 불편함을 감수해야 한다. 현재는 따로 디스플레이가 내장된 장치를 이용하여 지정된 장소에서 수화를 번역해야 하는 불편함을 해당 문제 해결을 위해 본 연구에서는 딥러닝을 적용하여 수화를 인식하고 번역하여 디스플레이에 텍스트를 출력해주는 시스템을 개발하였다. AI 프레임워크 MediaPipe와 SVM 알고리즘을 라즈베리파이에 적용하여 구현하였다. 개발한 시스템은 제스처에 대한 번역 결과를 제공한다. 기존의 지정된 장소가 아닌 대화가 필요한 모든 장소에서 번역이 가능하도록 개선하여 청각장애인과 언어장애가 있는 사람들과 소통의 불편함을 줄일 수 있을 것으로 기대할 수 있다.

  • PDF

Building a multimodal task-oriented dialogue task for panic disorder counseling (공황장애 상담을 위한 멀티모달 과제 지향 대화 태스크 구축)

  • Subin Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.258-262
    • /
    • 2023
  • 과제 지향 대화 시스템은 발화 의도 및 요구사항을 파악하여 사용자가 원하는 과제를 달성한다는 점에서 유용하다. 대화 상태 추적은 과제 지향 대화 시스템의 핵심 모듈이며, 최근에는 텍스트뿐만 아니라 시각 정보까지 활용하여 대화 상태를 추적하는 멀티모달 대화 상태 추적 연구가 활발히 진행되는 중이다. 본 논문에서는 멀티모달 공황장애 상담 대화 속 내담자의 상태를 추적하는 과제를 제안하였다. ChatGPT를 통한 멀티모달 공황장애 상담 과제 지향 대화 데이터셋 구축 프레임워크와, 구축한 데이터셋의 품질을 증명하기 위한 분석도 함께 제시하였다. 사전학습 언어 모델인 GPT-2를 벤치마크 데이터셋에 대해 학습한 성능을 측정함으로써 향후 멀티모달 대화 추적 성능이 능가해야 할 베이스라인 성능을 제시하였다.

  • PDF

Lightweight Language Models based on SVD for Document-Grounded Response Generation (SVD에 기반한 모델 경량화를 통한 문서 그라운딩된 응답 생성)

  • Geom Lee;Dea-ryong Seo;Dong-Hyeon Jeon;In-ho Kang;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.638-643
    • /
    • 2023
  • 문서 기반 대화 시스템은 크게 질문으로부터 문서를 검색하는 과정과 응답 텍스트를 생성하는 과정으로 나뉜다. 이러한 대화 시스템의 응답 생성 과정에 디코더 기반 LLM을 사용하기 위해서 사전 학습된 LLM을 미세 조정한다면 많은 메모리, 연산 자원이 소모된다. 본 연구에서는 SVD에 기반한 LLM의 경량화를 시도한다. 사전 학습된 polyglot-ko 모델의 행렬을 SVD로 분해한 뒤, full-fine-tuning 해보고, LoRA를 붙여서 미세 조정 해본 뒤, 원본 모델을 미세 조정한 것과 점수를 비교하고, 정성평가를 수행하여 경량화된 모델의 응답 생성 성능을 평가한다. 문서 기반 대화를 위한 한국어 대화 데이터셋인 KoDoc2Dial에 대하여 평가한다.

  • PDF

Unraveling the relationship between the dimensions of user experience and user satisfaction in metaverse: A Mixed-methods Approach (메타버스 이용자 경험요인이 만족도에 미치는 영향: 텍스트 마이닝과 계량 분석 혼합방법론)

  • Jeong, Da Hyeon;Kim, Hee Woong;Yoon, Sang Hyeak
    • The Journal of Information Systems
    • /
    • v.32 no.3
    • /
    • pp.19-39
    • /
    • 2023
  • Purpose This study aims to identify user experience factors that can enhance both metaverse utilization and satisfaction based on the honeycomb model. For this we presented two research questions: first, what are the experience factors of metaverse users? Second, do metaverse user experience factors impact satisfaction? Design/methodology/approach To address these questions, a mixed-methodology approach is employed, including text mining techniques to analyze online reviews and quantitative econometric analysis to reveal the relationship between user experience factors and satisfaction. A total of 69,880 reviews and ratings data were collected. Findings The analysis revealed eight metaverse user experience factors: entertainment, operability, virtual reality, immersion, economic activity, visual performance, avatar, and sociality, all of which were found to have a positive impact on user satisfaction.

A Study On YouTube Fake News Detection System Using Sentence-BERT (Sentence-BERT를 활용한 YouTube 가짜뉴스 탐지 시스템 연구)

  • Beom Jung Kim;Ji Hye Huh;Hyeopgeon Lee;Young Woon Kim
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.667-668
    • /
    • 2023
  • IT 기술의 발달로 인해 뉴스를 제공하는 플랫폼들이 다양해 졌고 최근 해외 인터뷰 영상, 해외 뉴스를 Youtube Shorts형태로 제작하여 화자의 의도와는 다른 자막을 달며 가짜 뉴스가 생성되는 문제가 대두되고 있다. 이에 본 논문에서는 Sentence-BERT를 활용한 YouTube 가짜 뉴스 탐지 시스템을 제안한다. 제안하는 시스템은 Python 라이브러리를 사용해 유튜브 영상에서 음성과 영상 데이터를 분류하고 분류된 영상 데이터는 EasyOCR을 사용해 자막 데이터를 텍스트로 추출 후 Sentence-BERT를 활용해 문자 유사도를 분석한다. 분석결과 음성 데이터와 영상 자막 데이터가 일치한 경우 일치하지 않은 경우보다 약 62% 더 높은 문장 유사도를 보였다.

An Application for Sharing Travel Activities Information by Using Deep Learning Models (딥러닝 모델을 활용한 관광지 활동 정보 공유 애플리케이션 )

  • Jiho Shin;Eunhye Gwon;Byungook Ryu;Byungjeong Lee
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.319-320
    • /
    • 2023
  • 일반적인 여행 커뮤니티는 사진과 텍스트 기반의 사용자 리뷰를 바탕으로 정보 공유를 한다. 본 연구에서는 관광지에서 수행한 활동을 한 문장의 형태로 공유하는 애플리케이션을 제안한다. ChatGPT를 활용하여 활동을 산책, 사진, 음식 등 9가지 태그로 분류하여 관광지가 가지는 특징을 용이하게 파악한다. 또한, 사용자가 작성한 활동을 임베딩하고 관광지 소개 글 벡터와 유사도를 비교하여 관광지를 추천한다. 본 애플리케이션을 통해 사용자가 긴 설명이나 사진 없이 관광지가 가지는 정보를 쉽게 공유하고 관광지 추천을 하는 새로운 여행 커뮤니티를 제공할 수 있을 것으로 기대한다.

Implementation of personal information detection and masking algorithm using YOLOv5 (YOLOv5를 이용한 개인정보 탐지 및 마스킹 알고리즘 구현)

  • Su-Yeon Yoo;You-na Park;Ji-Hye Seo;Ji-Yeon Oh
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.920-921
    • /
    • 2023
  • 미디어 공유 활성화에 따라 개인정보 노출의 위험성이 증가하고 있다. 본 논문에서는 YOLOv5를 통해 학습한 모델을 바탕으로 이미지에서 개인정보가 담긴 물체를 탐지하는 연구를 진행하였다. 모델로 탐지된 객체에는 광학 인식 기술(OCR)을 적용하여 객체 내의 텍스트 속 개인정보 영역을 마스킹한다. 설계된 알고리즘은 여러 분야에 활용되어 개인정보에 대한 서비스 강화를 제공해 줄 수 있을 것으로 기대된다.

Design of an AR-based Accessibility Improvement System for the Hearing Impaired (AR기반 청각장애인 접근성 향상 시스템 설계)

  • Hyun-Jun Jeong;Sang-Hoo Park;Tae-Hong Kim;Su-Bin Jeon
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.1020-1021
    • /
    • 2023
  • 장애인의 사회활동 증대는 개인의 삶의 질 향상 및 사회의 다양성과 포용성 증진에 중요하다. 특히 청각장애인은 환경적, 신체적 장애로 인해 사회적 접근성에 제한을 받는다. 이를 해결하기 위해 AR 글래스 기반의 NEAR를 개발하였다. NEAR는 음성자막 변환 및 위험 알람 기능을 제공하여 청각장애인의 사회활동 제약을 해소한다. STT 기능은 입력 음성을 텍스트로 변환하며, MFCC 기능은 다양한 상황의 소리를 감지하여 위험 알림을 제공한다. 이 연구는 청각장애인의 사회적 참여 향상 및 사회의 포용성 증진에 기여할 것으로 기대된다.