• 제목/요약/키워드: Topic Generation

검색결과 159건 처리시간 0.029초

PC-SAN: Pretraining-Based Contextual Self-Attention Model for Topic Essay Generation

  • Lin, Fuqiang;Ma, Xingkong;Chen, Yaofeng;Zhou, Jiajun;Liu, Bo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권8호
    • /
    • pp.3168-3186
    • /
    • 2020
  • Automatic topic essay generation (TEG) is a controllable text generation task that aims to generate informative, diverse, and topic-consistent essays based on multiple topics. To make the generated essays of high quality, a reasonable method should consider both diversity and topic-consistency. Another essential issue is the intrinsic link of the topics, which contributes to making the essays closely surround the semantics of provided topics. However, it remains challenging for TEG to fill the semantic gap between source topic words and target output, and a more powerful model is needed to capture the semantics of given topics. To this end, we propose a pretraining-based contextual self-attention (PC-SAN) model that is built upon the seq2seq framework. For the encoder of our model, we employ a dynamic weight sum of layers from BERT to fully utilize the semantics of topics, which is of great help to fill the gap and improve the quality of the generated essays. In the decoding phase, we also transform the target-side contextual history information into the query layers to alleviate the lack of context in typical self-attention networks (SANs). Experimental results on large-scale paragraph-level Chinese corpora verify that our model is capable of generating diverse, topic-consistent text and essentially makes improvements as compare to strong baselines. Furthermore, extensive analysis validates the effectiveness of contextual embeddings from BERT and contextual history information in SANs.

캡스톤 디자인 수업에서 학생들의 주제 결정 패턴 탐색 (Exploring Topic Defining Patterns of Students in Interdisciplinary Capstone Design Class)

  • 변문경
    • 공학교육연구
    • /
    • 제21권1호
    • /
    • pp.14-26
    • /
    • 2018
  • The goal of this study was to explore topic defining patterns of students in interdisciplinary Capstone Design Class. Thematic analysis methodology was used to examine 85 Korean college students' lived experience of project topic generation which is for interdisciplinary capstone design class and Individual open-ended survey for constituted the data sources. Findings show four contexts of student's topic defining patterns using thematic analysis including (a) one leader's directed problem representation, (b) team common decision making after brainstorming, (c) empathy with professor proposed issue, (d) problems offered to students by corporate or research competitions. Based on research result, I could suggest instructional strategies of Capstone Design Class of teacher for helping their students' topic defining. It was necessary to minimize the opinions of the instructors at the beginning of class and minimize the number of team members. And also it provided a lot of opportunities to collaborate with companies in the topic selection process, it will help to develop the students' ability to determine the valuable topic in project.

인공지능 스피커의 세대별 온라인 리뷰 분석을 통한 사용자 경험 요인 탐색 (Exploring user experience factors through generational online review analysis of AI speakers)

  • 박정은;양동욱;김하영
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.193-205
    • /
    • 2021
  • 인공지능 스피커 시장은 꾸준히 성장하고 있지만, 실제 스피커 사용자들의 만족도는 42%에 그치고 있다. 따라서, 본 연구에서는 인공지능 스피커의 세대별 토픽 변화와 감성 변화를 통해 사용자 경험을 저해하는 요소는 무엇인지 분석해 보고자 한다. 이를 위해 아마존 에코 닷 3세대와 4세대 모델에 대한 리뷰를 수집하였다. 토픽모델링 분석 기법을 사용하여 세대별로 리뷰를 이루는 주제 및 주제의 변화를 찾아내고, 딥러닝 기반 감성 분석을 통해 토픽에 대한 사용자 감성이 세대에 따라 어떻게 변화되었는지 살펴보았다. 토픽모델링 결과, 세대별로 5개의 토픽이 도출되었다. 3세대의 경우 스피커의 일반적 속성을 나타내는 토픽은 제품에 긍정적 반응 요인으로 작용했고, 사용자 편의 기능은 부정적 반응 요인으로 작용했다. 반대로 4세대에서는 일반적 속성은 부정적으로, 사용자 편의 기능은 긍정적으로 도출되었다. 이와 같은 분석은 방법론 측면에서 어휘적 특징뿐 아니라 문장 전체의 문맥적 특징이 고려된 분석결과를 제시할 수 있다는 것에 그 의의가 있다.

태그 기반 토픽맵 생성 시스템의 설계 및 구현 (Design and Implementation of Topic Map Generation System based Tag)

  • 이시화;이만형;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.730-739
    • /
    • 2010
  • 웹2.0환경에서의 핵심적인 기술은 태깅이며, 현재 블로그와 같은 웹 문서에서부터 이미지, 동영상 등과 같은 멀티미디어 데이터에 이르기까지 폭넓게 적용되고 있다. 그러나 태깅에 사용된 태그가 정보 검색에 재사용되어 검색의 효율성을 극대화 시킬 것이라는 기대와는 달리 실제로는 태그가 가지는 근본적인 한계들로 인해 만족스럽지 못한 검색결과가 나타나고 있다. 이에 본 연구에서는 태그 클러스터링을 통한 이미지 검색에 대한 선행연구를 기반으로 의미론적 지식체계인 토픽맵 생성 시스템을 설계 및 구현하였다. 구현 결과 클러스터 내의 태그 정보들은 토픽맵에서의 토픽으로 자동 생성되었으며, 생성된 토픽맵의 토픽들 간에는 WordNet을 적용하여 의미연관관계를 부여하였다. 또한 토픽 쌍에 적합한 어커런스 정보들을 추출하여 토픽들에 부여함으로서 의미론적 지식체계인 토픽맵을 생성하였다. 이와 같이 생성된 토픽맵은 사용자의 정보검색 요구에 대한 시맨틱 내비게이션의 제공을 가능하게 할 뿐만 아니라 풍부한 정보제공이 가능하다.

데이터 마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성 (Semi-Automatic Ontology Generation about XML Documents using Data Mining Method)

  • 구미숙;황정희;류근호;홍장의
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.299-308
    • /
    • 2006
  • 최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.

토픽모델링을 활용한 Z세대의 애플리케이션 효용성에 대한 분석: 이용자의 에세이 데이터를 중심으로 (Analysis of the Utilization of Mobile Applications by Generation Z using Topic Modeling :Focusing on Users' Essay Data)

  • 박주연;정도헌
    • 산업융합연구
    • /
    • 제20권1호
    • /
    • pp.43-51
    • /
    • 2022
  • 본 연구는 이용자 중심 관점에서 Z세대의 애플리케이션 사용의 효용성을 분석하여 Z세대에 대한 이해를 돕고 Z세대를 위한 모바일 서비스 마케팅 전략 수립, 교육서비스 개발, 공학교육 등에 필요한 기초 정보를 제공하는데 목적이 있다. 이를 위해 Z세대인 대학생의 애플리케이션 사용경험에 대한 에세이를 177건 수집하였고, 토픽모델링을 활용하여 주요 토픽들을 분석하고, 이를 워드 클라우드 분석을 통해 시각화하였다. 연구 결과 주요 토픽들은 이동, 대중교통 등과 같은 '교통', 일정관리, 금융관리, 음식관리 등과 같은 '개인적 관리', 계산, 모임, 구매, 외식 등과 같은 '거래', 여행, 스터디, 문화 등과 같은 '여가활용' 과 관련된 것으로 나타났다. 그리고 시간, 생각, 사람, 생활, 버스, 정보, 확인, 결제, 카카오톡 등의 용어가 높은 빈도를 보였다. 또한, 단과대학별로 분석한 결과 토픽 간 차이가 나타났다. 본 연구는 비정형데이터인 에세이를 수집하여 애플리케이션 효용성을 토픽모델링을 통해 실증적으로 분석하였다는 점에서 의의가 있다.

DDS 검색 방식 개선을 위한 TNS 시스템 성능 분석 (Performance Analysis of TNS System for Improving DDS Discovery)

  • 윤군재;최정현;최훈
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.75-86
    • /
    • 2018
  • DDS(Data Distribution Service) 미들웨어는 DDS 네트워크 내에 있는 참여자와 종단점을 검색하기 위해 DDS 표준 검색 방식을 사용한다. DDS 표준 검색 방식은 멀티캐스트 통신 방식으로 모든 종단점을 검색하기 때문에, 네트워크가 다를 경우 검색이 불가능할 수 있고 통신에 필요 없는 종단점들의 정보를 저장하는 자원 낭비가 발생한다. TNS(Topic Name Service)는 멀티캐스트를 이용하지 않고 전위 서버, 토픽 이름 서버, 종단 서버를 이용하여 통신할 참여자에게만 필요한 종단점 정보를 전달해주기 때문에, 전술한 DDS 표준 검색 방식의 문제점을 해결할 수 있다. 그러나 TNS 구성 서버들을 경유하기 때문에 시간 지연이 발생한다. 본 논문에서는 TNS의 구성 서버들에서의 처리 지연 시간을 측정하고, 종단점 정보를 수신하는데 소요되는 시간과 수신한 종단점 수를 측정함으로써 DDS 표준 검색 방식과 TNS 방식의 성능을 비교 및 분석하였다.

소셜미디어 토픽모델링을 통한 스마트폰 마케팅 전략 수립 지원 (A Topic Modeling Approach to Marketing Strategies for Smartphone Companies)

  • 차윤정;이지혜;최지은;김희웅
    • 지식경영연구
    • /
    • 제16권4호
    • /
    • pp.69-87
    • /
    • 2015
  • Given the huge number of data produced by its users, SNS is a great source of customer insights. Since viral trends in SNS reflect customers' direct feedback, companies can draw out highly meaningful business insights when such data is effectively analyzed and managed. However, while the importance of understanding SNS big data keeps growing, the methods for analyzing atypical data such as SNS postings for business insights over product has not been well studied. This study aims to demonstrate the way to exploit topic modeling method to support marketing strategy generation and therefore leverage business process. First, we conducted topic modeling analysis for twitter data of Apple and Samsung smartphones. Then we comparatively examined the analysis results to draw meaningful market insights about each smartphone product. Finally, we draw out a strategic marketing recommendation for each smartphone brand based on the findings.

Analysis of Secondary Battery Trends Using Topic Modeling: Focusing on Solid-State Batteries

  • Chunghyun Do;Yong Jin Kim
    • Asian Journal of Innovation and Policy
    • /
    • 제12권3호
    • /
    • pp.345-362
    • /
    • 2023
  • As the widespread adoption and proliferation of electric vehicles continue, the secondary battery market is experiencing rapid growth. However, lithium-ion batteries, which constitute a majority of secondary batteries, present high risks of fire and explosion. Solid-state batteries are thus garnering attention as the next-generation batteries since they eliminate fire hazards and significantly reduce the risk of explosions. Against this background, the study aimed to analyze research trends and provide insights by examining 2,927 domestic papers related to solid-state batteries over the past decade (2013-2022). Specifically, we used topic modeling to extract major keywords associated with solid-state batteries research and to explore the network characteristics across major topics. The changes in research on solid-state batteries were analyzed in-depth by calculating topic dominance by year. The findings provide an overview of the emerging trends in domestic solid-state battery research, and might serve as a valuable reference in shaping long-term research directions.

문서 주제에 따른 문장 생성을 위한 LSTM 기반 언어 학습 모델 (LSTM based Language Model for Topic-focused Sentence Generation)

  • 김다해;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.17-20
    • /
    • 2016
  • 딥러닝 기법이 발달함에 따라 텍스트에 내재된 의미 및 구문을 어떠한 벡터 공간 상에 표현하기 위한 언어 모델이 활발히 연구되어 왔다. 이를 통해 자연어 처리를 기반으로 하는 감성 분석 및 문서 분류, 기계 번역 등의 분야가 진보되었다. 그러나 대부분의 언어 모델들은 텍스트에 나타나는 단어들의 일반적인 패턴을 학습하는 것을 기반으로 하기 때문에, 문서 요약이나 스토리텔링, 의역된 문장 판별 등과 같이 보다 고도화된 자연어의 이해를 필요로 하는 연구들의 경우 주어진 텍스트의 주제 및 의미를 고려하기에 한계점이 있다. 이와 같은 한계점을 고려하기 위하여, 본 연구에서는 기존의 LSTM 모델을 변형하여 문서 주제와 해당 주제에서 단어가 가지는 문맥적인 의미를 단어 벡터 표현에 반영할 수 있는 새로운 언어 학습 모델을 제안하고, 본 제안 모델이 문서의 주제를 고려하여 문장을 자동으로 생성할 수 있음을 보이고자 한다.

  • PDF