• 제목/요약/키워드: Text Summarize

검색결과 47건 처리시간 0.018초

TextRank 알고리즘을 이용한 음악 가사 요약 기법 (Music Lyrics Summarization Method using TextRank Algorithm)

  • 손지영;신용태
    • 한국멀티미디어학회논문지
    • /
    • 제21권1호
    • /
    • pp.45-50
    • /
    • 2018
  • This research paper describes how to summarize music lyrics using the TextRank algorithm. This method can summarize music lyrics as important lyrics. Therefore, we recommend music more effectively than analyzing the number of words and recommending music.

문서 길이 정규화를 이용한 문서 요약 자동화에 관한 연구 (A Study on Text Summarize Automation Using Document Length Normalization)

  • 이재훈;김영천;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.228-230
    • /
    • 2001
  • WWW(World Wide Web)와 온라인 정보 서비스의 급속한 성장으로 인해, 보다 많은 정보가 온라인으로 이용 혹은 접근 가능해 졌다. 이런 정보홍수로 접근 가능한 정보들이 과잉되는 문제가 발생했다. 이러한 과잉 정보 현상으로 인하여 시간적 제약이 뒤따르며 이용 가능한 모든 정보를 근거로 중요한 의사 결정을 내려야 한다. 문서 요약 자동화(Text Summarize Automation)는 이 문제를 처리하는데 필수적이다. 본 논문에서는 정보 검색을 통해 획득한 문서들을 일차적으로 문서 길이 정규화를 이용하여 질의에 적합하고 신뢰도가 더욱 높은 문서 정보를 얻을 수 있음을 보인다.

  • PDF

단어 간 의미적 연관성을 고려한 어휘 체인 기반의 개선된 자동 문서요약 방법 (An Improved Automatic Text Summarization Based on Lexical Chaining Using Semantical Word Relatedness)

  • 차준석;김정인;김판구
    • 스마트미디어저널
    • /
    • 제6권1호
    • /
    • pp.22-29
    • /
    • 2017
  • 최근 스마트 디바이스의 급속한 발달과 보급으로 인하여 인터넷 웹상에서 등장하는 문서의 데이터는 하루가 다르게 증가 하고 있다. 이러한 정보의 증가로 인터넷 웹상에서는 대량의 문서가 증가하여 사용자가 해당 문서의 데이터를 이해하는데, 어려움을 겪고 있다. 그렇기 때문에 자동 문서 요약 분야에서 문서를 효율적으로 요악하기 위해 다양한 연구가 진행 되고 있다. 효율적으로 문서를 요약하기 위해 본 논문에서는 텍스트랭크 알고리즘을 이용한다. 텍스트랭크 알고리즘은 문장 또는 키워드를 그래프로 표현하며, 단어와 문장 간의 의미적 연관성을 파악하기 위해 그래프의 정점과 간선을 이용하여 문장의 중요도를 파악한다. 문장의 상위 키워드를 추출 하고 상위 키워드를 기반으로 중요 문장 추출 과정을 거친다. 중요 문장 추출 과정을 거치기 위해 단어 그룹화 과정을 거친다. 단어그룹화는 특정 가중치 척도를 이용하여 가중치 점수가 높은 문장을 선별하여 선별된 문장들을 기반으로 중요 문장을 중요 문장을 추출하여, 문서를 요약을 하게 된다. 이를 통해 기존에 연구 되었던 문서요약 방법보다 향상된 성능을 보였으며, 더욱 효율적으로 문서를 요약할 수 있음을 증명하였다.

Applications of the Text Mining Approach to Online Financial Information

  • Hansol Lee;Juyoung Kang;Sangun Park
    • Asia pacific journal of information systems
    • /
    • 제32권4호
    • /
    • pp.770-802
    • /
    • 2022
  • With the development of deep learning techniques, text mining is producing breakthrough performance improvements, promising future applications, and practical use cases across many fields. Likewise, even though several attempts have been made in the field of financial information, few cases apply the current technological trends. Recently, companies and government agencies have attempted to conduct research and apply text mining in the field of financial information. First, in this study, we investigate various works using text mining to show what studies have been conducted in the financial sector. Second, to broaden the view of financial application, we provide a description of several text mining techniques that can be used in the field of financial information and summarize various paradigms in which these technologies can be applied. Third, we also provide practical cases for applying the latest text mining techniques in the field of financial information to provide more tangible guidance for those who will use text mining techniques in finance. Lastly, we propose potential future research topics in the field of financial information and present the research methods and utilization plans. This study can motivate researchers studying financial issues to use text mining techniques to gain new insights and improve their work from the rich information hidden in text data.

문서 길이 정규화를 이용한 문서 요약 자동화 시스템 구현 (Implementation of Text Summarize Automation Using Document Length Normalization)

  • 이재훈;김영천;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.51-55
    • /
    • 2001
  • With the rapid growth of the World Wide Web and electronic information services, information is becoming available on-Line at an incredible rate. One result is the oft-decried information overload. No one has time to read everything, yet we often have to make critical decisions based on what we are able to assimilate. The technology of automatic text summarization is becoming indispensable for dealing with this problem. Text summarization is the process of distilling the most important information from a source to produce an abridged version for a particular user or task. Information retrieval(IR) is the task of searching a set of documents for some query-relevant documents. On the other hand, text summarization is considered to be the task of searching a document, a set of sentences, for some topic-relevant sentences. In this paper, we show that document information, that is more reliable and suitable for query, using document length normalization of which is gained through information retrieval . Experimental results of this system in newspaper articles show that document length normalization method superior to other methods use query itself.

  • PDF

Development of technology to improve information accessibility of information vulnerable class using crawling & clipping

  • Jeong, Seong-Bae;Kim, Kyung-Shin
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.99-107
    • /
    • 2018
  • This study started from the public interest purpose to help accessibility for the information acquisition of the vulnerable groups due to visual difficulties such as the elderly and the visually impaired. In this study, the server resources are minimized and implemented in most of the user smart phones. In addition, we implement a method to gather necessary information by collecting only pattern information by utilizing crawl & clipping without having to visit the site of the information of the various sites having the data necessary for the user, and to have it in the server. Especially, we applied the TTS(Text-To-Speech) service composed of smart phone apps and tried to develop a unified customized information collection service based on voice-based information collection method.

Generative Linguistic Steganography: A Comprehensive Review

  • Xiang, Lingyun;Wang, Rong;Yang, Zhongliang;Liu, Yuling
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.986-1005
    • /
    • 2022
  • Text steganography is one of the most imminent and promising research interests in the information security field. With the unprecedented success of the neural network and natural language processing (NLP), the last years have seen a surge of research on generative linguistic steganography (GLS). This paper provides a thorough and comprehensive review to summarize the existing key contributions, and creates a novel taxonomy for GLS according to NLP techniques and steganographic encoding algorithm, then summarizes the characteristics of generative linguistic steganographic methods properly to analyze the relationship and difference between each type of them. Meanwhile, this paper also comprehensively introduces and analyzes several evaluation metrics to evaluate the performance of GLS from diverse perspective. Finally, this paper concludes the future research work, which is more conducive to the follow-up research and innovation of researchers.

이동 단말을 위한 웹 기반 텍스트 요약 시스템의 설계 및 구현 (Design and Implementation of Web-based Text Summarization System for Mobile Device)

  • 차지은;천승만;박종태
    • 정보처리학회논문지C
    • /
    • 제16C권6호
    • /
    • pp.725-730
    • /
    • 2009
  • 최근에 스마트폰과 같은 소형 이동 단말기의 보급이 확산됨에 따라 이동 단말을 통한 인터넷 웹 접속이 크게 증가하고 있다. 하지만 이동 단말의 작은 화면은 한 번에 웹페이지의 전체 내용을 브라우징 하기에는 어려움이 있다. 본 논문에서 이러한 이동단말의 문제점을 해결하기 위한 웹 기반 텍스트 요약 시스템을 설계 및 구현하였다. 제안된 텍스트 요약 시스템의 특징은 문서의 구문적 특징을 크게 변화시키지 않고 다량의 텍스트가 단락 안에 존재하는 경우에 문서를 요약하여 텍스트 용량을 줄임으로써 웹 브라우징에 있어 데이터 전송량을 줄이고 빠른 접근과 불필요한 데이터의 출력을 최소화할 수 있다. 제안된 시스템의 특징을 구현을 통하여 확인하였다.

Is ChatGPT a "Fire of Prometheus" for Non-Native English-Speaking Researchers in Academic Writing?

  • Sung Il Hwang;Joon Seo Lim;Ro Woon Lee;Yusuke Matsui;Toshihiro Iguchi;Takao Hiraki;Hyungwoo Ahn
    • Korean Journal of Radiology
    • /
    • 제24권10호
    • /
    • pp.952-959
    • /
    • 2023
  • Large language models (LLMs) such as ChatGPT have garnered considerable interest for their potential to aid non-native English-speaking researchers. These models can function as personal, round-the-clock English tutors, akin to how Prometheus in Greek mythology bestowed fire upon humans for their advancement. LLMs can be particularly helpful for non-native researchers in writing the Introduction and Discussion sections of manuscripts, where they often encounter challenges. However, using LLMs to generate text for research manuscripts entails concerns such as hallucination, plagiarism, and privacy issues; to mitigate these risks, authors should verify the accuracy of generated content, employ text similarity detectors, and avoid inputting sensitive information into their prompts. Consequently, it may be more prudent to utilize LLMs for editing and refining text rather than generating large portions of text. Journal policies concerning the use of LLMs vary, but transparency in disclosing artificial intelligence tool usage is emphasized. This paper aims to summarize how LLMs can lower the barrier to academic writing in English, enabling researchers to concentrate on domain-specific research, provided they are used responsibly and cautiously.

멀티미디어 정보 관련 기술과 표준안에 대한 고찰 (Analytical Review of Data Formats and Technological Standards for Multimedia Information)

  • 유사라
    • 정보관리학회지
    • /
    • 제13권2호
    • /
    • pp.39-71
    • /
    • 1996
  • 도서관 환경에서 전자정보가 점차 중요한 위치를 차지하면서 정보의 성격과 그를 담아내는 정보매체의 기술적 요소들이 새롭게 조명되고 있다. 이 글에서는 디지털 도서관이 개발되고 하이퍼미디어 정보 환경의 특성을 이론적으로 정리하고, 멀티미디어 데이터의 응용에 필요한 관련 기술과 표준안들을 덱스트와 비텍스트 정보유형으로 나누어 구체적으로 살펴본다. 새로운 환경인 디지털 도서관의 도서관 실무자와 연구자 모두에게 시급히 요구되는 전문적 과정과 역할을 기술하고 있다.

  • PDF