• 제목/요약/키워드: text generation

검색결과 356건 처리시간 0.028초

테이블 구조 정보를 활용한 헤더 텍스트 생성 (Header Text Generation based on Structural Information of Table)

  • 정해민;심묘섭;민경구;최주영;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.415-418
    • /
    • 2023
  • 테이블 데이터는 일반적으로 헤더와 데이터로 구성되며, 헤더는 데이터의 구조와 내용을 이해하는데 중요한 역할을 한다. 하지만 웹 스크래핑 등을 통해 얻은 데이터와 같이 다양한 상황에서 헤더 정보가 누락될 수 있다. 수동으로 헤더를 생성하는 것은 시간이 많이 걸리고 비효율적이기 때문에, 본 논문에서는 자동으로 헤더를 생성하는 태스크를 정의하고 이를 해결하기 위한 모델을 제안한다. 이 모델은 BART를 기반으로 각 열을 구성하는 텍스트와 열 간의 관계를 분석하여 헤더 텍스트를 생성한다. 이 과정을 통해 테이블 데이터의 구성요소 간의 관계에 대해 이해하고, 테이블 데이터의 헤더를 생성하여 다양한 애플리케이션에서의 활용할 수 있다. 실험을 통해 그 성능을 평가한 결과, 테이블 구조 정보를 종합적으로 활용하는 것이 더 높은 성능을 보임을 확인하였다.

  • PDF

A Development for Web -based Name-plate Production System by using Image Processing

  • Kim, Gibom;Youn, Cho-Jin
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.60.2-60
    • /
    • 2001
  • In this paper, manufacturing system and Internet are combined and NC milling machine engraves image and text on nameplate. Image and text are input through Internet. And NC tool path is obtained by thinning algorithm and NC part program is generated. Thinning algorithm detects center lines from image and text by using connectivity and tool path is obtained along the center line. Actually experiments are performed and thinning algorithm and G-code generation module are verified.

  • PDF

딥러닝 알고리즘을 이용한 문서의 인코딩 및 언어 판별 (Encoding and language detection of text document using Deep learning algorithm)

  • 김선범;배준우;박희진
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권5호
    • /
    • pp.124-130
    • /
    • 2017
  • 문자 인코딩은 문자나 기호를 컴퓨터로 표현하기 위해 사용되는 방법이며 문자 인코딩 판별 소프트웨어들이 존재한다. 기존의 널리 쓰이는 인코딩 판별 소프트웨어인"uchardet"의 경우 변조되지 않은 일반 문서의 인코딩 판별 정확도는 91.39% 이지만 언어 판별 정확도는 32.09%에 불과하다. 또한 문서가 치환 암호에 의해 암호화 된 경우 인코딩 판별 정확도는 3.55%, 언어 판별 정확도는 0.06%로 매우 낮은 정확도를 보였다. 따라서 본 논문에서는 Deep learning 알고리즘인 LSTM(Long Short-Term Memory)을 이용한 문서의 인코딩 및 언어 판별 방법을 제안하며, 기존의 인코딩 판별 소프트웨어"uchardet"보다 뛰어난 결과를 보였다. 제안하는 방법을 이용한 일반 문서의 인코딩 판별 정확도는 99.89%이며, 언어 판별 정확도는 99.92%이다. 또한 문서가 치환 암호에 의해 암호화된 경우에는 제안하는 방법의 인코딩 판별 정확도는 99.26%이며, 언어 판별 정확도는 99.77%로 매우 뛰어나다.

자동차 멀티미디어 시스템에서의 사진과 음악을 이용한 음악스토리 비디오 자동생성 기술 (Automatic Music-Story Video Generation Using Music Files and Photos in Automobile Multimedia System)

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제9권5호
    • /
    • pp.80-86
    • /
    • 2010
  • 본 논문에서는 차량 내의 멀티미디어 시스템에 장착되는 엔터테인먼트 기능 중의 하나인 음악스토리 자동생성 기술을 소개한다. 음악스토리 비디오 자동생성 기술은 개인이 소지하고 있는 휴대폰을 차량 내의 멀티미디어 시스템과 연결하여, 휴대폰 안에 저장된 음악과 사진의 결합을 통해 음악비디오를 자동으로 생성하는 멀티미디어 요소기술로서, 사용자에게 분위기에 맞게 음악을 들으면서 생성된 음악스토리 비디오를 즐기는 기능을 제공한다. 음악스토리 비디오 자동생성 기술에 대한 성능은 음악분류, 사진분류, 핵심단어 검출 등의 정확도와 생성된 음악스토리 비디오를 시청한 사용자의 MOS 결과를 통해 측정되었다.

에지 및 컬러 양자화를 이용한 모바일 폰 카메라 기반장면 텍스트 검출 (Mobile Phone Camera Based Scene Text Detection Using Edge and Color Quantization)

  • 박종천;이근왕
    • 한국산학기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.847-852
    • /
    • 2010
  • 자연 영상 내에 포함된 텍스트는 영상의 다양하고 중요한 특징을 갖는다. 그러므로 텍스트를 검출하고 추출하여 인식하는 것이 중요한 연구대상으로 연구되고 있다. 최근 모바일 폰 카메라를 기반으로 다양한 분야에서 많은 응용 기술이 연구 개발되고 있다. 본 논문은 에지 및 연결요소를 이용한 장면 텍스트 검출 방법을 제안한다. 그레이스케일 영상으로부터 에지 성분 검출과 지역적 표준편차를 이용하여 텍스트 영역의 경계선을 검출하고, RGB 컬러공간의 유클리디안 거리를 기준으로 연결요소를 검출한다. 검출된 에지 및 연결요소를 레이블링하고 각각 영역의 외곽사각형을 구한다. 텍스트의 휴리스틱 이용하여 후보 텍스트를 추출한다. 후보 텍스트 영역을 병합하여 하나의 후보 텍스트 영역을 생성하고, 후보 텍스트의 지역적 인접성과 구조적 유사성으로 후보 텍스트를 검증함으로서 최종적인 텍스트 영역을 검출하였다. 실험결과 에지 및 컬러 연결요소 특징을 상호 보완함으로서 텍스트 영역의 검출률을 향상시켰다.

An Efficient Machine Learning-based Text Summarization in the Malayalam Language

  • P Haroon, Rosna;Gafur M, Abdul;Nisha U, Barakkath
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권6호
    • /
    • pp.1778-1799
    • /
    • 2022
  • Automatic text summarization is a procedure that packs enormous content into a more limited book that incorporates significant data. Malayalam is one of the toughest languages utilized in certain areas of India, most normally in Kerala and in Lakshadweep. Natural language processing in the Malayalam language is relatively low due to the complexity of the language as well as the scarcity of available resources. In this paper, a way is proposed to deal with the text summarization process in Malayalam documents by training a model based on the Support Vector Machine classification algorithm. Different features of the text are taken into account for training the machine so that the system can output the most important data from the input text. The classifier can classify the most important, important, average, and least significant sentences into separate classes and based on this, the machine will be able to create a summary of the input document. The user can select a compression ratio so that the system will output that much fraction of the summary. The model performance is measured by using different genres of Malayalam documents as well as documents from the same domain. The model is evaluated by considering content evaluation measures precision, recall, F score, and relative utility. Obtained precision and recall value shows that the model is trustable and found to be more relevant compared to the other summarizers.

한글 텍스트가 내장된 디지털 워터마크 생성 알고리즘 (Digital Watermark Generation Algorithm Embedding Hangul Text)

  • 조대제;김현기
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.485-490
    • /
    • 2003
  • 현재 알려진 워터마킹 방법들은 주로 PN-수열과 같은 잡음 특성을 가진 이진 코드를 워터마크로 사용하고 있는데, 이것은 생성 과정에서 일정한 길이의 이진 코드가 주기적으로 반복되는 단점이 있다. 그러나 혼돈 수열(chaotic sequence)은 기존의 PN-수열을 대체할 수 있는 새로운 개념의 수열로 여러 가지 장점을 가지고 있어서 워터마크로 사용하기에 적합하다. 본 논문에서는 우리 실정에 적합할 뿐 아니라, 의미를 바로 알 수 있는 한글 텍스트를 혼돈수열로 변환하여 워터마크로 사용한다. 즉. 한글로 이루어진 저작권 정보론 워터마크로 만들어 영상에 내장하고, 내장된 워터마크를 추출하여 다시 한글로 변환하여 원 저작권자가 누구인지를 알 수 있도록 한다. 한글 텍스트를 워터마크로 사용하는 경우, 내장할 수 있는 텍스트의 길이는 한계가 있다. 그래서 본 논문에서는 한글 텍스트를 단일 실수로 함축하는 방법과 이것을 다시 복원하여 원래의 문장으로 재생하는 알고리즘을 사용하여 한글 텍스트의 길이가 길어지더라도 워터마크로 사용할 수 있도록 하였다.

Involvement of nitric oxide-induced NADPH oxidase in adventitious root growth and antioxidant defense in Panax ginseng

  • Tewari, Rajesh Kumar;Kim, Soohyun;Hahn, Eun-Joo;Paek, Kee-Yoeup
    • Plant Biotechnology Reports
    • /
    • 제2권2호
    • /
    • pp.113-122
    • /
    • 2008
  • Nitric oxide (NO) affects the growth and development of plants and also affects plant responses to various stresses. Because NO induces root differentiation, we examined whether or not it is involved in increased ROS generation. Treatments with sodium nitroprusside (SNP), an NO donor, 2-phenyl-4,4,5,5-tetramethylimidazoline-1-oxyl-3-oxide (PTIO), a specific NO scavenger, and $N{\omega}-nitro-{\text\tiny{L}}-arginine$ methyl ester hydrochloride (${\text\tiny{L}}-NAME$), an NO synthase (NOS) inhibitor, revealed that NO is involved in the adventitious root growth of mountain ginseng. Supply of an NO donor, SNP, activates NADPH oxidase activity, resulting in increased generation of $O_2{^{{\cdot}-}}$, which subsequently induces growth of adventitious roots. Moreover, treatment with diphenyliodonium chloride (DPI), an NADPH oxidase inhibitor, individually or with SNP, inhibited root growth, NADPH oxidase activity, and $O_2{^{{\cdot}-}}$ anion generation. Supply of the NO donor, SNP, did not induce any notable isoforms of enzymes; it did, however, increase the activity of pre-existing bands of NADPH oxidase, superoxide dismutase, catalase, peroxidase, ascorbate peroxidase, and glutathione reductase. Enhanced activity of antioxidant enzymes induced by SNP supply seems to be responsible for a low level of $H_2O_2$ in the adventitious roots of mountain ginseng. It was therefore concluded that NO-induced generation of $O_2{^{{\cdot}-}}$ by NADPH oxidase seems to have a role in adventitious root growth of mountain ginseng. The possible mechanism of NO involvement in $O_2{^{{\cdot}-}}$ generation through NADPH oxidase and subsequent root growth is discussed.

온라인 커뮤니티에 드러난 MZ세대의 감성과 여론조사 간 상관관계에 관한 연구 (A Study on the Relationship between the Emotions of the MZ Generation Revealed in Online Communities and Public Opinion Surveys)

  • 최한별;김수림;양희동
    • 한국IT서비스학회지
    • /
    • 제22권3호
    • /
    • pp.101-118
    • /
    • 2023
  • The 'MZ generation' is accustomed to expressing their thoughts and opinions online. As a result, the role of social media in understanding the opinions and public sentiment of the MZ generation has become increasingly important. In particular, the role of social media in understanding the opinions of young people in political contexts such as policies and elections is becoming more significant. Traditionally, in such political situations, various institutions conduct opinion surveys to grasp the opinions of the people. However, existing opinion surveys have many errors and limitations in understanding the specific opinions of the entire population since they are conducted on arbitrary individuals through survey techniques. Online communities are representative social media that share the opinions of the public on specific issues such as politics, economics, and culture. Therefore, online communities are widely used as a means to supplement the limitations of traditional opinion polls. In particular, the MZ generation is familiar with online platforms, and their political support has significant influence on election results and policy decisions. With this regard, this study analyzed the relationship between the sentiment reflected in online community text data by age group on major candidates and public opinion survey support rates during the Korean presidential election for those in their 20s. The analysis showed that negative sentiments reflected in online communities by the MZ generation have a negative correlation with public opinion survey support rates. This study contributes to theory and practice by revealing a significant association between social media and public opinion polls.