한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
- /
- Pages.415-418
- /
- 2023
- /
- 2005-3053(pISSN)
테이블 구조 정보를 활용한 헤더 텍스트 생성
Header Text Generation based on Structural Information of Table
- 정해민 (LG AI 연구원) ;
- 심묘섭 (LG AI 연구원) ;
- 민경구 (LG AI 연구원) ;
- 최주영 (LG AI 연구원) ;
- 박민준 (LG AI 연구원) ;
- 최정규 (LG AI 연구원)
- Haemin Jung (LG AI Research) ;
- Myoseop Sim (LG AI Research) ;
- Kyungkoo Min (LG AI Research) ;
- Jooyoung Choi (LG AI Research) ;
- Minjun Park (LG AI Research) ;
- Stanley Jungkyu Choi (LG AI Research)
- 발행 : 2023.10.12
초록
테이블 데이터는 일반적으로 헤더와 데이터로 구성되며, 헤더는 데이터의 구조와 내용을 이해하는데 중요한 역할을 한다. 하지만 웹 스크래핑 등을 통해 얻은 데이터와 같이 다양한 상황에서 헤더 정보가 누락될 수 있다. 수동으로 헤더를 생성하는 것은 시간이 많이 걸리고 비효율적이기 때문에, 본 논문에서는 자동으로 헤더를 생성하는 태스크를 정의하고 이를 해결하기 위한 모델을 제안한다. 이 모델은 BART를 기반으로 각 열을 구성하는 텍스트와 열 간의 관계를 분석하여 헤더 텍스트를 생성한다. 이 과정을 통해 테이블 데이터의 구성요소 간의 관계에 대해 이해하고, 테이블 데이터의 헤더를 생성하여 다양한 애플리케이션에서의 활용할 수 있다. 실험을 통해 그 성능을 평가한 결과, 테이블 구조 정보를 종합적으로 활용하는 것이 더 높은 성능을 보임을 확인하였다.