• Title/Summary/Keyword: 테이블 모델

Search Result 272, Processing Time 0.03 seconds

Pre-trained Language Model for Table Question and Answering (표 질의응답을 위한 언어 모델 학습 및 데이터 구축)

  • Sim, Myoseop;Jun, Changwook;Choi, Jooyoung;Kim, Hyun;Jang, Hansol;Min, Kyungkoo
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.335-339
    • /
    • 2021
  • 기계독해(MRC)는 인공지능 알고리즘이 문서를 이해하고 질문에 대한 정답을 찾는 기술이다. MRC는 사전 학습 모델을 사용하여 높은 성능을 내고 있고, 일반 텍스트문서 뿐만 아니라 문서 내의 테이블(표)에서도 정답을 찾고자 하는 연구에 활발히 적용되고 있다. 본 연구에서는 기존의 사전학습 모델을 테이블 데이터에 활용하여 질의응답을 할 수 있는 방법을 제안한다. 더불어 테이블 데이터를 효율적으로 학습하기 위한 데이터 구성 방법을 소개한다. 사전학습 모델은 BERT[1]를 사용하여 테이블 정보를 인코딩하고 Masked Entity Recovery(MER) 방식을 사용한다. 테이블 질의응답 모델 학습을 위해 한국어 위키 문서에서 표와 연관 텍스트를 추출하여 사전학습을 진행하였고, 미세 조정은 샘플링한 테이블에 대한 질문-답변 데이터 약 7만건을 구성하여 진행하였다. 결과로 KorQuAD2.0 데이터셋의 테이블 관련 질문 데이터에서 EM 69.07, F1 78.34로 기존 연구보다 우수한 성능을 보였다.

  • PDF

Evaluating Table QA with Generative Language Models (생성형 언어모델을 이용한 테이블 질의응답 평가)

  • Kyungkoo Min;Jooyoung Choi;Myoseop Sim;Haemin Jung;Minjun Park;Jungkyu Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.75-79
    • /
    • 2023
  • 문서에서 테이블은 중요한 정보들을 축약하여 모아 놓은 정보 집합체라고 할 수 있다. 이러한 테이블을 대상으로 질의응답하는 테이블 질의응답 기술이 연구되고 있으며, 이 중 언어모델을 이용한 연구가 좋은 결과를 보이고 있다. 본 연구에서는 최근 주목받고 있는 생성형 언어모델 기술을 테이블 질의응답에 적용하여 언어모델과 프롬프트의 변경에 따른 결과를 살펴보고, 단답형 정답과 생성형 결과의 특성에 적합한 평가방법으로 측정해 보았다. 자체 개발한 EXAONE 1.7B 모델의 경우 KorWiki 데이터셋에 대해 적용하여 EM 92.49, F1 94.81의 결과를 얻었으며, 이를 통해 작은 크기의 모델을 파인튜닝하여 GPT-4와 같은 초거대 모델보다 좋은 성능을 보일 수 있음을 확인하였다.

  • PDF

Method of constructing a table search dataset by reconstructing queries assigned to tables (테이블에 할당된 질의 재구성을 통한 테이블 검색 데이터셋 구축 방법)

  • Joosang Lee;Geunyeong Jeong;Juoh Sun;Seokwon Jeong;Harksoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.634-638
    • /
    • 2022
  • 테이블은 행과 열로 이루어진 데이터 집합으로, 핵심 정보를 효율적으로 저장하고 표현하기 위해 널리 사용된다. 테이블을 활용하는 다양한 연구 중에서도 테이블 검색은 다른 테이블 관련 연구의 선행 모듈로서 기능하기 때문에 특히 중요하다. 그러나 테이블 검색을 위한 한국어 데이터셋이 전무하여 이에 관한 연구를 수행하기 어렵다. 본 논문은 이러한 문제를 해결하고자 공개된 테이블 질의응답 데이터셋으로부터 테이블에 할당된 질의를 재구성하는 방법을 통해 테이블 검색 데이터셋을 구축한다. 추가로, 검증 모델을 통해 구축된 데이터셋의 유효성을 확인한다.

  • PDF

Position Tracking Control of a Moving Table Using ER Brake/Clutch (ER 브레이크 및 클러치를 이용한 이송 테이블의 위치추적제어)

  • Choi, S.B.;Lee, H.G.;Kim, S.L.;Cheong, C.C.;Han, M.S.
    • Journal of the Korean Society for Precision Engineering
    • /
    • v.15 no.11
    • /
    • pp.208-217
    • /
    • 1998
  • 본 연구에서는 ER 브레이크와 ER클러치를 피드백작동기로 사용하여 이송테이블의 위치 추적제어를 수행하였다. 이를 위해 먼저 아라빅 검(arabic gum)계통의 ER유체를 자체조성한 후 전기장에 대한 빙햄(Bingham)모델을 실험적으로 도출하였다. 빙햄모델에 근거하여 평판형의 ER브레이크와 실린더형의 ER클러치를 설계 제작하였으며, 계단입력(step input)전기장에 따른 출력토오크특성을 통하여 이들 작동기의 동적모델을 얻었다. 이들 작동기와 연계된 이송테이블시스템의 운동지배방정식을 유도한 후 위치추적제어를 위한 슬라이딩모드제어기를 설계하였다. 제어기 설계시 이송해이블의 부하질량 변화에 대한 시스템 불확실성과 마찰력을 고려하여 제어성능의 강건성을 보장하도록 하였다. 제안된 제어시스템의 제어영역(control bandwidth)을 주파수 영역에서 고찰한 후 여러 레적에 대한 위치추적제어 실험을 수행하였다.

  • PDF

Generation and Evaluation of Power Model for Mobile AMOLED Display Using RGB Color Space Partitioning Method Considering Power (전력을 고려한 RGB 색 공간 분할 기법 및 이를 활용한 AMOLED 디스플레이의 소모 전력 모델 생성 그리고 평가)

  • Baek, Dusan;Choi, Yoo-Rim;Lee, Byungjeong;Lee, Jung-Won
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.9
    • /
    • pp.335-344
    • /
    • 2018
  • The power model is needed to handle the power consumption of mobile AMOLED display at the software level. However, the existing studies to generate the power model have required the experimental environment and equipment for the power measurement activity. In addition, the combination of RGB values used for modeling was imprudent and small, so it was difficult to reflect the mutual influence between the RGB values into the model. To solve these problems, we propose an RGB color space partitioning method, which is used to prudently sample the combinations of the RGB values based on the color or the power. We also propose a process for generating a mapping table composed of . We analyzed the characteristics of the samples generated according to the proposed partitioning methods, taking into account the color and the power, and generated the mapping table for the AMOLED display. Furthermore, we confirmed the reusability of the mapping table by utilizing one mapping table multiple times in evaluating different power models. These mapping tables are provided to researchers and can be used to generate and evaluate power models without power measurement activities.

Header Text Generation based on Structural Information of Table (테이블 구조 정보를 활용한 헤더 텍스트 생성)

  • Haemin Jung;Myoseop Sim;Kyungkoo Min;Jooyoung Choi;Minjun Park;Stanley Jungkyu Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.415-418
    • /
    • 2023
  • 테이블 데이터는 일반적으로 헤더와 데이터로 구성되며, 헤더는 데이터의 구조와 내용을 이해하는데 중요한 역할을 한다. 하지만 웹 스크래핑 등을 통해 얻은 데이터와 같이 다양한 상황에서 헤더 정보가 누락될 수 있다. 수동으로 헤더를 생성하는 것은 시간이 많이 걸리고 비효율적이기 때문에, 본 논문에서는 자동으로 헤더를 생성하는 태스크를 정의하고 이를 해결하기 위한 모델을 제안한다. 이 모델은 BART를 기반으로 각 열을 구성하는 텍스트와 열 간의 관계를 분석하여 헤더 텍스트를 생성한다. 이 과정을 통해 테이블 데이터의 구성요소 간의 관계에 대해 이해하고, 테이블 데이터의 헤더를 생성하여 다양한 애플리케이션에서의 활용할 수 있다. 실험을 통해 그 성능을 평가한 결과, 테이블 구조 정보를 종합적으로 활용하는 것이 더 높은 성능을 보임을 확인하였다.

  • PDF

모바일 RFID를 활용한 Tag-Table 비즈니스 모델 분석

  • Lee, Gyeong-Jeon;Lee, Hyeon-Seok
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.11a
    • /
    • pp.417-422
    • /
    • 2007
  • 개인 휴대 단말에 전파식별(Radio Frequency Identification) 기술이 결합됨에 따라, 전파식별 기술의 활용이 기존의 유통, 물류 등 B2B의 영역에서 벗어나 B2C영역으로 확대될 것으로 예상됨에 따라, 업계에서 다양한 시도가 이루어지고 있다. 본 논문에세는 인프라가 충분하지 않은 제약 조건하에서 인프라를 공급하면서 구현 가능한 비즈니스 모델로서 서비스 공간 내에서 RFID 태그가 부착된 테이블(Tag-Table)을 이용하는 B2C 비즈니스 모델과 애플리케이션을 제시하고 분석하였다. 본 논문에서 제시하는 비즈니스가 이뤄지기 위해서는 태그 테이블이 위치할 공간 제공자의 참여 여부가 중요하므로, 공간 제공자의 비용/수익 분석을 중심으로 비지니스 모델의 유효조건을 분석하였다.

  • PDF

A Table Parametric Method for Automatic Generation of Parametric CAD Models in a Mold Base e-Catalog System (몰드베이스 전자 카탈로그 시스템의 파라메트릭 CAD 모델 자동 생성을 위한 테이블 파라메트릭 방법)

  • Mun, Du-Hwan;Kim, Heung-Ki;Jang, Kwang-Sub;Cho, Jun-Myun;Kim, Jun-Hwan;Han, Soon-Hung
    • The Journal of Society for e-Business Studies
    • /
    • v.9 no.4
    • /
    • pp.117-136
    • /
    • 2004
  • As the time-to-market gets more important for competitiveness of an enterprise in manufacturing industry, it becomes important to shorten the development cycle of a product. Reuse of existing design models and e-Catalog for components are required for faster product development. To achieve this goal, an electric catalog must provide parametric CAD models since parametric information is indispensable for configuration design. There are difficulties in building up a parametric library of all the necessary combination using a CAD system, since we have too many combinations of components for a product. For example, there are at least 80 million combinations of components on one page of paper catalog of a mold base. To solve this problem, we propose the method of table parametric for the automatic generation of parametric CAD models. Any combination of mold base can be generated by mapping between a classification system of an electric catalog and the design parameters set of the table parametric. We propose how to select parametric models and to construct the design parameters set.

  • PDF

On-line Handwritten Numeral Recognition based on Table Top Display (테이블 탑 디스플레이 기반의 온라인 필기 숫자 인식)

  • Kim, Eui-Chul;Kim, Ji-Woong;Kim, Soo-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.9-12
    • /
    • 2007
  • 테이블 탑 디스플레이는 사람에게 친숙한 상호작용의 매개체인 손을 입력장치로 이용하는 일종의 탁자형 멀티 터치스크린이라고 할 수 있다. 본 논문에서는 이러한 환경에서 손가락 제스쳐를 활용하여 필기 숫자를 인식하는 연구를 수행함으로써 테이블 탑 디스플레이에 적합한 필기 숫자 인식 기술을 개발하였고, 이로 인해 추후 진행될 연속 숫자 혹은 특수기호의 성공적인 인식 가능성을 확인하였다. 실험 과정은 테이블 탑 디스플레이의 표면을 통해 입력된 손가락 궤적을 잡음제거, 대표점 추출등의 전처리 과정을 거쳐 16-방향 체인코드로 변환하고, 변환된 체인코드의 학습 및 필기 숫자 인식에 확률 통계적 모델인 은닉 마르코프 모델을 이용하였다. 학습에는 총 300개 필기 숫자 데이터를 이용하였고, 인식 실험에 사용한 별도의 100개의 필기 숫자 데이터에 대해 97%의 정인식율을 보였다.

A Star Schema Extraction Algorithm Using Connection Topologies of ER Diagrams (ER 도형의 연결 위상구조를 이용한 스타 스키마 추출 알고리즘)

  • 신성현;김진호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.136-138
    • /
    • 2002
  • 관계형 OLAP 시스템에서는 다차원 분석에 사용될 데이터를 하나의 사실과 여러 개의 차원 테이블로 구성된 스타 스키마로 표현한다. 사실 테이블은 측정치의 속성을 포함하며, 차원 테이블들은 이러한 사실 테이블에서 중심으로 뻗어져 나온 형태로써, 측정치에 대한 정보를 제공한다. 방대한 크기의 OLTP 소스 데이타베이스로부터 사실과 차원 테이블로 구성된 스타 스키마 설계하기 위해서는 풍부한 경험과 많은 시간을 필요로 한다. 따라서 스타 스키마를 효과적으로 설계하기 위한 체계적인 설계 방법이 필요하다. 본 논문에서는 소스 데이터베이스들에 대한 개념적 모델인 ER 도형을 이용하여 여러 개의 사실 엔터티를 추출하는 알고리즘과 이를 통해 자동적으로 스타 스키마를 설계하는 알고리즘을 제시하였다. 스타 스키마가 하나의 사실 테이블에 여러 개의 차원 테이블이 M:1의 관계로 연결되었다는 성질을 활용하여, 이 방법에서는 EH 도형이 연결된 위상 구조를 이용하여 각 엔터티에 연결된 M:1 관계의 개수에 근거하여 사실과 차원을 추출하는 방법을 제시하였다. 본 논문에는 이러한 방법을 통해 데이터 웨어하우스의 스타 스키마들 자동적으로 쉽게 설계하여 소요되는 시간과 노력을 줄일 수 있도록 하였다.

  • PDF