• 제목/요약/키워드: 테이블 모델

검색결과 272건 처리시간 0.025초

표 질의응답을 위한 언어 모델 학습 및 데이터 구축 (Pre-trained Language Model for Table Question and Answering)

  • 심묘섭;전창욱;최주영;김현;장한솔;민경구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.335-339
    • /
    • 2021
  • 기계독해(MRC)는 인공지능 알고리즘이 문서를 이해하고 질문에 대한 정답을 찾는 기술이다. MRC는 사전 학습 모델을 사용하여 높은 성능을 내고 있고, 일반 텍스트문서 뿐만 아니라 문서 내의 테이블(표)에서도 정답을 찾고자 하는 연구에 활발히 적용되고 있다. 본 연구에서는 기존의 사전학습 모델을 테이블 데이터에 활용하여 질의응답을 할 수 있는 방법을 제안한다. 더불어 테이블 데이터를 효율적으로 학습하기 위한 데이터 구성 방법을 소개한다. 사전학습 모델은 BERT[1]를 사용하여 테이블 정보를 인코딩하고 Masked Entity Recovery(MER) 방식을 사용한다. 테이블 질의응답 모델 학습을 위해 한국어 위키 문서에서 표와 연관 텍스트를 추출하여 사전학습을 진행하였고, 미세 조정은 샘플링한 테이블에 대한 질문-답변 데이터 약 7만건을 구성하여 진행하였다. 결과로 KorQuAD2.0 데이터셋의 테이블 관련 질문 데이터에서 EM 69.07, F1 78.34로 기존 연구보다 우수한 성능을 보였다.

  • PDF

생성형 언어모델을 이용한 테이블 질의응답 평가 (Evaluating Table QA with Generative Language Models)

  • 민경구;최주영;심묘섭;정해민;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.75-79
    • /
    • 2023
  • 문서에서 테이블은 중요한 정보들을 축약하여 모아 놓은 정보 집합체라고 할 수 있다. 이러한 테이블을 대상으로 질의응답하는 테이블 질의응답 기술이 연구되고 있으며, 이 중 언어모델을 이용한 연구가 좋은 결과를 보이고 있다. 본 연구에서는 최근 주목받고 있는 생성형 언어모델 기술을 테이블 질의응답에 적용하여 언어모델과 프롬프트의 변경에 따른 결과를 살펴보고, 단답형 정답과 생성형 결과의 특성에 적합한 평가방법으로 측정해 보았다. 자체 개발한 EXAONE 1.7B 모델의 경우 KorWiki 데이터셋에 대해 적용하여 EM 92.49, F1 94.81의 결과를 얻었으며, 이를 통해 작은 크기의 모델을 파인튜닝하여 GPT-4와 같은 초거대 모델보다 좋은 성능을 보일 수 있음을 확인하였다.

  • PDF

테이블에 할당된 질의 재구성을 통한 테이블 검색 데이터셋 구축 방법 (Method of constructing a table search dataset by reconstructing queries assigned to tables)

  • 이주상;정근영;선주오;정석원;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.634-638
    • /
    • 2022
  • 테이블은 행과 열로 이루어진 데이터 집합으로, 핵심 정보를 효율적으로 저장하고 표현하기 위해 널리 사용된다. 테이블을 활용하는 다양한 연구 중에서도 테이블 검색은 다른 테이블 관련 연구의 선행 모듈로서 기능하기 때문에 특히 중요하다. 그러나 테이블 검색을 위한 한국어 데이터셋이 전무하여 이에 관한 연구를 수행하기 어렵다. 본 논문은 이러한 문제를 해결하고자 공개된 테이블 질의응답 데이터셋으로부터 테이블에 할당된 질의를 재구성하는 방법을 통해 테이블 검색 데이터셋을 구축한다. 추가로, 검증 모델을 통해 구축된 데이터셋의 유효성을 확인한다.

  • PDF

ER 브레이크 및 클러치를 이용한 이송 테이블의 위치추적제어 (Position Tracking Control of a Moving Table Using ER Brake/Clutch)

  • 최승복;이호근;김승래;정재천;한문식
    • 한국정밀공학회지
    • /
    • 제15권11호
    • /
    • pp.208-217
    • /
    • 1998
  • 본 연구에서는 ER 브레이크와 ER클러치를 피드백작동기로 사용하여 이송테이블의 위치 추적제어를 수행하였다. 이를 위해 먼저 아라빅 검(arabic gum)계통의 ER유체를 자체조성한 후 전기장에 대한 빙햄(Bingham)모델을 실험적으로 도출하였다. 빙햄모델에 근거하여 평판형의 ER브레이크와 실린더형의 ER클러치를 설계 제작하였으며, 계단입력(step input)전기장에 따른 출력토오크특성을 통하여 이들 작동기의 동적모델을 얻었다. 이들 작동기와 연계된 이송테이블시스템의 운동지배방정식을 유도한 후 위치추적제어를 위한 슬라이딩모드제어기를 설계하였다. 제어기 설계시 이송해이블의 부하질량 변화에 대한 시스템 불확실성과 마찰력을 고려하여 제어성능의 강건성을 보장하도록 하였다. 제안된 제어시스템의 제어영역(control bandwidth)을 주파수 영역에서 고찰한 후 여러 레적에 대한 위치추적제어 실험을 수행하였다.

  • PDF

전력을 고려한 RGB 색 공간 분할 기법 및 이를 활용한 AMOLED 디스플레이의 소모 전력 모델 생성 그리고 평가 (Generation and Evaluation of Power Model for Mobile AMOLED Display Using RGB Color Space Partitioning Method Considering Power)

  • 백두산;최유림;이병정;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권9호
    • /
    • pp.335-344
    • /
    • 2018
  • 모바일 AMOLED 디스플레이의 소모 전력을 소프트웨어 수준에서 참조하기 위해서는 소모 전력에 대한 모델이 필요하다. 하지만, 전력 모델을 얻기 위한 기존 연구들은 전력 측정 활동을 위한 실험 환경 및 장비가 필수적으로 요구되었다. 또한, 모델링을 위해 사용된 RGB 값의 조합이 무분별하고, 매우 적어 RGB 값들 간의 상호 영향을 모델에 반영하기 어려웠다. 본 연구는 이러한 문제점을 해결하기 위해 RGB 색 공간분할 기법 및 으로 구성된 맵핑 테이블 제공 방법을 제안한다. 제안된 분할 기법을 통해 색과 함께 전력을 고려하며 RGB 조합들을 샘플링하고, 제안된 맵핑 테이블 제공 방법에 따라 샘플링된 RGB 조합들로 구성된 맵핑 테이블을 생성한다. 실험을 통해 색 차원과 전력 차원에서의 분할 기법에 따른 샘플들의 특징을 분석하였고, 이를 바탕으로 AMOLED 디스플레이에 대한 맵핑 테이블을 생성하였다. 더불어, 맵핑 테이블을 활용하여 각기 다른 4개의 전력 모델을 평가함으로써 맵핑 테이블의 재사용 가능성을 확인하였다. 이러한 맵핑 테이블은 연구자들에게 제공되어 전력 측정 활동 없이도 전력 모델을 생성하는데 활용될 수 있다.

테이블 구조 정보를 활용한 헤더 텍스트 생성 (Header Text Generation based on Structural Information of Table)

  • 정해민;심묘섭;민경구;최주영;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.415-418
    • /
    • 2023
  • 테이블 데이터는 일반적으로 헤더와 데이터로 구성되며, 헤더는 데이터의 구조와 내용을 이해하는데 중요한 역할을 한다. 하지만 웹 스크래핑 등을 통해 얻은 데이터와 같이 다양한 상황에서 헤더 정보가 누락될 수 있다. 수동으로 헤더를 생성하는 것은 시간이 많이 걸리고 비효율적이기 때문에, 본 논문에서는 자동으로 헤더를 생성하는 태스크를 정의하고 이를 해결하기 위한 모델을 제안한다. 이 모델은 BART를 기반으로 각 열을 구성하는 텍스트와 열 간의 관계를 분석하여 헤더 텍스트를 생성한다. 이 과정을 통해 테이블 데이터의 구성요소 간의 관계에 대해 이해하고, 테이블 데이터의 헤더를 생성하여 다양한 애플리케이션에서의 활용할 수 있다. 실험을 통해 그 성능을 평가한 결과, 테이블 구조 정보를 종합적으로 활용하는 것이 더 높은 성능을 보임을 확인하였다.

  • PDF

모바일 RFID를 활용한 Tag-Table 비즈니스 모델 분석

  • 이경전;이현석
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 추계학술대회
    • /
    • pp.417-422
    • /
    • 2007
  • 개인 휴대 단말에 전파식별(Radio Frequency Identification) 기술이 결합됨에 따라, 전파식별 기술의 활용이 기존의 유통, 물류 등 B2B의 영역에서 벗어나 B2C영역으로 확대될 것으로 예상됨에 따라, 업계에서 다양한 시도가 이루어지고 있다. 본 논문에세는 인프라가 충분하지 않은 제약 조건하에서 인프라를 공급하면서 구현 가능한 비즈니스 모델로서 서비스 공간 내에서 RFID 태그가 부착된 테이블(Tag-Table)을 이용하는 B2C 비즈니스 모델과 애플리케이션을 제시하고 분석하였다. 본 논문에서 제시하는 비즈니스가 이뤄지기 위해서는 태그 테이블이 위치할 공간 제공자의 참여 여부가 중요하므로, 공간 제공자의 비용/수익 분석을 중심으로 비지니스 모델의 유효조건을 분석하였다.

  • PDF

몰드베이스 전자 카탈로그 시스템의 파라메트릭 CAD 모델 자동 생성을 위한 테이블 파라메트릭 방법 (A Table Parametric Method for Automatic Generation of Parametric CAD Models in a Mold Base e-Catalog System)

  • 문두환;김흥기;장광섭;조준면;김준환;한순흥
    • 한국전자거래학회지
    • /
    • 제9권4호
    • /
    • pp.117-136
    • /
    • 2004
  • 치열한 경쟁 환경 하에서 빠른 시간 안에 고객이 원하는 제품을 생산해야 하는 즉, 시장 출시까지의 시간 (time to market) 단축의 필요성이 더욱 높아짐에 따라, 제품 설계 시에 협업(collaborative) 설계와 편집(configuration) 설계의 중요성이 커지고 있다. 이를 위해서 효율적인 부품 검색 방법이 필요하고, 그 방법의 하나로써 전자 카달로그 (e-Catalog)가 많이 사용된다. 편집설계를 통한 설계 모델 재사용을 위해서는 파라메트릭 정보가 필수적이다. 따라서 전자 카달로그는 파라메트릭 (parametric) 정보가 포함된 CAD 모델 라이브러리를 제공해야 한다. 그러나 제품의 구성에 따라 무수히 많은 조합이 존재하기 때문에, 기존의 방법으로는 파라메트릭 CAD 모델 라이브러리를 구축하기가 어렵다. 예를 들어, 몰드베이스 종이 카달로그의 한 페이지에는 8000만개 이상의 조합이 존재한다. 이와 같은 문제를 해결하기 위해서, 본 논문에서는 파라메트릭 CAD 모델 자동 생성을 위한 테이블 파라메트릭 (table parametric) 방법을 제안하고, 테이블 파라메트릭 모델을 선정하는 방법과 설계 파라메트릭 세트를 구성하는 방법에 대해서 설명한다. 테이블 파라메트릭 방법을 적용하게 되면, 전자 카달로그 시스템의 분류체계와 테이블 파라메트릭 모델의 설계 파라메터 세트 (design parameters set) 와의 매핑을 통해, 모든 조합의 몰드베이스 CAD 모델을 자동으로 생성할 수 있다.

  • PDF

테이블 탑 디스플레이 기반의 온라인 필기 숫자 인식 (On-line Handwritten Numeral Recognition based on Table Top Display)

  • 김의철;김지웅;김수형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.9-12
    • /
    • 2007
  • 테이블 탑 디스플레이는 사람에게 친숙한 상호작용의 매개체인 손을 입력장치로 이용하는 일종의 탁자형 멀티 터치스크린이라고 할 수 있다. 본 논문에서는 이러한 환경에서 손가락 제스쳐를 활용하여 필기 숫자를 인식하는 연구를 수행함으로써 테이블 탑 디스플레이에 적합한 필기 숫자 인식 기술을 개발하였고, 이로 인해 추후 진행될 연속 숫자 혹은 특수기호의 성공적인 인식 가능성을 확인하였다. 실험 과정은 테이블 탑 디스플레이의 표면을 통해 입력된 손가락 궤적을 잡음제거, 대표점 추출등의 전처리 과정을 거쳐 16-방향 체인코드로 변환하고, 변환된 체인코드의 학습 및 필기 숫자 인식에 확률 통계적 모델인 은닉 마르코프 모델을 이용하였다. 학습에는 총 300개 필기 숫자 데이터를 이용하였고, 인식 실험에 사용한 별도의 100개의 필기 숫자 데이터에 대해 97%의 정인식율을 보였다.

ER 도형의 연결 위상구조를 이용한 스타 스키마 추출 알고리즘 (A Star Schema Extraction Algorithm Using Connection Topologies of ER Diagrams)

  • 신성현;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.136-138
    • /
    • 2002
  • 관계형 OLAP 시스템에서는 다차원 분석에 사용될 데이터를 하나의 사실과 여러 개의 차원 테이블로 구성된 스타 스키마로 표현한다. 사실 테이블은 측정치의 속성을 포함하며, 차원 테이블들은 이러한 사실 테이블에서 중심으로 뻗어져 나온 형태로써, 측정치에 대한 정보를 제공한다. 방대한 크기의 OLTP 소스 데이타베이스로부터 사실과 차원 테이블로 구성된 스타 스키마 설계하기 위해서는 풍부한 경험과 많은 시간을 필요로 한다. 따라서 스타 스키마를 효과적으로 설계하기 위한 체계적인 설계 방법이 필요하다. 본 논문에서는 소스 데이터베이스들에 대한 개념적 모델인 ER 도형을 이용하여 여러 개의 사실 엔터티를 추출하는 알고리즘과 이를 통해 자동적으로 스타 스키마를 설계하는 알고리즘을 제시하였다. 스타 스키마가 하나의 사실 테이블에 여러 개의 차원 테이블이 M:1의 관계로 연결되었다는 성질을 활용하여, 이 방법에서는 EH 도형이 연결된 위상 구조를 이용하여 각 엔터티에 연결된 M:1 관계의 개수에 근거하여 사실과 차원을 추출하는 방법을 제시하였다. 본 논문에는 이러한 방법을 통해 데이터 웨어하우스의 스타 스키마들 자동적으로 쉽게 설계하여 소요되는 시간과 노력을 줄일 수 있도록 하였다.

  • PDF