Search | Korea Science

Evaluating Table QA with Generative Language Models (생성형 언어모델을 이용한 테이블 질의응답 평가)

Kyungkoo Min;Jooyoung Choi;Myoseop Sim;Haemin Jung;Minjun Park;Jungkyu Choi
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.75-79
- /
- 2023
문서에서 테이블은 중요한 정보들을 축약하여 모아 놓은 정보 집합체라고 할 수 있다. 이러한 테이블을 대상으로 질의응답하는 테이블 질의응답 기술이 연구되고 있으며, 이 중 언어모델을 이용한 연구가 좋은 결과를 보이고 있다. 본 연구에서는 최근 주목받고 있는 생성형 언어모델 기술을 테이블 질의응답에 적용하여 언어모델과 프롬프트의 변경에 따른 결과를 살펴보고, 단답형 정답과 생성형 결과의 특성에 적합한 평가방법으로 측정해 보았다. 자체 개발한 EXAONE 1.7B 모델의 경우 KorWiki 데이터셋에 대해 적용하여 EM 92.49, F1 94.81의 결과를 얻었으며, 이를 통해 작은 크기의 모델을 파인튜닝하여 GPT-4와 같은 초거대 모델보다 좋은 성능을 보일 수 있음을 확인하였다.
PDF

Information Seeking Behavior of the NAVER Users via Query Log Analysis (질의 로그 분석을 통한 네이버 이용자의 검색 형태 연구)

Lee, Joon-Ho;Park, So-Yeon;Kwon, Hyuk-Sung
- Journal of the Korean Society for information Management
- /
- v.20 no.2
- /
- pp.27-41
- /
- 2003
Query logs are online records that capture user interactions with information retrieval systems and all the search processes. Query log analysis offers ad advantage of providing reasonable and unobtrusive means of collecting search information from a large number of users. In this paper, query logs of NAVER, a major Korean Internet search service, were analyzed to investigate the information seeking behabior of NAVER users. The query logs were collected over one week from various collecions such as comprehensive search, directory search and web ducument searc. It is expected that this study could contribute to the development and implementation of more effective web search systems and services.
https://doi.org/10.3743/KOSIM.2003.20.2.027 인용 PDF

A Study of Join and Communication Cost for processing Integrated XQuery queries over Distributed Environment (분산 환경에서 통합 XQuery 질의 처리를 위한 조인과 통신비용에 대한 연구)

Choi, Seong-Il;Park, Jong-Hyun;Kang, Ji-Hoon
- Proceedings of the Korean Information Science Society Conference
- /
- 2007.06c
- /
- pp.59-63
- /
- 2007
XML은 웹 상에서 정보교환의 표준이며, 이종의 데이터를 보유하고 있는 지역 시스템들은 XML View를 이용하여 정보를 공개한다. 사용자는 XML을 위한 표준 질의어인 XQuery를 사용하여 분산된 XML View들을 대상으로 통합 XQuery질의를 생성할 수 있다. 이렇게 생성된 통합 XQuery질의는 자연스럽게 다른 지역시스템들 사이의 조인을 포함 할 수 있다. 조인은 비용이 많이 드는 연산자이므로 조인을 효율적으로 처리하는 것은 전체 질의의 성능에 큰 영향을 준다. 그러므로 조인을 효율적으로 처리하기 위한 비용을 결정하는 연구가 중요하다고 할 수 있다. SQL에서는 이와 같은 연구들이 많이 존재하며, 분산 환경에서의 조인을 효율적으로 처리하기 위해 크게 두 가지 비용을 고려한다. 그 중 하나는 지역시스템 내에서 조인을 처리하는 조인비용이며, 나머지 하나는 조인을 수행하기 위하여 다른 지역시스템으로 데이터를 전송하는 통신비용이다. 이 두 비용은 분산 조인을 처리하기 위한 중요한 요소이므로[6,7,8] 이를 측정하는 것은 통합 질의 처리를 위해서 필요한 연구라 할 수 있다. 그러나 테이블 구조의 데이터를 검색하기 위한 SQL 의 방법들을 구조적인 XML 데이터를 검색하기 위한 XQuery질의를 위해서 그대로 사용하는 것은 어려운 일이다. 본 논문에서는 분산 환경에서 통합 XQuery질의의 조인을 효율적으로 처리하기 위해 조인비용과 통신비용을 측정하는 방법을 제안한다. 본 논문의 기여는 앞서 기술한 문제점을 해결하여, XQuery 질의의 조인을 효율적으로 처리하기 위한 비용을 측정할 수 있도록 한다.
PDF

Design of Medical Image Retrieval System (의료 영상 검색 시스템의 설계 및 구현)

문형석;엄기현
- Proceedings of the Korea Multimedia Society Conference
- /
- 2002.11b
- /
- pp.315-318
- /
- 2002
대부분의 의료 영상 관리 시스템이 의료 영상의 저장, 전송 등의 기본적인 기능만 지원될 뿐 상위 응용 계층에서 내용기반 검색이 지원되지 않고 있다. 본 논문에서는 이를 위해 내용 기반 검색 기능을 지원하는 의료 영상 검색 시스템을 설계 및 구현한다. 의료 영상 검색 시스템은 질의 이미지의 내용기반 검색을 위해 색-공간, 질감, 모양 특징에 의한 유사 비교 기법을 사용하고 각각의 유사 비교 검색에 의해 생성된 결과 집합들을 통할하고 최종 결과 제시를 위해 복합 질의문 계획 생성 알고리즘을 제시한다.
PDF

청양금산금-은광상의 생성 환경

유봉철;이현구;김상중;최선규
- Proceedings of the KSEEG Conference
- /
- 2003.04a
- /
- pp.311-314
- /
- 2003
청양금산광상(군량맥)의 주변지질은 선캠브리아기의 변성퇴적암류, 중생대의 대동누층군 퇴적암류 및 소규모의 화성암과 맥암류가 분포된다. 선캠브리아기의 변성퇴적암류는 호상편마암, 각섬암질 편암, 사문암, 화강편마암, 미그마타이트질 편마암, 결정질석회암 및 석회규산염암으로 구성된다. 쥬라기 대동누층군 퇴적암류인 조계리층, 백운사층 및 성주리층은 광산의 동쪽에 북북동방향으로 분포되며 함장석각력사암, 사암, 역암, 셰일 및 이암으로 구성된다. (중략)
PDF

Filtering Method for Efficient Skyline Query Processing in Mobile P2P Network (모바일 P2P 네트워크에서 효율적인 스카이라인 질의처리를 위한 필터링 기법)

Park, Sunyong;Lim, Jongtae;Lee, SeokHee;Bok, Kyoungsoo;Yoo, Jaesoo
- Proceedings of the Korea Contents Association Conference
- /
- 2015.05a
- /
- pp.35-36
- /
- 2015
본 논문에서는 모바일 P2P 네트워크에서 스카이라인 질의 처리를 위한 새로운 필터링 기법을 제안한다. 제안하는 기법에서는 질의처리 이전에 스카이라인 처리를 통해 필터링 객체 셋을 생성하기 위해 피어 간 데이터 배포를 수행한다. 생성된 필터링 객체를 활용하여 질의에 참여하는 객체 중 불필요한 객체를 필터링한다. 사전 스카이라인 처리를 통해 효율적인 질의처리를 수행할 수 있다.
PDF

Voronoi 다이어그램을 이용한 고속 최근접 검색 기법

권동섭;최원익;박명선;이석호
- Proceedings of the Korean Information Science Society Conference
- /
- 1999.10a
- /
- pp.3-5
- /
- 1999
최근접 검색(nearest neighbor search)을 위해서 대부분의 기존 기법들은 데이터를 특정한 공간 인덱스 구조를 이용하여 인덱싱하고 이 인덱스를 이용하여 질의를 수행하는 방법을 사용하였다. 본 연구에서는 이러한 데이터 자체를 인덱싱하는 방법과는 달리 미리 최근접 질의의 결과가 되는 Vorononi 다이어그램을 생성해두고, 이를 통하여 최근접 검색을 수행하는 VGrid(Voronoi diagram-Grid) 기법을 제안한다. 이 방법은 미리 모든 데이터에 대한 Voronoi 다이어그램을 계산하고 그 결과를 격자(grid)를 이용하여 인덱싱한 다음 최근접 검색 질의가 주어지면 이 격자 인덱스를 이용하여 빠르게 결과를 찾아낸다. 이 방법을 이용하면 처음 인덱스를 생성할 때는 많은 계산 시간이 소모되지만, 일단 인덱스가 구성되고 나면 최근접 검색 질의 처리 시 디스크 접근 회수가 줄기 때문에 기존의 기법에 비해 빠르게 최근접 검색 질의를 수행할 수 있다.
PDF

A Problem Analysis of Layer-based Methods using Convex Hulls (Convex hull 을 사용하는 layer 기반 방법의 문제점 분석)

Lee, Ki-Eun;Park, Young-Ho
- Proceedings of the Korea Information Processing Society Conference
- /
- 2011.04a
- /
- pp.1240-1242
- /
- 2011
인터넷의 발달로 데이터의 양이 기하급수적으로 증가함에 따라 대용량 데이터를 효율적으로 검색하는 top k 질의 처리의 중요성이 커지고 있다. top k 는 릴레이션에서 가장 높은 (또는 가장 낮은) 스코어를 가지는 k 개의 튜플을 반환하는 방법으로, 스코어는 사용자가 정의한 스코어링 함수를 통해 계산된다. 효율적인 top k 질의 처리를 위해서는 전체 데이터 집합 중 최소한의 서브집합만 읽어서 k 개의 결과를 구할 수 있어야 한다. 이를 위해 기존 연구들은 다양한 방법의 인덱스 생성방법을 제안했다. 본 논문에서는 그 중에서 convex hull 을 사용하여 layer list 를 생성하는 기존 연구를 조사하고 문제점을 도출한다. 기존 연구 문제점 분석은 향후 연구인 스카이라인을 사용하는 top k 질의 처리 연구의 기반이 될 것으로 예상한다.
https://doi.org/10.3745/PKIPS.y2011m04a.1240 인용 PDF

A Method for Dynamic Query Creation for Multitenant Schema in SaaSpia (SaaSpia 에서 다중테넌트 지원을 위한 질의 처리 방법)

Chung, Moonyoung;Yang, KyungAh;Ku, Kyong-I;Won, Hee Sun;Hur, Sung Jin
- Proceedings of the Korea Information Processing Society Conference
- /
- 2011.11a
- /
- pp.1474-1475
- /
- 2011
본 논문에서는 다중 테넌트를 지원하기 위한 도구를 이용한 질의 생성 방법 및 질의 처리 방법, 그에 따른 페이지 자동 생성 방법을 제안한다.
https://doi.org/10.3745/PKIPS.y2011m11a.1474 인용 PDF

Implementation of Sensor Big Data Query Processing System for AI model training and inference of Power Turbine Equipment Failure Estimation (발전소 고장 예측 AI 모델 학습 및 추론을 위한 센서 빅데이터 질의 처리 시스템 구현)

Um, Jung-Ho;Yu, Chan Hee;Kim, Yuseon;Park, Kyongseok
- Proceedings of the Korea Information Processing Society Conference
- /
- 2021.11a
- /
- pp.545-547
- /
- 2021
발전시설 장비는 이상이 생기면 큰 경제적 피해를 발생시키기 때문에, 장비의 계통마다 수십만 개의 센서들이 부착되어 장비의 정상 작동 여부를 모니터링 한다. 장비의 이상 감지를 위해서, 최근 활발히 연구되고 있는 딥러닝 등의 기술을 활용한 AI 모델을 생성하여 장비의 고장을 예측한다. AI 모델을 학습하고 추론하기 위해서는 수많은 센서 중에서 AI 모델을 생성할 센서들을 선택하고, 지속적으로 모니터링 되는 값들을 비교하여 이상 감지 여부를 스트리밍 환경에서 추론할 수 있는 센서 빅데이터 질의 처리 및 스트리밍 추론 시스템이 필요하다. 본 논문에서는 AI 모델을 학습하고 스트리밍 추론할 수 있는 빅데이터 질의 처리 시스템을 설계 및 구현한다.
https://doi.org/10.3745/PKIPS.y2021m11a.545 인용 PDF

Search Result 2,127, Processing Time 0.039 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)