• 제목/요약/키워드: 질의 생성

검색결과 2,124건 처리시간 0.027초

한국어 대화 모델 학습을 위한 디노이징 응답 생성 (Denoising Response Generation for Learning Korean Conversational Model)

  • 김태형;노윤석;박성배;박세영
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

무선 XML 스트리밍을 위한 시뮬레이션 시스템의 설계 및 구현 (Design and Implementation of a Simulation System for Wireless XML Streaming)

  • 박정현;김충수;정연돈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.154-156
    • /
    • 2005
  • XML은 데이터 교환을 위한 표준으로서 데이터를 효과적으로 조직하고 표현 할 수 있다. 본 논문에서는 XML 데이터를 무선방송하기위한 스트림을 생성하는 시뮬레이션 시스템을 설계하고 구현한다. 구현한 시스템은 서버 모듈과 클라이언트 모듈로 구성되는데 서버 모듈은 XML 데이터에 대하여 스트림을 생성하는 역할을 하고 클라이언트 모듈은 생성된 스트링에 대해서 질의를 수행하고 생성된 스트림으로부터 XML 데이터를 복구하는 역할을 한다. 질의 수행에 대한 결과로 결과 XML 데이터가 출력되고 성능 평가요소로 질의를 수행하는 동안 걸린 수행시간을 측정할 수 있다.

  • PDF

대형 언어 모델의 한국어 Text-to-SQL 변환 능력 평가 (Evaluation of Large Language Models' Korean-Text to SQL Capability)

  • 최주영;민경구;심묘섭;정해민;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.171-176
    • /
    • 2023
  • 최근 등장한 대규모 데이터로 사전학습된 자연어 생성 모델들은 대화 능력 및 코드 생성 태스크등에서 인상적인 성능을 보여주고 있어, 본 논문에서는 대형 언어 모델 (LLM)의 한국어 질문을 SQL 쿼리 (Text-to-SQL) 변환하는 성능을 평가하고자 한다. 먼저, 영어 Text-to-SQL 벤치마크 데이터셋을 활용하여 영어 질의문을 한국어 질의문으로 번역하여 한국어 Text-to-SQL 데이터셋으로 만들었다. 대형 생성형 모델 (GPT-3 davinci, GPT-3 turbo) 의 few-shot 세팅에서 성능 평가를 진행하며, fine-tuning 없이도 대형 언어 모델들의 경쟁력있는 한국어 Text-to-SQL 변환 성능을 확인한다. 또한, 에러 분석을 수행하여 한국어 문장을 데이터베이스 쿼리문으로 변환하는 과정에서 발생하는 다양한 문제와 프롬프트 기법을 활용한 가능한 해결책을 제시한다.

  • PDF

CNF의 수평적 분리를 이용한 공간 질의 최적화 기법의 제안 (The Design of Spatial Query Optimization Technique using Horizontal Splitting of CNF)

  • 이환재;정보흥;조숙경;이순조;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.229-231
    • /
    • 2001
  • 공간 데이터베이스 시스템에서의 질의처리 과정 중 질의 재작성 과정에 의해 다중 블록 질의가 단일 블록으로 변환되면 공간 서술자와 비공간 서술자가 OR와 AND에 의해 연결되어있는 복잡한 CNF가 생성된다. CNF 내의 공간 서술자는 공간연산의 정제단계의 수행 비용이 비공간 연산에 비해 상당히 많이 들기 때문에 비공간 서술자와는 다른 최적화 기법이 필요하다. 본 논문에서는 공간 서술자가 포함된 복잡한 CNF를 수평적으로 분리하여 질의를 재작성하고 수행순서를 재조정하는 기법을 제안한다. 제안하는 기법은 원시 CNF를 수행 비용이 상대적으로 적은 전처리 단계의 CNF와 이에 비해 수행비용이 많이 드는 후처리 단계의 CNF로 분리하고 질의를 재작성 한 후 비용 모델에 의거해서 실행 트리를 최적화 한다. 본 논문에서 제시하는 기법은 질의 최적화 단계에서 공간연산의 단계별 실행특성을 감안한 효율적인 실행 계획 생성이 가능하다는 장점이 있다.

  • PDF

적응적인 시맨틱 정보 추출을 위한 대화형 사용자 질의 인터페이스 개발 (Developing an Interactive User Interface System for Adaptive Semantic Information Retrieval)

  • 조영현;손진현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.481-483
    • /
    • 2004
  • 기존의 웹 서비스는 않은 애플리케이션으로 개발되었고, 다양한 분야에서 잘 활용되어 왔다. 하지만, HTML을 기반 한 기존의 웹은 더 이상의 기능적 성장은 어렵게 되어 기존 웹 서비스의 성장에도 제악을 가져왔다. 이런 문제점을 극복하기 위해 시맨틱 웹이 대두되었다. 시맨틱 웹은 자원의 공유, 통합, 자동생성의 특징을 가진 기존 웹의 확장이다. 최근 기존의 웹 서비스는 시맨틱 웹의 이런 특성들을 받아들이려는 시도가 있었다. DAML-S가 대표적인 예이다. 본 논문은 기존 웹 서비스 검색처럼 일반 사용자도 편리하게 시맨틱 웹 서비스를 검색할 수 있도록 대화형 사용자 질의 인터페이스를 제시한다. 또, 사용자가 선택한 질의가 시맨틱 질의어(ROQL)로 자동 변환할 수 있는 시맨틱 질의어 자동 생성기 모듈을 제시한다.

  • PDF

패턴 매칭과 통계 모델링을 이용한 대화 인터페이스 시스템의 구현 (Implementation of a Dialogue Interface System Using Pattern Matching and Statistical Modeling)

  • 김학수
    • 컴퓨터교육학회논문지
    • /
    • 제10권3호
    • /
    • pp.67-73
    • /
    • 2007
  • 본 논문에서는 대화 인터페이스 시스템을 구성하는 필수 요소들을 알아보고, 각각에 대한 실용적인 구현 방법을 제안한다. 구현 시스템은 담화 관리자, 의도 분석기, 개체명 인식기, SQL 질의어 생성기, 응답 생성기로 구성된다. 구현 과정에서 비교적 영역 의존성이 낮은 의도 분석 모듈은 통계 기반의 최대 엔트로피 모델을 이용한다. 그리고 높은 영역 이식성을 필요로 하는 개체명 인식기, SQL 질의어 생성기, 응답 생성기는 단순 패턴 매칭 방법을 이용한다. 일정 관리 영역에서의 실험에서 구현 시스템은 88.1%의 의도 분석 정확률과 83.4%의 SQL 질의어 생성 성공률을 보였다.

  • PDF

검색모델과 LLM의 상호작용을 활용한 사고사슬 기반의 한국어 질의응답 (Interactions of Retriever and LLM on Chain-of-Thought Reasoning for Korean Question Answering)

  • 박민준;심묘섭;민경구;최주영;정해민;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.618-621
    • /
    • 2023
  • 최근 거대언어모델(LLM)이 기계 번역 및 기계 독해를 포함한 다양한 문제들에서 높은 성능을 보이고 있다. 특히 프롬프트 기반의 대규모 언어 모델은 사고사슬 방식으로 적절한 프롬프팅을 통해 원하는 형식의 답변을 생성할 수 있으며 자연어 추론 단계에서도 높은 정확도를 보여주고 있다. 그러나 근본적으로 LLM의 매개변수에 질문에 관련된 지식이 없거나 최신 정보로 업데이트 되지 않은 경우 추론이 어렵다. 이를 해결하기 위해, 본 연구는 검색문서와 생성모델의 상호작용을 통해 답변하는 한국어 질의응답 모델을 제안한다. 검색이 어려운 경우 생성형 모델을 통해 질문과 관련된 문장을 생성하며, 이는 다시 검색모델과 추론 과정에서 활용된다. 추가로 "판단불가"라는 프롬프팅을 통해 모델이 답변할 수 없는 경우를 스스로 판단하게 한다. 본 연구결과에서 GPT3를 활용한 사고사슬 모델이 63.4의 F1 점수를 보여주며 생성형 모델과 검색모델의 융합이 적절한 프롬프팅을 통해 오픈-도메인 질의응답에서 성능의 향상을 보여준다.

  • PDF

거대 언어 모델의 내재된 지식을 활용한 질의 응답 방법 (Question Answering that leverage the inherent knowledge of large language models)

  • 심묘섭;민경구;박민준;최주영;정해민;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.31-35
    • /
    • 2023
  • 최근에는 질의응답(Question Answering, QA) 분야에서 거대 언어 모델(Large Language Models, LLMs)의 파라미터에 내재된 지식을 활용하는 방식이 활발히 연구되고 있다. Open Domain QA(ODQA) 분야에서는 기존에 정보 검색기(retriever)-독해기(reader) 파이프라인이 주로 사용되었으나, 최근에는 거대 언어 모델이 독해 뿐만 아니라 정보 검색기의 역할까지 대신하고 있다. 본 논문에서는 거대 언어 모델의 내재된 지식을 사용해서 질의 응답에 활용하는 방법을 제안한다. 질문에 대해 답변을 하기 전에 질문과 관련된 구절을 생성하고, 이를 바탕으로 질문에 대한 답변을 생성하는 방식이다. 이 방법은 Closed-Book QA 분야에서 기존 프롬프팅 방법 대비 우수한 성능을 보여주며, 이를 통해 대형 언어 모델에 내재된 지식을 활용하여 질의 응답 능력을 향상시킬 수 있음을 입증한다.

  • PDF

관계 데이터로부터 재귀적 구조의 XML 값을 생성하는 SQL 함수 (An SQL Function for the Construction of Recursively Structured XML values from the Relational Data)

  • 박성철;박영철
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.309-313
    • /
    • 2009
  • SQL:2003 표준은 SQL 질의의 결과를 XML 값으로 생성하는 SQL/XML 출판 함수들을 지원하지만 재귀적 질의의 결과를 재귀적 구조의 XML 값으로 생성하는 SQL/XML 출판 함수를 제공하지 않는다. 그러므로, 주어진 조건에 의해 직간접으로 연결된 관계 투플들에 대하여, 적절한 SQL/XML 출판 함수들을 이용하여 그들의 내용과 그들 간의 연결 관계를 XML 값으로 생성하려면, 중첩 SQL 질의를 작성하여야 한다. 그러나 그 질의의 작성은 그 투플들의 연결 깊이를 알 수 있지만 그 깊이가 깊은 경우에는 쉽지 않으며, 그 연결 깊이를 알 수 없는 경우에는 불가능하다. 본 논문은 그 문제를 해결하기 위하여, 재귀적 질의의 결과를 재귀적 구조의 XML 값으로 생성하는 새로운 SQL 함수 XMLNEST를 제안한다.

관계 데이터를 XML로 변환하는 단순한 방법 (A Simple Method for Publishing Relational Data in XML)

  • 이동진;신병주;진민
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.608-612
    • /
    • 2003
  • XML 데이터 사용이 급속도로 증가함에 따라 대용량의 XML 데이터를 저장 관리하는 기술이 요구되고 있다. XML과 관계 데이터베이스의 구조적 불일치로 인해, 관계 데이터베이스에 저장된 XML 데이터에 대한 질의를 처리하여 XML 문서를 생성하기 위해서는 별도의 처리과정이 요구된다. 본 논문은 패스테이블에 표현된 스키마 구조 정보를 이용하여 XQuery 질의에서 요구하는 데이터를 위한 SQL 문을 만들고, 질의 결과 XML에 대한 구조 정보를 추출하여 SQL에 의해 출력된 결과를 XML 문서로 생성해 주는 단순한 방법을 제안한다.

  • PDF