• 제목/요약/키워드: 질의 언어

검색결과 802건 처리시간 0.026초

음질(Voice Quality)에 관한 청지각적 훈련자료개발을 위한 기초연구

  • 심현섭
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.198-199
    • /
    • 2003
  • 최근에 음성언어장애에 대한 언어치료사의 평가 및 치료 활동이 활발히 이루어지고 있으나, 음성평가 기준 및 치료 자료가 충분치 않은 것이 현실이다. 음성 평가를 실시할 때에도 각 치료실마다 음성 평가에 사용하는 장비가 달라 결과물의 해석에 다소 차이가 있으며, 또한 같은 장비를 사용함에도 불구하고 음성 자료를 수집하는 방법에 있어서 표준화된 절차 및 자료에 따라 평가를 하지 못하고 있는 실정이다. 이러한 표준화된 측정절차에 대한 요구는 개인적인 기준으로 좌우될 수 있는 주관적인 평가에서는 더욱 절실하다. 음성의 지각적 평가에서 중요한 측면 중에 하나는 음성의 질에 정확한 판단 및 이에 대한 자료공유 및 정보교환이다. 현재 음성의 질에 대한 측정평가를 위해 제일 많이 사용되고 있는 방법 중 하나가 GRBAS 방법이 간편하여 임상적으로 많이 사용하나 음성의 질에 대한 세밀한 평가를 하는 데는 한계가 있다. 따라서 본 연구에서는 음질을 평가하는데 있어서 자주 사용되는 음질 용어에 대한 우리말 용어를 통일의 필요성의 시급한 실정에 기초하여 이를 대표할 수 있는 음성샘플 자료의 구축마련을 위한 일종의 발제이다. 이러한 작업을 통해 각 음성 및 언어치료실에서 음성의 질에 대한 청지각적 평가에 공통 기준을 마련하고, 임상교육 적인 목적으로 청지각적 훈련 자료로 이용이 가능할 수 있으리라 사료된다. (중략)

  • PDF

대형 언어 모델의 한국어 Text-to-SQL 변환 능력 평가 (Evaluation of Large Language Models' Korean-Text to SQL Capability)

  • 최주영;민경구;심묘섭;정해민;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.171-176
    • /
    • 2023
  • 최근 등장한 대규모 데이터로 사전학습된 자연어 생성 모델들은 대화 능력 및 코드 생성 태스크등에서 인상적인 성능을 보여주고 있어, 본 논문에서는 대형 언어 모델 (LLM)의 한국어 질문을 SQL 쿼리 (Text-to-SQL) 변환하는 성능을 평가하고자 한다. 먼저, 영어 Text-to-SQL 벤치마크 데이터셋을 활용하여 영어 질의문을 한국어 질의문으로 번역하여 한국어 Text-to-SQL 데이터셋으로 만들었다. 대형 생성형 모델 (GPT-3 davinci, GPT-3 turbo) 의 few-shot 세팅에서 성능 평가를 진행하며, fine-tuning 없이도 대형 언어 모델들의 경쟁력있는 한국어 Text-to-SQL 변환 성능을 확인한다. 또한, 에러 분석을 수행하여 한국어 문장을 데이터베이스 쿼리문으로 변환하는 과정에서 발생하는 다양한 문제와 프롬프트 기법을 활용한 가능한 해결책을 제시한다.

  • PDF

질의 확장에 의한 데이터베이스 검색 (Retrieval of Databases Using Query Extension)

  • 박찬영;김정호;정홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.160-162
    • /
    • 2000
  • 데이터베이스에 대하여 아무런 지식이 없는 일반인도 데이터베이스를 쉽게 검색할 수 있도록 언어변수를 사용한 질의 및 질의 확장에 의한 효율적인 데이터베이스 검색 시스템을 설계한다. 언어 변수의 퍼지와 및 질의 확장을 위해 퍼지 소속함수, 개념 계층, 유사 관계 등을 적용하며, 한의원 데이터베이스를 사례로 하여 프로토타입을 구현하고 실험 및 평가를 한다.

  • PDF

TAPAS를 이용한 사전학습 언어 모델 기반의 표 질의응답 (Table Question Answering based on Pre-trained Language Model using TAPAS)

  • 조상현;김민호;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.87-90
    • /
    • 2020
  • 표 질의응답은 반-정형화된 표 데이터에서 질문에 대한 답을 찾는 문제이다. 본 연구에서는 한국어 표 질의응답을 위한 표 데이터에 적합한 TAPAS를 이용한 언어모델 사전학습 방법과 표에서 정답이 있는 셀을 예측하고 선택된 셀에서 정확한 정답의 경계를 예측하기 위한 표 질의응답 모형을 제안한다. 표 사전학습을 위해서 약 10만 개의 표 데이터를 활용했으며, 텍스트 데이터에 사전학습된 BERT 모델을 이용하여 TAPAS를 사전학습한 모델이 가장 좋은 성능을 보였다. 기계독해 모델을 적용했을 때 EM 46.8%, F1 63.8%로 텍스트 텍스트에 사전학습된 모델로 파인튜닝한 것과 비교하여 EM 6.7%, F1 12.9% 향상된 것을 보였다. 표 질의응답 모델의 경우 TAPAS를 통해 생성된 임베딩을 이용하여 행과 열의 임베딩을 추출하고 TAPAS 임베딩, 행과 열의 임베딩을 결합하여 기계독해 모델을 적용했을 때 EM 63.6%, F1 76.0%의 성능을 보였다.

  • PDF

어휘관계 정보와 질의개념연관도를 반영한 정보검색 성능 향상 기법 (Information Retrieval Based on Word Relationships and Degree of Query Concept)

  • 김준길;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.451-454
    • /
    • 2010
  • 정보검색 분야에서 어휘 불일치 문제를 해결하기 위해 질의에서의 어휘 사이의 관계를 반영하는 것은 필수적인 요구사항이 되었다. 본 논문에서는 문장-문장 번역쌍을 이용하여 어휘 번역확률을 계산하였고, 어휘관계 정보를 반영하는 번역기반 언어모델에 어휘와 질의 개념과의 연관 정도를 반영한 모델을 제안한다. 뉴스 컬렉션 집합인 TREC AP 컬렉션에 대한 비교실험을 하였다. 실험결과에서 언어모델보다 어휘 관계를 반영한 번역기반 언어모델의 성능이 향상되었고 어휘의 질의개념 연관도를 반영한 모델이 번역기반 언어모델보다 성능이 향상됨을 보였다.

클레버 한스 테스트를 통한 언어모델의 질의 이해 분석 (Analysis on Question Understanding of Language Models using Clever Hans Tests)

  • 임정우;오동석;박성진;황태선;심미단;손수현;김유진;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.36-40
    • /
    • 2021
  • 다양한 Masked Language Modeling을 통해 학습한 사전 학습 모델들은 질의응답 시스템에서 매우 높은 성능을 보여주고 있다. 이러한 강력한 성능에도 불구하고 그러한 모델들이 질의를 정확히 이해하고 정답을 예측하는 것인지, 혹은 질의에 등장하는 특정 단어와 잘 나타나는 단어들을 기반으로 정답을 예측하는 것인지에 대한 분석은 아직 충분하지 않다. 이러한 사전학습 모델의 질의 이해 능력을 밝히기 위하여, 본 연구에서는 클레버 한스 테스트를 제안한다. 클레버 한스 테스트에서는 의미적 구조적, 의도 유무 측면의 여러 질의 변형이 된 데이터 셋들이 포함되어 있다. 본 연구에서는 클레버 한스 테스트를 통하여 사전학습 모델들이 의미적으로 달라진 질의나 의도가 제거된 질의를 입력으로 받아도 성능이 크게 떨어지지 않는 것을 확인하였고 모델의 질의 이해능력 부족을 실험적으로 시사하였다.

  • PDF

이벤트 탐색을 사용하는 일정 영역 질의 응답 시스템의 구현 (A Domain-Dependent Question-Answering System)

  • 장두성;오종훈;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.414-421
    • /
    • 2001
  • 본 논문에서는 한정된 영역을 대상으로 하는 질의응답 시스템에서 사용자의 질의를 해석하고 적당한 대답을 생성하기 위해 백과사전이나 일반사전 등과 같은 지식원에서 추출된 구조화된 지식을 사용하는 과정을 기술한다. 질의응답을 위하여 지식원은 그 단락의 의미에 따라 구조화되고 각 단락은 논리형식으로 변환되었으며, 논리형식 내 각 개체들은 사전 정의문에 따라 확장되었다. 이 구조화된 지식은 입력된 자연언어 질의문에서 질의의 의도를 추출하고, 질의에 포함되어 있는 지식에 의미속성을 부착하기 위해 사용된다. 지식원의 논리형식 변환을 위해 한국어의 논리형식이 도입되었으며, 사용된 지식원은 우리말 큰사전과 계몽백과사전의 30여개 질병정의문이다.

  • PDF

결혼이주민의 언어능력이 삶의 질에 영향을 미치는 경로에 관한 연구 (A study on the path that the linguistic competence of Marriage migrants affects to the quality of life)

  • 이용규;문형란
    • 디지털융복합연구
    • /
    • 제13권3호
    • /
    • pp.37-47
    • /
    • 2015
  • 결혼이민자들을 대상으로 이들의 언어능력과 삶의 질 수준을 파악하고 언어능력이 가족관계, 사회관계의 경로를 통해 삶의 질에 미치는 영향을 규명하고자 수도권 지역의 다문화 결혼이민자를 대상으로 설문조사를 실시하였다. 그 결과를 요약하면 다음과 같다. 첫째, 결혼이주민의 가족관계와 사회관계, 삶의 질에 대한 인식이 보통 이상이었으며, 한국어능력은 보통수준으로 인식하였다. 둘째, 한국어능력이 가족관계, 사회관계를 거쳐 삶의 질에 영향을 미치는 모든 경로가 유의하였다. 셋째, 고학력, 고소득, 자발만남 결혼이민자집단이 한국어능력, 가족관계, 삶의 질에 대한 인식이 상대적으로 높았다. 넷째, 고학력 및 저학력 집단, 고소득 및 저소득 집단, 자발만남 및 중개만남 집단의 삶의 질에 언어능력이 미치는 경로는 상이하였으나 전체적으로 가족관계의 역할이 언어능력보다 크게 나타났다.

Doc2Vec 문서 임베딩을 이용한 질의문과 판례 자동 연결 방안 연구 (A Study on the Connecting Method of Query and Legal Cases Using Doc2Vec Document Embedding)

  • 강예지;강혜린;박서윤;장연지;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.76-81
    • /
    • 2020
  • 법률 전문 지식이 없는 사람들이 법률 정보 검색을 성공적으로 하기 위해서는 일반 용어를 검색하더라도 전문 용어가 사용된 법령정보가 검색되어야 한다. 하지만 현 판례 검색 시스템은 사용자 선호도 검색이 불가능하며, 일반 용어를 사용하여 검색하면 사용자가 원하는 전문 자료를 도출하는 데 어려움이 있다. 이에 본 논문에서는 일반용어가 사용된 질의문과 전문용어가 사용된 판례를 자동으로 연결해 주고자 하였다. 질의문과 연관된 판례를 자동으로 연결해 주기 위해 전문용어가 사용된 전문가 답변을 바탕으로 문서분류에 높은 성능을 보이는 Doc2Vec을 이용한다. Doc2Vec 문서 임베딩 기법을 이용하여 전문용어가 사용된 전문가 답변과 유사한 답변을 제안하여 비슷한 주제의 답변들끼리 분류하였다. 또한 전문가 답변과 유사도가 높은 판례를 제안하여 질의문에 해당하는 판례를 자동으로 연결하였다.

  • PDF

무결성 유지 기능을 지원하는 공간 데이터베이스시스템의 설계 및 구현 (A Design and Implementation of Spatial Database System Supporting Integrity maintenance Facility)

  • 이영걸;배해영
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2224-2232
    • /
    • 1998
  • 본 논문은 공간데이터와 비공간 데이터를 연계 처리하는 공간 데이터베이스 시스템에서 데이터의 의미적 무결성을 보장하는 확장된 공간 질의 처리 시스템의 구현에 대해 기술한다. 다양한 실세계의 지형 및 공간 정보를 모델링해야하는 지리정보 시스템은 공간 데이터베이스 시스템을 기반으로 구현되고 있다. 이러한 공간 데이터베이스 시스템에서 다루는 데이터는 단순 객체가 아닌 추상화된 복합 객체로 다양한 유도 데이터에 대한 의미적 무결성을 데이터베이스 시스템 내부에서 효율적으로 유지해야 하며 공간 데이터의 의미적 특성을 제약 조건의 형태로 표현할 수 있어야 한다. 본 논문에서는 공간 질의 처리기를 확장하기 위해 공간 데이터에 대한 무결성 정보를 술어 논리 형태로 표현할 수 있는 공간 제약 언어를 제안한다. 제안된 공간 제약 언어는 축약된 질의 트리 형태로 메타-데이터베이스에 저장하며 저장된 공간 제약 언어는 사용자의 질의에 대해 공간 데이터베이스의 일치성을 보장하는 정보로 사용된다.

  • PDF