• 제목/요약/키워드: 모델 자동 생성

검색결과 857건 처리시간 0.128초

대화형 질의응답 말뭉치 자동 생성에 대한 연구 (A study on the Automatic Generation of Conversational QA Corpora)

  • 황선정;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-138
    • /
    • 2021
  • 최근 다양한 분야에서 자동 고객 응대 시스템을 도입하고 있으며 이에 따른 대화형 질의응답 시스템 연구의 필요성이 증가하고 있다. 본 논문에서는 새로운 도메인의 대화형 질의응답 시스템 구축에 필요한 말뭉치를 자동으로 생성하는 대화형 질의-응답 생성 시스템을 소개한다. 또한 이전 대화 내용을 고려하여 문서로부터 사용자의 다음 질문 대상이 될만한 응답 후보를 추출하는 맥락 관련 응답 추출 과제와 이에 대한 성능 평가 지표인 Sequential F1 점수를 함께 제안한다. 대화형 질의응답 말뭉치인 CoQA에 대해 응답 후보 추출 실험을 진행한 결과 기존의 응답 추출 모델보다 우리의 맥락 관련 응답 추출 모델이 Sequential F1 점수에서 31.1 높은 성능을 보였다. 또한 맥락 관련 응답 추출 모듈과 기존에 연구된 대화형 질의 생성 모듈을 결합하여 개발한 대화형 질의-응답 생성 시스템을 통해 374,260 쌍의 질의-응답으로 구성된 대화형 질의응답 말뭉치를 구축하였다.

  • PDF

연관 규칙 분석 알고리즘을 활용한 영작문 형태.통사 오류 자동 발견 (Automatic Error Detection of Morpho-syntactic Errors of English Writing Using Association Rule Analysis Algorithm)

  • 김동성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2010
  • 본 연구에서는 일련의 연구에서 수집된 영작문 오류 유형의 정제된 자료를 토대로 연관 규칙을 생성하고, 학습을 통해서 효용성이 검증된 연관 규칙을 활용해서 영작문 데이터의 형태 통사 오류를 자동으로 탐지한다. 영작문 데이터에서 형태 통사 오류를 찾아내는 작업은 많은 시간과 자원이 소요되는 작업이므로 자동화가 필수적이다. 기존의 연구들이 통계적 모델을 활용한 어휘적 오류에 치중하거나 언어 이론적 틀에 근거한 통사 처리에 집중하는 반면에, 본 연구는 데이터 마이닝을 통해서 정제된 데이터에서 연관 규칙을 생성하고 이를 검증한 후 형태 통사 오류를 감지한다. 이전 연구들에서는 이론적 틀에 맞추어진 규칙 생성이나 언어 모델 생성을 위한 대량의 코퍼스 데이터와 같은 다량의 지식 베이스 생성이 필수적인데, 본 연구는 적은 양의 정제된 데이터를 활용한다. 영작문 오류 유형의 형태 통사 연관 규칙을 생성하기 위해서 Apriori 알고리즘을 활용하였다. 알고리즘을 통해서 생성된 연관 규칙 중 잘못된 규칙이 생성될 가능성이 있으므로, 상관성 검정, 코사인 유사도와 같은 규칙 효용성의 통계적 검증을 활용해서 타당한 규칙만을 학습하였다. 이를 통해서 축적된 연관 규칙들을 영작문 오류를 자동으로 탐지하는 실험에 활용하였다.

  • PDF

시맨틱 웹 서비스를 위한 서비스 온톨로지의 자동 생성 (Automatic Generation of Service Ontology for Semantic Web Services)

  • 양진혁;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.465-468
    • /
    • 2005
  • 본 논문에서는 OWL-S 서비스 온톨로지를 자동으로 생성하는 방법에 대한 연구결과를 제공한다. 자동생성을 위하여 UML 클래스 다이어그램 및 상태차트 다이어그램을 XMI 파일들로 변환한 후 원자 서비스 및 속성들에 대한 정보와 복합 서비스 조합에 대한 정보를 각각 추출한다. 추출된 정보는 UML 상태차트 다이어그램 구성 요소들과 OWL-S 복합 서비스를 위한 구조물들 사이의 매핑 규칙들을 통하여 XSLT 응용에서 OWL-S 서비스 모델 온톨로지를 자동으로 생성시키는데 사용된다. 생성된 온톨로지의 타당성 검증을 위해서 이용 가능한 여럿의 유효성 검사를 수행하였다. 우리의 방법론은 자동적, 효과적 및 일반적일 뿐만 아니라 서비스 온톨로지 생성자인 개발자들에게 매우 친숙한 환경에서 수행된다는 장점들을 가진다.

  • PDF

마이크로 블로깅 서비스를 지원하기 위한 컨텍스트 모델 기반 자동 블로깅 시스템 (An Auto-blogging System based Context Model for Micro-blogging Service)

  • 박재민;이상용
    • 디지털융복합연구
    • /
    • 제10권4호
    • /
    • pp.341-346
    • /
    • 2012
  • 소셜 네트워크 서비스의 가장 대표적인 마이크로 블로깅 서비스를 효과적으로 제공하기 위해 사용자가 자신의 현재 상황정보를 간편하게 기록하고 그 정보를 바탕으로 다른 사람들과 네트워크를 형성하고 유지하도록 하는 것이 중요하다. 하지만 모바일 환경에서 사용자가 자신의 정보를 매번 모바일 디바이스를 통해 직접 입력하는 것은 매우 번거로운 작업이다. 본 논문에서는 획득된 사용자 컨텍스트를 이용하여 사용자의 현재 행동과 다음 목적지를 추론한 후, 자동으로 문장을 생성하여 블로깅을 해주는 컨텍스트 모델 기반 자동 블로깅 시스템을 제안한다. 컨텍스트 모델을 생성하기 위해 사용자의 행동 추론은 나이브 베이즈 분류기를 이용하고, 이동중인 사용자의 다음 목적지 추론은 시퀀스 매칭을 이용하였다. 생성된 컨텍스트 모델을 기반으로 5W1H 구조를 이용하여 상황에 적합한 문장을 생성하여 자동으로 블로깅하였다. 제안한 방법의 정확도를 평가한 결과 평균 88.73%의 정확도를 보여 자동 블로깅 서비스가 가능함을 보여주었다.

TMO 기반의 실시간 객체 모델의 코드 자동생성기법 연구 (A Study of Automatic Code Generation for TMO-based Real-time Object Model)

  • 석미희;류호동;이우진
    • 정보처리학회논문지A
    • /
    • 제19A권2호
    • /
    • pp.101-112
    • /
    • 2012
  • 최근에 분산 실시간 소프트웨어가 다양한 분야에서 중요한 역할을 담당하고 있다. 실시간 소프트웨어는 반응 시간에 대한 시간제약성을 만족하여야 함으로 TMO(Time-triggered, Message-triggered Object), CORBA/RT, RTAI 등과 같은 미들웨어를 이용하여야 한다. 하지만 이러한 실시간 미들웨어에 친숙하지 않은 프로그래머들은 실시간 소프트웨어 개발에 어려움이 있다. 이 연구에서는 이러한 미들웨어에 대한 전문지식 없이도 실시간 소프트웨어 개발이 가능하도록 TMO 기반의 자동 코드 생성 도구를 제안하고자 한다. TMO 특성을 설계 모델에 반영하기 위해, 시간제약사항을 포함하는 SpM과 SvM 메소드를 클래스 다이어그램에 추가하고 상태 머신 다이어그램의 독립 영역으로 분할하여 이들의 행위를 표현한다. TMO 기반 코드 생성기는 이러한 모델 정보를 입력받아서 TMO 클래스 코드를 생성한다. 이러한 자동생성 접근 방법은 TMO에 대한 전문지식이 없더라도 실시간 소프트웨어를 생성할 수 있어, 소프트웨어 개발에 소요되는 비용과 시간을 줄이는 장점이 있다.

학습을 통한 탐지 모델 생성 시스템 (Detection Model Generation System using Learning)

  • 김선영;오창석
    • 한국콘텐츠학회논문지
    • /
    • 제3권1호
    • /
    • pp.31-38
    • /
    • 2003
  • 본 논문에서는 탐지 모델을 자동 생성하여 인력, 시간에서의 효율성과 오탐율을 향상시키는 학습을 통한 탐지 모델 생성 시스템을 제안한다. 제안된 탐지 모델 생성 시스템은 agent 시스템과 manager 시스템으로 구성되고 agent 시스템은 탐지 모델 데이터베이스를 기반으로 센서의 역활을 수행하고 manager 시스템에서는 탐지 모델 생성과 모델 분산의 역할을 수행한다. 모델 생성은 유전적 알고리즘에 의해 기존의 정형화된 포맷의 탐지 모델을 학습시켜 모델을 생성하고 새로운 탐지 모델로 적용할 수 있다. 실험 결과에 따라 제안된 데이터 마이닝 기반의 탐지 모델 생성 시스템은 기존의 침입 탐지 시스템보다 효율적으로 침입을 탐지하였다. 구현된 시스템으로 인하여 새로운 유형의 침입 시 탐지 모델 생성과, False-Positive율의 감소를 가져와 기존 침입 탐지 시스템의 성능을 개선하여 탐지모델 생성 시스템을 제안한다.

  • PDF

비즈니스 프로세스 패밀리 모델을 이용한 비즈니스 프로세스 모델 자동 생성 도구 (An Automatic Business Process Model Generation Tool Using Business Process Family Models)

  • 홍민우;문미경;염근혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권8호
    • /
    • pp.479-492
    • /
    • 2008
  • 오늘날 소비자의 요구사항이 빠르고 다양한 형태로 변화함에 따라 기업의 자산인 비즈니스 프로세스도 이러한 변화에 민첩하게 대처할 수 있는 능력이 요구되고 있다. 이러한 요구를 만족시키기 위해서는 비즈니스 프로세스 모델의 생성 단계에서부터 발생할 수 있는 변화에 대하여 분석 및 표현이 가능한 핵심 자산이 존재해야 하며 이러한 핵심자산의 재사용을 통해 특성 변화를 만족하는 비즈니스 프로세스모델의 자동 생성이 가능해야 한다. 본 논문에서는 동일한 목적을 가지는 여러 비즈니스 프로세스 모델에 대하여 공통적인 특징을 공통성으로, 차별적인 특징을 가변성으로 분석하고 표현할 수 있는 비즈니스 프로세스 패밀리 모델을 설명한다. 그리고 비즈니스 프로세스 패밀리 모델의 공통성을 재사용하고 가변성에 대한 의사결정 정보를 반영하여 특정한 변화를 만족하는 비즈니스 프로세스 모델의 자동 생성을 지원하는 도구에 대하여 설명한다.

자동 추출 자질을 이용한 대화 속 질의 문장 유사성 분석 (Question Similarity Analysis in dialogs with Automatic Feature Extraction)

  • 오교중;이동건;임채균;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.347-351
    • /
    • 2018
  • 이 논문은 대화 시스템에서 질의를 이해하기 위해 딥 러닝 모델을 통해 추출된 자동 추출 자질을 이용하여 문장의 유사성을 분석하는 방법에 대해 기술한다. 문장 간 유사성을 분석하기 위한 자동 추출 자질로써, 문장 내 표현 순차적 정보를 반영하기 위한 RNN을 이용하여 생성한 문장 벡터와, 어순에 관계 없이 언어 모델을 학습하기 위한 CNN을 이용하여 생성한 문장 벡터를 사용한다. 이렇게 자동으로 추출된 문장 임베딩 자질은 금융서비스 대화에서 입력 문장을 분류하거나 문장 간 유사성을 분석하는데 이용된다. 유사성 분석 결과는 질의 문장과 관련된 FAQ 문장을 찾거나 답변 지식을 찾는데 활용된다.

  • PDF

OpenMP프로그램을 위한 경합디버깅 환경의 자동생성 (Automatic Generation of Race Debugging Environment for OpenMP Programs)

  • 강문혜;김영주;전용기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.601-603
    • /
    • 2002
  • 공유메모리 병렬프로그램에서 경합은 프로그램의 비결정적인 수행을 초래하므로 디버깅을 위해서 반드시 탐지되어져야 한다. 경합을 수행 중에 디버깅하기 위한 기존의 도구들은 경합탐지 엔진과 시각화 엔진으로 구성된 경합디버깅 엔진을 특정 프로그램 모델에 의존적으로 적용하여 경합디버깅 환경을 구성한다. 이러한 도구들은 프로그램 모델의 변경 시에 경합디버깅 환경이 최적의 경합 디버깅 엔진으로 구성되지 못한다는 문제점이 있다. 본 논문에서는 OpenMP 병렬프로그랭에서 각 프로그램 모델에 따라 효과성, 효율성, 확장성 등을 고려한 경합탐지 엔진과 추상성을 고려한 시각화 엔진으로 경합디버깅 환경을 자동으로 생성하는 도구를 제안한다. 이 도구는 디버깅 대상이 되는 프로그램의 모델에 최적인 경합디버깅 엔진을 적용하므로 경합탐지 목적에 부합하는 최적의 성능과 효과적인 시각화를 제공한다. 따라서, 본 도구는 디버깅 환경을 생성하기 위한 부담을 줄여서 효과적인 디버깅을 할 수 있게 한다.

  • PDF

동의어 치환을 이용한 심층 신경망 모델의 테스트 데이터 생성 (Generating Test Data for Deep Neural Network Model using Synonym Replacement)

  • 이민수;이찬근
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제28권1호
    • /
    • pp.23-28
    • /
    • 2019
  • 최근 이미지 처리 응용을 위한 심층 신경망 모델의 효과적 테스팅을 위해 해당 모델이 올바르게 예측하지 못하는 코너 케이스에 해당하는 행동을 보이는 데이터를 자동 생성하는 연구가 활발히 진행되고 있다. 본 논문은 문장 분류 심층 신경망 모델에 기반하고 있는 버그 담당자 자동 배정 시스템의 테스트를 위해 입력 데이터인 버그 리포트의 내용에서 임의의 단어를 선택해 동의어로 변형하는 테스트 데이터 생성기법을 제안한다. 그리고 제안하는 테스트 데이터 생성 기법을 사용한 경우와 기존의 차이 유발 테스트 데이터 생성 기법을 사용했을 경우를 다양한 뉴런 기반 커버리지를 중심으로 비교 평가한다.