• Title/Summary/Keyword: 도메인 공학

Search Result 477, Processing Time 0.03 seconds

Interactions of Retriever and LLM on Chain-of-Thought Reasoning for Korean Question Answering (검색모델과 LLM의 상호작용을 활용한 사고사슬 기반의 한국어 질의응답)

  • Minjun Park;Myoseop Sim;Kyungkoo Min;Jooyoung Choi;Haemin Jung;Stanley Jungkyu Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.618-621
    • /
    • 2023
  • 최근 거대언어모델(LLM)이 기계 번역 및 기계 독해를 포함한 다양한 문제들에서 높은 성능을 보이고 있다. 특히 프롬프트 기반의 대규모 언어 모델은 사고사슬 방식으로 적절한 프롬프팅을 통해 원하는 형식의 답변을 생성할 수 있으며 자연어 추론 단계에서도 높은 정확도를 보여주고 있다. 그러나 근본적으로 LLM의 매개변수에 질문에 관련된 지식이 없거나 최신 정보로 업데이트 되지 않은 경우 추론이 어렵다. 이를 해결하기 위해, 본 연구는 검색문서와 생성모델의 상호작용을 통해 답변하는 한국어 질의응답 모델을 제안한다. 검색이 어려운 경우 생성형 모델을 통해 질문과 관련된 문장을 생성하며, 이는 다시 검색모델과 추론 과정에서 활용된다. 추가로 "판단불가"라는 프롬프팅을 통해 모델이 답변할 수 없는 경우를 스스로 판단하게 한다. 본 연구결과에서 GPT3를 활용한 사고사슬 모델이 63.4의 F1 점수를 보여주며 생성형 모델과 검색모델의 융합이 적절한 프롬프팅을 통해 오픈-도메인 질의응답에서 성능의 향상을 보여준다.

  • PDF

QA Pair Passage RAG-based LLM Korean chatbot service (QA Pair Passage RAG 기반 LLM 한국어 챗봇 서비스)

  • Joongmin Shin;Jaewwook Lee;Kyungmin Kim;Taemin Lee;Sungmin Ahn;JeongBae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.683-689
    • /
    • 2023
  • 자연어 처리 분야는 최근에 큰 발전을 보였으며, 특히 초대규모 언어 모델의 등장은 이 분야에 큰 영향을 미쳤다. GPT와 같은 모델은 다양한 NLP 작업에서 높은 성능을 보이고 있으며, 특히 챗봇 분야에서 중요하게 다루어지고 있다. 하지만, 이러한 모델에도 여러 한계와 문제점이 있으며, 그 중 하나는 모델이 기대하지 않은 결과를 생성하는 것이다. 이를 해결하기 위한 다양한 방법 중, Retrieval-Augmented Generation(RAG) 방법이 주목받았다. 이 논문에서는 지식베이스와의 통합을 통한 도메인 특화형 질의응답 시스템의 효율성 개선 방안과 벡터 데이터 베이스의 수정을 통한 챗봇 답변 수정 및 업데이트 방안을 제안한다. 본 논문의 주요 기여는 다음과 같다: 1) QA Pair Passage RAG을 활용한 새로운 RAG 시스템 제안 및 성능 향상 분석 2) 기존의 LLM 및 RAG 시스템의 성능 측정 및 한계점 제시 3) RDBMS 기반의 벡터 검색 및 업데이트를 활용한 챗봇 제어 방법론 제안

  • PDF

A Knowledge Service Using Automatic Document Sharing based on Intelligent OMDR (지능형 OMDR 기반의 자동 문서 공유 에이전트를 이용한 지식서비스)

  • Su-Kyoung Kim;Kee-Hong Ahn
    • Annual Conference of KIPS
    • /
    • 2008.11a
    • /
    • pp.747-750
    • /
    • 2008
  • 본 연구는 온톨로지, 자연어 처리, 메타데이터 등의 시맨틱 웹 기반 기술들을 이용하여 시맨틱 웹 응용을 위한 전체적인 기술 적용과 그의 활용에 목적을 두고 있다. 이를 위해 OWL을 기반으로 조직이나 기관의 지식 주제별 도메인 온톨로지와, 기존 워드넷(WordNet)이나 더브린 코어 메타데이터(Dublin Core Meta Data)와 조직에 정의된 데이터베이스의 스키마를 MDR로 구축하여 상호 연결하여 온톨로지가 갖는 지능적 추론과 규칙 서비스와 표준화된 메타데이터의 결합 방법을 제공한다. 이는 기존에 온톨로지와 메타데이터의 재활용과 연결(Alignment)에 있어 연구적으로 높은 가치가 있다. 그리고 조직의 사용자가 문서를 작성할 때 문서의 내용에 대해 자연어 처리 기술과 온톨로지의 기술을 이용해 적합한 용어나 메타데이터를 자동으로 제공하여 작성된 문서의 공유와 재사용성을 높이고, 작성된 문서를 XML 형식으로 구성되는 XML 기반 지능 문서 데이터베이스(XMB Based Intelligent Document Database)에 저장하여 유사한 문서를 작성하거나 사용할 필요가 있는 사용자에게 문서 등록과 검색 에이전트(Document Registry and Retrieval Agent)를 통해 이러한 제공하여 문서 지식의 사유화를 최소화 하고, 유사 문서의 재작성과 또는 특정 문서의 작성에 필요한 시간이나 경비를 줄이게 된다. 또한 웹상이나 PDA 같은 개인 휴대장치를 통해서도 서 등록과 검색 에이전트를 통해 문서를 검색하고 사용할 수 있게 한다면 언제 어디서나 해당 서비스를 활용하는 유비쿼터스와 시맨틱 웹의 실질적 응용을 거둘 수도 있으리라 사료된다.

Deep Learning-Based Neural Distinguisher for NIST Standard Format-Preserving Encryption (NIST 표준 형태 보존 암호에 대한 딥러닝 기반의 신경망 구별자)

  • Duk-young Kim;Hyun-Ji Kim;Kyung-Bae Jang;Se-Young Yoon;Hwa-jeong Seo
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.175-178
    • /
    • 2023
  • 차분 분석은 암호 분석기법 중 하나이며, 차분 공격을 위해 랜덤 데이터들로부터 차분 특성 (입/출력차분)을 만족하는 데이터를 구별해 내는 것을 구별자 공격이라 한다. Neural distinguisher는 구별자에 딥러닝을 적용한 것이다. 본 논문에서는 NIST 표준 형태보존암호인 FF1, FF3-1을 위한 단일 차분을 사용한 최초의 신경 구별자를 제안하였다. FF1은 차분으로 0F를 사용할 때, 숫자 및 소문자 도메인에서 차분 데이터 구별에 성공하였다 (정확도는 각각 0.85 및 0.52). FF3-1에서는 08을 사용할 때, 숫자 및 소문자 도메인에서 차분 데이터 구별에 성공하였다 (정확도는 각각 0.98 및 0.55).

Studies for Problem Solving Method on Development of General-multilingual Ontology System (범용 다국어 온톨로지 구축에서 나타난 문제점과 해결방안에 관한 연구)

  • Nam, Hyun-Ju;Kim, Do-Wan
    • The Journal of Engineering Research
    • /
    • v.8 no.1
    • /
    • pp.67-77
    • /
    • 2006
  • 본 논문의 핵심은 시맨틱 웹 환경에서 지능형 웹 서비스를 지원하기위한 온톨로지에 관계된다. 기존 온톨로지는 특정한 도메인을 위한 단일어로 구축되어 있다. 따라서 웹 상에서 정보서비스(정보검색, 정보관리, 정보서비스)를 하는데 제한적이였다. 본 논문에서 제안된 온톨로지는 다국어(영어, 한국어, 독일어)로 이루어진 범용적 목적의 온톨로지 구축 기술을 다루고 있다.

  • PDF

Trust Management Model for PACS-Grid (팍스 그리드를 위한 신뢰 관리 모델)

  • Cho, Hyun-Suk;Lee, Bong-Hwan
    • Annual Conference of KIPS
    • /
    • 2007.05a
    • /
    • pp.973-976
    • /
    • 2007
  • 본 논문에서는 인터넷 상에서 서로 신뢰할 수 없는 제3자들 사이에서 디지털 인증서를 교환하여 신뢰를 구축하는 방법인 신뢰 관리 시스템을 소개하고, KeyNote 방식의 인증서에 권한을 추가하는 방식을 팍스 그리드 도메인에 적용할 수 있는 모델을 제안하였다. 기존의 그리드 상의 보안 메커니즘을 활용하여 추가적인 오버헤드를 줄였으며, 인증서를 XML로 변환하여 그리드 시스템과의 연동 및 웹에서 사용 가능하도록 확장성도 고려하였다.

Implementation of Feature Modeling Tool using Jess System (JESS 시스템을 이용한 특성 모델링 도구 구현)

  • Ji, Eun-Mi;Jung, Hye-Sook;Kuak, Mi-Sun;Choi, Seung-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.38-43
    • /
    • 2008
  • 특성 모델(Feature Model)은 소프트웨어 제품 라인 개발 시 도메인 공학 단계에서 제품들 사이의 공통점과 차이점을 모델링하는데 널리 사용된다. 특성 구성(Feature Configuration)은 특성 모델로부터 특정 제품에 포함될 특성들을 선택한 결과이다. 특성 구성은, 특성 모델에 표현되어 있는 여러 가지 제한 조건을 만족해야 한다. 본 논문에서는 특성 모델 작성 기능과 특성 구성 정의 기능을 지원하고 특성 구성의 검증 기능을 지식 기반 시스템인 JESS를 활용하여 구현한 특성 모델링 도구를 제안한다. 본 도구는 자바 언어와의 결합성이 좋은 JESS 시스템을 이용하여 확장성이 좋으며 특성 구성에서의 오류 원인을 명확히 알려주는 장점을 가진다.

  • PDF

Embedded Software Development Process and Systematic Technical Information Management (내장형 소프트웨어 개발 프로세스와 기술자료 관리)

  • Jeong, Chang-Min;Hong, Jang-Eui;Pyun, Jae-Jeong
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2002.11a
    • /
    • pp.478-484
    • /
    • 2002
  • 국방 무기체계의 신뢰성 있는 내장형 소프트웨어를 개발하고, 이의 수명을 증대하기 위해서는 소프트웨어 개발 과정에서 공학적인 개발 방법론의 적용과 체계적인 기술 관리가 필수적으로 요구된다. 본 논문에서는 국방 분야에서의 내장형 소프트웨어를 개발에 있어서 고려되어야 할 공학적 관리 요소들을 살펴보고, 적용한 개발 방법론과 개발 프로세스 및 기술자료 관리 방안을 소개한다. 복잡도, 규모, 도메인 특성에 따라 객체 지향 방법론을 적절하게 재구성하고, 이를 토대로 문서화를 통한 기술 관리 방안을 연구 적용하였다.

  • PDF

A domain analysis and objected-oriented design of call control software in ATM transport network (ATM 전달망 호제어 소프트웨어의 도메인 분석과 객체지향 설계)

  • 김한경;구연설
    • Journal of the Korean Institute of Telematics and Electronics A
    • /
    • v.33A no.4
    • /
    • pp.47-56
    • /
    • 1996
  • For the implementation of callcontrol software, it will be shown how to divide problems into dimain and also presents methodologies to specify domains according to the object-orented analysis techniques. Domains is specified by the set of related objects as shown in call control examples. Events and conditons are able to be transformed into system invariant so that is possible to figure out the relationship between domains and those concludes that the software requirements specification can be established for the design and implementation. Relationships existing between domains can be formalized so as to verify software requirements.

  • PDF

Automatic Component Reconfiguration using Feature Configuration (특성 구성을 이용한 컴포넌트 재구성 자동화)

  • 정주미;장정아;최승훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.382-384
    • /
    • 2004
  • 소프트웨어 개발 단계 초기에 소프트웨어 제품군에 속하는 멤버들의 공통정과 차이점들을 미리 예측하고 분석하여 단위가 크고 전략적인 형태의 재사용을 가능하도록 함으로써 궁극적으로 소프트웨어 개발의 생산성을 향상시키고자 하는 것이 소프트웨어 프로덕트 라인 개발 방법론의 목적이다. 최근에는 소프트웨어 프로덕트 라인 개발에 자동 생성 프로그래밍 기법을 적용하기 위한 연구가 진행 중이다. 그런데, 어플리케이션 단위의 프로덕트 라인 개발 방법론은 단위가 너무 커서 자동 생성 기법을 효율적으로 적용하기가 힘들며, 따라서 그 초점을 컴포넌트 단위로 한정시킬 필요가 있다 본 논문에서는 도메인 공학의 주요 산물인 특성 다이어그램으로부터 특정 컴포넌트의 요구사항을 나타내는 특성 구성(Feature Configuration)을 만들고, 이를 바탕으로 컴포넌트 코드를 자동 생성하는 도구를 구현하였다. 본 논문의 컴포넌트 재구성 자동화 도구는 재사용자의 요구에 맞는 컴포넌트 소스 코드를 자동 생성함으로써 소프트웨어 프로덕트 라인 개발 생산성을 향상시킨다.

  • PDF