• Title/Summary/Keyword: 지식 모델

Search Result 1,915, Processing Time 0.03 seconds

Question Answering that leverage the inherent knowledge of large language models (거대 언어 모델의 내재된 지식을 활용한 질의 응답 방법)

  • Myoseop Sim;Kyungkoo Min;Minjun Park;Jooyoung Choi;Haemin Jung;Stanley Jungkyu Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.31-35
    • /
    • 2023
  • 최근에는 질의응답(Question Answering, QA) 분야에서 거대 언어 모델(Large Language Models, LLMs)의 파라미터에 내재된 지식을 활용하는 방식이 활발히 연구되고 있다. Open Domain QA(ODQA) 분야에서는 기존에 정보 검색기(retriever)-독해기(reader) 파이프라인이 주로 사용되었으나, 최근에는 거대 언어 모델이 독해 뿐만 아니라 정보 검색기의 역할까지 대신하고 있다. 본 논문에서는 거대 언어 모델의 내재된 지식을 사용해서 질의 응답에 활용하는 방법을 제안한다. 질문에 대해 답변을 하기 전에 질문과 관련된 구절을 생성하고, 이를 바탕으로 질문에 대한 답변을 생성하는 방식이다. 이 방법은 Closed-Book QA 분야에서 기존 프롬프팅 방법 대비 우수한 성능을 보여주며, 이를 통해 대형 언어 모델에 내재된 지식을 활용하여 질의 응답 능력을 향상시킬 수 있음을 입증한다.

  • PDF

A Evaluation on Robustness of Knowledge Distillation-based Federated Learning (지식 증류 기반 연합학습의 강건성 평가)

  • Yun-Gi Cho;Woo-Rim Han;Mi-Seon Yu;Su-bin Yun;Yun-Heung Paek
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.666-669
    • /
    • 2024
  • 연합학습은 원본 데이터를 공유하지 않고 모델을 학습할 수 있는 각광받는 프라이버시를 위한 학습방법론이다. 이를 위해 참여자의 데이터를 수집하는 대신, 데이터를 인공지능 모델 학습의 요소들(가중치, 기울기 등)로 변환한 뒤, 이를 공유한다. 이러한 강점에 더해 기존 연합학습을 개선하는 방법론들이 추가적으로 연구되고 있다. 기존 연합학습은 모델 가중치를 평균내는 것으로 참여자 간에 동일한 모델 구조를 강요하기 때문에, 참여자 별로 자신의 환경에 알맞은 모델 구조를 사용하기 어렵다. 이를 해결하기 위해 지식 증류 기반의 연합학습 방법(Knowledge Distillation-based Federated Learning)으로 서로 다른 모델 구조를 가질 수 있도록(Model Heterogenousity) 하는 방법이 제시되고 있다. 연합학습은 여러 참여자가 연합하기 때문에 일부 악의적인 참여자로 인한 모델 포이즈닝 공격에 취약하다. 수많은 연구들이 기존 가중치를 기반으로한 연합학습에서의 위협을 연구하였지만, 지식 증류 기반의 연합학습에서는 이러한 위협에 대한 조사가 부족하다. 본 연구에서는 최초로 지식 증류 기반의 연합학습에서의 모델 성능 하락 공격에 대한 위협을 실체화하고자 한다. 이를 위해 우리는 GMA(Gaussian-based Model Poisoning Attack)과 SMA(Sign-Flip based Model Poisoning Attack)을 제안한다. 결과적으로 우리가 제안한 공격 방법은 실험에서 최신 학습 기법에 대해 평균적으로 모델 정확도를 83.43%에서 무작위 추론에 가깝게 떨어뜨리는 것으로 공격 성능을 입증하였다. 우리는 지식 증류 기반의 연합학습의 강건성을 평가하기 위해, 새로운 공격 방법을 제안하였고, 이를통해 현재 지식 증류 기반의 연합학습이 악의적인 공격자에 의한 모델 성능 하락 공격에 취약한 것을 보였다. 우리는 방대한 실험을 통해 제안하는 방법의 성능을 입증하고, 결과적으로 강건성을 높이기 위한 많은 방어 연구가 필요함을 시사한다.

Customer Model Analysis for UCC Knowledge Sharing Service : A Case (UCC 지식 동영상 공유 서비스의 고객 모델 분석 사례)

  • Yoon, Eun-Jung;Lee, Kyoung-Jun
    • Journal of Intelligence and Information Systems
    • /
    • v.15 no.1
    • /
    • pp.15-30
    • /
    • 2009
  • As knowledge is now being distributed and shared through the Internet not only in the form of text but also in that of video, UCC (User Created Content) knowledge video sharing services have emerged on the Internet such as Instructables.com. This paper deals with a UCC knowledge video service in real world and reports the case of analyzing its customer model. The knowledge video sharing service can be considered as both a kind of discontinuous innovation, which requires knowledge provider's technical ability of creating and editing UCC video, and a value network, which matches UCC providers and consumers therefore brings network effect, we first adopt the Chasm theory as the base of the customer model and refine the customer model referencing the Technographics, which is also an Internet-refinement of the Chasm model. Finally, non-customer analysis of Blue Ocean strategy is applied for exploring potential customers of the service.

  • PDF

A Study on the development of a leveling model for Knowledge Management in Construction Firms (건설기업의 지식경영 수준 평가모델개발에 관한 연구)

  • Park Jae-Hyun;Baik Jong-Keon;Kim Jae-Joon
    • Korean Journal of Construction Engineering and Management
    • /
    • v.3 no.4 s.12
    • /
    • pp.104-113
    • /
    • 2002
  • Knowledge Management(KM), represented as a way to sustain or gain competitive edge in domestic construction companies since late 1990s economic fluctuation, whose priority is to transform individual tacit knowledge into explicit organizational one. Also, accompanied by academic researches, they come to turn their interests on KM leveling and its results. However, they went too far to KM results without commenting what their KM capabilities are and where they should lead. Thus, this research work suggests a leveling model for KM, especially construction company, whose role is to diagnose which parts they should be encouraged or how to strengthen their present capabilities.

A Hybrid Architecture for Flexible Reasoning (유연한 추론을 위한 하이브리드 구조)

  • 안홍섭;노희섭;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.3-5
    • /
    • 1998
  • 본 연구팀에서는 기존의 기호주의 전문가 시스템의 경우 지식표현 체계가 의미구조를 반영하지 못함으로써 발생하는 경직성문제를 해결하기 위해 CSN(Connectionist Semantic Network) 모델을 제안하였다. 그러나 CSN모델은 상위개념간의 관계를 표현하기 위해 단순한 전향 신경망을 사용함으로써 상위개념간의 일반적이고 구조화된 지식표현 및 추론에 어려움이 있었다. CSN 모델의 이런 문제점을 위해 본 논문에서는 상위개념간의 일반적이고 구조화된 지식표현과 추론이 용이한 기호주의 표현 체계와 이 표현 체계 안에 효과적으로 의미구조를 반영할 수 있는 연결주의 학습 모델인 CSN을 결합한 하이브리드 구조를 제안하고, 실험을 통하여 제안된 하이브리드 구조의 타당성을 보인다.

  • PDF

Extended Ontology Model based on DBMS (DBMS 기반의 온톨로지 확장 모델)

  • Lee, Mi-Kyoung;Kim, Pyung;Jung, Han-Min;Sung, Won-Kyung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.284-288
    • /
    • 2006
  • 본 논문은 시맨틱 웹 기술이 융합된 지식기반 정보유통 플랫폼(OntoFrame-K$^{(R)}$)의 추론 서비스 시스템 (OntoThink-K$^{(R)}$)에서 이용되는 Persistent Model인 DBMS기반의 온톨로지 확장 모델에 대해 설명하고자 한다. OntoFrame-K$^{(R)}$는 대용량의 지식 데이터를 다루기 때문에 기존에 개발된 온톨로지 추론 엔진을 이용할 경우 많은 한계점을 가지게 된다. 따라서 우리는 대용량의 지식 데이터를 안정적으로 처리할 수 있으며 추론의 신뢰성과 정합성을 가지는 온톨로지 확장 모델을 설계, 구현하였다. 본 모듈은 OWL과 인스턴스 데이터를 트리플 형태로 변환하여 입력 받은 후, 온톨로지 스키마 규칙과 사용자 정의 규칙을 이용한 정방향 추론 방법으로 추론 서비스에서 필요한 지식데이터들을 생성하는 역할을 한다. 본 모델은 DBMS를 이용하여 대용량의 지식 데이터를 저장할 수 있으며, 추론 규칙에 따른 정방향 추론을 통해 지식 모델을 확장하기 때문에 데이터의 정합성이 보장된다.

  • PDF

Knowledge-Grounded Dialogue Generation Using Prompts Combined with Expertise and Dialog Policy Prediction (전문 지식 및 대화 정책 예측이 결합된 프롬프트를 활용한 지식 기반 대화 생성)

  • Eojin Joo;Chae-Gyun Lim;DoKyung Lee;JunYoung Youn;Joo-Won Sung;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.409-414
    • /
    • 2023
  • 최근 지식 기반 대화 생성에 많은 연구자가 초점을 맞추고 있다. 특히, 특정 도메인에서의 작업 지향형 대화 시스템을 구축하는 것은 다양한 도전 과제가 있으며, 이 중 하나는 거대 언어 모델이 입력과 관련된 지식을 활용하여 응답을 생성하는 데 있다. 하지만 현재 거대 언어 모델은 작업 지향형 대화에서 단순히 정보를 열거하는 방식으로 응답을 생성하는 경향이 있다. 이 논문에서는 전문 지식과 대화 정책 예측 모델을 결합한 프롬프트를 제시하고 작업 지향형 대화에서 사용자의 최근 입력에 대한 정보 제공 및 일상 대화를 지원하는 가능성을 탐구한다. 이러한 새로운 접근법은 모델 파인튜닝에 비해 비용 측면에서 효율적이며, 향후 대화 생성 분야에서 발전 가능성을 제시한다.

  • PDF

What is the Potential of Animal Models to Inform Occupational Therapy Theories and Interventions From the Perspective of Neuroscience? (신경과학적 관점으로 본 작업치료에서 동물 모델의 필요성)

  • Park, Ji-Hyuk;Ahmad, S. Omar
    • Therapeutic Science for Rehabilitation
    • /
    • v.1 no.1
    • /
    • pp.39-56
    • /
    • 2012
  • Introduction : Animal studies cannot be applied directly to Occupational Therapy(OT) intervention protocol. However, animal models still provide essential evidences and knowledge to improve OT practice and to develop OT theories as well as human studies do. The purpose of this scholarly paper is to explore the potential of animal models to inform OT theory and practice particularly as it relates to neuroscience. Body : The animal models provide related knowledge for a better understanding of the mechanism of diseases and related neural networks. Based on this knowledge, researchers can test their hypothesis of neural disease. In addition, accumulated animal studies contribute to introduce the new approaches to human diseases and to improve the effectiveness of treatment. Conclusions : Animal models of neurological disease are critical and have the potential to improve OT practice and theory in many ways. Therefore, OT researchers need to pay more attention to animal models in addition human studies.

TWO MODELS FOR KNOWLEDGE DIFFUSION (지식확산에 관한 실증분석 모델)

  • Won-Zoe, Shin;Hoon, Choi
    • Proceedings of the Korea Society of Information Technology Applications Conference
    • /
    • 2002.11a
    • /
    • pp.490-501
    • /
    • 2002
  • 기업의 생산성향상과 이익률에 영향을 줄 수 있는 지식이 경제 전반에 확산되어 나가는 과정은 한 나라의 경제발전속도에 영향을 미치는 중요한 요인이다. 기업 측면에서는 도입하려는 기술이 도입 후에 그 기업의 이익을 높여 줄 수 있다면 도입하지 않을 이유가 없다. 하지만 미래 수요의 불확실성이나 기술발전 방향의 불확실성 등으로 해서 기업으로서는 도입 후의 이익을 정확히 사전적으로 측정하기는 어렵다. 본 논문에서는 학계에서 일반적으로 사용되고 있는 두 가지 지식확산 모델을 설명하고자 한다. 그 하나는 하나의 새로운 기술이나 상품이 시간이 흐름에 따라 어떻게 전체 사용 가능자(population)에게 확산되는 지를 보여주는 1) Epidemic Diffusion Model (흔히 5자형 - Sigmoid - 모델이라고도 한다. )과 어떤 도입자가 어느 시점에서 대상이 된 새로운 기술을 도입할 것인지 아닌지를 결정하는 모델로서 2) Probit Diffusion Model (프로빗 모델)을 중심으로 한다 그리고 이러한 지식확산과정과 속도에 영향을 줄 수 있는 기업 내부적 요인으로서 도입하고자 하는 기업의 누적된 경험이 중요하다는 것과 기업 외부적 요인으로서 네트웍 효과와 같은 요인들을 설명하였다.

  • PDF

TWO MODELS FOR KNOWLEDGE DIFFUSION (지식확산에 관한 실증분석 모델)

  • Shin, Won-Zoe;Park, Hoon
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2002.11a
    • /
    • pp.490-501
    • /
    • 2002
  • 기업의 생산성향상과 이익률에 영향을 줄 수 있는 지식이 경제 전반에 확산되어 나가는 과정은 한 나라의 경제발전속도에 영향을 미치는 중요한 요인이다. 기업 측면에서는 도입하려는 기술이 도입 후에 그 기업의 이익을 높여 줄 수 있다면 도입하지 않을 이유가 없다. 하지만 미래 수요의 불확실성이나 기술발전 방향의 불확실성 등으로 해서 기업으로서는 도입 후의 이익을 정확히 사전적으로 측정하기는 어렵다. 본 논문에서는 학계에서 일반적으로 사용되고 있는 두 가지 지식확산 모델을 설명하고자 한다. 그 하나는 하나의 새로운 기술이나 상품이 시간이 흐름에 따라 어떻게 전체 사용 가능자(population)에게 확산되는 지를 보여주는 1) Epidemic Diffusion Model (흔히 S자형 - Sigmoid - 모델이라고도 한다.)과 어떤 도입자가 어느 시점에서 대상이 된 새로운 기술을 도입할 것인지 아닌지를 결정하는 모델로서 2) Probit Diffusion Model (프로빗 모델)을 중심으로 한다. 그리고 이러한 지식확산과정과 속도에 영향을 줄 수 있는 기업 내부적 요인으로서 도입하고자 하는 기업의 누적된 경험이 중요하다는 것과 기업 외부적 요인으로서 네트웍 효과와 같은 요인들을 설명하였다.

  • PDF