통합 검색 | Korea Science

BM25 기반 고난도 부정 지식 검색을 통한 오픈 도메인 지식 기반 한국어 대화의 지식 검색 모듈 성능 향상 (Improvement of Knowledge Retriever Performance of Open-domain Knowledge-Grounded Korean Dialogue through BM25-based Hard Negative Knowledge Retrieval)

문선아;김산;신사임
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
- /
- pp.125-130
- /
- 2022
최근 자연어처리 연구로 지식 기반 대화에서 대화 내용에 자유로운 주제와 다양한 지식을 포함하는 연구가 활발히 이루어지고 있다. 지식 기반 대화는 대화 내용이 주어질 때 특정 지식 정보를 포함하여 이어질 응답을 생성한다. 이때 대화에 필요한 지식이 검색 가능하여 선택에 제약이 없는 오픈 도메인(Open-domain) 지식 기반 대화가 가능하도록 한다. 오픈 도메인 지식 기반 대화의 성능 향상을 위해서는 대화에 이어지는 자연스러운 답변을 연속적으로 생성하는 응답 생성 모델의 성능 뿐만 아니라, 내용에 어울리는 응답이 생성될 수 있도록 적합한 지식을 선택하는 지식 검색 모델의 성능 향상도 매우 중요하다. 본 논문에서는 오픈 도메인 지식 기반 한국어 대화에서 지식 검색 성능을 높이기 위해 밀집 벡터 기반 검색 방식과 주제어(Keyword) 기반의 검색 방식을 함께 사용하는 것을 제안하였다. 먼저 밀집 벡터 기반의 검색 모델을 학습하고 학습된 모델로부터 고난도 부정(Hard negative) 지식 후보를 생성하고 주제어 기반 검색 방식으로 고난도 부정 지식 후보를 생성하여 각각 밀집 벡터 기반의 검색 모델을 학습하였다. 성능을 측정하기 위해 전체 지식 중에서 하나의 지식을 검색했을 때 정답 지식인 경우를 계산하였고 고난도 부정 지식 후보로 학습한 주제어 기반 검색 모델의 성능이 6.175%로 가장 높은 것을 확인하였다.
PDF

OECD 국가 지식기반산업 형성에서 IT 산업 역할 (The Role of IT Industry on the Formation of Knowledge-Based Industry in OECD)

조상섭;조병선
- 전자통신동향분석
- /
- 제18권3호통권81호
- /
- pp.39-48
- /
- 2003
본 연구는 1990년대 우리나라를 포함한 OECD 국가의 지식기반산업 현황을 기술하고, 지식기반산업에서 IT 산업의 역할을 분석하는 데 목적이 있다. 1990년대 OECD 국가들의 지식기반산업의 중요한 특징은 OECD 각 국가들이 지식기반산업을 미래 중요한 산업으로 인식하고 지속적 자원투자와 관심을 기울이고 있다는 데 있다. 본 연구에서 대상 분석기간 동안 OECD 국가의 지식기반산업성장률은 5% 증가하였으며, 우리나라의 경우는 이보다 높은 10%대의 증가를 기록하였다. 또한 OECD 국가들의 지식기반산업 형성과정에서 IT 산업은 전통적 제조업의 역할보다 기술혁신 측면과 무역수지 측면에서 매우 중요한 역할을 수행한 것으로 나타났다. 특히 우리나라의 경우에 지식기반산업의 형성과정에서 IT 산업의 기여도는 다른 OECD 국가보다 높은 것으로 나타났다. 지식기반산업 가운데 IT 산업은 생산성 증가요인을 분해하여 볼 때, 전반적으로 산업간의 효율성에 의한 생산성증가, 산업간의 자원이동에 의한 생산성증가 그리고 IT 산업자체의 노동생산성증가 요인에서 다른 산업에 비하여 상대적으로 우월하게 나타났다.
https://doi.org/10.22648/ETRI.2003.J.180305 인용 PDF

지식기반 질의응답을 위한 질문분석 방법 (Question Analysis for Knowledge based Question/Answering)

허정;황이규;최미란;장명길
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
- /
- pp.308-314
- /
- 2004
AnyQuestion 1.0은 (주)두산의 '두산세계대백과 엔싸이버'의 인물분야만을 대상으로 한 질의응답형 정보검색 시스템이다. 본 시스템에서는 지식기반 질의응답, Logical Form 기반 질의응답, 단락 기반 질의응답을 통합한 3단계 정답 추출 방법을 제안하고 있다. 지식기반 질의응답은 본문의 구조화된 정보와 비구조화 된 정보로부터 정보추출 기술을 이용하여 구축한 지식베이스에 대한 질의응답을 목적으로 한다. "사용자의 질문에 대한 정답을 지식베이스에서 제시할 수 있는가?"와 "지식베이스에서 어떤 정보를 정답으로 제시해야 하는가?"는 3단계 정답 추출 방법에서는 상당히 중요하다 이를 위해서 질문 분석에서는 수동으로 구축한 지식베이스 속성 자질 정보와 다양한 규칙을 기반으로 질문 분석을 수행하였고, 이를 이용하여 지식기반 질의응답을 하였다. 실험결과, 지식기반 질의응답 할당 재현율은 65.4%, 지식기반 질의응답의 정확률은 81.25%였다. 백과사전 인물분야에 대한 지식기반 질의응답은 기존의 데이터베이스 분야에서 연구되어온 자연어 DB인터페이스를 활용한 질의응답으로 속도가 빠르며, 상대적으로 높은 정확률을 보였다.
PDF

지식의 일관성이 보장된 지식 기반 시스템 (Knowledge Based System with Consistency of Knowledge)

서의현
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
- /
- pp.116-118
- /
- 2000
생성 규칙은 지식 기반 시스템의 지식표현 기법 중 가장 많이 사용되고 많은 장점을 갖고 있음에도 불구하고 지식의 일관성 유지가 어렵다는 단점을 가지고 있다. 그런데 지식의 일관성이 추론 결과의 신뢰도에 직결된다는 점에서 지식의 일관성을 유지할 수 있는 시스템이 필수적이다. 따라서 본 논문에서는 새로 첨가될 지식이 기준 지식과 일관성이 유지될 경우에만 지식을 첨가하는 일관성 유지시스템과 지식베이스는 물론 데이터 베이스 내의 선언적 지식과 절차적 지식 등 다양한 지식을 호출할 수 있는 기능을 갖춘 지식 기반 시스템을 구축하였다.
PDF

지식기반 국가선진화 전략

김성태
- 정보와 통신
- /
- 제26권1호
- /
- pp.38-44
- /
- 2009
최근 급변하는 세계정세 속에 미래의 불확실성과 위협이 커져가는 실정에서 미래예측에 기반한 국정운영 시스템과 함께, 이를 과학적이고 체계적으로 지원할 수 있는 지식기반의 미래예측 인프라가 필요하다. 또한 기술 발달과 사회 환경의 미래 변화가 국가의 경쟁력으로 발현될 수 있도록 정책과 제도체계 마련이 선행되어야 혁신적 창의적 노력이 성공하고 기회를 선점할 수 있다. 결국, 지식기반과 국정 운영의 융합으로 지속가능한 국가선진화를 달성할 수 있을 것이다. 본고에서는 기술(공급), 사회(수요), 정책간의 상호작용을 중심으로 지식기반 국가선진화 전략을 제시하였다. 지식기반 국가선진화 전략은 국가 미래비전을 제시하고 추진하는 국정운영 인프라(Governance Infra), 지식기반 인프라(Knowledge Infra), 멘탈 인프라(Mental Infra)로 구성되어있다.
PDF KSCI

공정관리 지식기반 구축을 위한 기초적 연구 (A Basic Study for Accumulating Scheduling Knowledge-Base)

장세한;김경래
- 한국건설관리학회논문집
- /
- 제2권3호
- /
- pp.83-91
- /
- 2001
1990년 중반부터 지식(Knowledge)은 국가 및 기업 경쟁력의 원천으로 부상하고 있으며, 건설기업의 공정관리는 건설기업의 핵심 역량 중의 하나이다. 그러나 국내 건설기업은 공정관리에 대한 지식을 체계적으로 저장, 활용하지 못하고 있는 실정이다. 국내 건설기업의 공정관리 지식기반화에 대한 수준은 공정관리 지식기반 인프라 구축 단계에 머물러 있으며, 상위 건설기업 조차도 공정관리 지식 활동 단계의 초기 수준에 머물러 있다. 이는 공정관리 지식의 중요성에 대한 인식 부재, 관련 절차의 부재가 원인이라고 할 수 있을 것이다. 본 연구에서는 건설기업의 공정관리 지식기반화의 문제점을 분석한 후, 건설기업 차원에서 현행 공정관리 표준 절차서의 내용에 공정관리 지식기반 인프라 요소와 공정관리 지식 활동 요소를 보안할 수 있는 공정관리 지식기반화를 위한 공정관리 절차서 모델을 제시하였다. 본 연구의 결과물인 공정관리 지식기반화를 위한 절차서 모델을 통해, 국내 건설기업이 공정관리 지식 활동의 절차를 마련할 수 있는 방안을 제시하고, 추후 국내 건설기업의 건설통합시스템 및 KMS(Knowledge Management System)과의 연계를 위한 공정관리 지식 기반의 구축의 틀을 마련하고자 한다.
PDF

$\mathcal{K}o$-ATOMIC: 일반 상식 기반의 한국어 지식 그래프 ($\mathcal{K}o$-ATOMIC: Korean Commonsense Knowledge Graph)

이재욱;서재형;이승준;박찬준;;임희석
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
- /
- pp.412-417
- /
- 2022
일반 상식 기반의 지식 그래프는 대규모 코퍼스에 포함되어 있는 일반 상식을 그래프로 표현하여, 자연어 처리의 하위 작업들에 적용할 수 있도록 하는 구조화된 지식 표현 방법이다. 현재 가장 잘 알려진 일반 상식 기반의 지식 그래프로는 ATOMIC [1]이 있다. 하지만 한국어를 주요 언어로 하는 일반 상식 기반의 지식 그래프에 대한 연구는 아직 활발하지 않다. 따라서 본 연구에서는 기존에 존재하는 영어 기반의 지식 그래프와 일반 상식 기반의 한국어 데이터셋을 활용해서 한국어 일반 상식 기반 지식 그래프를 구축하는 방법론을 제시한다. 또한, 제작한 지식 그래프를 평가하여 구축하는 방법론에 대한 타당성을 검증한다.
PDF

우리나라의 산업별 지식기반도 측정

최종후;한성희;홍병석
- 한국통계학회:학술대회논문집
- /
- 한국통계학회 2000년도 추계학술발표회 논문집
- /
- pp.91-95
- /
- 2000
본 연구는 우리나라 산업구조에 있어서 지식과 기술의 영향을 파악하기 위하여 기술지표(R&D, IT집약도, 특허)와 인적자원지표(R&D인력, 대졸자수, 과학기술인적자원)를 기초로 117개 산업에 대한 지식기반도 측정을 시도한 것이다. 지식기반도 측정을 위한 분석모형으로 LISREL 모형이 적용되었다. 지식기반산업에 대한 기존의 연구로서는 OECD(1996)에 의한 R&D 직접투자와 간접투자를 이용한 분석이 있으나 기술과 인적자본 지표를 모두 활용하여 계량적으로 분석한 것은 새로운 시도이다.
PDF

대학도서관 사서의 근거기반실무 지식 영향 요인 (Perceived knowledge of Evidence-Based Practice among University Librarians)

김갑선
- 한국정보관리학회:학술대회논문집
- /
- 한국정보관리학회 2018년도 제25회 학술대회 논문집
- /
- pp.21-24
- /
- 2018
본 연구는 대학도서관 사서가 지각하는 근거기반실무 지식의 정도와 영향요인을 식별하고자 하는 연구이다. 근거기반실무 지식에 유의한 차이가 나타난 변인은 연령, 교육 정도, 고용 유형, 직위, 학술지 읽기, 학술대회 참여이었다. 근거기반실무 지식에 영향을 미치는 요인은 교육 정도, 학술지 읽기로 나타났다. 본 연구는 대학도서관 사서의 근거기반실무 지식은 대학도서관과 사서직의 지속적 발전과 혁신의 촉진 요인이기 때문에 근거기반실무 역량을 향상시킬 수 있도록 연구 관련 활동을 지원하는 조직단위, 도서관계, 학계 차원의 지원과 정책이 필요하다.
PDF

OK-KGD:오픈 도메인 한국어 지식 기반 대화 데이터셋 구축 (OK-KGD:Open-domain Korean Knowledge Grounded Dialogue Dataset)

문선아;김산;장진예;정민영;신사임
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
- /
- pp.342-345
- /
- 2023
최근 자연어처리 연구 중 오픈 도메인 지식 기반 대화는 많은 관심을 받고 있다. 연구를 위해서는 오픈 도메인 환경을 갖추고 적절한 지식을 사용한 대화 데이터셋이 필요하다. 지금까지 오픈 도메인 환경을 갖춘 한국어 지식 기반 대화 데이터셋은 존재하지 않아 한국어가 아닌 데이터셋을 한국어로 기계번역하여 연구에 사용하였다. 이를 사용할 경우 두 가지 단점이 존재한다. 먼저 사용된 지식이 한국 문화에 익숙하지 않아 한국인이 쉽게 알 수 없는 대화 내용이 담겨있다. 그리고 번역체가 남아있어 대화가 자연스럽지 않다. 그래서 본 논문에서는 자연스러운 대화체와 대화 내용을 담기 위해 새로운 오픈 도메인 한국어 지식 기반 대화 데이터셋을 구축하였다. 오픈 도메인 환경 구축을 위해 위키백과와 나무위키의 지식을 사용하였고 사용자와 시스템의 발화로 이루어진 1,773개의 대화 세트를 구축하였다. 시스템 발화는 크게 지식을 사용한 발화, 사용자 질문에 대한 답을 주지 못한 발화, 그리고 지식이 포함되지 않은 발화 3가지로 구성된다. 이렇게 구축한 데이터셋을 통해 KE-T5와 Long-KE-T5를 사용하여 간단한 실험을 진행하였다.
PDF

검색결과 5,060건 처리시간 0.035초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)