Search | Korea Science

A Probabilistic Context Sensitive Rewriting Method for Effective Transliteration Variants Generation (효과적인 외래어 이형태 생성을 위한 확률 문맥 의존 치환 방법)

Lee, Jae-Sung
- The Journal of the Korea Contents Association
- /
- v.7 no.2
- /
- pp.73-83
- /
- 2007
An information retrieval system, using exact match, needs preprocessing or query expansion to generate transliteration variants in order to search foreign word transliteration variants in the documents. This paper proposes an effective method to generate other transliteration variants from a given transliteration. Because simple rewriting of confused characters produces too many false variants, the proposed method controls the generation priority by learning confusion patterns from real uses and calculating their probability. Especially, the left and right context of a pattern is considered, and local rewriting probability and global rewriting probability are calculated to produce more probable variants in earlier stage. The experimental result showed that the method was very effective by showing more than 80% recall with top 20 generations for a transliteration variants set collected from KT SET 2.0.
https://doi.org/10.5392/JKCA.2007.7.2.073 인용 PDF

Design of Enterprise Beans Generator with Macro Functions (매크로 기능을 갖는 엔터프라이즈 빈즈 생성기 설계)

이상영;김송주;노혜민;유철중;장옥배;이우진;신규상
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10a
- /
- pp.531-533
- /
- 2000
J2EE 플랫폼의 핵심기술인 EJB는 서버 측 컴포넌트 표준 모델이다. 최근 들어 점차 이를 지원하는 도구의 중요성이 대두되고 있다. 본 논문에서는 EJB 환경의 컴포넌트인 엔터프라이즈 빈즈를 생성하는 생성기 모델을 제시한다. 특히 이 생성기는 개발자의 개입이 많은 빈 관리 지속성 엔티티 빈 개발 시 자동화할 수 있는 매크로 기능을 가진다. 제공하는 매크로 기능은 크게 두 가지 부류로 구분할 수 있는데 데이터를 조작하는 부분과 엔터프라이즈 빈즈 환경을 조작하는 부분이 있다. 먼저 데이터를 조작하는 부분의 매크로 기능으로는 SQL 질의 관련 매크로(데이터 삽입, 삭제, 선택, 갱신) 및 데이터베이스 필드 변수 설정 매크로가 있고, 환경을 조작하는 부분에는 엔터프라이즈 빈즈 환경 접근 매크로, 홈 객체 획득 매크로, JDBC 연결 매크로 등이 있다. 사용자 측면을 고려한 이러한 기능들을 통해 개발 시간 단축, 노력, 경감, 오류 방지 등의 효과를 얻을 수 있다.
PDF

Generation of High Resolution Elemental Images using Expanded Depth Image (깊이영상 확장을 이용한 고해상도 요소영상 생성)

Song, Min-Ho;Lim, Byung-Muk;Jeong, Ji-Seong;Yoo, Kwan-Hee
- Proceedings of the Korea Contents Association Conference
- /
- 2016.05a
- /
- pp.343-344
- /
- 2016
최근 3D 기술의 이슈는 안경을 사용하지 않고 고화질 3D를 볼 수 있도록 하는 것이며, 그 기술로 집적영상시스템이 대표적으로 사용된다. 본 논문에서는 고화질의 3D 영상 생성에 대한 기법의 하나로 저해상도의 깊이영상을 고해상도로 확장시켜 고해상도 요소영상을 생성하는 기법을 제안한다. 제안 기법을 적용한 결과 질 좋은 요소 영상을 생성하였다.
PDF

Zero-Shot Fact Verification using Language Models Perplexities of Evidence and Claim (증거와 Claim의 LM Perplexity를 이용한 Zero-shot 사실 검증)

Park, Eunhwan;Na, Seung-Hoon;Shin, Dongwook;Jeon, Donghyeon;Kang, Inho
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.524-527
- /
- 2021
최근 국외에서 사실 검증 연구가 활발하게 이루어지고 있지만 한국어의 경우 데이터 집합의 부재로 인하여 사실 검증 연구가 이루어지는데 큰 어려움을 겪고 있다. 이러한 어려움을 해소하고자 자동 생성 모델을 통하여 데이터 집합을 생성하는 시도도 있으나 생성 모델의 특성 상 부정확한 데이터가 생성되어 사실 검증 연구의 퀄리티를 떨어뜨린다는 문제점이 있다. 이러한 문제점을 해소하기 위해 수동으로 구축한 100건의 데이터 집합으로 최근에 이루어진 퓨-샷(Few-Shot) 사실 검증을 확장한 학습이 필요없는 제로-샷(Zero-Shot) 질의 응답에 대한 사실 검증 연구를 제안한다.
PDF

Semantic Parsing of Questions based on the Frame Semantics for Korean Question Answering System (한국어 질의응답 시스템을 위한 프레임 시멘틱스 기반 질의 의미 분석)

Hahm, Younggyun;Nam, Sangha;Choi, Key-Sun
- 한국어정보학회:학술대회논문집
- /
- 2016.10a
- /
- pp.122-127
- /
- 2016
본 논문에서서는 질의응답 시스템을 위한 자연언어 질의 이해를 위하여 프레임 시멘틱스 기반 의미 분석방식을 제안한다. 지식베이스에 의존적인 질의 이해는 지식베이스의 불완전성에 의해 충분한 정보를 분석하지 못한다는 점에 착안하여, 질의의 술부-논항구조 및 그 의미에 대한 분석을 수행하여 자연언어 질의에서 나타난 정보들을 충분히 파악하고자 하였다. 본 시스템은 자연언어 질의를 입력으로 받아 이를 프레임 시멘틱스의 구조에 기반하여 기계가 읽을 수 있는 임의의 RDF 표현방식의 모형 쿼리를 생성한다.
PDF

Semantic Parsing of Questions based on the Frame Semantics for Korean Question Answering System (한국어 질의응답 시스템을 위한 프레임 시멘틱스 기반 질의 의미 분석)

Hahm, Younggyun;Nam, Sangha;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2016.10a
- /
- pp.122-127
- /
- 2016
본 논문에서서는 질의응답 시스템을 위한 자연언어 질의 이해를 위하여 프레임 시멘틱스 기반 의미 분석 방식을 제안한다. 지식베이스에 의존적인 질의 이해는 지식베이스의 불완전성에 의해 충분한 정보를 분석하지 못한다는 점에 착안하여, 질의의 술부-논항구조 및 그 의미에 대한 분석을 수행하여 자연언어 질의에서 나타난 정보들을 충분히 파악하고자 하였다. 본 시스템은 자연언어 질의를 입력으로 받아 이를 프레임 시멘틱스의 구조에 기반하여 기계가 읽을 수 있는 임의의 RDF 표현방식의 모형 쿼리를 생성한다.
PDF

XML Query Processing Using XML Materialized Views in a Wrapper (랩퍼 상에서의 XML 실체뷰를 이용한 XQL 질의 처리)

문찬호;강현철
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10a
- /
- pp.28-30
- /
- 2001
웹 문서 표준으로 제안된 XML의 등장으로 XML 문서들은 점차 웹 데이타에서 많은 비중을 차지하고 있으며 웹 상에서의 통합 서비스를 지원하는 미디에이터/랩퍼 시스템에서 중요한 웹 자원으로 할용될 수 있다. 다수의 XML 문서를 저장하고 있는 XML 저장소 내에 XML 실체뷰가 있다고 가정할 때, 미디에이터/랩퍼 시스템은 XML 문서 검색의 성능 향상을 위해서 이들 실체뷰를 이용하여 질의를 처리할 수 있다. 본 논문에서는, 기존의 실체뷰를 이용한 질의 처리 유형 세가지 중에서 질의 결과 일부를 실체뷰로부터 얻고 나머지 결과를 하부 XML 문서들포부터 얻는 유형에 대하여 연구한다. 즉, 주어진 XQL 질의와 관련 실체뷰에 대하여, 실체뷰에 대한 XQL질의와 하부 데이타에 대한 XQL질의를 생성하는 질의 변환 알고리즘을 제시한다.
PDF

Question, Document, Response Validator for Question Answering System (질의 응답 시스템을 위한 질의, 문서, 답변 검증기)

Tae Hong Min;Jae Hong Lee;Soo Kyo In;Kiyoon Moon;Hwiyeol Jo;Kyungduk Kim
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.604-607
- /
- 2022
본 논문은 사용자의 질의에 대한 답변을 제공하는 질의 응답 시스템에서, 제공하는 답변이 사용자의 질의에 대하여 문서에 근거하여 올바르게 대답하였는지 검증하는 QDR validator에 대해 기술한 논문이다. 본 논문의 과제는 문서에 대한 주장을 판별하는 자연어 추론(Natural Language inference, NLI)와 유사한 과제이지만, 문서(D)와 주장(R)을 포함하여 질의(Q)까지 총 3가지 종류의 입력을 받아 NLI 과제보다 난도가 높다. QDR validation 과제를 수행하기 위하여, 약 16,000 건 데이터를 생성하였으며, 다양한 입력 형식 실험 및 NLI 과제 데이터 추가 학습, 임계 값 조절 실험을 통해 최종 83.05% 우수한 성능을 기록하였다
PDF

SPARQL Query Processing System over Scalable Triple Data using SparkSQL Framework (SparQLing : SparkSQL 기반 대용량 트리플 데이터를 위한 SPARQL 질의 시스템 구축)

Jeon, MyungJoong;Hong, JinYoung;Park, YoungTack
- Journal of KIISE
- /
- v.43 no.4
- /
- pp.450-459
- /
- 2016
Every year, RDFS data tends further toward scalability; hence, the manner of SPARQL processing needs to be changed for fast query. The query processing method of SPARQL has been studied using a scalable distributed processing framework. Current studies indicate that the query engine based on the scalable distributed processing framework i.e., Hadoop(MapReduce) is not suitable for real-time processing because of the repetitive tasks; in addition, it is difficult to construct a query engine based on an In-memory Distributed Query engine, because distributed structure on the low-level is required to be considered. In this paper, we proposed a method to construct a query engine for improving the speed of the query process with the mass triple data. The query engine processes the query of SPARQL using the SparkSQL, which is an In-memory based, distributed query processing framework. SparkSQL is a high-level distributed query engine that facilitates existing SQL statement. In order to process the SPARQL query, after generating the Algebra Tree using Jena, the Algebra Tree is required to be translated to Spark Algebra Tree for application in the Spark system, and construction of the system that generated the SparkSQL query. Furthermore, we proposed the design of triple property table based on DataFrame for more efficient query processing in the Spark system. Finally, we verified the validity through comparative evaluation with the query engine, which is the existing distributed processing framework.
https://doi.org/10.5626/JOK.2016.43.4.450 인용 PDF KSCI

The Design and Implementation of an Information Retrieval System Using Lexico-Semantic Pattern and Ontology (어휘 의미 패턴(Lexico-Semantic Pattern)과 온톨로지를 이용한 정보검색기의 설계 및 구현)

Kim, Byoung-Woo;Ko, Young-Joong
- 한국HCI학회:학술대회논문집
- /
- 2007.02a
- /
- pp.957-962
- /
- 2007
본 논문에서 제안하는 정보 검색기는 일반적인 불리언(Boolean) 질의를 통해서 정보를 검색하는 것이 아니라, 문장으로 입력된 질의형태의 패턴을 분석하여 그에 맞는 정보를 직접 제공하는 것에 목적을 둔다. 이를 위해 어휘 의미 패턴(Lexical Semantic Pattern)과 온톨로지(Ontology) 기술이 정보검색기 개발에 적용되었다. 제안된 시스템에서는 다양한 형태로 표현된 문장 질의를 어휘 의미 패턴을 사용해서 문장의 질의 패턴을 추출하고 사용자 질의를 하나의 온톨로지(Ontology) 추론 질의와 매칭함으로써 질의에 대한 정확한 해답을 추출할 수 있다. 또한, 자연어 문장 입력에 대한 검색 질의 생성기를 구축하고 온톨로지로 표현된 지식을 사용하여 정보검색기 질의를 자동으로 확장함으로써 더욱 정확한 정보 검색 결과를 만들어 낼 수 있다.
PDF

Search Result 2,124, Processing Time 0.027 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)