• Title/Summary/Keyword: 질의 생성

검색결과 2,131건 처리시간 0.031초

건국봇: 검색모델과 생성모델을 결합한 챗봇 (KU-Bot: Chatbot combining Retrieval-based model and Generative Model)

  • 이현우;민덕기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.449-452
    • /
    • 2018
  • 최근 AI 스피커를 비롯한 지능형 비서 서비스들이 빠르게 등장하고 있으며, AI 시장에서도 특히 챗봇 구축이 가장 활발하게 진행되고 있다. 건국봇은 건국대학교 학생들에게 필요한 정보를 제공하는 대화형 서비스이다. 본 논문에서는 대표적인 챗봇 구현 방법인 검색모델과 생성모델의 장단점을 분석하고, 건국봇에 적용한 사례를 소개한다. 궁극적으로, 질의문의 의도를 단어의 가중치를 고려해 추론함으로써 Unknown 추론을 강화하고 의도되지 않은 문장의 처리 관점에서 성능을 향상시키는 방법을 제안한다.

연속적인 공간질의에서 사용자의 방향을 고려한 개선된 k-oATY (Improved k-oATY considering the user's Direction in continuous spatial query)

  • 송두희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.217-219
    • /
    • 2023
  • 최근 사용자의 다양한 정보를 요구하는 어플리케이션이 개발됨에 따라 개인 정보 보호가 이슈화 되고 있다. 특히 사용자의 위치와 관련된 연구는 매우 중요한 부분을 차지한다. 본 논문에서는 기존에 제안되었던 k-oATY에 대해 소개하고, k-oATY에 대한 설명 중 미흡했던 부분을 지적하고 이를 개선하는 논문을 제안하고자 한다. 첫 번째, 제안기법에서 생성되는 가상의 더미 생성 방법을 알고리즘으로 정의했으며 두 번째, 제안기법에서 장애물이 있을 경우 회피할 수 있는 알고리즘을 제안했다.

고철질-초고철질 마천관입암의 층상구조 개관 (The Overview of Layered structures in Mafic - Ultramafic Macheon Intrusion)

  • 송용선;김동연;박계헌
    • 암석학회지
    • /
    • 제16권3호
    • /
    • pp.162-179
    • /
    • 2007
  • 영남(소백산)육괴의 남서부인 지리산지역의 북서부에 선캠브리아 편마암 복합체를 트라이아스기(약 223 Ma)에 관입한 마천층상관입암은 크게 층상계열과 엽상계열의 두 그룹으로 구분되는 고철질-초고철질 암석들로 구성되어 있으며, 마그마혼합의 특성을 잘 보이는 암맥상의 고철질 암이 수반된다. 층상계열은 누적조직의 특성과 주구성 유색광물의 종류에 의해 중앙부의 감람석 반려암대(하부대)와 주변부의 각섬석 반려암대(중 내지 상부대피 두 부분으로 다시 세분된다. 중앙부의 감람석 반려암은 비교적 얇은 우흑질과 우백질의 층들이 규칙적으로 교호된 중립질 반려암질 암과 균질하고 두꺼운 층상구조를 이룬 조립질 반려암질 암들이 서로 협재되어 있으며, 주구성 암종은 우흑질 반려암, 트록토라이트, 우백질 트록토라이트, 사장암질암 등으로 감람석과 사장석이 주구성 광물이다. 엽상계열은 함석영 흑운모휘석 반려암과 보다 분화된 특성의 각섬석 섬록암으로 분류되며 간극상로 산출되는 소량의 석영과 미사장석을 포함하고 있다 주변의 선캠브리아 편마암류와의 접촉대에 냉각대가 발달되어 있어 심부에서 보다 분화된 동원성 마그마가 어느 정도 시간적인 간격을 갖고 좀 더 냉각된 환경에서 관입한 것으로 보인다. 층상계열에 발달된 층상구조는 감람석은 주로 정누적구조 내지 부가누적구조, 사장석은 부가누적 내지 간극누적구조를 보이며, 단사휘석과 각섬석은 간극누적 내지 이형부가누적조직을 이루고 있다. 층상암들에서 마그마작용동안 생성된 습곡구조, 점이층리, 사층리 등이 드물지 않게 산출된다. 마천층상관입암체에 발달된 층상구조와 엽상구조가 주로 중력침전과 제자리 결정작용에 의해 생성되었으며 슬럼핑과 밀도류 흐름작용도 상당한 역할을 하였을 것으로 해석된다.

아웃소싱 데이터베이스에서 데이터 프라이버시 및 질의 무결성을 지원하는 공간 변환 기법 (A Spatial Transformation Scheme Supporting Data Privacy and Query Integrity for Outsourced Databases)

  • 김형일;송영호;장재우
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.652-663
    • /
    • 2015
  • 위치 기반 서비스의 발전으로 인해, 일상에서 생성되는 공간 데이터의 양이 급격히 증가하고 있다. 이에 따라, 데이터 소유자의 공간 데이터베이스 관리 비용 절감을 위한 공간 데이터베이스 아웃소싱이 활발히 진행되고 있다. 데이터베이스 아웃소싱 시 가장 중요한 고려사항은 프라이버시 요구사항을 충족하고 질의 결과 무결성을 보장하는 것이다. 그러나 대부분의 데이터베이스 변환 기법은 데이터 프라이버시 보호와 질의 결과 무결성을 동시에 보장하지 못한다. 이러한 문제점을 해결하기 위해, 본 논문에서는 층밀림 변환, 회전 변환, 시프팅 변환을 활용한 공간 데이터 변환 기법을 제안한다. 또한, 데이터베이스 변환기법의 데이터 프라이버시 보호 정도를 측정하기 위한 공격 모델을 소개한다. 마지막으로, 성능 분석을 통해 제안하는 기법이 기존 기법에 비해 다양한 공격 모델로부터 높은 수준의 데이터 프라이버시 보호를 수행하며, 동시에 질의 결과 무결성을 보장함을 검증한다.

데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법 (A Distributed SPARQL Query Processing Scheme Considering Data Locality and Query Execution Path)

  • 김병훈;김대윤;고건식;노연우;임종태;복경수;이병엽;유재수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.275-283
    • /
    • 2017
  • 시맨틱 웹 서비스의 증가로 인해 RDF 데이터가 대용량화되고 있다. 대용량 RDF 데이터를 효율적으로 활용하기 위하여 다양한 분산 저장 및 질의 처리기법들이 연구되고 있다. 본 논문에서는 대용량 RDF 데이터의 데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법을 제안한다. 제안하는 기법은 질의 처리 시의 조인 비용 및 통신비용을 감소시키기 위해 분산 저장된 RDF 데이터의 지역성 및 질의 수행 경로를 고려한다. 분산 환경에서 SPARQL 질의를 처리할 때 데이터 지역성을 고려하여 WHERE절을 기준으로 해당 질의를 여러 개의 서브 질의로 분할한다. 제안하는 기법은 분할된 서브 질의들을 인덱스를 통해 연관 노드들끼리 그룹화 하여 처리함으로써 데이터 통신비용을 감소시킬 수 있다. 또한 그룹 화된 서브 질의 처리 시 불필요한 조인 및 대기 시간을 감소시키기 위해 데이터 파싱 비용, 노드별 데이터 통신량 및 대기 시간 등을 고려한 효율적인 질의 수행 경로를 생성한다. 다양한 성능평가를 통해 제안하는 기법이 기존 기법보다 우수함을 보인다.

점 행렬을 이용한 새로운 부분 영상 검색 기법 (A Novel Sub-image Retrieval Approach using Dot-Matrix)

  • 김준호;강경민;이도훈
    • 한국산학기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.1330-1336
    • /
    • 2012
  • 영상 검색 방법은 텍스트 기반, 내용 기반, 영역 기반 영상 검색, 부분 영상 검색 방법 등 다양한 연구가 이루어지고 있다. 그 중에 부분 영상 검색은 질의 영상을 포함하는 대상 영상을 찾는 문제이다. 본 논문에서는 생물정보학에서 사용하는 점 행렬 방법을 이용한 새로운 부분 영상 검색 방법을 제안한다. 점 행렬은 두 DNA 서열 간에 유사도를 시각화하는 방법으로써 영상 검색에 적용하여 두 영상 간에 유사도를 비교하는 문제로 재정의한다. 이 알고리즘을 적용하기 위해서 이차원 배열 정보인 영상을 일차원 명암도 영상으로 변환한다. 두 일차원 명암도 영상을 정렬하여 생성된 점 행렬을 이용하여 부분 영상 후보 영역을 생성한다. 실험에는 10 개의 대상 영상과 대상 영상의 부분을 복사한 영상, 축소한 영상, 확대한 영상으로 5종류의 질의 영상을 사용하였다.

워드 임베딩을 이용한 질의 기반 한국어 문서 요약 분석 및 비교 (Analysis and Comparison of Query focused Korean Document Summarization using Word Embedding)

  • 허지욱
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.161-167
    • /
    • 2019
  • 현재 ICT 기반의 웹 서비스 발달과 빠른 최신 기술의 보급으로 인하여 생성되는 정보의 양이 기하급수적으로 증가하고 있다. 이와 더불어 사용자들은 자신이 원하는 정보를 얻기 위해서는 많은 시간과 노력을 필요로 한다. 문서요약기법은 사용자에게 주어진 문서의 문장과 핵심 단어들을 분석하여 효과적으로 요약문을 생성해주는 기술이다. 특히 한국어로 이루어진 문서는 언어의 특성상 기존 언어 분석 기법들을 적용하기 어렵다는 문제점이 있다. 따라서 한국어의 특성을 고려한 문서요약기법에 대한 연구가 필수적이다. 본 논문은 워드 임베딩 기법인 Word2Vec과 FastText를 활용하여 질의 기반의 한국어 문서요약 기법을 제안하고 그 결과를 비교 분석한다.

웹에서의 XML 질의 캐쉬 기법 (Techniques of XML Query Caching on the Web)

  • 박대성;강현철
    • 한국전자거래학회지
    • /
    • 제11권1호
    • /
    • pp.1-23
    • /
    • 2006
  • e-Commerce와 같은 응용 등에 의해 점에서 XML데이터의 양이 많아짐에 따라 XML질의 처리를 신속하게 해주는 기술이 필요하게 되었다. 이를 가능하게 해주는 것이 XML질의 캐슁이다. 자주 제기되는 질의에 대하여 질의 결과를 캐쉬한 후, 동일 질의에 재사용 함으로써 빠른 응답 시간을 보장할 수 있다. 본 논문에서는 XML 질의 결과의 포맷으로 가장 보편적으로 사용되고 있는 노드 식별자 집합(NIS)을 캐쉬하여 XML 질의 성능을 향상시키는 기법을 제안한다. 캐쉬되는 NIS는 질의 결과를 구성하는 소스 XML 엘리먼트들의 식별자 집합이다. 따라서 NIS는 질의 결과의 재구성, 변형, 다른 데이터와의 통합 등 정 응용의 데이터 검색 요건을 충족시키기에 적절하고, XML 소스의 변경에 따른 점진적 갱신에 효율적이다. 그러나 XML문서 형태로 질의 결과를 반환해야 할 경우에는 소스 XML 엘리먼트를 검색하는 실체화 과정을 필요로 한다. 본 논문에서는 세 가지의 서로 다른 NIS의 구성을 고려하여 이들의 생성, 실체화. 점진적 갱신 알고리즘을 제안하고 RD BMS를 이용하여 구현하였다. 다양한 실험을 통한 성능 평가 결과 본 논문에서 제시하는 XML질의 캐쉬 기병의 효율성을 확확하였다.

  • PDF

영역 모니터링 질의 처리를 위한 공간 분할 기법 (A Spatial Split Method for Processing of Region Monitoring Queries)

  • 정재우;정하림;김응모
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.67-76
    • /
    • 2018
  • 본 논문은 영역 모니터링 질의를 효율적으로 처리하는 기법에 대해서 다룬다. 기존의 영역 모니터링 질의 처리를 위해서 사용된 중앙 집중식 기법은 이동 객체가 서버에 주기적으로 자신의 위치 업데이트를 전송하고, 서버가 질의 결과를 지속적으로 업데이트 한다고 가정한다. 그러나 이러한 가정은 많은 양의 위치 데이터 전송으로 인해 시스템 성능을 크게 저하시킨다. 최근, 영역 모니터링 질의 처리를 위한 몇 가지 분산 기법들이 제안되었다. 분산 기법에서 서버는 각 이동 객체에게 I) 작업 공간의 서브 공간인 상주 도메인과 ii) 몇 개의 인접 질의 영역을 할당한다. 각 이동 객체는 상주 도메인을 벗어나거나 질의 영역의 경계를 가로지를 경우에만 서버에게 자신의 위치를 전송한다. 상주 도메인 및 인접 질의 영역을 이동 객체에 할당하기 위해서 서버는 작업 공간을 반복적으로 동일하게 반으로 분할하여 생성되는 질의 색인 구조를 사용한다. 하지만 이와 같은 색인 구조는 불필요한 분할이 발생하게 되므로 시스템의 성능 저하를 발생시킨다. 본 논문에서는 불필요한 분할을 줄이기 위해서 적응 분할 기법을 제안한다. 적응 분할 기법은 I) 질의 영역과 결과 서브 공간의 공간적 관계와 ii) 질의 영역의 분포를 고려하여 동적으로 작업 공간을 분할한다. 본 논문에서는 기존의 색인 구조인 QR-tree에 본 논문에서 제안한 새로운 분할 기법을 적용하였으며, 시뮬레이션을 통해 제안 된 분할 기법의 효율성을 검증했다.

상수를 염소소독시 생성되는 염소 소독부산물(DBPs)의 생성능에 관한 연구

  • 정용;신동천;임영욱;김준성;박연신
    • 한국환경독성학회:학술대회논문집
    • /
    • 한국환경독성학회 1996년도 제19회정기학술대회(The 19th Symposium of the Korean Society of Environmental Toxicology)
    • /
    • pp.75-75
    • /
    • 1996
  • 최근 가장 관심이 집중되고 있는 음용수중의 미량오염물질로는 인위적으로 첨가되는 소독제(disi octant)로 인한 소독부산물(disinfection by-products: DBPs)을 들 수 있다. 1970년대부터 염소소독시 수중의 유기오염물길과 반응하여 발암성물질 과 돌연변이 물질이 다수 함유되어 있는 클로로포름(chloform)을 포함한 트리할로메탄(Trih리omethane: THMs)의 생성이 발견되었으며 이로 인한 건강상의 영향이 지속적으로 보고되고 있다. 염소소독시 780가지 이상의 화합물이 염소와 휴믹산(humic acids)과의 반응에 의해 생성되며, 이중 대부분이 할로겐 화합물로 알려져 있다. 염소 소독부산물로는 인체발암력을 지니고 있는 트리할로메탄(THMs) 이외에도 할로아세틱산(Haloaceticacids: HAAs), 할로아세토나이트릴(Haloacetbnitriles: HANs)등이 주 생성물질인 것으로 알려져 있으나 우러나라의 원수특성에 따른 소독부산물의 생성능 (Formation potential)에 대한 연구가 미흡한 실정이다. 본 연구에서는 우리나라 주요 4대강(한강, 대청호, 영산강, 낙동강)의 원수를 실험실내에서 염소처리하여 생성되는 소독부산물의 생성농과 pH, 체류시간 등의 조건에 따라 생성능을 조사하였다. 각 화합물은 추출 및 농축과정을 거친 후 GC/MSD를 사용하여 물질을 확인한 후 할로겐화합물에 민감한 GC/ECD를 사용하여 시료를 분석하였다. pH와 시간, 원수중의 유기물 함량이 소독부산물의 생성에 많은 영향을 미치는 것으로 나타났다. THMs은 알칼리에서, HAAs의 경우는 약산성에서 접촉시간이 증가할수록 높은 생성능을 보였고, HANs의 경우는 급속히 생성했다가 시간이 경과함에 따라 소멸하며 약산성에서 높은 생성능을 보임을 알 수 있었다, 강별로는 낙동강에서 THMs파 HANs의 생성능이 비교적 높았고, 영산강에서는 HAAs의 생성능이 높았다. 각 원수의 특성에 따른 생성능을 파악함으로써 생성능 저감방안을 마련하며, 소독 부산물질의 인체노출평가에 따른 위해성평가를 통해 관리기준을 설정해야 할 것이다.

  • PDF