• 제목/요약/키워드: Query analysis

검색결과 460건 처리시간 0.026초

패턴 매칭과 통계 모델링을 이용한 대화 인터페이스 시스템의 구현 (Implementation of a Dialogue Interface System Using Pattern Matching and Statistical Modeling)

  • 김학수
    • 컴퓨터교육학회논문지
    • /
    • 제10권3호
    • /
    • pp.67-73
    • /
    • 2007
  • 본 논문에서는 대화 인터페이스 시스템을 구성하는 필수 요소들을 알아보고, 각각에 대한 실용적인 구현 방법을 제안한다. 구현 시스템은 담화 관리자, 의도 분석기, 개체명 인식기, SQL 질의어 생성기, 응답 생성기로 구성된다. 구현 과정에서 비교적 영역 의존성이 낮은 의도 분석 모듈은 통계 기반의 최대 엔트로피 모델을 이용한다. 그리고 높은 영역 이식성을 필요로 하는 개체명 인식기, SQL 질의어 생성기, 응답 생성기는 단순 패턴 매칭 방법을 이용한다. 일정 관리 영역에서의 실험에서 구현 시스템은 88.1%의 의도 분석 정확률과 83.4%의 SQL 질의어 생성 성공률을 보였다.

  • PDF

트리플 데이터베이스 단축 경로 이득 함수와 구성 인자 실험 분석 (Empirical Analysis on the Shortcut Benefit Function and its Factors for Triple Database)

  • 강승석;심준호
    • 한국전자거래학회지
    • /
    • 제19권1호
    • /
    • pp.131-143
    • /
    • 2014
  • 3-컬럼의 트리플 테이블로 구성되는 트리플 데이터베이스의 질의 처리는 고비용이 드는데, 단축 경로는 그 비용을 감소시키는 방법으로 알려졌다. 어떠한 단축 경로를 선택 구성할지는 주요한 문제이며, 질의 빈도를 기반으로 단축 경로 이득을 계산하는 방식이 주로 사용된다. 하지만 이러한 방식은 트리플 데이터의 추가 혹은 변경을 적절히 반영하지 못한다. 본 논문에서는 질의 처리 시간 단축 측면뿐 아니라 경로 구축 및 유지 비용도 고려하는 이득 모델을 다룬다. 이득 모델은 이득 함수로 설계되어 단축 경로 선택 기법에 적용된다. 이득 함수 구성 인자가 미치는 영향을 실세계 트리플 데이터를 사용해 실험 분석한다.

이동객체궤적에 대한 효율적인 범위질의 (Efficient Range Query on Moving Object Trajectories)

  • 박영희;김규재;조우현
    • 한국정보통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.364-370
    • /
    • 2014
  • 최근 많은 응용프로그램에서 시공간 데이터와 멀티미디어 데이터 등이 사용되고 있다. 그래서 이러한 유형의 데이터들을 효율적으로 관리하고 분석할 수 있는 연구들이 많이 진행 중이다. 본 논문에서는 이동객체궤적에 대하여 단순화 기법을 사용하여 단순화한 후에 색인구조를 생성하고 이 색인구조를 이용하여 범위질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 이동객체궤적의 단순화 기법으로는 Douglas-Peucker 알고리즘을 수정하여 이용한다. 제안된 방법과 기존의 최소 경계 사각형(MBR)을 이용한 색인 방법을 실험을 통하여 비교 및 분석한다. 실험 결과로 제안된 방법에서는 색인 데이터 량이 상대적으로 작아지고 색인 및 질의 처리방법이 간단하며 기존의 방법보다 시공간적으로 효율적임을 확인하였다.

STAT 조건을 지원하는 연속질의 모델의 설계 (Design of a Continuous Query Model for supporting STAT Conditions)

  • 조대수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.441-443
    • /
    • 2010
  • 다양한 센서들로부터 실시간으로 수집되는 데이터를 분석, 처리해야 하는 유비쿼터스 환경의 다양한 응용 서비스를 개발하기 위해서는 반드시 연속질의 처리 방법이 요구된다. 기존 연구에서 연속질의는 대부분 간격질의와 영역질의만으로 표현되고, 이러한 질의에 대한 처리 기법들이 제시되었다. 그러나 연속질의의 종류는 매우 다양하며, 속성 조건, 공간 조건, 시간 조건의 결합을 통해 표현될 수 있다. 이 논문에서는 연속질의의 종류를 분류하고, 여러 조건들의 결합을 통해 표현 가능한 연속질의 모델을 제안하고자 한다. 이 논문은 연속질의를 표현하는 질의 모델을 제안함으로써, 연속질의 처리를 위한 다양한 후속 연구에 대한 방향을 제시하는데 기여하였다.

  • PDF

무순위 연속 k 최근접 객체 탐색을 위한 효율적인 분할점 추출기법 (A Efficient Method of Extracting Split Points for Continuous k Nearest Neighbor Search Without Order)

  • 김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.927-930
    • /
    • 2010
  • 최근 이동 중인 경로 상에 존재하는 모든 지점에 대해 k개의 최근접 객체를 탐색하는 연속 k 최근접 객체 탐색 질의가 위치기반 서비스와 지능형 교통 시스템의 응용 분야에 폭넓게 사용되고 있다. 이러한 질의는 위와 같은 응용에 빠른 응답을 요구하고, 공간 네트워크 데이터베이스에 적용가능 해야 한다. 이 논문에서는 공간네트워크 상에서 움직이는 질의 객체를 위한 최근접 객체를 효율적으로 탐색하는 새로운 기법을 제안하고자 한다. 제안하는 기법은 다수의 분할점과 그에 상응하는 k개의 최근접 객체 집합들을 결과로 추출하며, POI들 간에는 순서가 없다. 분석을 통해 제안한 기법에 기존기법에 비해 우수함을 보인다.

  • PDF

이동객체궤적에 대한 효율적인 최근접 이웃 검색 (Efficient Nearest Neighbor Search on Moving Object Trajectories)

  • 김규재;박영희;조우현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.418-421
    • /
    • 2014
  • 스마트폰과 같은 이동 통신 매체의 발달과 LTE, NFC, RFID 등 무선통신의 발달로 실시간으로 이동 객체의 위치데이터를 수집하여 활용하는 위치 기반의 서비스들이 다방면의 개발에 이용되고 있다. 이에 따라 대용량의 이동객체 위치 데이터들을 효율적으로 저장하는 방법과 여러 질의를 좀 더 빠르게 처리할 수 있는 방법들에 대한 연구들이 진행 중이다. 본 논문에서는 Douglas-Peucker 알고리즘을 응용하여 대용량의 이동객체궤적 데이터를 단순화하여 색인 구조를 생성하고 이 색인 구조를 이용하여 최근접 이웃 검색 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 제안된 방법으로 대용량의 데이터가 더 적은 양의 데이터로 단순화 되고 얼마나 더 효율적으로 질의를 처리하는지 실험을 통하여 확인하였다.

  • PDF

약간 감독되는 포인트 클라우드 분석에서 일반 로컬 트랜스포머 네트워크 (General Local Transformer Network in Weakly-supervised Point Cloud Analysis)

  • ;이태호;;최필주;이석환;권기룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.528-529
    • /
    • 2023
  • Due to vast points and irregular structure, labeling full points in large-scale point clouds is highly tedious and time-consuming. To resolve this issue, we propose a novel point-based transformer network in weakly-supervised semantic segmentation, which only needs 0.1% point annotations. Our network introduces general local features, representing global factors from different neighborhoods based on their order positions. Then, we share query point weights to local features through point attention to reinforce impacts, which are essential in determining sparse point labels. Geometric encoding is introduced to balance query point impact and remind point position during training. As a result, one point in specific local areas can obtain global features from corresponding ones in other neighborhoods and reinforce from its query points. Experimental results on benchmark large-scale point clouds demonstrate our proposed network's state-of-the-art performance.

분석 CRM 실무자의 자연어 질의 처리를 위한 기업 데이터베이스 구성요소 인덱싱 방법론 (A PageRank based Data Indexing Method for Designing Natural Language Interface to CRM Databases)

  • 박성혁;황경서;이동원
    • CRM연구
    • /
    • 제2권2호
    • /
    • pp.53-70
    • /
    • 2009
  • 분석 CRM 영역에서는 고객 데이터 분석을 통하여 고객 행동과 관련된 통찰력을 얻는 것이 중요하다. 이러한 분석 과정에서, 사용자 스스로 기업 데이터베이스에서 대용량 고객 이력 데이터를 조회하고 추출하기 위해서는 SQL 을 사용하여 자유롭게 질의구문을 작성할 수 있어야 한다. 그런데 일반 사용자들이 이러한 업무를 수행하고자 할 때, 기업 데이터베이스 구성 요소에 대한 전문적인 지식이 부족하기 때문에 정보 탐색에 있어서 어려움을 겪는다. 이를 해결하기 위한 방안으로 본 연구에서는 사용자가 제공하는 자연어 수준의 질의를 분석하고, 데이터베이스를 구성하는 값을 중심으로 올바른 질의 결과를 제공하기 위한 데이터베이스 구성요소 인덱싱 방법론을 제안한다. 구체적으로 기업 데이터베이스를 구성하는 세 가지 요소인 관계, 속성, 값에 대한 정보를 읽어 들여 요약 정보에 대한 인덱스를 구성한 다음 사용자의 자연어 질의에서 분석된 의미 단위 별로 데이터베이스 요약 정보와 연결해주는 TableRank 기법을 소개한다. 실험용 데이터베이스를 대상으로 테스트를 수행한 결과, 사용자의 자연어 질의 결과가 데이터베이스를 구성하는 값 정보와 연결되는 것이 관찰되었다. 논문의 후반부에서는 자연어 질의를 자동적으로 처리하기 위한 선행 모듈 개발의 시사점을 정리하고, 향후 기업 데이터베이스 자동 검색 시스템으로 발전하기 위한 방안에 대해서도 설명한다.

  • PDF

Analysis of Myosin Heavy Chain Isoforms from Longissimus Thoracis Muscle of Hanwoo Steer by Electrophoresis and LC-MS/MS

  • Kim, Gap-Don
    • 한국축산식품학회지
    • /
    • 제34권5호
    • /
    • pp.656-664
    • /
    • 2014
  • The purpose of this study was to analyze myosin heavy chain (MHC) isoforms in bovine longissimus thoracis (LT) muscle by liquid chromatography (LC) and mass spectrometry (MS). LT muscles taken from Hanwoo (Korean native cattle) steer (n=3) used to separate myosin bands by sodium dodecyl sulfate-polyacrylamide gel electrophoresis. The peptide queries were obtained from the myosin bands by LC-MS/MS analysis following in-gel digestion with trypsin. A total of 33 and 43 queries were identified as common and unique peptides, respectively, of MHC isoforms (individual ions scores >43 indicate identity or extensive homology, p<0.05). MHC-1 (IIx), -2 (IIa), -4 (IIb), and -7 (slow/I) were identified based on the Mowse score (5118, 3951, 2526, and 2541 for MHC-1, -2, -4, and -7, respectively). However, more analysis is needed to confirm the expression of MHC-4 in bovine LT muscle because any query identified as a unique peptide of MHC-4 was not found. The queries that were identified as unique peptides could be used as peptide markers to confirm MHC-1 (14 queries), -2 (8 queries), and -7 (21 queries) in bovine LT muscle; no query identified as a unique peptide of MHC-4 was found. LC-MS/MS analysis is a useful approach to study MHC isoforms at the protein level.

RFID 충돌 비트를 이용한 다중 태그 인식 알고리즘 (A New RFID Multi-Tag recognition Algorithm using Collision-Bit)

  • 지유강;조미남;홍성수;박수봉
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.55-58
    • /
    • 2008
  • RFID(Radio Frequency IDentification)리더는 영역 내에 있는 다수의 태그를 인식할 때 데이터간의 충돌이 발생하는데 이러한 충돌은 리더의 태그인식 시간을 지연시키는 원인이 된다. 리더의 태그인식 시간의 지연을 방지하는 프로토콜은 대표적으로 QT(Query Tree)알고리즘을 사용하는데 본 논문에서는 충돌비트위치를 이용하여 개선된 QT-MTC(Query Tree with Multi-Tag Cognition)알고리즘을 제안한다. 제안 알고리즘은 충돌이 일어난 비트 수와 충돌이 발생한 비트 위치를 스택에 저장하여 트리를 순회하는 횟수를 줄였고, 두 개의 태그를 동시에 식별할 수 있도록 설계되었다. 성능분석 결과 QT 프로토콜에 비교하여 제안알고리즘은 연속된 태그 비트에 대해 높은 성능개선효과를 보였다.

  • PDF