• 제목/요약/키워드: Probabilistic Search

검색결과 99건 처리시간 0.023초

Incorporating Deep Median Networks for Arabic Document Retrieval Using Word Embeddings-Based Query Expansion

  • Yasir Hadi Farhan;Mohanaad Shakir;Mustafa Abd Tareq;Boumedyen Shannaq
    • Journal of Information Science Theory and Practice
    • /
    • 제12권3호
    • /
    • pp.36-48
    • /
    • 2024
  • The information retrieval (IR) process often encounters a challenge known as query-document vocabulary mismatch, where user queries do not align with document content, impacting search effectiveness. Automatic query expansion (AQE) techniques aim to mitigate this issue by augmenting user queries with related terms or synonyms. Word embedding, particularly Word2Vec, has gained prominence for AQE due to its ability to represent words as real-number vectors. However, AQE methods typically expand individual query terms, potentially leading to query drift if not carefully selected. To address this, researchers propose utilizing median vectors derived from deep median networks to capture query similarity comprehensively. Integrating median vectors into candidate term generation and combining them with the BM25 probabilistic model and two IR strategies (EQE1 and V2Q) yields promising results, outperforming baseline methods in experimental settings.

스킵리스트를 이용한 인터넷 토론 게시판 댓글 관리 (Using Skip Lists for Managing Replying Comments Posted on Internet Discussion Boards)

  • 이윤정;김은경;조환규;우균
    • 한국콘텐츠학회논문지
    • /
    • 제10권8호
    • /
    • pp.38-50
    • /
    • 2010
  • 최근 웹 블로그나 인터넷 게시판과 같은 가상 커뮤니티가 활발히 사용됨에 따라 댓글을 통해 자신의 의견을 적극적으로 나타내고자 하는 이용자들이 점점 증가하고 있는 추세다. 실제로 댓글 활동이 활발한 인터넷 토론 게시판에서 수천 개의 댓글이 달린 게시물도 어렵지 않게 찾아볼 수 있다. 대부분의 웹 블로그나 인터넷 게시판에서는 댓글이 작성된 시간에 따라 목록 형태로만 제공되고 있을 뿐 기본적인 검색 기능조차도 지원되지 않고 있다. 본 논문에서는 인터넷 토론 게시판의 댓글 분석을 통해 댓글 작성자의 분포가 거듭제곱 법칙을 따르는 것을 밝혔다. 그리고 이러한 댓글의 통계적 특성을 반영하는 스킵리스트 기반의 댓글 검색 구조를 제안한다. 제안 방법의 주안점 댓글 작성자들의 확률적 특성을 데이터 구조에 반영하는 것이다. 실험을 통해 제안 방법이 B-트리나 일반적인 스킵리스트의 이론적인 계산 복잡도인 logN에 비해 더 빠른 검색을 수행할 수 있음을 보인다.

Chaotic particle swarm optimization in optimal active control of shear buildings

  • Gharebaghi, Saeed Asil;Zangooeia, Ehsan
    • Structural Engineering and Mechanics
    • /
    • 제61권3호
    • /
    • pp.347-357
    • /
    • 2017
  • The applications of active control is being more popular nowadays. Several control algorithms have been developed to determine optimum control force. In this paper, a Chaotic Particle Swarm Optimization (CPSO) technique, based on Logistic map, is used to compute the optimum control force of active tendon system. A chaotic exploration is used to search the solution space for optimum control force. The response control of Multi-Degree of Freedom (MDOF) shear buildings, equipped with active tendons, is introduced as an optimization problem, based on Instantaneous Optimal Active Control algorithm. Three MDOFs are simulated in this paper. Two examples out of three, which have been previously controlled using Lattice type Probabilistic Neural Network (LPNN) and Block Pulse Functions (BPFs), are taken from prior works in order to compare the efficiency of the current method. In the present study, a maximum allowable value of control force is added to the original problem. Later, a twenty-story shear building, as the third and more realistic example, is considered and controlled. Besides, the required Central Processing Unit (CPU) time of CPSO control algorithm is investigated. Although the CPU time of LPNN and BPFs methods of prior works is not available, the results show that a full state measurement is necessary, especially when there are more than three control devices. The results show that CPSO algorithm has a good performance, especially in the presence of the cut-off limit of tendon force; therefore, can widely be used in the field of optimum active control of actual buildings.

RFID 무선 프로토콜 필터링의 설계와 확률적 인식 과정 시뮬레이션 (Design of RFID Air Protocol Filtering and Probabilistic Simulation of Identification Procedure)

  • 박현성;김종덕
    • 한국통신학회논문지
    • /
    • 제34권6B호
    • /
    • pp.585-594
    • /
    • 2009
  • RFID 리더에서의 효율적인 필터링은 RFID 시스템의 성능에 있어 중요한 요소이다. RFID 기술 사용이 보편화되면 태그 및 리더의 수가 크게 늘고 리더가 필터링 없이 수집한 태그 정보 모두를 그대로 RFID 응용 시스템으로 전달할 경우 통신망 및 응용 시스템에 부하를 증가시켜 성능에 악영향을 미치기 때문이다. 본 논문은 RFID 무선 프로토콜 구간 필터링과 무선 인식 후 필터링이라는 단계적인 필터링 기능 조합으로 효과적으로 필터링을 수행하는 방법을 제안한다. 특히 계산 기하학을 활용하여 무선 프로토콜 구간의 필터링을 효율적으로 수행할 수 있는 구체적 방법론을 제시하였다. 시뮬레이션을 통해 제안한 방법의 성능을 검증하였는데 무선 프로토콜 구간의 필터링 없이 수행한 순차적인 필터링에 비해 성능이 50% 정도 개선됨을 확인하였다.

동적 베이지안 네트워크를 이용한 동영상 기반의 화재연기감지 (Fire-Smoke Detection Based on Video using Dynamic Bayesian Networks)

  • 이인규;고병철;남재열
    • 한국통신학회논문지
    • /
    • 제34권4C호
    • /
    • pp.388-396
    • /
    • 2009
  • 본 연구는 CCD카메라로부터 입력된 영상을 분석하여 특징값을 추출하고, 패턴인식기술을 이용하여 화재연기영상을 감지하는 방법을 제안한다. 우선 CCD카메라로부터 획득된 영상들간의 차영상을 이용하여 움직임 영역만을 검출하고, 이후 연기색상모델을 적용하여 후보영역을 생성한다. 연기영역은 유사색상의 군집화를 이루고, 주변에 비해 단순한 질감을 가지며, 시간에 따른 모션정보의 상승 방향성을 가지는 특징을 가진다. 본 논문에서는 연기영역의 이러한 특성을 이용하여 학습영상으로부터 연기의 밝기, 웨이블릿 고주파 성분, 모션 벡터 등의 특징 값을 추출하고 이들 특징 값들에 대해 가우시안 확률 모델을 생성한다. 이렇게 추출된 확률모델은 연기영역의 시간적 연속성을 고려하기 위해 본 논문에서 새롭게 구성한 동적 베이지안 네트워크의 관찰노드에 적용된다. 본 논문에서 제안하는 방법은 산불을 비롯한 다양한 연기를 감지하였으며, 기존의 알고리즘에 비해 우수한 성능을 보여주었다.

이중 쐐기형 초음속 흡입구의 압력회복률에 대한 신뢰성 기반 최적설계 (Reliability Based Design Optimization for the Pressure Recovery of Supersonic Double-Wedge Inlet)

  • 이창혁;안중기;배효길;권장혁
    • 한국항공우주학회지
    • /
    • 제38권11호
    • /
    • pp.1067-1074
    • /
    • 2010
  • 본 연구에서는 이중 쐐기형 초음속 흡입구의 압력회복률에 대한 신뢰성 최적설계를 수행하였다. 주어진 설계영역에서 다양한 설계변수의 불확실성을 고려하여 흡입구의 압력회복률을 확률적으로 모델링하였으며, 목적함수로는 흡입구 항력을 선정하였다. 신뢰성 최적설계에 앞서 전산해석비용을 줄이기 위해 실험계획법과 크리깅 모델을 이용하여 적절한 설계공간을 탐색하였다. 신뢰성 기법의 정확도 검증을 위해 몬테카를로 시뮬레이션을 수행하였으며 이 결과를 신뢰성 기법 결과가 잘 추종함을 확인하였다. 신뢰성 기반 최적설계를 수행한 결과, 설계변수의 불확실성을 고려함으로써 시스템의 신뢰성을 확보하였다. 시스템 설계의 다양한 불확실성을 고려하기 위해서는 신뢰성 기반 최적설계가 유용한 접근방법임을 확인할 수 있었다.

지역간 철도의 확률적 통행배정모형 구측 연구 (A Stochastic Transit Assignment Model for Intercity Rail Network)

  • 권용석;김경태;임종훈
    • 한국철도학회논문집
    • /
    • 제12권4호
    • /
    • pp.488-498
    • /
    • 2009
  • 지역간 철도는 일반적인 대중교통의 특징 이외에도 노선의 수가 매우 많다는 등의 차별화되는 특징이 있다. 본 연구는 경로구간에 노선선택확률의 개념을 도입하여, 지역간 철도의 특징을 잘 반영할 수 있는 확률적 대중교통 통행배정모형을 제시하였다. 확률적 통행배정모형은 결정적 통행배정모형의 특성을 포함한 보다 일반화된 모형이다. 본 모형은 다양한 지역간 철도의 특징을 반영할 수 있으며, 기존의 도로 통행배정모형에서 많이 활용되고 있는 탐색알고리즘을 직접 활용하기 위해 대중교통 통행배정모형에서 적용되는 네트워크 확장을 단순화시킬 수 있다. 모형의 검증을 위해서 기존에 대표적으로 이용되는 선형 및 격자형 네트워크에서의 적용성을 검증하기 위해서 본 연구에서 제안한 해법을 사용하여 기존 모형과 비교하였다. 또한, 지역간 철도의 현실을 반영한 소규모 네트워크에서 기존 모형과의 예측 능력을 비교하였으며, 그 결과 본 연구에서 제시한 모형의 예측 능력이 가장 우수한 것으로 분석되었다.

전자 카탈로그에 대한 효율적인 색인어 통계 정보 관리 방법 (Efficient Management of Statistical Information of Keywords on E-Catalogs)

  • 이동주;황인범;이상구
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.1-17
    • /
    • 2009
  • 전자 카탈로그는 상품이나 서비스 정보를 저장하고 있는 전자 문서로, 전자 상거래에서 가장 중요한 자료 중 하나이다. 전자 카탈로그는 지속적으로 추가, 수정 혹은 삭제되면서 최신의 상태로 유지되게 되는데, 전자 카탈로그의 양이 많아지면서 중복이 발생하고, 부적합한 분류에 할당되는 등, 품질 유지 문제가 발생한다. 검색, 중복확인, 자동분류는 카탈로그 품질 관리를 위해 중요한 기능들인데, 이 기능을 구현하기 위해서 카탈로그에서 추출된 색인어들의 통계 정보를 활용한 확률 모델들이 제시되었다. 그러나 이들은 서로 독립적으로 다루어 졌기에, 카탈로그 관리 시스템이라 는 하나의 시스템에서 구현될 수 있음에도 불구하고, 각 모델들이 공유하는 데이터와 이를 관리하기 위한 데이터 관리 기법에 관한 연구는 미흡하였다. 따라서 본 논문에서는 세 기능을 위한 확률모델을 정리하고, 이를 관계형 데이터베이스 상에서 구현하고, 통계 정보를 효율적으로 관리하는 방법을 제시한다. 특히, 실체화 뷰를 이용하여 불필요한 응용의 개발 비용과 데이터 무결성 저해요인을 제거하였다. 다량의 실제 전자 카탈로그 데이터베이스에 대한 실험을 통해 관계형 데이터 베이스를 이용한 구현이 속도와 정확성에 있어 실용성이 있음을 보였고, 응용을 통한 통계 정보갱신 방법과의 비교를 통해 실체화 뷰를 활용한 통계 정보 관리 기법의 효용성을 보였다.

  • PDF

기상예보 정보 사용자 그룹의 만족가치 제고 방안: 강수예보를 중심으로 (Enhancing the Satisfaction Value of User Group Using Meteorological Forecast Information: Focused on the Precipitation Forecast)

  • 김인겸;정지훈;김정윤;신진호;김백조;이기광
    • 한국콘텐츠학회논문지
    • /
    • 제13권11호
    • /
    • pp.382-395
    • /
    • 2013
  • 기상정보 제공자들은 예보사용자들이 제공되는 예보서비스에 얼마나 만족하고 있는지를 알고 싶어 한다. 더 나은 예보서비스 제공을 위해서 각국의 기상 커뮤니티들은 사용자들의 만족도에 관한 다양한 설문조사를 진행하고 있다. 하지만 대부분의 설문조사들이 단순하게 사용자들이 얼마나 서비스에 만족하는지를 질문하고 있기 때문에 설문 결과의 설명력이 떨어지고, 예보서비스의 전략수립에 활용되기 어렵다. 본 연구에서는 예보의 가치를 평가하는 유용한 도구인 $2{\times}2$ 검증테이블에 기존의 비용-손실이 아닌 만족-불만족 개념을 적용하여 상해와 서울에서 제공된 24시간 강수예보의 만족가치를 도출하였다. 그리고 예보에 대한 개인의 만족가치뿐만 아니라 예보 사용자 그룹의 만족가치를 평가하였다. 그 결과, 확정예보 사용자 그룹의 만족가치를 높이기 위해선 예보 정확도의 향상이 유용하지만, 확률예보의 경우엔 사용자 그룹의 불만족 정도와 예보확률의 사용 분포를 파악하는 것이 중요한 것으로 나타났다. 따라서 기상 커뮤니티들이 예보 사용자들에게 더 나은 만족가치를 제공할 수 있는 방안을 찾는데 도움을 줄 수 있을 것이다.