• 제목/요약/키워드: Information retrieval techniques

검색결과 275건 처리시간 0.025초

Real-time Knowledge Structure Mapping from Twitter for Damage Information Retrieval during a Disaster

  • Sohn, Jiu;Kim, Yohan;Park, Somin;Kim, Hyoungkwan
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.505-509
    • /
    • 2020
  • Twitter is a useful medium to grasp various damage situations that have occurred in society. However, it is a laborious task to spot damage-related topics according to time in the environment where information is constantly produced. This paper proposes a methodology of constructing a knowledge structure by combining the BERT-based classifier and the community detection techniques to discover the topics underlain in the damage information. The methodology consists of two steps. In the first step, the tweets are classified into the classes that are related to human damage, infrastructure damage, and industrial activity damage by a BERT-based transfer learning approach. In the second step, networks of the words that appear in the damage-related tweets are constructed based on the co-occurrence matrix. The derived networks are partitioned by maximizing the modularity to reveal the hidden topics. Five keywords with high values of degree centrality are selected to interpret the topics. The proposed methodology is validated with the Hurricane Harvey test data.

  • PDF

공간 개념 계층에 따른 STOMP(FW) 알고리즘의 정확도 분석 (Precision Analysis of the STOMP(FW) Algorithm According to the Spatial Conceptual Hierarchy)

  • 이연식;김영자;박성숙
    • 한국산학기술학회논문지
    • /
    • 제11권12호
    • /
    • pp.5015-5022
    • /
    • 2010
  • 기존의 패턴 탐사 기법들은 대부분 객체가 갖는 공간 정보의 연속적인 변화에 대한 패턴 탐사는 가능하나, 추출하고자 하는 패턴에 반드시 포함되어야 하는 공간 정보에 대한 제약이 없어 특정 지점들 사이의 최적 경로 탐색 문제나 단위기간 동안 이동 객체가 순회해야 하는 지점들에 대한 경로 예측 문제 등에 적용하기 어렵다. 본 논문에서는 Road Network 상의 특정한 지점들 사이를 이동한 객체의 위치 데이터들 중 최다 빈발 패턴과 시간 및 비용 등의 가중치를 복합적으로 고려하여 최적의 이동 경로를 탐색하는 방법(Spatial-Temporal Optimal Moving Pattern(with Frequency & Weight) algorithm)[13]을 이용하여, 공간 개념 계층에 따른 경로 탐색의 정확도를 분석한다. 분석의 결과는 패턴 탐사 과정에 있어 공간 제약을 적용하여 검색 데이터 범위를 축소함으로써 데이터베이스 검색 시간을 최소화함을 보이고, 또한 공간 추상 계층의 각 계층별 영역 내 포함여부를 고려함으로써 효율적으로 최적 이동 패턴을 탐색하여 제공하도록 한다.

비디오 콘텐츠를 위한 색인 온톨로지 저장소 (Index Ontology Repository for Video Contents)

  • 황우연;양정진
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1499-1507
    • /
    • 2009
  • 나날이 방대해지는 디지털 콘텐츠들의 홍수 속에서 원하는 정보를 찾아내는 데 필요한 정밀한 색인 기술의 필요성은 날로 증대되어 가고 있다. 이러한 요구 수용을 위해서는 지능형 개체가 정보의 검색 주체가 되어야 하며, 지능형 개체간의 상호 운용성이 뒷받침되어져야 한다. 본 논문에서는 Snoek, Worring들이 제안한 다중 형상 색인을 위한 통합 기반구조를 분석하고 콘텐츠 기반의 자동화된 색인 기법에서 색인정보의 신뢰성을 높이기 위한 방법을 살펴본다. 그리고 이를 통해 시맨틱 웹 기술의 온톨로지 개념을 적용하여 추상화된 색인 정보의 생성과 제어를 지원하고 사람과 기계간, 기계와 기계간의 의미적 상호 운용성이 보장되는 기반 모델을 제시하고자 한다. 온톨로지의 메모리 상주 모델 처리 방식은 방대한 색인 정보를 수용하기에 부적절하기 때문에 온톨로지 저장소의 사용을 필요로 하며, 논리적으로 표현된 지식의 일관성과 추론을 위해 추론엔진의 사용이 요구된다. 본 논문에서는 온톨로지 저장소의 기능 및 성능적인 요구사항을 모두 만족시키는 Minerva 온톨로지 저장소를 이용하여 비디오 콘텐츠를 표현한 설계 지식을 저장하고 회수하는 실험을 하였다. 또한 마지막으로는 다른 연구과제들과 연계한 효율적인 색인 가능성에 대해 고찰해 본다.

  • PDF

퍼지적분을 이용한 내용기반 검색 사용자 의견 반영시스템 (Relevance Feedback for Content Based Retrieval Using Fuzzy Integral)

  • Young Sik Choi
    • 인터넷정보학회논문지
    • /
    • 제1권2호
    • /
    • pp.89-96
    • /
    • 2000
  • 영상의 유사성에 대한 사용자의 주관적인지를 학습하는 방법으로 relevance feedback 기술이 사용되며, 최근 들어 이에 대한 관심이 높아지고 있다. 대부분의 relevance feedback기술은 영상 유사성을 측정하는데 사용되는 특징이 서로 독립적이라는 가정하고 있으나, 이러한 가정은 유사성 판단을 모델링 하는데 있어서 상당한 제약을 두는 것이다. 이 논문에서는. 퍼지 측정과 Choquet 적분을 이용하여, 유사성 판단에 대한 보다 나은 모델링 방법을 제안하고, 이를 이용한 relevance feedback 알고리즘을 제안한다. 실험결과를 통하여, 기존의 가중치 평균 방식에 의한 relevance feedback보다 제안된 방식이 우수함을 보인다.

  • PDF

Deterministic Estimation of Stripe Type Defects and Reconstruction of Mask Pattern in L/S Type Mask Inspection

  • Kim, Wooshik;Park, Min-Chul
    • Journal of the Optical Society of Korea
    • /
    • 제19권6호
    • /
    • pp.619-628
    • /
    • 2015
  • In this paper, we consider a method for estimating a stripe-type defect and the reconstruction of a defect-free L/S type mask used in lithography. Comparing diffraction patterns of defected and defect-free masks, we derive equations for the estimation of the location and size of the defect. We construct an analytical model for this problem and derive closed form equations to determine the location and size using phase retrieval problem solving techniques. Consequently, we develop an algorithm that determines a defect-free mask pattern. An example shows the validity of the equations.

AUTOMATED INTEGRATION OF CONSTRUCTION IMAGES IN MODEL BASED SYSTEMS

  • Ioannis K. Brilakis;Lucio Soibelman
    • 국제학술발표논문집
    • /
    • The 1th International Conference on Construction Engineering and Project Management
    • /
    • pp.503-508
    • /
    • 2005
  • In the modern, distributed and dynamic construction environment it is important to exchange information from different sources and in different data formats in order to improve the processes supported by these systems. Previous research has demonstrated that (i) a significant percentage of construction data is stored in semi-structured or unstructured data formats (ii) locating and identifying such data that are needed for the important decision making processes is a very hard and time-consuming task. In this paper, an automated methodology for the classification and retrieval of construction images in AEC/FM model based systems will be presented. Specifically, a combination of techniques from the areas of image processing, computer vision, and content-based image retrieval have been deployed to develop a method that can retrieve related construction site image data from components of a project model.

  • PDF

영역기반 이미지 검색을 위한 칼라 이미지 세그멘테이션 (Color Image Segmentation for Region-Based Image Retrieval)

  • 황환규
    • 전자공학회논문지CI
    • /
    • 제45권1호
    • /
    • pp.11-24
    • /
    • 2008
  • 효율적인 저차원의 인덱싱을 제공하기 위해 이미지를 유사한 성질을 갖는 영역으로 나누고, 나누어진 영역에 대해 유사성을 비교하는 영역 기반 이미지 검색이 제안되었다. 그러나 영역 기반 이미지 검색은 이미지를 유사한 영역으로 나누기 위한 이미지 세그멘테이션 기술이 추가적으로 필요하다. 일반적인 칼라 자연 이미지의 경우 다양한 칼라와 질감 성분을 갖는 영역으로 나누는 것은 많은 어려움이 있다. 본 논문에서는 자동적인 칼라 이미지 세그멘테이션 알고리즘을 제안한다. 제안하는 세그멘테이션 방법은 양자화를 통해 칼라수를 줄이고 양자화 된 이미지를 Fisher의 클래스 선형 판별식을 이용하여 이미지의 전체적인 에지를 보여주는 그레이 레벨 이미지를 생성한다. 이렇게 얻은 그레이 레벨 에지 이미지를 지역적 임계치 비교를 통해 이진 에지 이미지로 변환하고 이진 에지의 끊어진 부분을 찾아내어 인접 에지에 연결하여 영역을 생성한다. 마지막으로 나누어진 영역간의 유사성을 비교하고 유사한 영역을 병합하여 최종 세그멘테이션 결과 이미지를 생성한다. 본 논문에서는 세그멘테이션 알고리즘을 이용한 영역 기반 이미지 검색 시스템을 구현하였으며, 다양한 실험에 의하면 제안한 세그멘테이션 방법이 다양한 이미지에 대하여 양질의 세그멘테이션 결과를 보이는 것으로 나타났다.

Syslog 데이터의 의미론적 검색을 위한 XML 기반의 모델링 (XML-based Modeling for Semantic Retrieval of Syslog Data)

  • 이석준;신동천;박세권
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.147-156
    • /
    • 2006
  • 이벤트 로깅은 시스템 및 네트워크 관리에 있어 그 역할이 증대되고 있으며, syslog는 해당 분야에 있어 사실상의 표준으로 사용되고 있다. 그러나 대부분의 로그 분석은 반구조적 특징을 보이는 로그 형식으로 인하여 빈번히 출현하는 패턴에만 집중하고 있다. XML은 syslog 데이터를 구조화하는 데 있어 유용한 방식을 제공하고 정보 탐색을 용이하게 해 준다. 하지만 이전의 XML 형식들 및 어플리케이션들은 로그 데이터를 위한 순위 기반 검색이나 유사도 측정 등과 같은 의미론적 접근에 적합하지 않다. 본 논문에서는 XML 기반의 순위 키워드 검색 기법을 기초로, 새로운 로그 데이터 모델링을 통해 syslog 데이터를 위한 XML 트리 구조를 제안한다. 그리고 기존의 XML 구조보다 의미론적 검색에 적합함을 보인다.

COVA: 내용 기반 강의 검색을 지원하는 원격 학습 시스템 (COVA: A Distance Learning System supporting Content-based Lecture Retrieval)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.99-107
    • /
    • 2004
  • 인터넷, 데이타베이스, 멀티미디어 기술의 복합적인 영향으로 교육과 학습의 형태가 크게 변하고 있다. 그러나 강의 내용을 효과적으로 관리하고 검색할 수 있는 시스템과 도구의 부족으로 원격 학습은 크게 효과적이지 못하다. 이 논문은 대용량 강의 데이타베이스에서 사용자가 내용에 기반 하여 관심 있는 강의 부분만 발췌하여 접근할 수 있도록 하는 프로토타입 시스템 COVA를 소개한다. COVA는 원격 학습에서 내용 기반 강의 검색을 위한 다음과 같은 새로운 기법을 포함한다: (1) 강의 내용을 표현하기 위한 XML 기반의 준 구조적(semistructured) 데이타 모델, (2) XML 강의 데이타베이스의 구조적 요약, 즉, 스키마 추출 기법: (3) 원하는 강의 부분의 빠른 탐색을 위한 색인 기법.

Issues and Empirical Results for Improving Text Classification

  • Ko, Young-Joong;Seo, Jung-Yun
    • Journal of Computing Science and Engineering
    • /
    • 제5권2호
    • /
    • pp.150-160
    • /
    • 2011
  • Automatic text classification has a long history and many studies have been conducted in this field. In particular, many machine learning algorithms and information retrieval techniques have been applied to text classification tasks. Even though much technical progress has been made in text classification, there is still room for improvement in text classification. In this paper, we will discuss remaining issues in improving text classification. In this paper, three improvement issues are presented including automatic training data generation, noisy data treatment and term weighting and indexing, and four actual studies and their empirical results for those issues are introduced. First, the semi-supervised learning technique is applied to text classification to efficiently create training data. For effective noisy data treatment, a noisy data reduction method and a robust text classifier from noisy data are developed as a solution. Finally, the term weighting and indexing technique is revised by reflecting the importance of sentences into term weight calculation using summarization techniques.