• Title/Summary/Keyword: 텍스트 검색

Search Result 684, Processing Time 0.029 seconds

Design XML Meidator for Content-based Query Processing (내용기반 질의 처리하기 위한 XML Mediator)

  • Yoo, Cwang-Yul;Kim, Heung-Shik
    • Annual Conference of KIPS
    • /
    • 2001.10a
    • /
    • pp.47-50
    • /
    • 2001
  • 최근 인터넷의 발전으로 방대한 정보가 존재함에 따라 이들 정보들을 통합 관리할 필요성이 증대하고, 웹 검색 시스템의 서비스가 텍스트 뿐만 아니라 이미지나 사운드 데이터와 같은 멀티미디어 정보까지 보편화되어 검색의 결과로 서비스를 제공하고 있다. 기존의 검색결과를 보면 멀티미디어 데이터에 대한 검색결과는 부가적 정보로서 서비스를 제공하기 때문에 검색 결과에 대해서도 정확한 결과에 대한 서비스를 제공하지 못하고 있다. 본 논문에서는 XML기반에서 멀티미디어 데이터 소스에 대한 메타데이터를 DTD로 설계하여 내용기반 질의를 효과적으로 분산처리 할 수 있도록 Mediator를 설계한다.

  • PDF

A Study on the Video Information Retrieval System for Effective Management of Video data (동영상 자료의 효과적인 관리를 위한 검색시스템에 관한 연구)

  • Min, In-Sik;Lee, Sang-Hoon
    • Annual Conference of KIPS
    • /
    • 2001.10a
    • /
    • pp.213-216
    • /
    • 2001
  • 국방부문에 있어 항공에서 촬영되는 동영상들은 정보분석 측면에서 수많은 자료를 제공하고 있다. 그러나 이러한 자료는 Off-Line 상태에서 또는 국한된 네트웍에서 다루어지고 있으며, 비직관적인 텍스트 위주의 데이터로 가공되어 전파됨으로써 정보를 필요로 하는 여러 부대에 효과적으로 제공되지 못하고 있다. 본 연구에서는 항공에서 촬영된 동영상 정보를 디지털화하여 관리하기 위하여 동영상을 정보 분석 자료와 유기적으로 결합시킨 데이터베이스로 관리하고 이러한 정보를 국방망등의 인트라넷에서 이용하기 위해 자료요구 부대에서 효율적으로 동영상을 검색할 수 있는 동영상 정보 시스템을 설계하였다. 동영상 정보시스템은 검색의 다양성과 정확성을 위해 주석기반의 검색과 내용기반의 검색을 지원하는 시스템으로 설계하였다.

  • PDF

Development of an ontology-based knowledge search system: The case of KT call center (온톨로지 기반 지식 검색 시스템 개발: KT 콜센터 사례)

  • Ahn, Seyeol;Choi, Hyunsik
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.576-579
    • /
    • 2010
  • 콜센터의 고객문의는 복잡하여 기존 검색 시스템으로는 고객의 문제점을 신속하게 찾아 상담에 적용하는데 문제가 많았다. 온톨로지를 구축하고 시맨틱 검색을 제공할 경우 보다 보다 좋은 검색 기능을 제공할 것으로 기대되나 콜센터의 상담지식은 내용이 매우 복잡하여 그 텍스트의 내용을 완벽하게 온톨로지로 표현하는 것은 쉽지 않았다. 본 논문에서는 온톨로지 기반으로 구축된 지식베이스의 데이터 검색과 함께 그와 가장 관련성이 높은 문서를 출력하기 위해 문서를 온톨로지와 링크하여 어노테이션하는 방법을 제안한다. 본 시스템을 적용한 상담에서 상담원들의 생산성이 향상되고 고객 만족도를 높이는 결과를 확인했다.

Obscene Material Searching Method in WWW (WWW상에서 음란물 검색기법)

  • 노경택;김경우;이기영;김규호
    • Journal of the Korea Society of Computer and Information
    • /
    • v.4 no.2
    • /
    • pp.1-7
    • /
    • 1999
  • World-Wide Web(WWW) is a protocol for changing information exchanges which is central to text documents in the existing network to make a multimedia data exchanges. It is possible for a beginner to search and access data which he wants to find as data were stored in the form of hypertext. The easiness for searching and accessing the multimedia data in WWW makes a important role for obscene materials to be toward generalization and multimedia and occurs social problems for them to be commercialized, while other researchers have actively studied the way to block effectively the site providing obscene materials for solving such problems. This paper presents and implements the blocking method for the sites having obscene material as it effectively search them. The proposed model was based on Link-Based information retrieval method and proved that it accomplished more efficient retrieval of relevant documents than probabilistic model when compared the one with the other which is known to generate the most correct results. The improvements in the average recall and precision ratio were shown as 12% and 8% respectively. Especially, the retrieval capability of relevant documents which include non-text data and have a few links increased highly.

  • PDF

A Study on Information Retrieval Systems Integration Using Common Object Request Broker Architecture (CORBA기능을 이용한 정보검색시스템 통합에 관한 연구)

  • 최한석;김상미;남태우;손덕주
    • Journal of the Korean Society for information Management
    • /
    • v.13 no.2
    • /
    • pp.223-242
    • /
    • 1996
  • This study proposes an integration model of information retrieval systems using a standard distributed object computing technology in digital library environments. In the proposed integration model called DDIRIORB, the middleware broker based on CORBA is designed for the transparent access to the distributed information repositories and the consistent view of the information retrieval by applying 239.50 protocol. The DDIRIORB is an adaptable open architecture that allows for the following benefits : bibliographic and abstract information retrieval simultaneously, interoperability between application servers and clients, consistent view of search results, complexity reduction of integration interfaces, and easy to use.

  • PDF

Image retrieval integrated image contents and metadata (텍스타일 영상의 내용과 메타데이터의 결합을 통한 검색)

  • Kwon, Hye-Young;Kim, Keun-Ha;Kim, Ha-Yan;Lee, Kyoung-Mi;Park, U-Chang;Lee, Eun-Ok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.465-469
    • /
    • 2007
  • 본 논문에서는 텍스타일 영상의 내용 데이터와 메타데이터를 결합시킨 영상 검색 시스템을 제안한다. 섬유 패션의 정보를 가지고 있는 메타데이터와의 결합은 그 동안의 섬유 패션 산업과 관련된 영상 검색 시스템에서 진보된 것이다. 우선 메타데이터의 정보를 통해서 영상을 검색하게 된다. 검색된 영상 안에서 색상히스토그램과 색상스케치를 통하여 주어진 영상과 비슷한 영상들을 검색하게 된다. 이러한 방법은 영상내용만을 통해 검색했던 것 뿐만아니라 텍스트가 가지고 있는 의미를 보안하여 보다 효과적인 검색을 할 수 있었다. 본 논문에서 제안된 시스템에서 부가적인 기능인 돋보기 기능, 색상 히스토그램 기능, 색상 스케치 기능, 반복 패턴 보기 기능을 통해 검색된 영상들의 정보를 효과적으로 제공함으로써 사용자의 편의를 강화하였다.

  • PDF

The Advanced Effective Feature Extraction for Image Retrieval of an Automobile Head Lamp (자동차 전조등 영상검색을 위한 향상된 유효 특징 추출 방법)

  • Son, Byong-Hwan;Lee, Byeong-Il;Son, Sung-Kun;Choi, Heung-Kook
    • Annual Conference of KIPS
    • /
    • 2002.04a
    • /
    • pp.261-264
    • /
    • 2002
  • 자동차 전조등에서 나오는 데이터는 다양한 패턴을 가지는 영상자료와 부분적으로 보이는 문자자료이다. 내용기반 영상검색을 통해 자동차 전조등에서 검사자가 판독하는 텍스트와 부분적인 전조등의 영상정보로 차량의 정보를 추출하기 위한 검색 방법을 국립과학수사연구소의 자료를 기반으로 설계하였으며, 영상검색에 사용된 영상특징값의 구성과 영상 검색방법을 연구하였다. 본 논문에서는 영상데이터의 검색을 위해 효과적인 영상특징이 추출 되도록 향상된 방법론을 제시하였다. 특징함수에 대한 유효성 검증을 위해 샘플 영상에서 각 후보 특징함수들에 대한 결과값들을 비교하였으며, 이를 기반으로 유효한 특징함수를 찾아서 검색에 사용되어지도록 구성하였다. 사용되어진 영상의 특징값은 전조등 영상이 가지는 다수의 텍스쳐함수와 가로, 세로 성분값을 사용하였다. 영상 검색을 위해 추출된 영상 특징값을 데이터베이스화하고 용의차량의 전조등 영상을 질의 영상으로 하여 후보 차량에 대한 정보를 검색하도록 하였다.

  • PDF

Information Retrieval Management System KRISTAL-2001 (정보검색관리시스템 KRISTAL-2001)

  • Jin, Du-Seok;Seo, Jeong-Hyeon;Choe, Yun-Su;Choe, Seong-Pil;Kim, kwang-Yeong
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.7
    • /
    • pp.32-43
    • /
    • 2001
  • 정보화사회에 있어서 인간의 지적 활동에 필수적인 요소는 과학기술에 의존한 정보의 수집과 축적 및 검색과 이용이라고 할 수 있다. 이러한 요구에 따른 다양한 형태의 정보나 데이터를 효율적으로 구축, 유지, 운영할 수 있는 정보 검색시스템 개발의 중요성이 점차 증가하고있다. 특히, 웹과 컴퓨터의 보급이 확산됨에 따라 수많은 전자문서들이 생산되면서 기존의 검색시스템의 기능, 즉 정형적인 텍스트문서에 대한 단순한 불리언질의만으로는 사용자의 요구를 충족시킬 수 없게되었다. 따라서, 본 논문에서는 이러한 사용자 요구를 빠르고 정확하게 처리하기 위해 기존의 정보 검색시스템인 "KRISTAL-2001"의 특징은 저장엔진, 시스템제어기, 검색기, 색인기, 분산엔진 모듈이 각각 서버 역활을하며 통신을 통하여 상호간의 정보를 전달한다. 따라서 분산검색을 통한 빠른 질의처리가 가능하다는 장점을 가지고 있다. 그리고 문서 또는 문서그룹단위의 트랜잭션처리를 지원하기 때문에 데이터의 안정적인 저장 및 수정을 보장한다. 또한 구조문서, 멀티미디어 데이터등 다양한 형태의 데이터를 관리할 수 있기 특징을 가지고 있다. KRISTAL-2001은 순수 국내기술로 개발된 대용량 데이터를 위한 차세대 정보검색시스템으로서 국제 경쟁력 향상에 중요한 역할을 수행할 것으로 기대된다.

  • PDF

Analysis of Keyword-based Content Search Service Requirements in Video Archive for Media Creation (미디어 창작을 위한 비디오 아카이브 키워드기반 내용 검색 서비스 요구사항 분석)

  • Jung, Byunghee;Park, Wan;Lee, Yunseong;Lee, Hajoo;Kim, Sansung
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1265-1267
    • /
    • 2022
  • 방대한 분량의 콘텐츠 홍수 속에서 원하는 소재를 찾기 위해 콘텐츠 내용을 검색할 수 있는 효과적인 방법이 지원되는 것은 창작을 자유롭게 하고, 콘텐츠 활용도를 높이기 위해 매우 중요하다. KBS 바다 서비스의 경우 분류체계 방법을 사용하고 있으나. 최근 딥러닝을 이용한 인공지능 기술의 발전으로 콘텐츠의 내용을 인공지능 기술로 태깅하고, 태깅된 텍스트 정보를 이용하여 검색할 수 있는 기술 개발이 활발히 수행되고, 국가적으로도 해당 기술을 지원하고 있다. 본 논문에서는 이러한 기술 개발의 선행 요소인 방송사의 제작과정에서 요구되는 동영상 소재 콘텐츠 검색의 요구사항을 KBS 비디오 아카이브 검색 키워드 실제 사용 데이터를 이용하여 분석하였다. 약 1,000여건의 검색 키워드 분석과 이용자와 운영자의 응답 내용을 고찰한 결과, 특정 키워드에 집중하여 검색할 수 있도록 보완하여 주는 것이 필요함을 알아내었다. 또한, 검색 범위를 효과적으로 축소하여 검색을 손쉽고 빠르게 할 수 있는 방법을 고찰하였다. 본 논문에서는 미디어 창작에서 필요한 소재 콘텐츠를 찾기 위해 연구 개발해야 할 미디어 속성 추출 기술의 방향성을 제시하였다.

  • PDF

Interplay of Text Mining and Data Mining for Classifying Web Contents (웹 컨텐츠의 분류를 위한 텍스트마이닝과 데이터마이닝의 통합 방법 연구)

  • 최윤정;박승수
    • Korean Journal of Cognitive Science
    • /
    • v.13 no.3
    • /
    • pp.33-46
    • /
    • 2002
  • Recently, unstructured random data such as website logs, texts and tables etc, have been flooding in the internet. Among these unstructured data there are potentially very useful data such as bulletin boards and e-mails that are used for customer services and the output from search engines. Various text mining tools have been introduced to deal with those data. But most of them lack accuracy compared to traditional data mining tools that deal with structured data. Hence, it has been sought to find a way to apply data mining techniques to these text data. In this paper, we propose a text mining system which can incooperate existing data mining methods. We use text mining as a preprocessing tool to generate formatted data to be used as input to the data mining system. The output of the data mining system is used as feedback data to the text mining to guide further categorization. This feedback cycle can enhance the performance of the text mining in terms of accuracy. We apply this method to categorize web sites containing adult contents as well as illegal contents. The result shows improvements in categorization performance for previously ambiguous data.

  • PDF