• Title/Summary/Keyword: 문서 영상 검색

Search Result 78, Processing Time 0.028 seconds

Mashup for Instant and Simple Search using OpenAPIs (OpenAPI를 이용하여 간결함과 즉시성을 가진 검색 매쉬업)

  • Hwang, Ki-Tae
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.11 no.2
    • /
    • pp.41-49
    • /
    • 2011
  • This paper introduces a new search model which can retrieve information instantly and easily about a given search word on Internet and control search spaces diversely. In the existing web searches, because the user has to stop his work, run web browsers, connect to special internet sites, and type the search word by keyboard. it is a long way and not a simple way. Also the search result is too much. The user suffers difficulties of multiple searches for different categories such as dictionary, image, video clips, etc. The software implemented in this paper enables for the user to select search word simply at any documents on the screen and make search started by simply pressing CRTL key and left button of the mouse simultaneously. The software is a mash up style using the Open API which is provided by a web site and can be freely available in any other sites. By calling different Open APIs of several web sites, the mash-up software can integrate search functions of many different sites. We evaluate that the software implemented in this paper will be a good reference of mash-up as one with characteristics of easy and instant search, simple result, diversity of search category, and scalability of search functions.

Weighted N-Gram Indexing for Image Search Engine (영상검색엔진을 위한 가중치 N-Gram색인 방법)

  • 이상열;정성호;황병곤
    • Proceedings of the Korea Society of Information Technology Applications Conference
    • /
    • 2002.11a
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기발에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

Weighted N-Gram Indexing for Image Search Engine (영상검색엔진을 위한 가중치 N-Gram색인 방법)

  • 이상열;정성호;황병곤
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2002.11a
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

Multimedia Retrieval using Relevance Feedback (적합성 피드백을 이용한 멀티미디어 검색)

  • Lee, Pal-Jin;Yun, Bo-Hyun;Choi, Eun-Ha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.101-104
    • /
    • 2002
  • 본 문서에서는 사용자 적합성 피드백을 적용한 멀티미디어검색 기법을 제안한다. 적합성 피드백은 멀티미디어검색에 있어 사용자가 요구하는 정보를 반영할 수 있어 영상의 검색 효율을 높일 수 있다. 이 실험에서는 긍정적 피드백과 부정적 피드백을 함께 사용하였다. 실험결과, 적합성 피드백을 이용하면 적은 횟수의 반복검색으로 우수한 결과를 얻을 수 있음을 알 수 있다.

  • PDF

An Indexing Model for Effective Retrieval of Multimedia Data Based on XML (XML 기반 멀티 미디어 데이터의 효과적인 검색을 위한 색인 모델)

  • Ko, Eun-Kyung;Hwang, Bu-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1895-1898
    • /
    • 2002
  • 웹 환경에서 처리하는 데이터의 종류가 텍스트에서 비디오, 오디오와 같은 멀티미디어 데이터까지 다양해지면서 데이터를 효율적으로 표현, 저장 및 검색하기 위한 다양한 방법이 연구되고 있다. 이 논문에서는 동영상 데이터의 구조적인 형태를 고려하여 XML 문서로 표현하고 XML 문서를 데이터베이스에 저장하기 위한 데이터베이스 스키마를 설계하였다. 그래서 XML 문서내의 각 노드에 엘리먼트의 고유성을 나타내기 위한 고유식별자와 부모노드와 자식노드들 간의 관계를 표현하여 주기 위한 엘리먼트 식별자와 ETID를 결합하여 멀티미디어 데이터에 대한 XML 문서의 부모와 자식의 관계를 표현하여 준다. 그리고 부모가 같은 형제간의 순서 정보와 형제들 간의 동일한 타입을 구별하고 정보를 표현하기 위한 관계 테이블을 설계하였다.

  • PDF

Document Image Segmentation and Classification using Texture Features and Structural Information (텍스쳐 특징과 구조적인 정보를 이용한 문서 영상의 분할 및 분류)

  • Park, Kun-Hye;Kim, Bo-Ram;Kim, Wook-Hyun
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.11 no.3
    • /
    • pp.215-220
    • /
    • 2010
  • In this paper, we propose a new texture-based page segmentation and classification method in which table region, background region, image region and text region in a given document image are automatically identified. The proposed method for document images consists of two stages, document segmentation and contents classification. In the first stage, we segment the document image, and then, we classify contents of document in the second stage. The proposed classification method is based on a texture analysis. Each contents in the document are considered as regions with different textures. Thus the problem of classification contents of document can be posed as a texture segmentation and analysis problem. Two-dimensional Gabor filters are used to extract texture features for each of these regions. Our method does not assume any a priori knowledge about content or language of the document. As we can see experiment results, our method gives good performance in document segmentation and contents classification. The proposed system is expected to apply such as multimedia data searching, real-time image processing.

The Multimedia Searching Behavior of Korean Portal Users (국내 포털 이용자들의 멀티미디어 검색 행태 분석)

  • Park, So-Yeon
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.44 no.1
    • /
    • pp.101-115
    • /
    • 2010
  • The main difference between web searching and traditional searching is that the web provides and supports multimedia searching. This study aims to investigate the multimedia searching behavior of users of NAVER, a major Korean search portal. In conducting this study, the query logs and click logs of a unified search service were analyzed. The results of this study show that among the multimedia queries submitted by users, audio searches are the dominant media type, followed similarly by video and image searches. On the other hand, among the multimedia documents clicked on, video is the most popular collection type followed by image and audio collections. Entertainment is the most popular topic in both multimedia queries and clicks. The results of this study can be implemented for the portal's development of multimedia content and searching algorithms.

JDBC based Distributed Image search Web Agent (JDBC를 이용한 분산 환경에서의 이미지 검색 웹 에이전트)

  • 차상환;황병곤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.644-651
    • /
    • 2004
  • 본 논문은 웹상에 존재하는 이미지를 멀티 스레드에 의한 분산 아키텍처를 이용하여 수집 및 검색 시스템으로, 웹문서에 나타나는 텍스트중 이미지의 이름이나 확장자 그리고 링크에 붙어 있는 텍스트를 추출하여 이미지 자료를 JDBC를 이용하여 데이터베이스화하였다. 이 데이터베이스에 저장된 이미지 자료는 웹 브라우저에서 질의자의 스케치에 의한 검색과 그리고 예제 영상 질의로 검색하는 방법을 제시하여 질의 효율성을 개선하였다. 또한, 멀티 스레드를 이용한 분산 아키텍처를 이용하여, 데이터베이스화 하는 시간에 효율을 개선하였다.

  • PDF

The Optimization of Near Duplicate Detection Using Representative Unigram Grouping (대표 Unigram 군집화를 통한 유사중복문서 검출 최적화)

  • Kwon, Young-Hyun;Yun, Do-Hyun;Ahn, Young-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.291-293
    • /
    • 2012
  • SNS, 블로그의 이용이 늘어나면서, 문서의 복제와 재생산이 빈번하게 발생함에 따라 대용량 문서에서의 유사중복문서 검출이 큰 이슈로 제기되고 있다. 본 논문에서는 한국어 문서를 대상으로 이러한 문제를 해결하기 위해 품질을 유지하면서 신속하게 문서집합 중 유사중복문서를 검출하는 방법에 대해 제안한다. 제안하는 알고리즘에서는 문서를 대표하는 고빈도 Unigram Token을 활용하여 문서를 군집화함으로써 비교 대상을 최소화 하였다. 실험결과, 76만 문서에서 기존 방법 대비 평균 0.88의 Recall을 유지하면서도 중복을 검출하는데 있어서 십수초내에 처리가 가능함을 보였다. 향후 대용량 검색시스템 및 대용량 이미지, 동영상 유사중복 검출에도 활용할 수 있을 것으로 기대한다.

Advanced Documents Authoring Tool (Advanced Documents 저작 도구)

  • Hong, Kwang-Jin;Jung, Kee-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.903-906
    • /
    • 2005
  • 프로젝션 디스플레이 시스템(PDS)을 사용한 Advanced Paper Document (APD)는 오프라인 문서와 온라인 문서의 장점을 모두 가지고 있다. PDS는 가상의 물체를 실제 세계에 공간적으로 연결하여 줌으로써 사용자에게 더욱 풍부한 정보를 제공할 수 있다. 본 논문은 단순하게 오프라인 문서에 대한 온라인 정보를 보여주는 APD의 기능을 확장한, 사용자가 직접 오프라인 문서에 온라인 정보들을 삽입, 삭제, 수정할 수 있는 Advanced Documents Authoring Tool (ADAT)을 제안한다. ADAT는 PDS 위에 놓여진 실제의 오프라인 문서와 가상의 온라인 정보를 직관적으로 연결해준다. 사용자가 전자펜을 통하여 문서를 선택하면, 작업 공간 위쪽에 설치된 카메라를 통하여 문서의 영상을 입력받고, 해당 문서의 기존에 저장되어있는 정보를 검색한 후, 프로젝터를 통하여 문서 위에 투영해줌으로써, 사용자에게 온라인 정보를 제공한다.

  • PDF