• 제목/요약/키워드: Content-based Search

검색결과 517건 처리시간 0.026초

페이지 그룹 검색 그룹 모델 : 음란성 유해 정보 색출 시스템을 위한 인터넷 정보 검색 모델 (Page Group Search Model : A New Internet Search Model for Illegal and Harmful Content)

  • 육현규;유병전;박명순
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권12호
    • /
    • pp.1516-1528
    • /
    • 1999
  • 월드 와이드 웹(World Wide Web)에 존재하는 음란성 유해 정보는 많은 국가에서 사회적인 문제를 일으키고 있다. 그러나 현재 음란성 유해 정보로부터 미성년자를 보호하는 실효성 있는 방법은 유해 정보 접근 차단 프로그램을 사용하는 방법뿐이다. 유해 정보 접근 차단 프로그램은 기본적으로 음란성 유해 정보를 포함한 유해 정보 주소 목록을 기반으로 사용자의 유해 정보에 대한 접근을 차단하는 방식으로 동작한다.그런데 대규모 유해 정보 주소 목록의 확보를 위해서는 월드 와이드 웹으로부터 음란성 유해 정보를 자동 색출하는 인터넷 정보 검색 시스템의 일종인 음란성 유해 정보 색출 시스템이 필요하다. 그런데 음란성 유해 정보 색출 시스템은 그 대상이 사람이 아닌 유해 정보 접근 차단 프로그램이기 때문에 일반 인터넷 정보 검색 시스템과는 달리, 대단히 높은 검색 정확성을 유지해야 하고, 유해 정보 접근 차단 프로그램에서 관리가 용이한 검색 목록을 생성해야 하는 요구 사항을 가진다.본 논문에서는 기존 인터넷 정보 검색 모델이 "문헌"에 대한 잘못된 가정 때문에 위 요구사항을 만족시키지 못하고 있음을 지적하고, 월드 와이드 웹 상의 문헌에 대한 새로운 정의와 이를 기반으로 위의 요구사항을 만족하는 검색 모델인 페이지 그룹 검색 모델을 제안한다. 또한 다양한 실험과 분석을 통해 제안하는 모델이 기존 인터넷 정보 검색 모델보다 높은 정확성과 빠른 검색 속도, 그리고 유해 정보 접근 차단 프로그램에서의 관리가 용이한 검색 목록을 생성함을 보인다.Abstract Illegal and Harmful Content on the Internet, especially content for adults causes a social problem in many countries. To protect children from harmful content, A filtering software, which blocks user's access to harmful content based on a blocking list, and harmful content search system, which is a special purpose internet search system to generate the blocking list, are necessary. We found that current internet search models do not satisfy the requirements of the harmful content search system: high accuracy in document analysis, fast search time, and low overhead in the filtering software.In this paper we point out these problems are caused by a mistake in a document definition of the current internet models and propose a new internet search model, Page Group Search Model. This model considers a document as a set of pages that are made for one subject. We suggest a Group Construction algorithm and a Group Evaluation algorithm. And we perform experiments to prove that Page Group Search Model satisfies the requirements.uirements.

Sorting Instagram Hashtags all the Way throw Mass Tagging using HITS Algorithm

  • D.Vishnu Vardhan;Dr.CH.Aparna
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.93-98
    • /
    • 2023
  • Instagram is one of the fastest-growing online photo social web services where users share their life images and videos with other users. Image tagging is an essential step for developing Automatic Image Annotation (AIA) methods that are based on the learning by example paradigm. Hashtags can be used on just about any social media platform, but they're most popular on Twitter and Instagram. Using hashtags is essentially a way to group together conversations or content around a certain topic, making it easy for people to find content that interests them. Practically on average, 20% of the Instagram hashtags are related to the actual visual content of the image they accompany, i.e., they are descriptive hashtags, while there are many irrelevant hashtags, i.e., stophashtags, that are used across totally different images just for gathering clicks and for search ability enhancement. Hence in this work, Sorting instagram hashtags all the way through mass tagging using HITS (Hyperlink-Induced Topic Search) algorithm is presented. The hashtags can sorted to several groups according to Jensen-Shannon divergence between any two hashtags. This approach provides an effective and consistent way for finding pairs of Instagram images and hashtags, which lead to representative and noise-free training sets for content-based image retrieval. The HITS algorithm is first used to rank the annotators in terms of their effectiveness in the crowd tagging task and then to identify the right hashtags per image.

An Improved Combined Content-similarity Approach for Optimizing Web Query Disambiguation

  • Kamal, Shahid;Ibrahim, Roliana;Ghani, Imran
    • 인터넷정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.79-88
    • /
    • 2015
  • The web search engines are exposed to the issue of uncertainty because of ambiguous queries, being input for retrieving the accurate results. Ambiguous queries constitute a significant fraction of such instances and pose real challenges to web search engines. Moreover, web search has created an interest for the researchers to deal with search by considering context in terms of location perspective. Our proposed disambiguation approach is designed to improve user experience by using context in terms of location relevance with the document relevance. The aim is that providing the user a comprehensive location perspective of a topic is informative than retrieving a result that only contains temporal or context information. The capacity to use this information in a location manner can be, from a user perspective, potentially useful for several tasks, including user query understanding or clustering based on location. In order to carry out the approach, we developed a Java based prototype to derive the contextual information from the web results based on the queries from the well-known datasets. Among those results, queries are further classified in order to perform search in a broad way. After the result provision to users and the selection made by them, feedback is recorded implicitly to improve the web search based on contextual information. The experiment results demonstrate the outstanding performance of our approach in terms of precision 75%, accuracy 73%; recall 81% and f-measure 78% when compared with generic temporal evaluation approach and furthermore achieved precision 86%, accuracy 71%; recall 67% and f-measure 75% when compared with web document clustering approach.

스마트 센서와 시각적 기술자를 결합한 사진 검색 시스템 (Photo Retrieval System using Combination of Smart Sensor and Visual Descriptor)

  • 이용환;김흥준
    • 반도체디스플레이기술학회지
    • /
    • 제13권2호
    • /
    • pp.45-52
    • /
    • 2014
  • This paper proposes an efficient photo retrieval system that automatically indexes for searching of relevant images, using a combination of geo-coded information, direction/location of image capture device and content-based visual features. A photo image is labeled with its GPS (Global Positioning System) coordinates and direction of the camera view at the moment of capture, and the label leads to generate a geo-spatial index with three core elements of latitude, longitude and viewing direction. Then, content-based visual features are extracted and combined with the geo-spatial information, for indexing and retrieving the photo images. For user's querying process, the proposed method adopts two steps as a progressive approach, filtering the relevant subset prior to use a content-based ranking function. To evaluate the performance of the proposed scheme, we assess the simulation performance in terms of average precision and F-score, using a natural photo collection. Comparing the proposed approach to retrieve using only visual features, an improvement of 20.8% was observed. The experimental results show that the proposed method exhibited a significant enhancement of around 7.2% in retrieval effectiveness, compared to previous work. These results reveal that a combination of context and content analysis is markedly more efficient and meaningful that using only visual feature for image search.

모바일 TV 기반의 멀티미디어 콘텐츠 복합 검색 인터페이스 설계 (Design of Complex Retrieval User Interface for Multimedia Content based on Mobile TV)

  • 변재희;문남미
    • 정보통신설비학회논문지
    • /
    • 제9권3호
    • /
    • pp.119-123
    • /
    • 2010
  • Since the two-way interactive broadcasting service began, remote controllers have been fitted with 4 color buttons, which enable interaction and convenience to grow between users and content. With Currently, diverse studies on IPTV are in progress. Particularly, as the mobile market rapidly grows, studies on mobile IPTV and on linkage with other media are constantly increasing. Yet, mobile IPTV has never been studied as of now. In that sense, the present study attempted to design a mobile-based IPTV UI that is fitted with more usability and functionality of 4 color buttons and multi-dimensional search based on consistent criteria for content search. The UI designed in this study was estimated using user interface design guideline. The guideline is comprised of consistency, user centered, ease of use, forgiveness, feedback, functionality, aesthetic integrity.

  • PDF

임베디드 시스템을 이용한 이미지 검색 시스템 설계에 관한 연구 (A Study on Design of the Image Retrieval System Using Embedded System)

  • 김경수
    • 융합보안논문지
    • /
    • 제10권1호
    • /
    • pp.49-53
    • /
    • 2010
  • 최근, 멀티미디어는 인터넷의 확산과 하드웨어의 발전에 이르기까지 과거와 비교할 수 없을 만큼 형성, 제공, 그리고 공유되고 있다. 따라서 국제적으로 멀티미디어의 메타 데이터에 대한 적절한 표현을 제공하기 위해 MPEG-7의 표준이 설립되었다. 그리고 이미지 검색 중 MPEG-7을 사용한 멀티미디어의 다양한 데이터에 대한 연구가 진행되고 있다. 이미지 검색 시스템에는 meaning-based 검색과 content-based 검색이 있다. meaning-based 검색은 검색 속도가 빠른 것이 장점이지만, 이미지에 대한 기술적인 지식에 의해 기술과 정밀도가 영향을 받는다. content-based 검색은 이미지에 대한 의미와 사용자의 의도를 제대로 이해하지 못해 검색의 정확도가 감소하고 있다. 이 연구에서는 이러한 문제들을 해결하기 위해 두 가지 방법을 결합하여 검색 시스템을 설계하였다. 또한 시스템을 휴대용 장치 즉 휴대용 PDA 또는 스마트 폰으로 이미지 데이터를 검색하고 관리하기 위해 임베디드 시스템에 적용할 수 있도록 설계하였다. 이 시스템을 사용한다면, 휴대용 장치로 멀티미디어 데이터를 효율적으로 검색하고 활용할 수 있다.

An analysis of user behaviors on the search engine results pages based on the demographic characteristics

  • Bitirim, Yiltan;Ertugrul, Duygu Celik
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권7호
    • /
    • pp.2840-2861
    • /
    • 2020
  • The purpose of this survey-based study is to make an analysis of search engine users' behaviors on the Search Engine Results Pages (SERPs) based on the three demographic characteristics gender, age, and program studying. In this study, a questionnaire was designed with 12 closed-ended questions. Remaining questions other than the demographic characteristic related ones were about "tab", "advertisement", "spelling suggestion", "related query suggestion", "instant search suggestion", "video result", "image result", "pagination" and the amount of clicking results. The questionnaire was used and the data collected were analyzed with the descriptive statistics as well as the inferential statistics. 84.2% of the study population was reached. Some of the major results are as follows: Most of each demographic characteristic category (i.e. female, male, under-20, 20-24, above-24, English computer engineering, Turkish computer engineering, software engineering) have rarely or more click for tab, spelling suggestion, related query suggestion, instant search suggestion, video result, image result, and pagination. More than 50.0% of female category click advertisement rarely; however, for the others, 50.0% or more never click advertisement. For every demographic characteristic category, between 78.0% and 85.4% click 10 or fewer results. This study would be the first attempt with its complete content and design. Search engine providers and researchers would gain knowledge to user behaviors about the usage of the SERPs based on the demographic characteristics.

특징벡터의 끌러스터링 기법을 통한 2단계 내용기반 이미지검색 시스템 (Two-phase Content-based Image Retrieval Using the Clustering of Feature Vector)

  • 조정원;최병욱
    • 전자공학회논문지CI
    • /
    • 제40권3호
    • /
    • pp.171-180
    • /
    • 2003
  • 내용기반 이미지검색이란 색상, 형태 및 질감 등의 저-수준 특징정보를 이용하여 이미지 데이터베이스를 구축하고, 이미지에 대한 검색요구가 발생했을 때 사용자가 찾고자 하는 이미지와 유사한 이미지를 제공하는 시스템으로 정의된다. 데이터베이스의 구축시간과 사용자가 질의를 입력한 후 결과를 얻을 때까지의 반응시간을 나누어 고려할 때, 사용자는 반응시간에 보다 관심을 갖는 것이 일반적이다. 내용기반 이미지검색 시스템에서 질의이미지와 데이터베이스 내의 이미지와의 유사도 비교시간이 전체 반응시간 중에서 가장 큰 비중을 차지한다. 본 논문에서는 이러한 유사도 비교시간을 최소화하기 위해 특징벡터의 클러스터링 기법을 적용한 2단계 탐색방법을 제안한다. 실험 결과를 통해 제안하는 2단계 탐색방법으로 대용량의 이미지 데이터베이스 내의 전체 이미지에 대한 원 특징정보와 비교하는 전체검색에 비해, 동일한 적합성을 보장하면서 평균적으로 2배 이상의 검색속도 향상을 확인하였으며, 이미지의 수가 더욱 커질수록 효과적임을 입증하였다.

특징벡터의 차원축약 기법을 이용한 2단계 내용기반 이미지검색 시스템 (Two-stage Content-based Image Retrieval Using the Dimensionality Condensation of Feature Vector)

  • 조정원;최병욱
    • 한국통신학회논문지
    • /
    • 제28권7C호
    • /
    • pp.719-725
    • /
    • 2003
  • 내용기반 이미지검색 시스템에서는 색인과정으로 색상, 형태 및 질감 등의 특징정보를 추출하여 데이터베이스에 저장한다. 전체 검색 시스템 내에서 탐색이라 함은 특징정보 데이터베이스를 이용하여 질의이미지와 유사한 특징정보를 갖는 이미지를 찾아나가는 부분 과정으로 정의할 수 있다. 본 논문에서는 내용기반 이미지검색 시스템에서의 새로운 2단계 탐색방법을 제안한다. 제안하는 방법은 사용자가 질의를 입력한 후 결과를 얻을 때까지의 반응시간 중 가장 큰 비중을 차지하는 유사도 비교시간인 탐색시간을 최소화하기 위해 Cauchy-Schwartz 부등식의 특성을 이용하여 미리 특징벡터의 차원을 축약하여 저장하고, 이를 사용하여 검색범위를 최소화함으로써 검색속도를 향상시킬 수 있다. 실험결과를 통해 차원축약 기법을 이용하는 2단계 검색방법으로 기존 상세검색 방법과 비교하여, 동일한 검색 적합성을 보장하면서 대용량의 이미지 데이터베이스에서 월등한 탐색속도 향상을 확인하였으며, 특징벡터가 더욱 고차원화 되고 이미지의 수가 더욱 늘어날수록 효과적이었다.

내용기반 영상정보 검색기술에 관한 이론적 고찰 (A Study on Content-based Image Information Retrieval Technique)

  • 노진구
    • 한국도서관정보학회지
    • /
    • 제31권1호
    • /
    • pp.229-258
    • /
    • 2000
  • The growth of digital image an video archives is increasing the need for tools that efficiently search through large amount of visual dta. Retrieval of visual data is important issue in multimedia database. We are using contented-based visual data retrieval method for efficient retrieval of visual data. In this paper, we introduced fundamental techniques using characteristic values of image data and indexing techniques required for content-based visual retrieval. In addition we introduced content-based visual retrieval system for use of digital library.

  • PDF