• Title/Summary/Keyword: 단어 검색

Search Result 560, Processing Time 0.035 seconds

Weighted N-Gram Indexing for Image Search Engine (영상검색엔진을 위한 가중치 N-Gram색인 방법)

  • 이상열;정성호;황병곤
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2002.11a
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

A Study on Implementation for Web Search Program in Specific Web Site (특정 사이트내의 검색 프로그램 구현에 관한 연구)

  • Jang, Doc-Sung;Gu, Se-Wan
    • Annual Conference of KIPS
    • /
    • 2002.04b
    • /
    • pp.1243-1246
    • /
    • 2002
  • 본 논문은 검색엔진을 이용하여 대상 웹사이트의 링크 사이트 전체를 수집하고, 각 링크 사이트의 페이지를 인덱싱하여 데이터베이스화하는데, 특히 가장 최신의 페이지를 분류하여 시간에 의해 검색단어의 정확도가 가려지는 경우, 이를 이용할 수 있도록 하였다. 본 논문은 검색엔진에 의해 검색 서비스를 제공하는 기본적인 웹 로봇의 구현에 대한 연구이며, 웹 로봇의 역할은 크게 링크 사이트를 수집하는 것 이외에 제목, 메타태그, 멀티미디어 다운로드등의 역할들을 수행하며 이를 인덱싱 하여 데이터베이스화한다.

  • PDF

RGB 컬러의 Contour 개념을 이용한 직관적인 이미지 검색 설계

  • Lee, Ji-Min;Cho, Hee;Cha, ByungRae
    • Annual Conference of KIPS
    • /
    • 2009.04a
    • /
    • pp.257-260
    • /
    • 2009
  • 기존 이미지 검색사이트는 대부분 이미지 파일의 이름에 포함된 단어를 기반으로 검색을 수행하였다. 좀더 진보한 이미지 검색을 위해서 하세도표를 이용한 색 구성 영역을 데이터베이스화 하고 Contour개념을 이용하여 이미지 자체의 직관적인 검색이 가능하도록 하는 시스템을 제안한다.

Ontology-based Culture·Tourist Attraction Search Application (온톨로지 기반의 문화·관광지 검색 어플리케이션 구현)

  • Hwang, Tae-won;Seo, Jung-hee;Park, Hung-bog
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.772-774
    • /
    • 2017
  • Currently, there are many simple searches for local culture and tourism, but systematic information retrieval using ontology technology is weak. The keyword-based search, which is an existing search method, derives a search result that is different from a user's wanted intention. On the other hand, semantic search using ontology constructs shows the information related to the search term by creating a relation between words and words. Therefore, when tourists search for cultural and tourist attractions in the area, they provide information that includes meaning relevance in the search results. If the ontology provides information on the culture, sightseeing area, transportation, Can be more easily grasped. In this paper, we propose an ontology-based retrieval system based on culture and tourist sites utilizing public institutions database by using mobile application by extending search system which relied only on existing internal database to provide accurate and reliable information to users. This efficient structure of the ontology makes it possible to provide information suitable for the user quickly and accurately.

  • PDF

Development of the Operating and Management System for a Vocabulary Independent Speech Recognition System (단어독립 음성인식 시스팀을 위한 운용시스팀 개발)

  • 전예임
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.65-68
    • /
    • 1995
  • 이 논문은 현재 주식시장에 상장되어 있는 약 700개 회사의 현재주가를 음성인식을 이용하여 검색할 수 있는 대어휘, 화자독립, 단어독립 음성인식 시스팀의 운용자를 위한 운용관리 시스팀에 대해 기술하였다. KT-STOCK은 시스팀의 음성안내에 따라 사용자가 전화기에 상장회사 이름을 말하면, 이 시스팀은 그 회사의 현재 증권정보를 말해준다. 이 시스팀의 운용관리 시스팀은 주식시장에 상장된 종목의 변화에 따라서 인식대상 단어를 추가하거나 삭제, 조회할 때 그 처리를 용이하게 할 수 있도록 구현되었다.

  • PDF

Real-time Character Detection System Using EAST Model and OCR (EAST 모델과 OCR을 이용한 실시간 문자 탐지 시스템)

  • Ye-Jun Choi;Mikyeong Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.683-684
    • /
    • 2023
  • 웹페이지나 디지털 문서에는 특정 단어나 특정 문구를 검색하는 기능이 있다. 인쇄된 도서나 참고서 등과 같은 인쇄물에는 실시간으로 특정 단어나 특정 문구를 찾는 기능이 없어 어려움을 겪는 경우가 많다. 본 논문에서는 텍스트를 감지(Detection)하는 EAST 모델과 텍스트를 인식(Recognition)하는 EasyOCR을 활용한 실시간 문자 탐지 시스템의 개발내용에 대해 기술한다. 이 시스템을 통해 사용자는 인쇄물에서 실시간으로 원하는 단어나 문구를 찾아 필요한 정보를 빠르게 읽는 것에 효과적일 것을 기대한다.

  • PDF

Personalized Research Agent System Based on User Model Neural Network (사용자 모델 신경회로망을 기반으로 한 사용자 중심의 리서치 에이전트 시스템)

  • 송종길;김유신;조영임
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.321-323
    • /
    • 1999
  • 본 논문에서는 사용자가 자신이 연구하고 있는 분야에 관련된 웹 문서를 스스로 찾아서 보여 주는 PReA 시스템을 구현한다. 사용자의 성향을 파악하기 위해서 미리 작성된 서지 정보데이터를 사용자가 사용하는 것을 관찰하여 사용자 모델 신경회로망을 구축한다. 사용자 모델 신경회로망은 단어의 부하와 단어 사이의 부하로 구성되어 있어서 사용자의 정보 요구의 의미를 나타낼 수 가 있다. 사용자 모델 신경회로망을 기반으로 질의어를 생성하고 웹문서를 검색하며 검색된 문서에 대해 순위를 정한다. 순위가 정해진 문서중 사용자가 선택한 문서와 선택하지 않은 문서는 각각 사용자 모델 신경회로망을 학습하는데 쓰이게 되며 오랜 시간 동안 사용함에 따라 회로망은 사용자의 성향에 적응하게 되어 보다 정확한 검색을 수행하게 된다.

  • PDF

The Multimedia Sign Language Dictionary by Internet using JAVA - Web Sign (JAVA를 이용한 인터넷 멀티미디어 수화사전 - Web Sign)

  • 강석훈;우요섭
    • Journal of Biomedical Engineering Research
    • /
    • v.21 no.6
    • /
    • pp.591-598
    • /
    • 2000
  • 본 논문에서는 인터넷 멀티미디어 수화사전 Web-Sign을 설계 및 구현한다. Web-Sign은 여러 가지의 검색조건에 의한 수화동영상을 화면에 출력하고 관련 정보를 쉽게 찾아 볼 수 있는 특징이 있다. 또한 Web-Sign은 100% JAVA로 구현하였기 때문에 플랫폼과 OS의 영향을 거의 받지 않으며, 애플릿과 어플리케이션으로 모두 배포 가능한 장점을 가지고 있다. 웹 브라우저에 의한 접속은 애플릿을 자동으로 지원하며, 어플리케이션을 이용할 경우 모든 데이터는 On-Line 혹은 Off-Line 형태로 전송이 가능하다. 검색방법은 단어입력, 가나다순서별 선택, 동작정보(수위소)선택, 동작화면에 의한 선택, 수화 교과서〔10〕의 챕터순서별로 선택, 주제별 수화분류에 의한 단어선택 등을 이용할 수 있다. 현재까지 등록된 동영상은 현재까지 총 500 여개이며 각 동영상에 대한 시작 및 끝 화면의 정지영상 1000여개와 빠른 전송을 위한 동영상 1000여개를 참고자료로 가지고 있다. 본 논문에서 제안하는 Web-Sign은 많은 검색방법을 가지고 있고, 다양한 정보를 인터넷을 통해 제공할 수 있으므로, 사용자가 쉽게 접근하여 수화를 익힐 수 있을 것으로 판단된다.

  • PDF

다차원 이진트리를 기반으로 하는 한글 전자사전의 성능 분석

  • 김희철;이창식
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.3 no.1
    • /
    • pp.165-174
    • /
    • 1998
  • 본 연구는 기존의 한글 전자사전의 단점들인 과다한 검색 횟수, 비효율적인 주 기억장치 사용, 이미 구축된 사전에 새로운 단어에 대한 추가·삭제의 난이성 등을 해결할 수 있는 다차원 이진트리 구조 기반의 한글 전자사전의 설계 및 구현을 그 내용으로 하고 있다. 본 논문에서 구현된 한글 전자사전의 검색시간 성능평가를 위해 입력 키워드의 종류에 따라 실험1, 실험2 의 두가지 성능평가를 수행하였다. 실험1에서는 구현된 사전의 단어를 입력 키워드로 사용하여 실험하였으며 그 결과로서 제안한 사전구조가 검색 속도 면에서 기존의 트라이 사전구조보다 약 1.5배의 성능향상을 부여주고 있음을 보았다. 실험 2는 다차원 이진트리 구조의 한글 전자사전이 트라이 구조의 한글 전자사전보다 약 2.3배의 성능향상을 이루고 있음을 보여주고 있다. 한편, 사전 구축시 필요한 주기억장치 용량에 대한 성능평가 결과는 트라이구조사전은 1.987Kbyte를 가지는 반면 제안한 다차원 이진트리 구조의 한글 전자사전은 1.136Kbyte를 가지므로 약 1.8배의 성능향상을 보여주고 있다.

다차원 이진트리 기반의 한글 전자사전 구축기법

  • 김희철;신정훈;이용두;김영순
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1998.03a
    • /
    • pp.221-227
    • /
    • 1998
  • 본 연구에서는 지금까지 한글 전자사전이 가지고 있는 과다한 검색 횟수, 비효율적인 주기억 장치 사용, 이미 구축된 사전에 새로운 단어에 대한 추가·삭제의 어려움에 대한 단점들을 개선하기 위하여 다차원 이진트리 구조의 한글 전자사전을 구현한다. 본 논문에서 구현된 한글 전자사전의 검색시간 성능평가를 위해 입력 키워드의 종류에 따라 실험1, 실험2로 나누어 성능평가를 한 결과, 실험 1에서는 구현된 사전의 단어를 입력 키워드로 사용하여 실험한 결과 제안한 사전구조가 검색 속도면에서 기존의 트라이 사전구조 보다 약 1.5배 성능향상을 보여주고 있으며 실험 2 결과도 다차원 이진트리 구조의 한글 전자사전이 트라이 구조의 한글 전자사전보다 약 2.3배의 성능향상을 보여주고 있다. 한편 사전 구축 시 필요한 주 기억 장치 용량에 대한 성능평가 결과는 트라이구조사전은 1.987Kbyte를 가지는 반면 제안한 다차원 이진트리 구조의 한글 전자사전은 1.136Kbyte를 가지므로 1.8배의 성능 향상을 보여주고 있다.