• 제목/요약/키워드: 텍스트 검색

검색결과 677건 처리시간 0.027초

한글 하이퍼텍스트 자동변환시스팀의 설계 및 구현 (The Design & Implementation of Korean Hypertext Automatic Translator)

  • 안병익;김재군;김영환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.91-98
    • /
    • 1993
  • 하이퍼텍스트는 문서검색 전산화의 새로운 대안을 제시하고 있으나 저작에 많은 시간과 노력이 요구되는 단점이 있다. 본 연구에서는 기존의 한글문서를 하이퍼텍스트 문서로 자동 변환하는 변환시스팀을 설계, 구현하였다. 문서는 사용자가 제공한 부제목형식의 정규표현식(regular expression)으로부터 논리적 구조가 분석되며 문서분할, 형태소분석, 대표카드결정 및 링크생성의 과정을 거쳐 하이퍼텍스트 문서로 변환된다. 시험운용 결과 본 시스팀은 대량의 한글문서를 적은 노력으로 실용성있는 하이퍼텍스트 문서로 자동 변환할 수 있음을 입증하였다.

  • PDF

텍스트 문서 인식을 위한 학습 기반 단어 분할 (Learning-based Word Segmentation for Text Document Recognition)

  • 로말리자쟝피에르;문광석;박한훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.41-42
    • /
    • 2018
  • 텍스트 문서 영상으로부터 단어를 검출하고, LLAH(locally likely arrangement hashing) 알고리즘을 이용하여 이웃 단어 사이의 기하 관계를 표현하는 특징 벡터를 계산한 후, 특징 벡터를 비교함으로써 텍스트 문서를 효과적으로 인식하거나 검색할 수 있다. 그러나, 이는 문서 내 각 단어가 정확하고 강건하게 검출된다는 전제를 필요로 한다. 본 논문에서는 텍스트 내 각 라인을 검출하고, 각 라인 내에서 단어 사이의 간격과 글자 사이의 간격을 깊은 신경망(deep neural network)을 이용하여 학습하고 분류함으로써, 보다 카메라와 텍스트 문서 사이의 거리나 방향이 동적으로 변하는 조건에서 각 단어를 강건하게 검출하는 방법을 제안한다. 모바일 환경에서 제안된 방법을 구현하였으며, 실험을 통해 단어 사이의 간격과 글자 사이의 간격을 92.5%의 정확도로 구별할 수 있으며, 이를 통해 동적인 환경에서 단어 검출의 강건성을 크게 개선할 수 있음을 확인하였다.

  • PDF

이미지 유사도를 이용한 와인라벨 인식 시스템 (Wine Label Recognition System using Image Similarity)

  • 정종문;양형정;김수형;이귀상;김선희
    • 한국콘텐츠학회논문지
    • /
    • 제11권5호
    • /
    • pp.125-137
    • /
    • 2011
  • 최근 휴대폰 카메라로 촬영한 영상을 입력으로 사용하는 시스템에 대한 연구가 활발히 이루어지고 있다. 본 논문에서는 와인라벨의 문자를 인식한 후, 데이터베이스내의 와인이미지들 중에서 입력 와인라벨 이미지와 유사한 순서대로 사용자에게 보여주는 시스템을 제안한다. 이미지의 유사도 계산을 위해 본 논문에서는 이미지의 각 영역별 대표색상, 텍스트 영역의 텍스트 색상과 배경색상, 그리고 특징점의 분포를 특징으로 사용한다. 이미지의 색상차를 계산하기 위해 RGB색상을 CIE-Lab색상으로 변환하여 사용하고, 특징점은 해리스코너 검출 알고리즘을 사용하여 추출한다. 각 셀의 대표 색상차와 텍스트 색상차 및 배경 색상차는 가중치를 적용하여 색상차 유사도를 계산하고 색상차 유사도와 특징점 분포 유사도를 정규화하여 최종 이미지 유사도를 구한다. 본 논문에서는 입력 이미지와 데이터베이스내의 이미지 간의 유사도를 계산하여 유사도 순으로 사용자에게 검색 결과를 보여줌으로써 검색 결과로부터 다시 최대 유사 와인라벨을 수동으로 찾는 노력을 줄일 수 있다.

GUI 환경에서 검색작업의 수행도에 관한 연구 -감성을 고려한 색을 중심으로-

  • 심준형;이근희
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1995년도 추계학술대회논문집
    • /
    • pp.192-200
    • /
    • 1995
  • 본 연구에서는 점차 사용이 증가하고 있는 GUI 환경의 작업에서, 인간의 감 성인석을 색에 적용하고 이에 대한 수행도를 분석하고자 하였다. 실험은 우선 텍스트만 있는 윈도우와 색이 있는 윈도우와의 검색 시간을 비교하였다. 그리 고 색의 세 가지 속성인 색상, 채도, 명도와 검색 시간과의 관계를 알아보기 위해 색상, 채도, 명도, 거리를 독립변수로 하고 검색 시간을 종속변수로 하여 실험을 하였다. 그리고 색에 대한 인간의 감성 인식을 알아보고, 감성 인식을 고려한 색의 실질적인 수행도에 대해서도 분석하였다. 통계분석 결과, 색이 있는 환경에서의 검색 시간은 악 50.31% 향상되었으며, 색상과 채도의 수준 차이는 검색 시간에 유의한 것으로 나타났다. 색상의 경우는 녹색,적색 순 으로 검색 시간이 좋았으며, 채도의 경우는 회색이 적게 포함된 경우 검색 시간이 향상되었다. 그리고 감성을 고려한 색도 검색 시간이 향상된 것으로 나타났다. 본 연구는 여러 산업환경과 디자인 측면에 인간의 감성을 고려하 고 적용하는데 있어, 실질적인 수행도를 향상시키는 감성구현 방법과 이에 대 한 검증을 제시하고자 한다.

  • PDF

이미지 데이타 클러스터링을 이용한 검색 연구 (Study on the searching of images via clustering)

  • 김진옥;황대준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.97-100
    • /
    • 2002
  • 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들은 텍스트기반의 데이터에 비하여 대용량이고 비정형적인 특성을 가지기 때문에 검색이 어렵다. 또한 멀티미디어 데이터의 특징은 행렬이나 벡터의 형태로 표현되기 때문에 완전일치 검색이 아닌 유사 검색을 수행하여 사용자가 원하는 이미지와 유사한 이미지를 검색해야 한다. 본 연구에서는 멀티미디어 데이터 검색에 클러스터링와 인덱싱 기법을 같이 적용하여 유사한 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제안한다 제안 검색 방법은 클러스터링을 생성하는 알고리즘과 해싱기법의 인덱싱을 같이 적용함으로써 VQ(Vector Quantization)보다 높은 재현율과 정확도를 보인다.

  • PDF

XML기반 멀티미디어 검색시스템의 설계 (Design of Multimedia Retrieval System based on XML)

  • 윤미희;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.59-62
    • /
    • 2003
  • 컴퓨팅 기술의 발달 밍 보편화로 인해 사용자들의 멀티미디어에 대한 요구가 증가하였고, 이러한 요구를 만족시키기 위해서는 단순한 텍스트 형식의 데이터가 아닌 멀티미디어 데이터, 특히 비디오 데이터에 대한 저장, 관리, 검색하는 기능이 필수적이다. 본 논문에서는 비디오데이터에 대한 효율적인 의미검색을 위해 주석기반 검색뿐만 아니라 특징기반 검색을 지원한다. 특히 사용자가 원하는 객체나 장면의 유사성 검색이 가능하며, 장면의 검색 결과로 제시된 장면을 선택한 후 선택된 장면을 기반으로 사용자가 원하는 좀 더 정확한 장면의 검색을 위한 SQBE(scene-query-by-example) 질의가 가능한 XML 기반 멀티미디어 검색시스템을 제안한다.

  • PDF

Open API를 활용한 다국어 정보검색 시스템 모델링에 관한 연구

  • 황세찬;김흥철;김선진;정주석;강신재
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.129-132
    • /
    • 2009
  • 본 논문은 오픈 API를 이용하여 다국어 정보검색 시스템을 모델링하는 방법론을 제시한다. 웹 2.0이 대두되면서 웹 2.0의 개념을 활용한 기술들이 발달하고 있는데, 그 중 한 기술이 오픈 API이다. 기업에서 개발한 새로운 서비스나 기능, 데이터 등을 API로 공개함으로써 사용자들이 공개된 API를 이용하여 새로운 서비스를 쉽게 개발할 수 있게 되었다. 본 연구에서는 구글, 플리커, 유튜브, 네이버, 다음 등의 사이트에서 제공하는 오픈 API를 이용하여, 다국어 정보 검색 시스템을 구현하였다. 구글 번역 API를 이용하여 한국어 질의어를 검색 대상 언어(영어, 일본어, 중국어 등)로 번역한 후, 소설 웹 사이트(플리커, 유튜브, 다음, 네이버 등)의 정보를 검색하고, 검색된 결과 내 텍스트를 다시 한국어로 번역한 후, 통합된 검색 결과를 사용자에게 보여준다.

  • PDF

목적을 가진 게임을 이용한 사용자의 검색 의도 자동 획득 시스템 설계 (The automatic acquisition system design of the user's searching intention using Game With A Purpose(GWAP))

  • 양영욱;임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.810-812
    • /
    • 2009
  • 정보의 양이 기하급수적으로 증가함에 따라, 그 정보들을 효과적으로 제공하기 위해 검색 기술들이 개발 되었다. 현대 검색 기술은 단순 텍스트 매칭 기반으로 사용자의 의도와는 상관없는 정보까지 검색하는 경우가 많아서, 실제로 원하는 정보를 찾는데 많은 시간과 노력을 요구한다. 이런 단점들을 극복하고자 사용자의 검색 의도를 고려한 검색 기술들이 개발되었다. 검색 의도를 획득하는 방법에는 자동적인 방법과 수동적인 방법, 그리고 반자동적인 방법이 있다. 자동적인 방법은 사람이 아닌 컴퓨터를 통해서 획득이 이루어지기 때문에 사용자의 의도를 완벽히 반영하는 것이 어렵다. 수동적인 방법은 사람이 직접 참여하여 작성하기 때문에 사용자의 의도를 반영할 수 있지만, 시간과 비용이 많이 드는 단점이 있다. 반자동적인 방법은 위의 두 가지 단점을 보완할 수 있다. 본 논문에서는 반자동적인 방법인 목적을 가진 게임을 이용한 사용자의 검색 의도 획득 시스템을 사용한다. 이 후에 시스템에서 도입한 Game With A Purpose(GWAP)의 개념과 시스템의 구성, 그리고 발전방향 및 결론을 논의한다.

  • PDF

퍼지 개념 네트워크를 이용한 링크기반 검색엔진의 개인화 (Personalization of Link-based Search Engine by Fuzzy Concept Network)

  • 김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.316-318
    • /
    • 2001
  • 링크 기반 검색엔진은 사용자의 질의어와 관련된 웹문서들에 대해 링크 정보를 이용하여 순위를 생성한다. 링크 정보는 문서들간의 추천을 나타내므로 중요한 문서를 찾는데 이용할 수 있다. 링크 정보를 이용한 검색은 일반적인 텍스트 기반 검색엔진에 비해 좋은 결과를 낸다고 알려져 있다. 링크 정보를 이용한 검색엔진의 대표적인 예로는 Google과 Clever Search가 있다. 본 논문에서는 링크 정보를 이용한 검색엔진을 개발하고 퍼지 개념 네트워크를 이용하여 개인화를 수행한다. 퍼지 개념 네트워크는 퍼지 문서 추 2654; 시스템을 위한 지식베이스로 이용된다. 사용자 프로파일을 이용하여 사용자별로 퍼지 개념 네트워크를 생성하고 링크 기반 검색 결과를 개인화한다. 3명의 사용자에 대해 실험을 수행하여, 개인화가 주는 효과에 대해 평가한다. 검색결과는 중요한 웹 문서를 찾아 주었으며, 개인화 과정을 통해 사용자가 원하는 순서대로 정렬해 주는 것을 알 수 있었다.다.

  • PDF

딥러닝 기반의 이미지를 이용한 의류 상품 검색 알고리즘 개발 (Development of clothing product search algorithm using images based on deep learning)

  • 황재용;최호진;강선경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.686-687
    • /
    • 2022
  • 기존의 의류 상품 검색은 텍스트 검색만으로 가능하여 사용자가 찾고자 하는 상품 검색이 제대로 이루어지지 않고, 원하는 상품 검색을 하기 위해 많은 시간이 걸렸다. 또한 소호몰 상품과 같이 브랜드 없는 상품 판매처를 알기 어려웠으며 패션 상품의 디테일한 속성을 검색하기도 어려웠다. 이를 해결하기 위해 학습된 이미지 검색을 통해 사용자가 원하는 정확한 정보를 검색할 수 있는 딥러닝 기법을 제안하고자 한다.

  • PDF