• 제목/요약/키워드: web Indexing

검색결과 113건 처리시간 0.026초

XML을 위한 효율적인 저장구조 및 인덱싱 기법설계 (Design of Efficient Storage Structure and Indexing Mechanism for XML Documents)

  • 신판섭
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.87-100
    • /
    • 2004
  • 최근에 인터넷의 급속한 발전과 더불어 대량의 정보를 효과적으로 표현 및 교환할 수 있는 새로운 데이터 표준으로 XML (extensible Markup Language)이 제안되었으며, XML 문서에 대한 저장과 인덱싱에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 실시간 XML 문서 처리에 효율적인 주기억장치 기반의 XML 전용 저장 시스템을 설계하고, 사용자 질의에 포함된 엘리먼트 타입 정보를 이용하여 XML 문서트리에 대한 순회를 최소화시킬 수 있는 구조적 검색 기법을 설계한다 또한, 엘리먼트의 삭제 및 삽입 등 동적인 변경에 빠르고 유연하게 대처할 수 있는 인덱스 구조와, 링크 정보를 가지고 있는 XML 문서의 질의 처리를 위해 XLink 표준을 준수하여 테이블 형식의 링크 정보 인덱스 구조를 설계한다.

  • PDF

온톨로지 기반의 계층적 개념 인덱싱을 이용한 사용자 관심사 학습 (Learning User Interest using Hierarchical Concept indexing based on Ontology)

  • 박지현;김흥남;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.646-648
    • /
    • 2005
  • 인터넷의 급속한 성장과 더불어 사용자들은 인터넷을 통해 많은 정보를 얻을 수 있게 되었으며 최신 뉴스를 실시간으로 접근할 수 있게 되었다. 이에 따라 방대한 정보 속에 사용자 관심사에 맞는 정보를 효과적으로 검색하기 위한 여러 방법들이 연구되어 왔다. 하지만 기존의 많은 선행 연구들은 단어 빈도 기반의 키워드 벡터 모델을 이용하여 사용자의 관심사를 학습하고 있다. 이러한 키워드 벡터 모델은 사용자의 선호도를 명확하게 기술하지 못하고 키워드를 이용한 특징 벡터 (feature-vector)는 개념들 사이의 관계를 찾기 어려운 한계를 가지고 있다. 이를 개선하기 위해 본 논문에선 계층적 개념 인덱싱(Hierarchical Concept Indexing)을 이용한 온톨로지 형태의 개인화된 사용자 프로파일을 만드는 방법을 제안한다. 생성된 사용자 프로파일에 개념 간의 유사도와 개념에 대한 사용자의 관심도를 고려하여 보다 개인의 선호도에 맞는 기사를 제공한다. 실험에서는 제안된 방법의 성능 평가를 위해서 기존의 키워드 벡터 모델의 학습 방법인 WebMate 시스템과 비교 분석하였다. 그 결과 제안하는 방법이 키워드 벡터를 이용한 학습 방법보다 향상된 성능을 보였다.

  • PDF

체계적 분석 기법을 이용한 의미기반 이미지검색 분야 고찰에 관한 연구 (A Systematic Review on Concept-based Image Retrieval Research)

  • 정은경
    • 한국비블리아학회지
    • /
    • 제25권4호
    • /
    • pp.313-332
    • /
    • 2014
  • 디지털 기술과 인터넷의 발달로 인해 이미지 생산, 유통, 이용이 활발하게 이루어지고 있으며, 이미지 검색에 관한 연구도 증가하는 추세이다. 이미지검색 분야는 내용기반과 의미기반으로 나뉘어 연구가 수행되어왔으며, 문헌정보학 관점에서는 특히 의미기반의 색인과 검색에 주목해왔다. 본 연구는 체계적인 분석기법을 이용하여 의미기반 이미지검색 분야 연구 집적의 분석결과를 제시하고자 한다. 이를 위하여 데이터는 Web of Science 수록된 문헌정보학(Information Science/Library Science)분야의 이미지검색 논문 및 학술회의 논문 총 282건을 대상으로 하였으며, 국내 연구와 비교를 위해서는 DBpia에 수록된 문헌정보학 분야의 이미지검색 논문 35건을 수집하였다. 데이터 분석 과정은 우선 개괄적인 현황을 파악하기 위해서 서지사항을 분석하였고, 이와 함께 내용분석을 통한 체계적 분석 고찰을 수행하였다. 연구 결과 이미지 검색은 기존 연구에서 밝힌 바와 같이 의미기반 이미지 검색이 주된 흐름이며, 그 중에서도 이미지 색인과 기술 분야, 이미지 요구와 검색행태 분야의 연구가 주를 이루는 것으로 나타났다. 최근 연구 경향으로 주목할 만한 분야는 집합적 색인, 다언어/다문화 환경에서의 색인과 이미지 요구, 감정색인과 접근 등이다. 이용자 중심의 이미지 검색 연구 측면에서는 특정 이용자 그룹 중에서 대학생이나 대학원생이 주된 연구 대상 이용자 그룹이며 이 외에도 이미지를 업무에 사용하는 이용자 그룹에 대한 연구가 주된 경향이다. 최근에는 일반 이용자를 대상으로 일상생활 환경에서 이미지검색에 관한 연구가 등장하기 시작했다. 국내 연구와 비교하면, 논문의 수적인 차이를 제외하면 세부 연구 주제에 있어서 상당히 유사한 분포를 보이는 것으로 나타났다. 이러한 연구결과는 지금까지의 이미지 검색 분야의 연구 집적을 조명하며, 향후 발전적 방향을 제시하는데 있어서 도움이 될 것으로 기대한다.

DOM을 이용한 PC 웹 페이지에서 모바일 웹 페이지로의 다이나믹 오브젝트 변환 및 서비스 기법 (A Scheme that Transcodes and Services from PC Web Page to Mobile Web Page of Dynamic Object with DOM)

  • 김종근;강의선;심근정;고희애;임영환
    • 정보처리학회논문지D
    • /
    • 제14D권3호
    • /
    • pp.355-362
    • /
    • 2007
  • 이동 통신 단말기의 발달과 모바일 인터넷의 확산으로 많은 사용자들은 언제 어디서나 모바일 웹 콘텐츠를 이용 할 수 있게 되었으며 나아가 더 많은 콘텐츠의 서비스를 요구하게 될 것이다. 이러한 요구로 인하여 유선 웹 콘텐츠를 모바일 웹에 사용할 수 있도록 콘텐츠를 변환하는 연구들이 많이 진행되고 있으나, 통신사 및 모바일 단말기들의 지원사양이 표준화되지 않아 모바일 웹 콘텐츠의 변환 및 생성에 많은 어려움이 따르고 있다. 특히나 유선 웹 페이지의 내용 중에 시간이나 사용자에 따라 그 내용이 동적으로 변화하는 다이나믹 오브젝트를 모바일 웹에 서비스하기 위해서는 각각의 단말기에 맞도록 스크립트를 프로그래밍 해야 할 뿐 아니라 사용되는 리소스의 선 변환이 요구되어진다. 이러한 어려움을 해결하기 위해 본 논문에서는 유선 웹 페이지의 구조적 특성을 나타내는 DOM(Document Object Model)의 계층구조를 이용한다. 즉 유선 웹페이지를 분석하여 이를 자료구조화 하고, 이 가운데에서 다이나믹 오브젝트를 추출하여 그 영역을 인덱싱 하였다가, 모바일 웹 페이지를 서비스 할 때 인덱싱 된 위치에서 정보를 추출하여 실시간으로 모바일 웹 콘텐츠를 생성하여 서비스하는 기법을 제시한다. 또한 본 논문은 이 기법을 적용하여 모바일 웹 콘텐츠를 편집하는 편집기와 이를 서비스하는 모바일 웹 서비스 서버를 개발하는 데 그 목표가 있다.

시맨틱 웹 데이터에서 접미사 배열 기반의 경로 질의 처리 기법 (Suffix Array Based Path Query Processing Scheme for Semantic Web Data)

  • 김성완
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권10호
    • /
    • pp.107-116
    • /
    • 2012
  • 서로 연결된 데이터들의 의미를 컴퓨터가 이해하여 자동으로 처리할 수 있는 시맨틱 기술의 보급이 확산되고 있다. 시맨틱 웹에서 데이터에 대한 처리는 데이터 자체에 대한 접근뿐만 아니라 데이터 상호간의 연관성 즉, 데이터 상호간의 의미에 대한 이해와 접근을 중요시 하고 있다. 시맨틱 웹의 데이터와 그 연관성을 표현하기 위해 W3C에서는 RDF를 표준 형식으로 제정하였으며 RDF로 표현된 데이터에 대한 질의 처리를 지원하기 위해 여러 RDF 질의어가 제안되었으나 시맨틱 연관성을 고려한 질의어 정의와 이에 관련한 질의 처리 기법은 계속적인 연구가 필요한 분야이다. 본 논문에서는 RDF 질의 처리를 위해 소개된 접미사 배열 기반의 인덱싱 기법을 기반으로 시맨틱 연관성의 대표적 유형인 ${\rho}$-path 질의를 처리하기 위한 방법을 제안한다. 제안된 질의 처리 방법의 성능 평가를 위해 다른 두 가지 형태의 처리 방법을 구현하여 실험적으로 비교하였다. 평균 질의 처리 시간 측정을 통해 제안 기법이 다른 두 가지 처리 방법에 비해 각각 약 1.8~2.5배와 3.8~11배의 우수한 처리 성능을 보인다.

DOM을 이용하여 PC 웹 페이지의 다이나믹 오브젝트를 모바일 웹 컨텐츠로 변환하는 기법 (A Scheme that Transcodes from Dynamic Object of PC Web Page to Mobile Web Contents with DOM)

  • 김종근;고희애;심근호;강의선;임영환
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.648-653
    • /
    • 2008
  • 이동 통신 단말기의 발달과 모바일 인터넷의 확산으로 많은 사용자들은 언제 어디서나 모바일 웹 콘텐츠를 이용 할 수 있게 되었으며 나아가 더 많은 콘텐츠의 서비스를 요구하게 될 것이다. 이러한 요구로 인하여 유선 웹 콘텐츠를 모바일 웹에 사용할 수 있도록 콘텐츠를 변환하는 연구들이 많이 진행되고 있으나, 통신사 및 모바일 단말기들의 지원사양이 표준화되지 않아 모바일 웹 콘텐츠의 변환 및 생성에 많은 어려움이 따르고 있다. 특히나 유선 웹 페이지의 내용 중에 시간이나 사용자에 따라 그 내용이 동적으로 변화하는 다이나믹 오브젝트를 모바일 웹에 서비스 하기 위해서는 각각의 단말기에 맞도록 스크립트를 프로그래밍 해야 할 뿐 아니라 사용되는 리소스의 선 변환이 요구되어진다. 이러한 어려움을 해결하기 위해 본 논문에서는 유선 웹 페이지의 구조적 특성을 나타내는 DOM(Document Object Model)의 계층구조를 이용한다. 즉 유선 웹페이지를 분석하여 이를 자료구조화 하고 이 가운데에서 다이나믹 오브젝트를 추출하여 그 영역을 인덱싱 하였다가, 모바일 웹 페이지를 서비스 할 때 인덱싱 된 위치에서 정보를 추출하여 실시간으로 모바일 웹 콘텐츠로 변환하는 기법을 제시한다.

  • PDF

비정형 문서의 정보추출을 통한 OWL 온톨로지 구축 시스템의 설계 및 구현 (The Design and Implementation of OWL Ontology Construction System through Information Extraction of Unstructured Documents)

  • 조대웅;최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.23-33
    • /
    • 2014
  • 정보검색 분야의 발전은 많은 양의 정보를 빠르게 찾아주는 것에서 사람이 원하는 정보를 정확하게 찾아주는 연구 분야로 넓혀가고 있다. 핵심 기술로는 개인화 및 시맨틱 웹 기술을 활용하고 있다. 웹 문서에 대한 자동색인 기술과 처리능력은 연구단계를 넘어 실용 서비스로 나타나고 있다. 하지만 웹 문서 이외의 첨부된 문서 형태에 대한 문서정보검색에 관한 연구는 미진한 상황이다. 본 논문에서는 텍스트, 워드, 한글과 같은 형식으로 작성된 비정형 문서의 본문 내용을 분석하여 OWL 온톨로지로 구축하는 방법에 대해 설명한다. 문서 온톨로지의 TBox를 구축하고, 문서로부터 얻을 수 있는 자원을 선정하여, 구축된 문서 온톨로지의 인스턴스로 활용할 수 있도록 시스템으로 구현한다. 이와 같은 비정형 문서의 온톨로지 자동 구축으로 해당 문서의 시맨틱 기술을 이용한 정보검색 및 문서관리 시스템에서 효과적으로 활용 가능하다.

OntCIA: 시맨틱 웹 기술 기반의 소프트웨어 변경 영향분석 시스템 (OntCIA: Software Change Impact Analysis System Based on the Semantic Web)

  • 송희석
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.111-131
    • /
    • 2004
  • 소프트웨어 유지보수 단계에서는 고객니즈, 마케팅 정책, 법, 제도의 변화 등으로 인한 다양한 시스템 변경 요구를 수용하여야 한다. 그러나, 소프트웨어의 비가시성문제로 인해 새로운 변경 요구사항 발생 시 수정 대상 모듈을 발견하는데 지대한 시간이 요구될 뿐 아니라 모듈의 재 사용을 어렵게 만들어 중복 모듈이 양산 됨으로써 향후 장애의 근원이 되는 악순환이 전개된다. 이에 본 연구에서는 시맨틱 웹(Semantic Web) 기술을 활용하여 이동통신사의 과금/청구 도메인의 관리자와 개발자들이 공유하고 있는 개념과 개념간 관계를 명시적으로 표현하고 이를 이용하여 변경대상 모듈을 쉽게 발견 할 뿐 아니라, 발견된 모듈에 대해 구조적 호출 및 조립 관계를 분석하도록 지원하는 온톨로지 기반 변경 영향 분석 시스템(OntCIA; Ontology based Change Impact Analysis System)을 제시한다. OntCIA는 스트링 매칭과는 근본적으로 다른 의미적 모듈검색을 지원하며 잦은 변경이 요구되는 호출 및 조립 구조 정보는 데이터 베이스에서 관리하고 도메인 지식은 온톨로지로 관리함으로써 유지 보수가 용이한 구조를 가진다.

  • PDF

실시간 소셜 네트워크 서비스를 위한 사용 가능한-통합적-유비쿼터스 (U3) 웹 서비스에서의 모바일 상호작용 (Mobile Interaction in a Usable-Unified-Ubiquitous (U3) Web Service for Real-time Social Networking Service)

  • 김영복;김철수
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.219-228
    • /
    • 2008
  • 실시간 소셜(Social) 네트워킹 서비스를 위해서, 사용 가능한-통합적-유비쿼터스 (U3) 웹 서비스에서의 모바일 상호작용을 연구하였다. 실시간 소셜 네트워크를 위한 편리한 모바일 HCI로서, 또한 유비쿼터스 웹 서비스에서의 메타데이터 정보 색인 키로서, 다국어 한 글자 도메인 명(예, 김.net, 이.net, 가.net, ㄱ.net, ㄴ.net, ㅎ.net, ㅏ.net, ㅔ.net, ㄱ.com, ㅎ.com) 은 소셜 정보를 검색하고 또한 등록할 때 편리한 모바일 인터페이스이다. U3 웹 서비스의 예로서, 실시간 소셜 네트워킹 서비스 구현과 함께 모바일 상호작용을 위해 스케치된 디자인 목표와 한국, 일본, 중국에서의 모바일 상호작용 경험을 소개한다. 또한, 소셜 네트워킹과 센서 네트워킹 서비스에서 통합 정보관리를 위해, IP 기반의 센서네트워크 (IP-USN)에서 메타데이터 디렉터리 서비스에의 응용 확장 가능성도 소개한다.

효율적인 장면전환 검출을 이용한 비디오 브라우징 서비스 (Video Browsing Service Using An Efficient Scene Change Detection)

  • Seong-Yoon Shin;Yang-Won Rhee
    • 인터넷정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.69-77
    • /
    • 2002
  • 최근 디지털 비디오는 인터넷을 통해 제공되는 매우 중요한 정보 미디어의 하나이며 멀티미디어 분야에서 매우 중요한 역할을 수행하고 있다. 본 논문에서는 웹 상에서 실시간 사용자 인터페이스를 통해 비디오 내용 검색과 브라우징을 제공하는 비디오 브라우징 서비스를 제시한다. 비디오 시퀀스의 장면 분할과 키 프레임 추출을 위해서 RGB 컬러 히스토그램과 $x^2$(카이 스퀘어) 히스토그램을 합성한 효율적인 장면 전환 검출 방법을 제안한다. 이렇게 추출된 키 프레임들은 물리적인 방법과 논리적인 방법에 따라 색인 화된다. 이 시스템은 또한 비디오카세트리코더(VCR)가 갖고 있는 비디오 편집과 검색 기능을 포함한다. 비디오 브라우징을 위하여 날짜, 분야, 그리고 주제의 세 가지 요소가 사용되며, 비디오 브라우징 서비스는 아파치 웹서버에서 MySQL, PHP, 그리고 JMF를 이용하여 구현된다.

  • PDF