• 제목/요약/키워드: 사용자 문서

검색결과 1,731건 처리시간 0.033초

XML 문서를 위한 효율적인 색인구조의 설계 (A Design of an Efficient Index Organization for XML Documents)

  • 안선하;박경환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.292-295
    • /
    • 2000
  • XML은 메타언어로써 구조적인 문서를 생성할 수있게 하며 이러한 구조적인 문서는 내용 기반검색,질의등의 처리가 가능하다는 것이다. XML문서의 논리적 구조를 표현하는 방법은 사용자 정의 문서타입(DTD)과 XML Schema 의 두가지 방식이 있으며, XML Schema 는 사용자 정의문서타입(DTD)에 비해 다양한 데이터 타입, namespace, Open-ended 데이터 모델등을 지원하여 문서의 구조 정의를 훨씬 더 유연하고 명시적이게 하게 하는 장점이있다. 본 논문에서는 XML 문서 검색을 위해 XML Schemadp 기반하여 내용 검색과 구조 검색을 효율적으로 지원하는 인덱스 구조를 제안한다. 요소들의 정의에 따르면 계층관계를 표현하기위한 구조정보와 XML 문서 인스턴스에서 나타나는 각 요소들의 순서정보를 요소의 ID로 사용함으로써 임의의 요소를 효율적으로 접근할 수 있게 한다.

  • PDF

동적인 문서 여과에서 나이브 베이즈 분류기와 코사인 유사 계수의 성능 비교 (Comparative Between Naive Bayes Classifier and Cosine Similarity Coefficient in Dynamic Document Filtering)

  • 손기준;임수연;박성배;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2006
  • 온라인 정보가 증가함에 따라 많은 양의 정보 중에서 사용자가 원하는 정보를 정확하고 신속하게 찾아 주는 문서 여과의 중요성 또한 증가하고 있는 추세이다. 본 논문은 문서 여과 문제를 이진 문서 분류 문제로 보고, 나이브 베이즈 분류기를 동적인 문서 여과 목적으로 사용하였다. 이때 사용자가 자신의 관심 분야에 해당하는 주제를 제대로 여과 받기 위해서 학습 대상으로 삼아야 할 학습문서의 범위와 관련성 있는 문서를 제대로 여과 받기 위해서 체크해야 하는 관련성 표기 비율에 따른 분류기의 성능에 대하여 실험을 하였다. 코사인 유사계수를 이용한 여과 방법과의 성능도 비교 실험하였다. 실험 결과 나이브 베이즈 이진 분류기는 문서집합의 크기가 일정한 정도일 때 관련성 있는 문서가 모두 표기되지 않더라도 여과에는 큰 영향을 미치지 않음을 볼 수 있었다.

  • PDF

XTM문서의 가상문서로의 변환 시스템 설계 및 구현 (Design and Implementation of a System for Converting a XTM Document to a Virtual Document)

  • 류긍호;김운;김태현;맹성현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.172-174
    • /
    • 2001
  • 인터넷상의 정보과다로 인하여 사용자는 필요한 정보를 찾는데 많은 시간을 소모하게 되며 사용자 자신의 정보를 관리 하는데 있어서도 어려움을 겪을 수 있다. 이러한 단점을 극복하려는 시도로서 XTM이라는 새로운 문서표준이 [1] 제안되었다. 본 논문에서는 이 XTM 문서와 충남대학교에서 개발한 가상문서가 [3] 링크 정보를 통해문서를 표현하는 공통점을 발전시켜 XTM 문서를 가상문서로 자동변환하는 시스템을 설계 및 구현하였다. 본 시스템을 통해 가상문서의 처리 능력을 강화함으로써 가상문서기반 디지털도서관 시스템의 확장을 도모하며 효율적인 정보 구측이 가능하도록 하였다.

  • PDF

텍스트/비텍스트 특성기반 질의답변문서의 품질지수 알고리즘 (A Quality Value Algorithm based on Text/Non-text Features in Q&A Documents)

  • 김덕주;박건우;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.105-108
    • /
    • 2010
  • 쌍방향으로 질문과 답변을 하는 커뮤니티 기반의 지식검색서비스에서는 질의를 통해 원하는 답변을 얻을 수 있지만, 수많은 사용자들이 참여함에 따라 방대한 문서 속에서 검증된 문서를 찾아내는 것은 점점 더 어려워지고 있다. 지식검색서비스에서 기존 연구는 사용자들이 생성한 데이터 즉 추천수, 조회수 등의 비텍스트 정보를 이용하거나 답변의 길이, 자료첨부, 연결어 등의 텍스트 정보 이용하여 전문가를 식별하거나 문서의 품질을 평가하고, 이를 검색에 반영하여 검색성능을 향상시키는 데 활용했다. 그러나 비텍스트 정보는 질의/응답의 초기에 사용자들에 의해 충분한 정보를 확보할 수 없는 단점이 제기 되며, 텍스트 정보는 전체의 문서를 답변의 길이, 자료 첨부등과 같은 일부요인으로 판단해야하기 때문에 품질평가의 한계가 있다고 볼 수 있겠다. 본 논문에서는 이러한 비텍스트 정보와 텍스트 정보의 문제점을 개선하기 위한 품질평가 알고리즘을 제안한다. 제안된 알고리즘을 통한 품질지수는 텍스트/비텍스트 정보와 소셜 네트워크 사용자 중앙성을 고려하여 질문에 적합하고 신뢰성 있는 답변을 랭킹화 함으로써 지식검색문서를 분별하는 지표가 되며, 이는 지식검색서비스의 성능향상에 기여를 할 수 있을 것으로 기대된다.

  • PDF

FCA 기반 계층적 구조 표현을 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure Representation based on the Formal Concept Analysis)

  • 김태환;박제현;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.388-392
    • /
    • 2006
  • 가공해서 사용하는 정보량이 많아질수록 원하는 정보를 찾는 데 더 많은 노력이 필요하게 마련이다. 따라서 사람들은 대대로 정보를 구조화하는 방법들을 고안해왔으며, 여러 가지 계층적 구조화 방법들을 사용했었다. 이렇게 구현된 정보의 계층 구조는 키워드 검색을 바탕으로 수평적 계층 구조만을 가지는 구조였다. 자료가 전문화되고 정보를 검색하는 사용자 또한 검색된 정보와 관련된 정보를 더 원하는 현 시점에서 정보의 수평적 계층 구조만으로 사용자의 만족도를 충족할 수 없다. 이러한 문제점을 해결하기 위해 이 논문에서는 특정 도메인의 문서를 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 체크하여 그 단락의 계층적 트리를 구성하고, 단락별 트리를 이용하여 문서의 내용을 트리로 재구성할 수 있게 된다. 이렇게 만들어진 문서의 트리들은 트리의 구조를 보고 특정 문서에 더 구체적인지 아니면 더 일반적인지 측정하여 문서와 문서간의 관계 또한 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색해 주는 자동화 문서 계층 구조를 제안한다.

  • PDF

XML 문서 관리 및 질의를 위한 웹 기반의 도구 설계 및 구현 (Implementation of a Web-based xml query report ing tool)

  • 박유림;이민수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.193-195
    • /
    • 2004
  • 데이터베이스에 저장된 수많은 자료들을 사용자의 질의에 맞추어 웹상에서 표현해주는 것이 바로 리포팅 툴의 역할이다. 그에 관한 연구들로 BBQ(Blended Browsing and Querying), EASY BASE, QURSED(Querying and Reporting Semistructured Data)와 같은 여러 리포팅 툴들이 상용화되어 있다. 하지만 사용자가 보다 쉽고 직관적으로 XML 문서를 작성하고 관리할 수 있는 툴들은 미흡한 것이 사실이다. 이 논문에서는 XML과 XSL문서를 각각 그룹핑하고 직관적인 구조로 표현 해주며 사용자의 관점에 맞추어 XQuery를 지원하는 시스템을 설계 구현하였다.

  • PDF

XML DTD를 위한 확장 SQL DDL의 설계 (Design of Extended SQL DDL for XML DTD)

  • 오준환;이병욱
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.95-98
    • /
    • 2000
  • 최근 XML 문서를 저장 및 검색하기 위한 연구가 활발히 진행되고 있다. DTD 문서를 효율적으로 저장 관리하는 것도 중요하지만 이들을 위한 질의문에 대한 연구도 중요하다. 기존의 질의문들은 XML 사용자들만을 위한 것이었고 데이터베이스와의 연동을 위한 것이 아니었다. 데이터베이스에 저장된 문서를 저장 관리하기 위해서는 기존의 SQL 질의를 확장할 필요가 있다. 본 논문에서는 RDBMS에 DTD를 저장하기 위해 SQL의 DDL을 확장하였다. 확장을 할 때 기존의 SQL 사용자들도 쉽게 접근하기 쉽게 하기 위해 각 DTD 인스턴스들을 SQL의 데이터형의 형태를 가지도록 하였고 XML 사용자들도 접근을 쉽게 하기 위해 선언 하는 방법을 기존의 DTD 선언하는 방법과 비슷하게 설계하였다.

  • PDF

웹 디렉토리 서비스를 위한 문서 클러스터링 (Document Clustering for Web Directory Service)

  • 이문기;권오욱;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.351-353
    • /
    • 2000
  • 대부분의 검색 엔진에서의 사용자의 정보 검색 요구에서 나타나는 키워드 장벽의 문제점을 해결하고 사용자의 정보 검색 과정에 도움을 주기 위해 디렉토리 서비스를 제공한다. 하지만 디렉토리 서비스에서 새로운 웹 사이트를 지속적으로 인덱스하여 하나의 주제어에 너무 많은 수의 웹 사이트가 부여되어 있으면 사용자의 검색 편의를 위해서 재분류하여 세분류할 필요가 있다. 따라서 본 논문에서는 한 주제어에 과다하게 부여된 웹 사이트들을 세분류하기 위해 기존의 문서 클러스터링 기법을 사용하여 클러스터링 할 때 생기는 문제점을 보완한 문서 클러스터링 시스템을 소개한다.

  • PDF

SIP 프로토콜 시뮬레이터 설계 및 구현 (Implementation of a Test Simulator for SIP Protocol)

  • 장성만;이극
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.695-698
    • /
    • 2003
  • SIP은 인터넷 컨퍼런스와 인터넷 텔레포니를 위한 시그널링 프로토콜로써, 오디오, 비디오, 화이트보드 등과 같은 하나 또는 그 이상의 미디어 타입으로 이루어진 멀티미디어 회의, 인터넷 텔레포니 등에 적용할 수 있다. 본 논문에서는 SIP 사용자 에이전트의 시험, 인증 절차 문서를 개발하였으며, 개발된 문서를 바탕으로 하여 SIP 사용자 에이전트 시험 시뮬레이터를 설계 및 구현하였다. 이 시험 시뮬레이터를 통해 표준 시험 절차 문서를 바탕으로 사용자 에이전트들간의 전송되는 메시지의 표준 구현 여부 검증할 수 있다.

  • PDF

사용자 중심의 멀티미디어 데이터 검색 방안 (Multimedia data search method for User)

  • 정성주;박희숙;김성록;조우현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.202-205
    • /
    • 2003
  • 인터넷의 보급으로 사용자는 일반문서에 대한 검색뿐만 아니라 멀티미디어 데이터에 대한 검색도 할 수 있게 되었다. 기존 포탈사이트의 검색은 주로 html 문서위주로 제공되고 있으며, 검색방법은 html 문서의 단어, 구를 이용하는 검색방식을 주로 사용하고 있다. 멀티미디어 데이터에 대한 검색 또한 데이터 제공자(Data provider)가 제시한 검색어구를 바탕으로 이루어진다. 본 논문에서는 사용자(User)에게 관심이 있는 멀티미디어 데이터 부가정보를 인덱스로 유지하고 구성하여 제공하는 XML 트리 형식의 검색 시스템을 제안한다.

  • PDF