• 제목/요약/키워드: 문서과

검색결과 2,265건 처리시간 0.024초

효과적인 웹 컨텐츠 개발과 관리를 통합한 시스템의 설계 및 구현 (Design and Implementation of An Integrated System for Effective Development and Management of Web Contents)

  • 유대승;강만모;심민석;이명재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.440-442
    • /
    • 2000
  • 본 논문에서는 일반문서 작성 에디터와 동일한 방식으로 웹 문서 작성이 가능한 일반문서와 웹 문서 동시작성 에디터의 설계 및 구현을 통하여 효율적인 웹 문서 작성에 대한 연구를 수행한다. 문서의 파싱한 결과를 데이터베이스에 저장함으로써 웹 문서를 유지하지 않고도 데이터베이스에 저장된 정보를 웹 어플리케이션이 필요에 따라 동적으로 문서를 생성함으로써 웹 문서 생성과 유지 및 관리를 통합하는 방법을 제시한다. 마지막으로 ASP 컴포넌트의 개념과 컴포넌트 사용의 필요성 및 이점에 대하여 재고하고 본 연구의 수행과정에서 개발한 ASP 컴포넌트(dll)를 통한 효율적인 웹 어플리케이션 및 컴포넌트 개발 방법을 개한다.

  • PDF

Competitive Unit을 사용한 Helmholtz Machine에 의한 문서 클러스터링 (Topical Clustering of Documents using Helmholtz Machines with Competitive Units)

  • 장정호;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.292-294
    • /
    • 2001
  • 문서 클러스터링은 정보검색 시스템에서 검색과정의 효율성을 향상시키기 위해서 많이 사용된다. 기존의 K-means 클러스터링과 같은 거리-기반 접근 방법은 거리에 대한 척도를 정해야 하는 문제가 있고, 또한 전체 자질 공간에서 지역적 특성에 민감하기 때문에 문서 내에 노이즈가 존재할 경우 만족스러운 결과를 내지 못할 수 있다. 그리고 기본적으로 문서 데이터는 희소성(sparseness)을 가기 때문에 정규 분포를 가정한 mixture 모델을 적용하기도 어려움이 있다. 본 논문에서는 Helmoholtz machine에 의한 문서 클러스터링 방법을 제안한다. 제안되는 방법에서는 하나의 문서를 어떤 내재적인 요인(factor)들의 다양한 결합에 의한 결과로 가정하는데, 이 때의 요인은 주제어 집합 또는 적어도 의미적으로 유사한 단어들의 집합이다. 그리고 기본적으로 Helmholtz machine은 이진 데이터를 다루는데, 텍스트 문서에 나타나는 단어들의 빈도를 고려하기 위해 수정된 Helmholtz machine을 제시한다. TREC-8 adhoe 데이터와 20 Newsgroup 문서 집합에 대한 클러스터링 실험 결과, 제안된 방법이 K-means 알고리즘에 비해 우수한 성능을 보였으며 주제어 추출을 통해 문서 집합의 전체 내용 파악을 용이하게 하는 특성이 있었다.

  • PDF

XSL패턴을 응용한 XSL 문서 편집 시스템 (XSL document authoring system using XSL Pattern)

  • 박진우;김성한;현득창;정회경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.372-374
    • /
    • 2000
  • 본 논문은 인터넷상에서 사용이 가능하며 확장성이 뛰어나 XML(eXtensible Markup Language)을 다른 문서로 변환 및 브라우징(Browsing), 프리젠테이션(Presentation)이 가능한 표준 언어인 XSL(eXtensible Stylesheet Language)을 응용한 XSL 문서 편집 시스템의 설계 및 구현에 관한 것이다. 이를 위해 XSL문서의 기본 구조 단위를 패턴(Pattern)으로 구분하여 서식 집합(Template Rule)들을 사용자 서술 방식이 아닌 사용자의 선택 방식의 자동 생성으로 구성하도록 하였다. XSL 엘리먼트 (Element)의 선택방식은 구성되어진 XML문서를 읽어 들여 문서의 엘리먼트 정보를 확장할 수 있게 하였다. 또한 XML문서와 XSL문서의 HTML(HyperText Markup Language)로의 변환을 쉽게 확인할 수 있는 사용자 인터페이스(User Interface)를 구성하며 원활하게 문서를 교환 할 수 있도록 설계 구현 하였다.

  • PDF

구조화된 문서 생성을 위한 논리적인 구조 분석 기법 : 구문론적인 접근방식 (Logical Structure Analysis for Structured Document Generation A Syntactic Approach)

  • 이경호;최윤철;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.175-177
    • /
    • 2000
  • 본 논문에서는 다수의 페이지로 구성된 복잡한 구조의 문서로부터 SGML/XML에 기반한 전자 문서를 생성하기 위한 구문론적인 구조분석 방법을 제안한다. 제안된 방법은 구조분석의 정확성과 처리속도의 향상을 위하여 텍스트 영역의 계층적인 트리를 파싱하여 논리적인 계층 구조를 추출한다. 또한 본 논문은 문서 유형의 논리적인 구조 정보와 기하적인 특성을 효과적으로 기술할 수 있는 문서 모델을 정의한다. 제안된 방법의 성능을 평가하기 위하여 IEEE Transactions on Pattern Analysis and Machine Intelligence로부터 스캐닝한 372개의 논문 영상으로 실험한 결과, 제안된 방법은 기존 연구와 달리 다수의 문서 영상으로 구성된 문서에 대하여 논리적인 구조분석을 효율적으로 지원하였다. 특히 제안된 방법은 논리적인 구조분석의 최종 결과로서 SGML/XML 문서를 생성하기 때문에 문서의 재사용성과 호환성을 높인다.

  • PDF

XML DTD(Document Type Definition) 편집기의 설계 및 구현 (A Design and Implementation of An DTD Editor)

  • 지석진;박정환;장우영;임두욱;신동규;신동일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.237-239
    • /
    • 2000
  • 인터넷의 비약적인 발전, 네트웍 인프라의 향상으로 인해 인터넷을 이용한 문서 처리는 날로 증가하고 있으며, 이 기종간의 문서 정보 교환 역시 계속해서 증가하고 있다. 또한 문서의 표현 방법 및 문서량의 증대로 사용자의 요구는 계속 다양해져 가고 있다. 기존의 웹에서 사용되고 있는 HTML(Hyper-Text Markup Language)의 경우 그 표현력의 한계 때문에 사용자가 직접 구조적인 문서를 생성할 수가 없었다. 이에 W3C에서 XML (eXtensible Markup Language)을 발표하여 사용자가 직접 논리적인 문서의 작성하는 것이 가능하도록 했다. 이러한 XML 문서의 논리적인 구조를 표현하기 위해서는 문서의 원형을 정의할 수 있는 DTD(Document Type Definition)가 필요하며, 본 논문은 이러한 XML 문서의 원형을 정의하기 위해 필요한 DTD를 보다 효율적이며 쉽게 작성할 수 있는 DTD 편집기의 구현 및 설계에 대하여 논술한다.

  • PDF

XML 문서 관리 시스템의 순환적 DTD 구조 저장 기법 및 질의 변환 전략 (Method of storing nested DTD structure and Query translation strategy in XML Repository system)

  • 김정은;신판섭;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.299-301
    • /
    • 2000
  • XML은 문서의 구조를 독립적으로 작성할 수 있어 문서의 체계적인 구조화가 가능하다. 이러한 이유로 최근, XML 문서를 구조화하여 데이터베이스에 저장, 관리하는 XML 문서 관리 시스템 연구가 활발하다. XML 문서 관리 시스템은 XML의 구조 정보를 효과적으로 표현하기 위해 여러 가지 기법을 사용하고 있다. 그러나, 기존의 방법들은 XML 문서 구성에 따라 저장 스키마가 유동적이거나 문서 정보 검색의 제약을 가지고 있을 뿐만 아니라, DTD의 문서 구조가 순환 관계와 같이 복잡한 형태를 지닐 때, 그 구조를 적절히 반영하지 못하거나, 구조를 반영하더라도 검색 시, 모든 요소를 순차적으로 탐색해야 하는 등의 문제점을 지니고 있다. 따라서 본 연구에서는 XML의 내용이나 구성에 영향받지 않는 저장 스키마를 설계하고 정보검색의 제약을 해결가능한 경로 정보를 제안한다. 또한 순환 관계를 갖는 DTD의 구조 정보를 비 순환 구조 부분과 순환 구조 부분으로 분리, 정의하고 질의처리 시, 입력되는 XML-QL을 SQL로 변환하기 위하여 XML-QL의 패턴을 분류하고 이에 따른 중간 단계의 SQL을 정의하여 질의어 변환기법을 제안한다.

  • PDF

Topic Signature와 동시 출현 단어 쌍을 이용한 문서 범주화 (Text Categorization using Topic Signature and Co-occurrence Features)

  • 배원식;한요섭;차정원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.262-267
    • /
    • 2008
  • 본 논문에서는 문서 내에서 동시에 출현하는 단어 쌍을 자질 추출 단위로 하는 문서 범주화 시스템에 대하여 기술한다. 자질 추출 단위를 단어 쌍으로 정의한 것은 문서에서 빈번하게 동시에 출현하는 단어들은 서로 연관관계가 높으며, 단어 하나보다는 연관관계가 높은 단어들의 쌍이 특정 범주의 문서에서만 나타날 확률이 높아지므로 문서 분류 능력을 높이는데 좋은 요인으로 작용할 수 있을 것이라는 가정 때문이다. 그리고 문서 요약 분야에서 제안된 Log-likelihood Ratio를 기반으로 하는 Topic Signature Term Extraction 방법을 사용하여 자질 추출을 하고, Naive Bayes 분류기를 이용하여 문서를 분류한다. 본 연구는 Reuters-21578 문서 집합을 이용한 성능평가에서 좋은 결과를 보였으며, 이는 앞으로의 연구에도 기여할 수 있을 것이라 기대한다.

  • PDF

ThruDoc:XForms를 이용한 액티브 문서 플랫폼 개발 (ThruDoc : Development of an Active Document System Based on XForms)

  • 서원일;김기식;안형진;이정훈;이은정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.184-186
    • /
    • 2002
  • 액티브 문서 시스템은 문서를 중심으로 사용자 상호작용이나 통신 등을 지원하는 분산 컴퓨팅 모델로서 내용과 행위 정의를 포함하는 행동 가능한 문서를 통해 분산 응용 시스템을 구현하고자 하는 접근방법이다. 본 논문에서는 이러한 액티브 문서 시스템을 구현하기 위한 coordination 미들웨어로서 XForms를 이용하여 사용자 상호작용과 행위를 정의하고 웹 클라이언트가 HTTP와 소켓 기반 통신을 통해 coordination을 담당하는 시스템의 설계와 구현을 소개한다. 개발된 플랫폼 ThruDoc은 웹 상에서 여러 사용자가 액티브 문서를 통해 동시에 데이터 접근을 가능하게 하며, 동시 접근 단위와 락킹 행동을 XForms 문서에서 유연하게 정의할 수 있어 기존의 액티브 문서지원 미들웨어와 비교하였을 때 웹 기반의 구조에 자연스럽게 통합되면서도 자유로운 행위 정의가 가능하고 문서 공유가 실시간으로 가능하다는 장점을 가진다.

  • PDF

SGML 정보검색 인덱스 설계를 위한 K-ary 트리, 문서단위 구문 트리와 에리먼트 단위 구문 트리의 비교 (Comparison of K-ary tree, Document-unit parser tree and Element-unit parser tree for SGML IR index design)

  • 손정한;한성근;장재우;주종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.383-385
    • /
    • 1998
  • ISO에서 문서 교환에 대한 표준으로 제시된 SGML(Standard Generalized Markup Language)은 논문이나 보고서와 같이 내부적으로 복잡한 구조를 가지는 문서를 효과적으로 처리하기 위해 매우 융통성 있는 문법을 제공하고 있다. 이에 각 기업체나 행정기관에서는 기존의 전자 문서들을 SGML 문서로 변환하는 작업이 활발히 진행되고 있다. 따라서 문서의 논리적 구조에 기반한 검색에 대한 요구도 크게 증가하고 있다. 본 연구에서는 SGML 문서의 기본단위인 엘리먼트 단위의 검객과 문서의 논리적인 구조에 기반한 검색을 효율적으로 지원하는 인텍스를 설계하기 위해, K-ary 트리, 문서단위 구문트리와 엘리먼트단위 구문 트리의 3가지 방법에 대해 저장 시간, 삭제 시간, 검색 시간, 부가 저장 공간 측면에서 수학적 모델로서 성능평가를 수행한다.

동적인 문서 여과에서 나이브 베이즈 분류기와 코사인 유사 계수의 성능 비교 (Comparative Between Naive Bayes Classifier and Cosine Similarity Coefficient in Dynamic Document Filtering)

  • 손기준;임수연;박성배;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2006
  • 온라인 정보가 증가함에 따라 많은 양의 정보 중에서 사용자가 원하는 정보를 정확하고 신속하게 찾아 주는 문서 여과의 중요성 또한 증가하고 있는 추세이다. 본 논문은 문서 여과 문제를 이진 문서 분류 문제로 보고, 나이브 베이즈 분류기를 동적인 문서 여과 목적으로 사용하였다. 이때 사용자가 자신의 관심 분야에 해당하는 주제를 제대로 여과 받기 위해서 학습 대상으로 삼아야 할 학습문서의 범위와 관련성 있는 문서를 제대로 여과 받기 위해서 체크해야 하는 관련성 표기 비율에 따른 분류기의 성능에 대하여 실험을 하였다. 코사인 유사계수를 이용한 여과 방법과의 성능도 비교 실험하였다. 실험 결과 나이브 베이즈 이진 분류기는 문서집합의 크기가 일정한 정도일 때 관련성 있는 문서가 모두 표기되지 않더라도 여과에는 큰 영향을 미치지 않음을 볼 수 있었다.

  • PDF