• Title/Summary/Keyword: 문서과

Search Result 2,264, Processing Time 0.034 seconds

E-비즈니스 DTD문서 생성을 위한 XML DTD 편집 시스템 (XML DTD Edit System to create fur DTD document of e-business)

  • 이상복;김창수;조현성;조현규;정희경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.715-717
    • /
    • 2001
  • e-비즈니스에서 사용되는 정보교환 문서는 효율적으로 정보를 전송하고 시스템에 독립성을 갖고 있어 거래 파트너간 상호 운용성을 향상 시켜야 한다. 기존의 정보 교환 전자 문서는 e-비즈니스에서 사용함에 있어서 정보교환 및 상호 운용성 측면에서 문제점들이 발생하였다. XML의 등장으로 정보 교환 및 상호 운용성에서 발생되었던 문제점들을 해결할 수 있는 계기가 되었다. XML문서의 논리적인 구조를 표현하기 위해서는 문서 원형을 정의 할 수 있는 DTD문서가 필요하다. 각 e-비즈니스 XML 문서에 맞는 DTD 문서들이 존재하며 이러한 DTD 문서를 보다 쉽고 효율적으로 작성 할 수 있는 e-비즈니스 DTD문서 편집 시스템의 필요성이 증대되고 있다. 이에 본 논문에서는 e-비즈니스 XML 문서에서 사용되어지는 DTD문서를 보다 쉽고 효율적으로 편집 할 수 있는 DTD문서 편집 시스템의 설계 및 구현 하였다.

  • PDF

DTD의 의미 구조 분석을 이용한 XML 문서의 변환 (A Transformation of XML Documents With Semantic Constraints)

  • 곽동규;최종명;조용윤;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.589.2-861
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서를 다른 XML 어플리케이션에서 재 사용하여 사용자에게 동일한 정보를 제공하는데 있다 XML 문서는 어플리케이션 특성에 따라 한 문서에서 전달할 수 있는 정보의 량이 다르다. 따라서 문서를 변환하기 전에 어플리케이션의 특성에 따라 문서를 분할하거나 병합하여야 한다[1]. 또한, XML 문서의 정보는 속성에 따라 문법적인 특성을 가진다. 본 논문은 문벌적인 특성을 의미 속성이라 하고 의미 속성을 파악하기 위해 XML 문서의 의미 구조와 의미 구조 관계를 정의한다. 그리고 정의된 의미 구조와 의에 구조 관계를 이용하여 문서 정보의 속성을 분류하는 방법을 제안한다. 변환 규칙은 의ロP 구조 관계가 유사한 엘리먼트간의 대응으로 정의하고, 변환 규칙을 이용하여 문서 변환을 실행하여 변환 XML과 의미 관계 구조가 유사한 피 변환 XML 문서를 생성한다. 의미구조 분석을 이용한 변환은 기존의 사용 패턴을 분석한 변환에서 벗어나 DTD의 분석을 통한 자동화된 문서 변환 방법을 제공한다.

  • PDF

멀티미디어 기술문서를 위한 자동 XML 변환기 개발 (Development of Automatic XML Converter for Multimedia Technical Documents)

  • 박건일;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.45-47
    • /
    • 1999
  • 전자도서관과 같은 문서 정보 검색 시스템의 구축을 위한 중요한 요소 기술은 지금까지 출판물로 만들어 놓은 기존의 방대한 자료와 이미 다양한 형식으로 전자문서화 되어 있는 문서정보를 사용자에게 얼마나 단일 형식으로 통일화시켜 효과적으로 제공할 수 있는가이다. 본 논문은 이러한 문제에 있어서 표준화된 단일 전자문서 형식으로 XML 문서를 적용시키기 위해 국립 중앙 도서관 표준 SGML DTD를 XML DTD로 재정의한 후, 일반적이로, 다양한 특성을 지닌 멀티미디어 기술 문서를 표준화된 XML 문서로 자동 변환하는 자동 XML 변환기를 개발하는 것을 목적으로 하고 있다. 자동 XML 변환기는 다양한 문서형식의 전자문서를 표준화된 XML 문서로 자동변환함으로써 문서 정보검색 시스템에서의 문서정보의 교환, 저장방법상의 표준화 및 문서 형식의 단일화를 제공해 줄 수 있다.

  • PDF

SVM 학습을 이용한 다중 클래스 뉴스그룹 문서 분류 (Classification of Multiclass Newsgroup Documents Using SVM Learning)

  • 오장민;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.60-62
    • /
    • 1999
  • 다중 클래스 문서분류는 주어진 여러 개의 관심사별로 문서를 선별해 주는 문제이다. 문서 분류 문제의 특징은 문서가 매우 높은 차원으로 표현된다는 것이다. 다른 학습 알고리즘에 비해 SVM 알고리즘은 차원을 전혀 줄이지 않고 문제를 해결한다. 본 논문에서는 SVM 학습 알고리즘을 이용하여 대규모의 뉴스 그룹 문서 분류 문제를 다룬다. 다중 클래스 문서 분류를 위해서 각 클래스에 대한 SVM학습 결과를 효과적으로 결합하였으며 실험을 통하여 SVM과 다른 학습 알고리즘과의 성능을 비교하였다.

  • PDF

XML 문서 저장 시스템의 설계 및 구현 (Design and Implementation of an SML Document Storage System)

  • 이용석;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.347-349
    • /
    • 1998
  • 최근 W3C에서 개발하고 있는 차세대 웹 문서인 XML을 이용한 웹 구축이 진행중이다. 많은 문서들이 XML문서형식으로 작성이 되는데 이렇게 대량으로 생산되는 문서들을 적절히 저장하고 다시 사용자의 질의에 맞게 재가공 되어서 제공할 수 있는 저장 시스템이 필요한데, 본 논문에서는 XML문서들의 DTD에 독립적인 데이터베이스를 구축하여 XML문서의 엘리먼트 트리상에서의 항해와 구조적 질의를 수행하기 위한 데이터베이스 구축 방법과, XML XPointer를 이용한 하이퍼링킹을 수행 하기 위한 저장 프로시듀어를 제시한다.

텍스트 문서의 주제어 추출을 위한 확률적 그래프 모델의 학습 (Learning Probabilistic Graph Models for Extracting Topic Words in a Collection of Text Documents)

  • 신형주;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.265-267
    • /
    • 2000
  • 본 논문에서는 텍스트 문서의 주제어를 추출하고 문서를 주제별로 분류하기 위해 확률적 그래프 모델을 사용하는 방법을 제안하였다. 텍스트 문서 데이터를 문서와 단어의 쌍으로(dyadic)표현하여 확률적 생성 모델을 학습하였다. 확률적 그래프 모델의 학습에는 정의된 likelihood를 최대화하기 위한 EM(Expected Maximization)알고리즘을 사용하였다. TREC-8 AdHoc 텍스트 에이터에 대하여 학습된 확률 그래프 모델의 성능을 실험적으로 평가하였다. 이로부터 찾아 낸 문서에 대한 주제어가 사람이 제시한 주제어와 유사한 지와, 사람이 각 주제에 대해 분류한 문서가 이 확률모델로부터의 분류와 유사한 지를 실험적으로 검토하였다.

  • PDF

XML 기반 가상문서에서의 멀티미디어 및 구조적 문서의 표현과 처리 (Representing and Processing Multimedia and Structured Documents For XML-Based Virtual Documents)

  • 박천수;임동수;박종현;강민구;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.246-248
    • /
    • 2000
  • 가상문서는 웹 상에 존재하는 내용 중에서 원하는 부분만을 링크를 이용해 새로운 문서를 생성하는 개념이다. 본 논문에서는 가상문서를 지원하는 디지털 도서관 시스템에서 텍스트, 이미지 데이터뿐 아니라 멀티미디어 데이터와 구조적 의미를 갖는 데이터를 처리 가능하도록 DTD의 표기법을 확장하였다. 또한, 저작도구에서 생성된 내포링크, 참조링크, 총칭링크 등 다양한 의미의 가상무서를 브라우징 가능하도록 문서 변환기에서 멀티미디어와 구조적 문서를 처리하기 위한 방법을 제시하였다.

  • PDF

웹 문서 검색을 위한 한글 MG 시스템의 확장 (An Extension of Hangul MG System for Web Document Retrival)

  • 김범수;나연묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.290-292
    • /
    • 2000
  • 최근 국대 인터넷 발전과 더불어 검색엔진들의 수요가 많아지고 있어 크고 작은 검색엔진들이 많이 개발되고 있다. 기존의 디지털 라이브러리에 사용되고 있는 정보 검색 엔진인 한글 MG 시스템을 웹 문서 검색에 적용하는데는 어려움이 있었다. 본 논문은 한글 MG 시스템을 기반으로 웹 사이트의 내부 문서 검색이 가능한 소형검색엔진으로 확장하는데 필요한 웹 로봇에 의한 문서 수집, 수집된 문서의 가공, 메타 데이터의 데이터베이스와, 단락 대 문서 사상, 문서 검색을 위한 질의 루틴의 수정과 웹 검색 및 시스템 관리 인터페이스에 대한 방안들을 제안하여 확장 시스템을 설계하고 구현하였다.

  • PDF

어휘정보와 통사정보를 모두 이용한 문서분류 (Text Categorization Using Both Lexical Information and Syntactic Information)

  • 박성배;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.37-39
    • /
    • 2001
  • 현재 이용가능한 대부분의 자동문서분류 시스템의 가장 큰 문제는 문서에 포함된 단어 사이의 통사 정보는 무시한 채, 각 단어의 분포만 고려한다는 점이다. 하지만, 통사 정보도 문서 분류를 위해 매우 중요한 정보 중의 하나이다. 본 논문에서는 문서에 나타난 어휘 정보와 함께 통사 정보를 함께 고려하는 자동문서분류 방법을 제시한다. Reuters-21578 말뭉치에 대한 문서분류 실험결과 제시된 방법은 어휘정보만 사용하는 방법과 통사정보만 사용하는 방법 모두보다 높은 성능을 보인다 이 말뭉치에 대해서, 어휘정보만으로 학습된 Support Vector Machine으로 약 77%의 매우 높은 정확도를 얻을 수 있음에도 약 0.63%의 추가적인 성능 향상이 있었다.

  • PDF

검증 규칙을 포함한 XML 문서 (XML Documents Including Validation Rules)

  • 남철기;양재군;배재학
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.709-711
    • /
    • 2001
  • 본 논문에서는 XML 문서에 문서검증을 위한 로직을 추가하였다 로직을 기술하기 위해 규칙 표현에 효과적인 Prolog를 이용하였고 검증 규칙을 XML 문서로 변환하여 원래의 XML 문서에 포함시켰다. XML 문서검증에 관한 연구가 기존에는 주로 문서 구조의 검증에 치중한 반면 본 논문은 XML 엘리먼트의 데이터 값 검증에 역점을 두었다. 또한 폼 값의 검증을 XML과 Prolog를 이용하여 검증함으로써 스크립트언어를 사용해 검증하는 일반적인 방법을 개선하였다.

  • PDF