• 제목/요약/키워드: Document Based Database

검색결과 197건 처리시간 0.019초

디지털 도서관 환경에서의 정보 검색을 위한 자연어 문서 및 질의 처리기에 관한 연구 (A Study on Natural Language Document and Query Processor for Information Retrieval in Digital Library)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권12호
    • /
    • pp.1601-1608
    • /
    • 2001
  • 디지털 도서관은 자연어 문서와 멀티미디어 자료에 대한 정보 검색 엔진을 필요로 하는 가장 중요한 데이터베이스 시스템이다. 이 논문은 자연어 처리 기법의 정보 검색 엔진과 브라우저에 대한 설계와 실험 결과를 소개한다. 자연어 문서에 대한 정보 검색 과정은 어휘 분석, 구문 분석, 스테밍, 주제어 색인 등의 계산학적 처리를 포함한다. 많은 이미지와 이미지의 제목, 그리고 자연어로 기술된 설명 문서를 포함하는 실험적인 데이터베이스 ‘Earth and Space Science’를 통해서 자연어 문서 분석에 기반하는 정보 검색 기능을 실험하였다. 또한 디지털 도서관 환경에서의 멀티미디어 정보 검색 내용 기반의 이미지 검색 엔진과 병행하는 정보 검색 시스템으로서의 가능성을 보여준다.

  • PDF

Similarity Measurement Between Titles and Abstracts Using Bijection Mapping and Phi-Correlation Coefficient

  • John N. Mlyahilu;Jong-Nam Kim
    • 융합신호처리학회논문지
    • /
    • 제23권3호
    • /
    • pp.143-149
    • /
    • 2022
  • This excerpt delineates a quantitative measure of relationship between a research title and its respective abstract extracted from different journal articles documented through a Korean Citation Index (KCI) database published through various journals. In this paper, we propose a machine learning-based similarity metric that does not assume normality on dataset, realizes the imbalanced dataset problem, and zero-variance problem that affects most of the rule-based algorithms. The advantage of using this algorithm is that, it eliminates the limitations experienced by Pearson correlation coefficient (r) and additionally, it solves imbalanced dataset problem. A total of 107 journal articles collected from the database were used to develop a corpus with authors, year of publication, title, and an abstract per each. Based on the experimental results, the proposed algorithm achieved high correlation coefficient values compared to others which are cosine similarity, euclidean, and pearson correlation coefficients by scoring a maximum correlation of 1, whereas others had obtained non-a-number value to some experiments. With these results, we found that an effective title must have high correlation coefficient with the respective abstract.

Digital Government Application: A Case Study of the Korean Civil Documents using Blockchain-based Resource Management Model

  • Hanbi Jeong;Jihae Suh;Jinsoo Park;Hanul Jung
    • Asia pacific journal of information systems
    • /
    • 제32권4호
    • /
    • pp.830-856
    • /
    • 2022
  • The Digital Government landscape is changing to reflect how governments try to discover innovative digital solutions, and how they transform themselves in the process. In addition, with the advent of information and communication technology (ICT), e-governance became an essential part of the government. Among the services provided by the Korean government, the Minwon24 online portal is the most used one. However, it has some processing limitations, namely: (1) it provides a cumbersome document authenticity service; (2) people cannot know what happened even if the agency handles the documents arbitrarily. To address the issues outlined above, blockchain processing can be a good alternative. It has a tremendous potential in that it has maximum transparency and a low risk of being hacked. Resource management is one of the areas where blockchain is frequently used. The present study suggests a new model based on blockchain for Minwon24; the proposed model is a type of resource management. There are three participants: issuer, owner and receiver. The proposed model has two stages: issuing and exchanging. Issuing is creating civil documents on the database, which is BigchainDB in this study. Exchanging, the next stage, is a transaction between the owner and the receiver. Based on this model, the actual program is built with the programming language Python. To evaluate the model, the study uses various criteria and it shows the excellence of the model in comparison to others in prior research.

XML기반의 EDI 문서교환을 위한 미들웨어 설계 및 구현 (Design and Implementation of Middleware supporting translation of EDI using XML)

  • 최광미;박수영;정채영
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.845-852
    • /
    • 2002
  • EDI를 이용한 전자문서 처리는 별도의 전용 소프트웨어와 부가가치망을 이용해 문서를 교환하게 되는데, 전용 소프트웨어의 사용은 새로운 문서에 대한 변경이 필요하며, 부가가치망의 사용은 문서교환과 유지보수에 많은 비용이 소요된다. 이러한 문제점 때문에 VAN 기반의 기존 EDI가 웹기반의 EDI로 옮겨지고 있다. 본 논문에서는 JDBC 브리지를 이용하여 두개의 관계형 데이터베이스에 존재하는 EDI 메시지를 XML로 변환하는 기법을 제안한다. 변환된 XML 파일을 사용하여 스키마를 그대고 복구하는 동시에 정의된 테이블에 원래 레코드를 그대로 삽입하는 방범을 제시하였다. 이는 동일한 데이터베이스 관리시스템을 사용해야 한다는 전제조건을 필요로 했던 기존방식을 탈피했으며, 전자문서 교환시 환경에 따라 정상적으로 동작하지 않았던 경우의 문제점을 극복했다.

XMDR을 이용한 분산 DB의 동기화 에이전트 (A Synchronizing Agent in Distributed Database using XMDR)

  • 국윤규;정계동;최영근
    • 정보처리학회논문지A
    • /
    • 제12A권1호
    • /
    • pp.31-40
    • /
    • 2005
  • 본 논문에서는 분산되어 있는 데이터의 상호운용성을 보장하기 위하여 XMDR(XML Metadata Registry)을 제안하고, 이를 이용한 데이터 동기화 에이전트 시스템에 대하여 기술한다. XMDR은 데이터의 공유 및 교환에 있어 데이터 이질성 문제를 해결하기 위하여 사용된다. 데이터 이질성은 주로 동일한 정보에 대하여 서로 다르게 정의하거나 표현이 불일치되어 발생한다. 따라서 MDR 명세를 바탕으로 동기화 하려는 데이터 요소들을 분석하고, 이를 바탕으로 XML로 정의한 XMDR을 이용하여 해결할 수 있다. 본 논문에서 제안한 동기화 에이전트 시스템은 분산 데이터의 동기화 진행에 있어서, 데이터 상호운용을 위한 XMDR을 이용하여 데이터 이질성을 해결할 수 있으며, 또한 시스템 수와 동기화 요청빈도수 증가에 따른 에러 빈도수 감소를 통해 보다 신뢰성 있는 동기화 에이전트를 제공한다.

XML 기반의 이기종 DBMS간 데이터 복제 웹 에이전트 설계 및 구현 (Design and Implementation of Data Replication Web Agent between Heterogeneous DBMSs based on XML)

  • 유선영;임재홍
    • 한국항해항만학회지
    • /
    • 제26권4호
    • /
    • pp.427-433
    • /
    • 2002
  • 최근 인터넷에서 사용되고 있는 하이퍼텍스트 생성 언어(HTML : Hyper Text Markup Language)는 제한된 태그(Tag)들을 사용하기 때문에 문서를 구조화시키지 못해 정보 축적과 정의추출 방법이 비효율적이고 추출한 정보의 가공이 어렵다. 그러나 확장성 생성 언어 (XML ; eXtensible Markup Language)는 사용자가 문서상에 사용될 태그를 자유롭게 정의할 수 있고 다른 사람들도 그 태그를 사용할 수 있기 때문에 HTML에 비해 정보 축적과 정보추출 방법이 용이하다. 서로 다른 데이터베이스를 사용하고 있는 항만 관련 업체들간의 물류에 관한 정보를 공유하거나 교환하기 위해서는 HTML이 아닌 XML이 더 적합하다. 본 논문에서는 항만업체들의 요구를 수용하기 위해 XML을 이용하여 웹에서 이기종 데이터베이스 관리 시스템(DBMS ; Database Management System)간의 데이터 복제 및 정보를 교환할 수 있는 웹 에이전트 시스템을 설계하고 구현하였다.

공통 문서 구조 추출을 통한 XML DTD의 관계형 데이터 베이스 스키마 변환 기법 (A Transformation Technique of XML DTD to Relational Database Schema Based On Extracting Common Structure in XML Documents)

  • 안성은;최황규
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.999-1008
    • /
    • 2002
  • XML은 W3C에 제안된 마크업 언어고 HTML의 단순함과 SGML의 복잡함을 극복하여, 웹 상에서 데이터를 표현하고 교환하기 위한 표준으로 등장하고 있다. XML 문서를 질의 처리하기 위한 방법으로 XML 문서 전용 질의 언어가 개발되고 있지만, 데이터의 양이 증가한다면 결국 막대한 양의 데이터를 처리 할 데이터베이스 시스템을 필요하게 된다. 본 논문에서는 XML DTD를 관계형 데이터베이스 시스템 스키마로 변환하는 기법을 제안한다. 제안된 기법은 XML 데이터의 스키마 역할을 하는 DTD의 트리 구조를 생성하여, XML 데이터들의 공통구조와 비공통구조를 추출한 후 관계형 데이터베이스 스키마를 추출하는 기법이다. 추출된 관계형 데이터베이스 스키마는 기존의 방법들에 비해 생성 테이블 수가 적으며, 널(NULL)값의 출현을 감소시킨다. 또한, 제안기법은 XML 데이터를 보다 적은 테이블로 맵핑(mapping)시킴으로써 데이터 검색 시 참조 테이블 수를 감소시킬 수 있으며 질의 처리 시에도 성능 면에서 우수함을 보인다.

XML 데이터베이스 시스템을 기반으로 한 B2B 통합 시스템 개발 (Developing a B2B Integration System based on XML Database System)

  • 이정수;정상혁;주경수
    • 한국멀티미디어학회논문지
    • /
    • 제6권1호
    • /
    • pp.1-14
    • /
    • 2003
  • 전자상거래는 여러 가지 종류의 교류와 예측하기 힘든 양의 데이터 변화를 필요로 한다. 따라서 많은 플랫폼과 시스템은 서로 중립적인 데이터 교류에 필요한 표준을 필요로 하는데, 이 요구를 만족시켜 줄 수 있는 기술 중 하나가 바로 XML이며, 이는 W3C에 의해 표준으로 자리잡았다. 또한 XML은 표준화와 운영체제 중립적이라는 특성 때문에 전자상거래에서 중요한 위치를 차지하며, 이미 많은 전자상거래 시스템에서 이용하고 있다. 본 논문에서는, 기업 간 거래에서 사용될 XML 문서를 설계하였고, 이 문서를 주고받아 거래를 완료하는 B2B 통합 시스템을 XML 저장시스템을 기반으로 구현하였다 또한 기업간의 이질적인 XML 문서의 교환을 위하여 XML문서의 형식을 변환 시켜 줄 수 있는 XSLT을 사용하였다. 이로써 본 논문에서 구축한 시스템을 이용하여 기업간의 XML 문서 교환을 형식에 제한을 받지 않고 원활하게 할 수 있을 것이다.

  • PDF

XML Type vs Inlined Shredding into Tables for Storing XML Documents in RDBMS

  • Jin, Min;Seo, Min-Jun
    • 한국멀티미디어학회논문지
    • /
    • 제10권12호
    • /
    • pp.1539-1550
    • /
    • 2007
  • As XML is increasingly used for representing and exchanging data, relational database systems have been trying extend their features to handle XML documents XML documents can be stored in a column with XML data type like primitive types. The shredding method, which is one of the traditional methods for storing and managing XML documents in RDBMS, is still useful and viable although it has some drawbacks due to the structural discrepancy between XML and relational databases. This method may be suitable for data-centric XML documents with simple schema. This paper presents the extended version of the Association inlining method that is based on inlined shredding and compares the performance of querying processing to that of XML type method of conventional relational database systems. The experiments showed that in most cases our method resulted in better performance than the other method based on XML data type. This is due to the fact that our shredding method keeps and uses the order and path information of XML documents. The path table has the information of the corresponding table and column for each distinct path and the structure information of the XML document is extracted and stored in data tables.

  • PDF

VML을 이용한 웹노트 : MyNote (A Web Note using VML : MyNote)

  • 박영목;유경종;정정욱;이부권;서영건
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.530-537
    • /
    • 2002
  • 현재 웹기반 교육의 형태가 계속해서 증가하고 있지만, 여전히 홈페이지 형태의 교재를 사용하고, 웹브라우저 상에서 강의 노트를 만드는 환경만이 제공되고 있다. 본 연구에서는 웹 상에서 학생들이 VML과 DHTML을 사용하여 선을 긋고 필기를 할 수 있는 웹노트인 MyNote를 제안한다. 노트의 내용은 서버에 저장되고, 동적으로 생성된 텍스트 기반의 VML은 데이터베이스에 저장된다. 강의 교재로 사용되는 문서는 서버에서 클라이언트로 내려 받고 VML내용은 데이터베이스로부터 가져오게 된다. MyNote로 학생들은 웹에서 자신만의 서재를 가질 수 있다. 필기된 내용이 웹 상에서 저장 및 출력되고, 필기 내용을 다시 볼 수 있으므로 재학습이 가능하다.

  • PDF