• 제목/요약/키워드: Databases

검색결과 5,085건 처리시간 0.033초

Implementation issues for Uncertain Relational Databases

  • Yu, Hairong;Ramer, Arthur
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 The Third Asian Fuzzy Systems Symposium
    • /
    • pp.128-133
    • /
    • 1998
  • This paper aims to present some ideas for implementation of Uncertain Relational Databases (URD) which are extensions of classical relational databases. Our system firstly is based on possibility distribution and probability theory to represent and manipulate fuzzy and probabilistic information, secondly adopts flexible mechanisms that allow the management of uncertain data through the resources provided by both available relational database management systems and front-end interfaces, and lastly chooses dynamic SQL to enhance versatility and adjustability of systems.

  • PDF

An assessment of the taxonomic reliability of DNA barcode sequences in publicly available databases

  • Jin, Soyeong;Kim, Kwang Young;Kim, Min-Seok;Park, Chungoo
    • ALGAE
    • /
    • 제35권3호
    • /
    • pp.293-301
    • /
    • 2020
  • The applications of DNA barcoding have a wide range of uses, such as in taxonomic studies to help elucidate cryptic species and phylogenetic relationships and analyzing environmental samples for biodiversity monitoring and conservation assessments of species. After obtaining the DNA barcode sequences, sequence similarity-based homology analysis is commonly used. This means that the obtained barcode sequences are compared to the DNA barcode reference databases. This bioinformatic analysis necessarily implies that the overall quantity and quality of the reference databases must be stringently monitored to not have an adverse impact on the accuracy of species identification. With the development of next-generation sequencing techniques, a noticeably large number of DNA barcode sequences have been produced and are stored in online databases, but their degree of validity, accuracy, and reliability have not been extensively investigated. In this study, we investigated the extent to which the amount and types of erroneous barcode sequences were deposited in publicly accessible databases. Over 4.1 million sequences were investigated in three largescale DNA barcode databases (NCBI GenBank, Barcode of Life Data System [BOLD], and Protist Ribosomal Reference database [PR2]) for four major DNA barcodes (cytochrome c oxidase subunit 1 [COI], internal transcribed spacer [ITS], ribulose bisphosphate carboxylase large chain [rbcL], and 18S ribosomal RNA [18S rRNA]); approximately 2% of erroneous barcode sequences were found and their taxonomic distributions were uneven. Consequently, our present findings provide compelling evidence of data quality problems along with insufficient and unreliable annotation of taxonomic data in DNA barcode databases. Therefore, we suggest that if ambiguous taxa are presented during barcoding analysis, further validation with other DNA barcode loci or morphological characters should be mandated.

자원공유 수단으로서의 전문 데이터베이스 (Full-text databases as a means for resource sharing)

  • 노진구
    • 한국도서관정보학회지
    • /
    • 제24권
    • /
    • pp.45-79
    • /
    • 1996
  • Rising publication costs and declining financial resources have resulted in renewed interest among librarians in resource sharing. Although the idea of sharing resources is not new, there is a sense of urgency not seen in the past. Driven by rising publication costs and static and often shrinking budgets, librarians are embracing resource sharing as an idea whose time may finally have come. Resource sharing in electronic environments is creating a shift in the concept of the library as a warehouse of print-based collection to the idea of the library as the point of access to need information. Much of the library's material will be delivered in electronic form, or printed. In this new paradigm libraries can not be expected to su n.0, pport research from their own collections. These changes, along with improved communications, computerization of administrative functions, fax and digital delivery of articles, advancement of data storage technologies, are improving the procedures and means for delivering needed information to library users. In short, for resource sharing to be truly effective and efficient, however, automation and data communication are essential. The possibility of using full-text online databases as a su n.0, pplement to interlibrary loan for document delivery is examined. At this point, this article presents possibility of using full-text online databases as a means to interlibrary loan for document delivery. The findings of the study can be summarized as follows : First, turn-around time and the cost of getting a hard copy of a journal article from online full-text databases was comparable to the other document delivery services. Second, the use of full-text online databases should be considered as a method for promoting interlibrary loan services, as it is more cost-effective and labour saving. Third, for full-text databases to work as a document delivery system the databases must contain as many periodicals as possible and be loaded on as many systems as possible. Forth, to contain many scholarly research journals on full-text databases, we need guidelines to cover electronic document delivery, electronic reserves. Fifth, to be a full full-text database, more advanced information technologies are really needed.

  • PDF

탠덤 질량 분석을 위한 디코이 데이터베이스 생성 방법의 중복성 관점에서의 성능 평가 (Evaluation of the Redundancy in Decoy Database Generation for Tandem Mass Analysis)

  • 이홍란;류단휘;이기욱;황규백
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권1호
    • /
    • pp.56-60
    • /
    • 2016
  • 탠덤 질량 분석에서는 신뢰도 높은 펩타이드 동정을 위해 목표 데이터베이스의 참조 단백질 순서를 재배치한 디코이 데이터베이스가 주로 이용된다. 한편 목표 데이터베이스와 디코이 데이터베이스 사이 혹은 디코이 데이터베이스 내부에 서열이 동일한 중복 펩타이드가 존재할 수 있으며, 이는 단백질 동정을 어렵게 하는 요인이 된다. 따라서 디코이 데이터베이스의 중복성을 최소화하는 것은 중요한 문제이다. 본 논문에서는 디코이 데이터베이스 생성에 널리 사용되는 의사셔플(pseudo-shuffling)과 의사역순(pseudo-reversing) 방법이 디코이 데이터베이스의 중복성에 미치는 영향을 조사하였다. 실험 결과, 목표 데이터베이스 크기와 데이터베이스 생성 시 허용되는 'missed cleavage site'의 최대 개수는 중복성을 증가시킴을 확인하였다. 또한 동일한 조건에서는 의사역순 방법이 의사셔플보다 항상 낮은 수준의 중복성을 가지는 디코이 데이터베이스를 생성하였다.

다중축척 공간 데이터베이스에서 축소연산자를 위한 위상 일관성 (Topological Consistency for Collapse Operator on Multi-Scale Databases)

  • 권오제;강혜경;이기준
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 추계 학술대회 논문집
    • /
    • pp.27-40
    • /
    • 2004
  • 다중축척 공간데이터베이스란 동일한 현실 공간을 여러 축척의 데이터베이스로 저장한 것을 말한다. 이 다중축척의 데이터베이스는 기존에 구축된 원시 데이터베이스로부터 유도될 수 있다. 그런데 이 유도과정에서 원시 데이터베이스에 있던 기하 및 위상관계는 변형이 된다. 그리고 이 관계 변형은 유도된 데이터베이스의 무결성을 보장하지 못하는 원인이 된다. 때문에 유도된 데이터베이스가 원시 데이터베이스와 일관성이 있는지를 조사할 필요가 있다. 이 논문은 원시 데이터베이스와 유도된 다중축척 데이터베이스간의 위상적 일관성에 초점을 둔다. 특히, 2차원 공간객체가 1차원으로 축소되었을 때 위상관계의 일관성을 평가하는 방법을 제안할 것이다. 즉, 2차원 공간객체간에 위상관계를 표현하는 8가지 위상관계를 2차원과 1차원 공간객체간에 위상관계를 표현하는 19가지 위상관계로 일관성 있게 전환하는 4가지 방법을 제안할 것이다. 이 방법들은 새로 생성된 다중축척 데이터베이스의 위상관계가 원시 데이터베이스로부터 일관성 있게 유도되었는지를 판단하는 근거가 될 수 있다. 또, 다중축척 데이터베이스간에 위상관계의 일관성을 보장하므로 동일 공간에 주어진 사용자 질의는 축척에 상관없이 그 결과가 동일하게 된다.

  • PDF

이기종 데이터베이스 통합을 위한 미들웨어 개발 (Development of middle-ware for integration of heterogeneous databases)

  • 정다운;박시형;추영열
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.101-103
    • /
    • 2012
  • 다양한 응용프로그램에서 해당 목적에 따라 서로 다른 데이터베이스 시스템을 사용하여 정보를 저장한다. 하지만 여러 데이터베이스에 저장된 정보를 하나의 응용프로그램을 통해 서비스하기 위해선 각각의 데이터베이스 정보를 통합해야 한다. 서로 다른 이기종 데이터베이스에서 생성되는 정보 중 필요한 정보만 선별하여 저장하는 통합 미들웨어 시스템 개발에 대해 기술한다.

  • PDF

이용자 인터페이스에 관한 연구-인터넷 특허정보 데이터베이스를 중심으로-

  • 최경화;이란주
    • 한국도서관정보학회지
    • /
    • 제29권
    • /
    • pp.213-239
    • /
    • 1998
  • The purpose of this study is to provide more effective utilization of Internet patent information databases and to help develop an user-friendly interface design. Search functions, level of user-friendliness and user-suport have been closely analyzed, using USPTO, QPAT-US, IBM as well as the relatively well-known domestically-developed Patrom. The factors used in this quality evaluation are those resulting from the combination of CD-ROM databases and traditional databases. The followings are the results. Patrom most effectively utilizes the characteristics of databases. USPTO provides the most adequate Interface for a novice user. QPAT-US employs various auxilary services while IBM uses an assortment of search methods and images. In addition, it is expected that the findings will contribute to the development of user-friendly interface databases.

  • PDF

BioStore: A Repository System for Registering and Distributing Public Biology Databases

  • Tae, Hong-Seok;Han, Jeong-Min;Ahn, Bu-Young;Park, Kie-Jung
    • Genomics & Informatics
    • /
    • 제7권1호
    • /
    • pp.49-51
    • /
    • 2009
  • Although abundant biology data have been accumulated in public biology databases, such as GenBank and PIR, few easy-interface services are provided for users to access or update them. We have developed a system, named BioStore, that is composed of several programs to aid users to not only access public data but also share their own data easily. The service can be used for maintaining a local database as a repository of raw data files of several public databases and distributing the data files to other users. Currently, BioStore manipulates major bio-databases and will expand to include more databases and more useful interfaces.

과학기술분야 서지 DB의 품질관리 및 평가 방안: KORDIC의 KRISTAL DB를 중심으로 (Methods for Quality Control and Evaluation in the Scientific and Technical Bibliographic Databases)

  • 이제환
    • 한국문헌정보학회지
    • /
    • 제31권3호
    • /
    • pp.109-134
    • /
    • 1997
  • 이 연구는 국내 과학기술계에서 구축하고 있는 서지 DB의 품질 문제를 다루고 있다. 구체적으로, 과학기술분야의 중추적인 정보유통기관인 KORDIC이 1990년대 초부터 구축해 오고 있는 KRISTAL DB 중에서 핵심이라 할 수 있는 UNION DB와 SATURN DB를 선정하여 그 품질을 평가하고 개선방안을 제시한다. 특히, UNION DB와 SATURN DB의 품질 평가를 위한 접근 방식에서, 기존의 시스템개발자 중심의 논리를 배격하고 이용자 중심의 평가 기준을 제시함으로써 '정보시스템의 설계 및 평가'에 있어서 이용자의 중요성을 강조한다.

  • PDF

Evaluation of 16S rRNA Databases for Taxonomic Assignments Using a Mock Community

  • Park, Sang-Cheol;Won, Sungho
    • Genomics & Informatics
    • /
    • 제16권4호
    • /
    • pp.24.1-24.4
    • /
    • 2018
  • Taxonomic identification is fundamental to all microbiology studies. Particularly in metagenomics, which identifies the composition of microorganisms using thousands of sequences, its importance is even greater. Identification is inevitably affected by the choice of database. This study was conducted to evaluate the accuracy of three widely used 16S databases-Greengenes, Silva, and EzBioCloud-and to suggest basic guidelines for selecting reference databases. Using public mock community data, each database was used to assign taxonomy and to test its accuracy. We show that EzBioCloud performs well compared with other existing databases.