• 제목/요약/키워드: Knowledge Database

검색결과 993건 처리시간 0.026초

EST Analysis system for panning gene

  • Hur, Cheol-Goo;Lim, So-Hyung;Goh, Sung-Ho;Shin, Min-Su;Cho, Hwan-Gue
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2000년도 International Symposium on Bioinformatics
    • /
    • pp.21-22
    • /
    • 2000
  • Expressed sequence tags (EFTs) are the partial segments of cDNA produced from 5 or 3 single-pass sequencing of cDNA clones, error-prone and generated in highly redundant sets. Advancement and expansion of Genomics made biologists to generate huge amount of ESTs from variety of organisms-human, microorganisms as well as plants, and the cumulated number of ESTs is over 5.3 million, As the EST data being accumulate more rapidly, it becomes bigger that the needs of the EST analysis tools for extraction of biological meaning from EST data. Among the several needs of EST analyses, the extraction of protein sequence or functional motifs from ESTs are important for the identification of their function in vivo. To accomplish that purpose the precise and accurate identification of the region where the coding sequences (CDSs) is a crucial problem to solve primarily, and it will be helpful to extract and detect of genuine CD5s and protein motifs from EST collections. Although several public tools are available for EST analysis, there is not any one to accomplish the object. Furthermore, they are not targeted to the plant ESTs but human or microorganism. Thus, to correspond the urgent needs of collaborators deals with plant ESTs and to establish the analysis system to be used as general-purpose public software we constructed the pipelined-EST analysis system by integration of public software components. The software we used are as follows - Phred/Cross-match for the quality control and vector screening, NCBI Blast for the similarity searching, ICATools for the EST clustering, Phrap for EST contig assembly, and BLOCKS/Prosite for protein motif searching. The sample data set used for the construction and verification of this system was 1,386 ESTs from human intrathymic T-cells that verified using UniGene and Nr database of NCBI. The approach for the extraction of CDSs from sample data set was carried out by comparison between sample data and protein sequences/motif database, determining matched protein sequences/motifs that agree with our defined parameters, and extracting the regions that shows similarities. In recent future, in addition to these components, it is supposed to be also integrated into our system and served that the software for the peptide mass spectrometry fingerprint analysis, one of the proteomics fields. This pipelined-EST analysis system will extend our knowledge on the plant ESTs and proteins by identification of unknown-genes.

  • PDF

Chinese Patients with Gastric Cancer Need Targeted Adjuvant Chemotherapy Schemes

  • Shi, Wen-Tao;Wei, Lei;Xiang, Jin;Su, Ke;Ding, Qiong;Tang, Meng-Jie;Li, Ji-Qiang;Guo, Yi;Wang, Pu;Zhang, Jing-Wei
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권10호
    • /
    • pp.5263-5272
    • /
    • 2012
  • Background: Gastric cancer (GC) is one of the most common cancers in China. Adjuvant chemotherapy (AC) is a routine auxiliary treatment for GC recommended by the guidelines issued in 2011 by the Ministry of Health of the People's Republic of China, but the relevant credible consequences in China have been insufficient because of China's late start and ethical concerns. Methods: A series of databases, including Cochrane Library, MEDLINE, EMBASE, the Chinese database of the National Knowledge Infrastructure and the VIP database, were searched by 2 reviewers independently for studies investigating AC for GC through March 2012. The retrieved literature was screened according to the eligibility criteria. Results: A total of 35 randomized control trials (RCTs) were subjected to the final analysis, including 4,043 patients in treatment group and 3,884 in the control group, as well as 4 clinical-control trials (CCTs), which accessed the final analysis with 238 and 252 patients, respectively. AC reduced the risk of death as a protective treatment with statistical significance (HR=0.91, 95%CI: [0.85, 0.97], P=0.002), and it seemed more effective for Asian than non-Asian patients. The effects of AC were not influenced by the starting time (P>0.05). D2 lymphadenectomy-based chemotherapy was effective (HR=0.89, 95%CI: [0.80, 0.99], P=0.04). Oral S-1 40 mg/m2 after D2 lymphadenectomy might be a better choice for Asians with advanced GC and might result in a greater reduction of adverse events than in non-Asian patients. GRADE quality assessment determined that the strength of the evidence from foreign studies from Europe, the United States and Asian countries other than China was high, while it was moderate for Chinese studies. Conclusion: AC was effective or even curative in Chinese patients in general, although it is still necessary to optimize a targeted AC scheme for Chinese patients with GC.

온톨로지 기반의 모션 캡처 데이터베이스 설계 및 구현 (Design & Implementation of a Motion Capture Database Based on Motion Ontologies)

  • 정현숙
    • 한국멀티미디어학회논문지
    • /
    • 제8권5호
    • /
    • pp.618-632
    • /
    • 2005
  • 본 논문에서는 모션 캡처 데이터의 효과적인 저장 및 의미 기반 검색을 위한 프레임워크를 제안한다. 모션 캡처 기술은 현실감있는 캐릭터 동작을 얻기 위해 많이 사용되고 있지만, 모션 캡처 데이터의 검색과 저장을 위한 표준화의 부족으로 인한 여러 가지 문제점을 가지고 있다. 또한 미리 캡처된 모션 데이터에 의미론적 부가설명이 없으므로 애니메이터들이 캡처된 모션 데이터로부터 필요한 부분 동작들만을 검색하고 조합하여 새로운 동작을 생성하기가 어렵다. 본 논문의 목적은 모션 캡처 데이터의 재사용성을 향상시키기 위한 것이다 먼저 상이한 모션 캡처 데이터 포맷들을 통합하기 위한 표준 포맷을 제안한다. 제안하는 표준 포맷은 XML 기반의 마크업 언어로서 MCML(Motion Capture Markup Language)라고 한다. 제안하는 MCML은 서로 상이한 포맷들의 변환 또는 통합을 하기 위해 유용할 뿐만 아니라, MCML파일로 모션 데이터 베이스를 구축하므로 모션 캡처 데이터의 재사용성을 향상시킬 수 있다. 또한 모션 캡처 데이터의 부분 동작들에 의미를 부여하고 동작들 사이에 의미론적 연결을 위해 모션 온톨로지를 정의한다. 온톨로지 기반 데이터 접근으로 인해 부분 동작 및 그와 연관된 동작들을 검색하고 항해할 수 있다.

  • PDF

디지털도서관 연구 동향(2) (Digital Library Research : Major Issues and Trends)

  • 안현수
    • 정보관리연구
    • /
    • 제31권1호
    • /
    • pp.12-42
    • /
    • 2000
  • 대부분의 선진국 및 여러 개발도상국에서 디지털도서관 연구에 많은 관심을 보이고 있다. 많은 디지털도서관 연구 프로젝트들이 정부 기관과 국가 및 국제 기관들에 의해 재정적인 지원을 받고있는 반면, 몇몇 프로젝트는 특정 대학과 연구기관 그리고 도서관들에 의해 단독 형태 혹은 협력 형태로 운영되고 있다. 영국의 ELINOR 프로젝트, 영국 eLib(Electronic Li-braries) 프로그램의 첫 번째 두 단계, 미국 DLI(Digital Library Initiative)의 첫 번째 단계 등과 같은 몇몇 디지털도서관 프로젝트는 현재 종료되었지만 몇몇 다른 프로젝트들은 전 세계의 다른 지역에서 현재 진행중이다. 본 고에서는 다양한 연구자들이 제시한 디지털도서관의정의 및 특징들에 대한 설명으로 시작하여 전 세계의 다른 지역에서 현재 진행중이거나 막 종료된 몇몇 주요 디지털도서관 프로젝트에 대해 간단히 언급하였다. 그 다음으로는 디지털도서관 연구를 16개의 주요 항목으로 구분하여 리뷰하였다. 본 리뷰를 위한 문헌은 LISA CD-ROM 데이터베이스의 탐색과 DIALOG의 문헌정보학 데이터베이스 탐색을 통해 확보하였으며 탐색 결과는 D-Lib Magazine과 Ariadne의 다양한 호들의 탐색과 디지털도서관 연구에 참여하는 다양한 기관들의 웹사이트의 탐색으로 보완되었다. 짧은 기간동안의 디지털도서관 연구를 통하여 많은 것을 배우게 되었다는 사실을 본 리뷰를 통해 알게되었다. 그러나 많은 이슈들이 해결되어야 한다. 본 고는 디지털도서관을 연구 단계로부터 실제 환경으로 발전시키기 위해 가까운 장래에 해결해야 할 연구 이슈들을 언급하는 것으로 끝을 맺는다.

  • PDF

디지털도서관 연구 동향(1) (Digital Library Research : Major Issues and Trends)

  • 안현수
    • 정보관리연구
    • /
    • 제30권4호
    • /
    • pp.39-60
    • /
    • 1999
  • 대부분의 선진국 및 여러 개발도상국에서 디지털도서관 연구에 많은 관심을 보이고 있다. 많은 디지털도서관 연구 프로젝트들이 정부 기관과 국가 및 국제 기관들에 의해 재정적인 지원을 받고있는 반면, 몇몇 프로젝트는 특정 대학과 연구기관 그리고 도서관들에 의해 단독 형태 혹은 협력 형태로 운영되고 있다. 영국의 ELINOR 프로젝트, 영국 eLib(Electronic Li-braries) 프로그램의 첫 번째 두 단계, 미국 DLI(Digital Library Initiative)의 첫 번째 단계등과 같은 몇몇 디지털도서관 프로젝트는 현재 종료되었지만 몇몇 다른 프로젝트들은 전 세계의 다른 지역에서 현재 진행중이다. 본 고에서는 다양한 연구자들이 제시한 디지털도서관의 정의 및 특징들에 대한 설명으로 시작하여 전 세계의 다른 지역에서 현재 진행중이거나 막 종료된 몇몇 주요 디지털도서관 프로젝트에 대해 간단히 언급하였다. 그 다음으로는 디지털도서관 연구를 16개의 주요 항목으로 구분하여 리뷰하였다. 본 리뷰를 위한 문헌은 LISA CD-ROM 데이터베이스의 탐색과 DIALOG의 문헌정보학 데이터베이스 탐색을 통해 확보하였으며 탐색 걸과는 D-Lib Magazine과 Ariadne의 다양한 호들의 탐색과 디지털도서관 연구에 참여하는 다양한 기관들의 웹사이트의 탐색으로 보완되었다. 짧은 기간동안의 디지털도서관 연구를 통하여 많은 것을 배우게 되었다는 사실을 본 리뷰를 통해 알게되었다. 그러나 많은 이슈들이 해결되어야 한다. 본 고는 디지털도서관을 연구 단계로부터 실제 환경으로 발전시키기 위해 가까운 장래에 해결해야 할 연구 이슈들을 언급하는 것으로 끝을 맺는다.

  • PDF

TOC 기반 연구기록물시스템 모형 구축 (A Study on Developing a TOC-based Research Record System Model)

  • 오정훈;이응봉
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.109-133
    • /
    • 2015
  • 본 연구의 목적은 연구개발과정에서 생산되는 다양한 연구개발 경험과 지식이 축적된 각종 연구기록물을 종합적이고 체계적으로 관리하고 활용할 수 있는 TOC(Table of Contents) 기반의 연구기록물시스템 모형을 구축하고 그 활용성을 밝히는데 있다. TOC 기반 연구기록물시스템 구축을 위하여 TOC를 기반으로 한 기술기록을 할 수 있도록 기술기록 작성 템플릿과 각 아이템에 대한 구성요소를 제시하였고, 이 TOC 기술기록과 기존의 연구기록물과의 유기적인 연결을 할 수 있도록 콘텐츠 구조화 설계를 하였다. 또한 데이터베이스를 설계하기 위해서 데이터베이스 논리 스키마를 설계하였고, 연구기록물과 TOC 기술기록으로 테스트 컬렉션을 구축하였다. 아울러 통합검색을 포함하는 TOC 기술기록 검색시스템 및 활용 인터페이스 등의 설계를 통해서 연구기록물시스템 모형을 구축하였다. 이를 바탕으로 기존 분산 운영 일반시스템과 TOC 기반 연구기록물시스템의 활용성을 비교 분석하기 위한 활용성 평가를 실시하였으며, 그 결과는 연구기록물의 활용성은 기존에 분산하여 운영하고 있는 연구기록물의 일반시스템보다는 TOC 기반 연구기록물시스템이 전반적으로 높은 것으로 나타났다.

난소예비력 저하 여성에 대한 한약 단독 치료의 임신 관련 지표 개선 효과에 관한 체계적 문헌 고찰 및 메타분석 (East Asian Herbal Medicine (EAHM) Alone for the Treatment of Women with Diminished Ovarian Reserve (DOR): A Systematic Review and Meta-analysis)

  • 이주현;최수지;노은지;민상연;김동일
    • 대한한의학회지
    • /
    • 제43권1호
    • /
    • pp.136-153
    • /
    • 2022
  • Objectives: The aim of this study was to find out whether east asian herbal medicine (EAHM) treatment alone is effective in improving pregnancy-related indicators compared to conventional medicine in women with Diminished Ovarian Reserve (DOR). Methods: We searched eligible studies from PubMed, Cochrane Library, EMBASE, Chinese National Knowledge Infrastructure Database, CiNii, Korean Medical Database, Korean Studies Information Service System, Oriental Medicine Advanced Searching Integrated System, ScienceOn. GRADE pro was used to evaluate the current evidence of the study. Result: A total of 5 studies, 325 women with DOR were included. EAHM showed a significant effect on improvement of pregnancy rate (n=270, RR 2.13 [95% CI 1.44 to 3.15], Z=3.78, p=0.0002, I2=0%) and Anti-Mullerian Hormone (AMH) level (n=211, SMD 0.82 [95% CI 0.40 to 1.25], Z=3.80, p=0.0001) compared to conventional medicine. In ovulation rate (n=156, RR 0.86 [95% CI 0.70 to 1.06], Z=1.43, p=0.15, I2=0%), Antral Follicle Count (n=245, SMD 0.27 [95% CI -0.25 to 0.79], Z=1.01, p=0.31), and follicle stimulating hormone (n=245, SMD 0.29 [95% CI -0.13 to 0.70], Z=1.36, p=0.17) level, EAHM showed similar effects to conventional medicine. In this study, the most frequently used herbal medicines were Cuscutae Semen, Dipsaci Radix, and Angelicae Gigantis Radix. Conclusion: This meta-analysis showed that EAHM could improve pregnancy rates and AMH levels in women with DOR. However, more well-designed RCTs will have to be performed further in the future.

NCS 기반 의료정보관리를 위한 퇴원분석 교육프로그램 개발 (The Development of Discharge Analysis Educational Program on NCS-Based for Medical Information Management)

  • 최준영
    • 한국전자통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.957-964
    • /
    • 2017
  • 본 연구에서는 NCS 기반 의료정보관리 직무수행을 위한 교육과정을 수행하고, 학습자의 실무지식을 이해할 수 있는 프로그램을 제작하였다. 이 프로그램은 의무기록의 데이터를 발생시키고 저장한 후 의무기록의 데이터를 분석하여 의료정보를 생성할 수 있는 교육용 프로그램이다. 의무기록의 내용이 다양하고 의무기록의 양적 차이가 있기 때문에 교육용 데이터의 표준을 위해 퇴원분석 프로그램에 의무기록의 내용을 요약하고 저장할 수 있도록 하였다. 프로그램을 사용하여 의료정보관리 NCS 능력단위 요소인 의료용어 DB, 의료용어 관련 DB, 진료관련 DB를 구축하고 관리할 수 있다. 다음은 프로그램 운영을 통해 학습 할 수있는 내용이다. 첫 번째로 데이터베이스의 구조를 이해하여 의료정보 DB 관리규정을 작성할 수 있다. 두 번째로 퇴원분석 프로그램에 입력하는 진단코드 및 의료행위코드의 구조와 기능을 이해할 수 있다. 또한 퇴원분석 프로그램에서 입력된 진단코드 및 의료행위코드들을 각 필드별로 검색하고 분석할 수 있다. 세 번째로 데이터를 입력하고 추출하여 의료정보를 생성함으로써 의료정보관리 능력을 향상시킬 수 있다. 본 연구에서는 퇴원분석 프로그램을 이용하여 학생들이 의무기록의 데이터를 발생시키고 분석하여 의료정보를 생성함으로써 의료정보관리에 대한 지식을 습득하고 실무능력을 향상시킬 수 있는 프로그램을 개발하였다.

Efficient Mining of Frequent Subgraph with Connectivity Constraint

  • Moon, Hyun-S.;Lee, Kwang-H.;Lee, Do-Heon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.267-271
    • /
    • 2005
  • The goal of data mining is to extract new and useful knowledge from large scale datasets. As the amount of available data grows explosively, it became vitally important to develop faster data mining algorithms for various types of data. Recently, an interest in developing data mining algorithms that operate on graphs has been increased. Especially, mining frequent patterns from structured data such as graphs has been concerned by many research groups. A graph is a highly adaptable representation scheme that used in many domains including chemistry, bioinformatics and physics. For example, the chemical structure of a given substance can be modelled by an undirected labelled graph in which each node corresponds to an atom and each edge corresponds to a chemical bond between atoms. Internet can also be modelled as a directed graph in which each node corresponds to an web site and each edge corresponds to a hypertext link between web sites. Notably in bioinformatics area, various kinds of newly discovered data such as gene regulation networks or protein interaction networks could be modelled as graphs. There have been a number of attempts to find useful knowledge from these graph structured data. One of the most powerful analysis tool for graph structured data is frequent subgraph analysis. Recurring patterns in graph data can provide incomparable insights into that graph data. However, to find recurring subgraphs is extremely expensive in computational side. At the core of the problem, there are two computationally challenging problems. 1) Subgraph isomorphism and 2) Enumeration of subgraphs. Problems related to the former are subgraph isomorphism problem (Is graph A contains graph B?) and graph isomorphism problem(Are two graphs A and B the same or not?). Even these simplified versions of the subgraph mining problem are known to be NP-complete or Polymorphism-complete and no polynomial time algorithm has been existed so far. The later is also a difficult problem. We should generate all of 2$^n$ subgraphs if there is no constraint where n is the number of vertices of the input graph. In order to find frequent subgraphs from larger graph database, it is essential to give appropriate constraint to the subgraphs to find. Most of the current approaches are focus on the frequencies of a subgraph: the higher the frequency of a graph is, the more attentions should be given to that graph. Recently, several algorithms which use level by level approaches to find frequent subgraphs have been developed. Some of the recently emerging applications suggest that other constraints such as connectivity also could be useful in mining subgraphs : more strongly connected parts of a graph are more informative. If we restrict the set of subgraphs to mine to more strongly connected parts, its computational complexity could be decreased significantly. In this paper, we present an efficient algorithm to mine frequent subgraphs that are more strongly connected. Experimental study shows that the algorithm is scaling to larger graphs which have more than ten thousand vertices.

  • PDF

동시출현단어 분석에 기반한 메타데이터 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Metadata Research by Using Co-word Analysis)

  • 최예진;정연경
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.63-83
    • /
    • 2016
  • 다양한 매체와 유형으로 생산되는 정보자원에 대한 이용이 높아짐에 따라, 정보자원을 기술하기 위한 정보조직의 도구로서 메타데이터에 대한 중요성이 높아지고 있다. 본 연구에서는 메타데이터 분야의 연구 영역을 파악할 수 있도록 동시출현단어 분석을 사용하여 메타데이터 분야의 지적 구조를 규명하고자 하였다. 이를 위하여 1998년 1월 1일부터 2016년 7월 8일까지 Web of Science 핵심컬렉션에 등재된 저널에 게재된 문헌을 대상으로 'metadata'라는 질의어로 Topic 검색을 수행하여, 총 727건의 논문에 대한 서지정보를 수집하였다. 이 중 저자 키워드를 가진 410건의 논문의 저자 키워드로 수집하고, 전처리 과정을 거쳐 저자 키워드 총 1,137개를 추출하여 최종적으로 빈도수 6회 이상의 키워드 37개를 분석대상으로 선정하였다. 이후 메타데이터 분야의 지적구조 규명을 위해 첫째, 네트워크 분석을 통하여 2개 영역 9개 군집을 도출하였으며, 메타데이터 분야 키워드들의 지적 관계를 시각화하고, 중심성 분석을 통한 전역 중심 키워드와 지역 중심이 높은 키워드를 제시하였다. 둘째, 군집분석을 실시하여 형성된 6개의 군집을 다차원축적지도상에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 메타데이터 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 향후 메타데이터 관련 교육과 연구의 방향성 모색에 유용하게 사용될 수 있을 것이다.