Abstract
Recently, as it is considered more important to identify the function of ail unknown genes in living things, many tools for gene prediction have been developed to identify genes in the DNA sequences. Unfortunately, most of those tools use their own schemes to represent their programs results, requiring researchers to make additional efforts to understand the result generated by them So, it is desirable to provide a standardized method of representing predicted gene information, which makes it possible to automatically produce the predicted results for a given set of gene data In this paper, we describe an effective U representation for various predicted gene information, and present an XML-based analysis tool for gene predication results based on this representation. The developed system helps users of gene prediction tools to conveniently analyze the predicted results and to automatically produce the statistical results of the prediction. To show the usefulness of the tool, we applied our programs to the results generated by GenScan and GeneID, which are widely used gene prediction systems.
생명체의 주된 기능 요소인 유전자를 모두 식별하는 작업의 중요성이 증가함에 따라, 최근에 유전자 예측도구들이 활발히 개발되고 있다. 그러나 유전자 예측 프로그램들은 예측 결과를 그들 고유의 형식으로 제공하여 사용자가 그 결과를 이해하기 위해서는 상당히 많은 추가적인 노력이 필요하다. 따라서 유전자 예측결과에 대한 표준화된 표현과 유전자 데이터 집합에 대한 예측결과를 자동으로 계산하는 방법을 지원하는 것이 바람직하다. 본 논문에서는 다양한 유전자 예측 정보에 대한 효과적인 XML 표현과 이를 바탕으로 예측된 유전자 결과를 자동으로 분석하는 in 기반 분석 도구에 대하여 기술한다. 개발된 도구는 유전자 예측도구를 사용하는 사용자들이 편리하게 예측결과를 분석하고 예측결과에 대한 통계결과를 자동으로 산출할 수 있도록 지원한다. 도구의 유용성을 보여주기 위하여 널리 사용되는 유전자 예측 도구인 GenScan과 GeneID의 처리결과를 개발된 도구에 적용시켜 보았다.