• Title/Summary/Keyword: 유전자 데이터베이스

Search Result 183, Processing Time 0.028 seconds

Identifying Statistically Significant Gene-Sets by Gene Set Enrichment Analysis Using Fisher Criterion (Fisher Criterion을 이용한 Gene Set Enrichment Analysis 기반 유의 유전자 집합의 검출 방법 연구)

  • Kim, Jae-Young;Shin, Mi-Young
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.45 no.4
    • /
    • pp.19-26
    • /
    • 2008
  • Gene set enrichment analysis (GSEA) is a computational method to identify statistically significant gene sets showing significant differences between two groups of microarray expression profiles and simultaneously uncover their biological meanings in an elegant way by employing gene annotation databases, such as Cytogenetic Band, KEGG pathways, gene ontology, and etc. For the gone set enrichment analysis, all the genes in a given dataset are first ordered by the signal-to-noise ratio between the groups and then further analyses are proceeded. Despite of its impressive results in several previous studies, however, gene ranking by the signal-to-noise ratio makes it difficult to consider highly up-regulated genes and highly down-regulated genes at the same time as the candidates of significant genes, which possibly reflect certain situations incurred in metabolic and signaling pathways. To deal with this problem, in this article, we investigate the gene set enrichment analysis method with Fisher criterion for gene ranking and also evaluate its effects in Leukemia related pathway analyses.

바이오인포매틱스 인프라 구축

  • Son, Hyeon-Seok
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.12
    • /
    • pp.52-57
    • /
    • 2003
  • 바이오인포매틱스 시스템은 생명공학, 의학, 약학 등의 바이오인포매틱스 관련 산.학.연 연구자들의 연구개발의 기반이 되는 대용량의 생물정보를 효율적으로 저장하는 데이터베이스 구축 및 운영에 필요한 검색 처리 및 분석 시스템을 구축하는 정보인프라로서 21세기 가장 각광 받는 분야로 자리잡고있다. 최근 기하급수적으로 증가하고 있는 유전정보와 특정그룹이나 개인별 유전자 변화와 질병 감수성과의 관계 및 특정 질병과 관련된 유전자에 대한 생물학적 2차, 3차 분석정보 등 바이오인포매틱스 연구의 확대 필요성이 증가하고 있으나, 대부분의 생명공학 관련 산.학.연 연구자들은 연구분야에 적합한 IT기술을 적용할 수 있는 적절한 방법을 보유하고 있지못한 실정이다.

  • PDF

Genetic Algorithm to find Classification Rule for Classifier Systems (분류시스템의 분류 규칙 발견을 위한 유전자 알고리즘)

  • Kim Dae-Hee;Park Sahng Ho
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.9 no.4
    • /
    • pp.16-25
    • /
    • 2004
  • A Classifier System is a system based on rules to invent new rules from the present useful ones. In this paper, Genetic Algorithms are proposed to find good classification rule of Classifier System which can extract useful information from huge database. The proposed scheme is applied to the real problems such as the car insurance problem to evaluate the performance of Genetic Algorithm based classifier systems.

  • PDF

Sequence Alignment Scheme Using User Grouping for Bioinformatics (생물정보학에서 사용자 그룹핑 기법을 이용한 서열 정렬 방법)

  • 김민준;김재훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.13-15
    • /
    • 2002
  • 생물정보학 관련 프로그램들은 대부분 인터넷을 통해서 많은 생물학자, 생화학자 들에게 생물 정보 검색 및 처리 서비스를 제공한다. 이런 서비스를 제공하는 많은 프로그램들은 데이터베이스로부터 유전자 등의 데이터를 검색하고 처리한다. 이때 각각 클라이언트의 요청마다 매번 데이터베이스의 검색을 수행한다면 많은 시간이 걸리게 된다. 또한 서버에 과부하를 초래하여 응답시간이 길어질 수 있다. 본 논문에서는 서버의 과부하와 응답시간을 줄이기 위해 사용자의 요청을 그룹화하여 일정 시간 간격으로 일괄 처리하는 방법을 제안한다.

  • PDF

User-Centric Personal Biological Retrieval System Using Agents (에이전트를 이용한 사용자 중심의 개인용 생물학 검색시스템)

  • Kim, Young-Uk;Jung, Kwang-Su;Ryu, Keun-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.76-78
    • /
    • 2005
  • 생명정보 분야의 발전과 더불어 과거 축적되어 온 방대한 양의 생물학 데이터들이 이질적인 형태로 데이터베이스화 되어있다 특히, 인간게놈프로젝트의 완료 후에 유전자 및 단백질의 기능을 밝히기 위한 지노믹스 및 프로테오믹스 연구가 활발해졌다. 새로운 생물학적 과정을 탐색하기 위해서는 기존에 존재하는 생물학 데이터베이스의 데이터를 수집하기 위한 기술적인 검색 능력이 필요하다. 전산지식이 부족한 대부분의 생물학자들은 공개용 데이터베이스로부터 필요한 정보를 획득하는데 어려움을 격고 있다. 각 분야의 생물학자들이 공개용 데이터베이스로부터 자신의 분야에 관련된 데이터를 검색?추출하는 작업을 수월하게 해 줄 검색 시스템이 필요하다. 따라서, 에이전트를 이용하여 공개용 데이터베이스로부터 정보를 수집하는 사용자 중심의 개인용 검색시스템을 제안하고자 한다. 또한, 검색시스템을 이용하여 생물학자가 지노믹스와 프로테오믹스의 실험적인 접근을 위해 원하는 많은 양의 특정 도메인의 데이터를 검색하고 질의된 결과를 개인 컴퓨터에 2차 데이터베이스를 만들어 저장한다. 사용자에 의해 생성된 특정 분야의 도메인인 2차 데이터베이스를 통해 데이터의 접근의 편리성과 생물학 정보의 분석의 용이성을 얻을 수 있다.

  • PDF

Development of Bioinformatic Database and Converting Tools based on BSML (BSML 기반의 유전자 데이터베이스와 변환기의 구축)

  • 윤애란;이수정;이희전;용환승
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.638-640
    • /
    • 2003
  • 최근 바이오인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리와 변환에 어려움이 많다. 본 논문에서는 이러한 문제점을 해결하기 위하여 바이오인포매틱스 데이터를 다루기 위한 표준으로 다양한 XML 포맷들 중에서 BSML(Bioinformatic Sequence Markup Language)을 채택하고, Genbank 파일을 변환하여 관계형 데이터베이스에 저장하는 모듈을 개발한다. 또한 관계형 데이터베이스 형태의 유전체 데이터를 BSML 형태로, Genbank 파일 형태를 BSML 형태로 그리고 AGAVE(Architecture for Genomic Annotation)파일 형태를 BSML 형태로 변환하는 변환기롤 개발하고자 한다.

  • PDF

Comparison of Gene Selection Method for Prediction of Non-muscle Bladder Cancer Recurrence (비침윤성 방광암 환자의 재발 예측을 위한 유전자 선택 기법 비교)

  • Lee, Kyung Seok;Park, Hyun Woo;Park, Soo Ho;Yun, Seok Joong;Ryu, Keun Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.87-89
    • /
    • 2013
  • 이 논문에서는 비침윤성 방광암 환자의 재발 예측을 위해 마이크로어레이 데이터에서 최적의 속성 부분 집합을 찾고 이를 비교 평가한다. 정보 이득(information gain)을 통해 구한 상위 40개, 80개, 100개의 속성 집합과 FCBF(fast correlation based filter) 알고리즘을 적용하여 구한 최적의 속성 부분집합을 SVM 분류 모델에 적용하여 정확도를 비교 평가한 결과 정보 이득을 적용한 상위 100개 속성 부분집합의 분류 정확도가 가장 높게 나왔으며, FCBF 알고리즘을 적용한 속성 집합은 비교적 적은 속성을 사용하면서 이와 비슷한 분류 정확도를 보임을 확인할 수 있었다.

Social Issues Arising from the Establishment of a National DNA Database (신원확인 유전자정보은행 설립을 둘러싼 쟁점 연구)

  • Kim Byoung-Soo
    • Journal of Science and Technology Studies
    • /
    • v.3 no.2 s.6
    • /
    • pp.83-104
    • /
    • 2003
  • The use of DNA in identification is growing. The criminal DNA databases are in operation in some countries including the UK, Austria, Germany, and US. The militaries and law enforcement agencies in these countries have used the DNA profile. In Korea, DNA identification has been used in determining paternity and in criminal cases since the middle 1990's, and in recent years law enforcement agencies are promoting a national DNA database for identification. The DNA database threatens our civil liberties because of its potential to be used as an instrument of surveillance. Expanding the database puts increasing numbers of people on a 'list of suspects'. Nevertheless, there is little social concern about using DNA database for identification. This paper reviews social issues related to the establishment of DNA database and investigates the features of DNA profile and DNA Database establishment project promoted law enforcement agencies.

  • PDF

Minimizing the Total Stretch when Scheduling Flows of Divisible Requests without Interruption (총 스트레치 최소화를 위한 분할 가능 리퀘스트 흐름 스케줄링)

  • Yoon, Suk-Hun
    • The Journal of Society for e-Business Studies
    • /
    • v.20 no.1
    • /
    • pp.79-88
    • /
    • 2015
  • Many servers, such as web and database servers, receive a continual stream of requests. The servers should schedule these requests to provide the best services to users. In this paper, a hybrid genetic algorithm is proposed for scheduling divisible requests without interruption in which the objective is to minimize the total stretch. The stretch of a request is the ratio of the amount of time the request spent in the system to its response time. The hybrid genetic algorithm adopts the idea of seed selection and development in order to improve the exploitation and exploration power of genetic algorithms. Extensive computational experiments have been conducted to compare the performance of the hybrid genetic algorithm with that of genetic algorithms.

Epigenetic Characterization of Aging Related Genes (노화 관련 유전자의 후성유전학적 특성 분석)

  • Ryu, Jea Woon;Lee, Sang Cheol;Yoo, Jaesoo;Kim, Hak Yong
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.8
    • /
    • pp.466-473
    • /
    • 2013
  • Gene expression is regulated by a wide range of mechanisms at the DNA sequence level. In addition, gene expression is also regulated by epigenetic mechanisms through DNA methylation, histone modification, and ncRNA. To understand the regulation of gene expression at the epigenetic level, we constructed aging related gene database and analyzed epigenetic properties that are focused on DNA methylation. The DNA methylation of promoter or upstream region of the genes induces to repress the gene expression. We compared and analyzed distribution between whole human genes and aging related genes in the epigenetic properties such as CGI distribution, methylation motif pattern, and TFBS (transcription factor binding site) distribution. In contrast to methylation motif pattern, CGI and TFBS distributions are positively correlated with epigenetic regulation of aging related gene expression. In this study, the epigenetic data about DNA methylation of the aging genes will provide us to understand phenomena of the aging and epigenetic mechanism for regulation of aging related genes.