• 제목/요약/키워드: EST database

검색결과 93건 처리시간 0.031초

An Integrated Genomic Resource Based on Korean Cattle (Hanwoo) Transcripts

  • Lim, Da-Jeong;Cho, Yong-Min;Lee, Seung-Hwan;Sung, Sam-Sun;Nam, Jung-Rye;Yoon, Du-Hak;Shin, Youn-Hee;Park, Hye-Sun;Kim, Hee-Bal
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제23권11호
    • /
    • pp.1399-1404
    • /
    • 2010
  • We have created a Bovine Genome Database, an integrated genomic resource for Bos taurus, by merging bovine data from various databases and our own data. We produced 55,213 Korean cattle (Hanwoo) ESTs from cDNA libraries from three tissues. We concentrated on genomic information based on Hanwoo transcripts and provided user-friendly search interfaces within the Bovine Genome Database. The genome browser supported alignment results for the various types of data: Hanwoo EST, consensus sequence, human gene, and predicted bovine genes. The database also provides transcript data information, gene annotation, genomic location, sequence and tissue distribution. Users can also explore bovine disease genes based on comparative mapping of homologous genes and can conduct searches centered on genes within user-selected quantitative trait loci (QTL) regions. The Bovine Genome Database can be accessed at http://bgd.nabc.go.kr.

CHILDES 코퍼스를 기반으로 한 아동의 영어 굴절형태소 발달 연구 (A Study on the Development of English Inflectional Morphemes Based on the CHILDES Corpus)

  • 민명숙;전종섭;이선영
    • 인지과학
    • /
    • 제24권3호
    • /
    • pp.203-235
    • /
    • 2013
  • 본 연구의 목적은 선행 연구에서 보고된 영어 모국어 아동의 굴절형태소 습득 과정을 대규모 언어습득 데이터베이스를 활용하여 검증하는 것이다. 이를 위해, 우리는 CHILDES(Child Language Data Exchange System) 데이터베이스에 등장하는 1-7세 영국 및 미국 아동 1,630명이 발화한 470만 어절 말뭉치를 대상으로 굴절형태소의 발달 과정을 분석하였다. 본 논문에서는 동사의 현재분사 -ing, 과거형 -(e)d, 형용사의 비교/최상급 -er/est 등의 형태소에 대해 어휘 유형(Type)과 사례(Token) 빈도, 전체 사례(Token)에 대한 유형(Type) 비율인 TTR(Type per Token Ratio), 어휘 다양성 척도인 Lexical Diversity(D) 값을 구하여 이를 국가 및 연령별로 비교, 분석하였다. 그 결과, 굴절형태소별로 연령과 D 값의 상관관계가 다르게 나타났다. 특히, 현재분사 -ing와 D 값 사이에는 주목할 만한 상관관계가 나타나지 않은 반면, 과거형 -(e)d의 경우 양의 상관관계 경향성이 보였고, 비교/최상급 -er/-est는 유의미한 상관관계를 보였다. 이는 현재진행형이 과거형보다 먼저 습득된다고 보고한 Brown(1973)의 견해를 지지한다. 다음으로, 과잉일반화에 따른 오류 표현이 2-3세 사이에 많이 나타나면서 U자형 발달 양상을 보였다. 과잉일반화도 현재분사보다 과거형에서 많이 나타났는데, 이것 또한 현재분사가 과거형보다 일찍 습득된다는 주장을 지지한다. 영국과 미국 아동의 연령별 굴절형태소 사용 양상을 비교한 결과, 미국 아동의 D 값이 영국 아동보다 높았다. 이는 미국 아동이 영국 아동보다 더 많은 어휘 유형에 대해 굴절형태소를 사용했음을 의미한다. 본 연구는 소수의 아동을 대상으로 수행된 선행 연구의 다양한 논점을 대규모 데이터베이스로 검증하고, CHILDES 코퍼스를 효율적으로 분석하는 연구 방법론을 제안했다는 점에서 의의가 있다.

  • PDF

한국산 백합 (Meretrix lusoria) 의 전사체 분석 (Expressed sequence tag analysis of Meretrix lusoria (Veneridae) in Korea)

  • 강정하;정지은;김봉석;안철민;강현숙;강세원;황희주;한연수;채성화;고현숙;이준상;이용석
    • 한국패류학회지
    • /
    • 제28권4호
    • /
    • pp.377-384
    • /
    • 2012
  • The importance of biological resources has been gradually increasing, and mollusks have been utilized as main fishery resources in terrestrial ecosystems. But little is known about genomic and transcriptional analysis in mollusks. This is the first report on the transcriptomic profile of Meretrix lusoria. In this study, we constructed cDNA library and determined 542 of distinct EST sequences composed of 284 singletons and 95 contigs. At first, we identified 180 of EST sequences that have significant hits on protein sequences of the exclusive Mollusks database through BLASTX program and 343 of EST sequences that have significant hits on NCBI NR database. We also found that 211 of putative sequences through local BLAST (blastx, E < e-10) search against KOG database were classified into 16 functional categories. Some kinds of immune response related genes encoding allograft inflammatory factor 1 (AIF-1), B-cell translocation gene 1 (BTG1), C-type lectin A, thioester-containing protein and 26S proteasome regulatory complex were identified. To determine phylogenetic relationship, we identified partial sequences of four genes (COX1, COX2, 12S rRNA and NADH dehydrogenase) that significantly matched with the mitochondrial genomes of 3 species-Ml (Meretrix lusoria), Mp (Meretrix petechialis) and Mm (Meretrix meretrix). As a result, we found that there was a little bit of a difference between sequences of Korean isolates and other known isolates. This study will be useful to develop breeding technology and might also be helpful to establish a classification system.

잣나무(Pinus koraiensis)의 cDNA library 제작 및 EST 분석 (Construction of a full-length cDNA library from Pinus koraiensis and analysis of EST dataset)

  • 김준기;임수빈;최선희;이종석;노승문;임용표
    • 농업과학연구
    • /
    • 제38권1호
    • /
    • pp.11-16
    • /
    • 2011
  • In this study, we report the generation and analysis of a total of 1,211 expressed sequence tags (ESTs) from Pinus koraiensis. A cDNA library was generated from the young leaf tissue and a total of 1,211 cDNA were partially sequenced. EST and unigene sequence quality were determined by computational filtering, manual review, and BLAST analyses. In all, 857 ESTs were acquired after the removal of the vector sequence and filtering over a minimum length 50 nucleotides. A total of 411 unigene, consisting of 89 contigs and 322 singletons, was identified after assembling. Also, we identified 77 new microsatellite-containing sequences from the unigenes and classified the structure according to their repeat unit. According to homology search with BLASTX against the NCBI database, 63.1% of ESTs were homologous with known function and 22.2% of ESTs were matched with putative or unknown function. The remaining 14.6% of ESTs showed no significant similarity to any protein sequences found in the public database. Gene ontology (GO) classification showed that the most abundant GO terms were transport, nucleotide binding, plastid, in terms biological process, molecular function and cellular component, respectively. The sequence data will be used to characterize potential roles of new genes in Pinus and provided for the useful tools as a genetic resource.

Insilico profiling of microRNAs in Korean ginseng (Panax ginseng Meyer)

  • Mathiyalagan, Ramya;Subramaniyam, Sathiyamoorthy;Natarajan, Sathishkumar;Kim, Yeon Ju;Sun, Myung Suk;Kim, Se Young;Kim, Yu-Jin;Yang, Deok Chun
    • Journal of Ginseng Research
    • /
    • 제37권2호
    • /
    • pp.227-247
    • /
    • 2013
  • MicroRNAs (miRNAs) are a class of recently discovered non-coding small RNA molecules, on average approximately 21 nucleotides in length, which underlie numerous important biological roles in gene regulation in various organisms. The miRNA database (release 18) has 18,226 miRNAs, which have been deposited from different species. Although miRNAs have been identified and validated in many plant species, no studies have been reported on discovering miRNAs in Panax ginseng Meyer, which is a traditionally known medicinal plant in oriental medicine, also known as Korean ginseng. It has triterpene ginseng saponins called ginsenosides, which are responsible for its various pharmacological activities. Predicting conserved miRNAs by homology-based analysis with available expressed sequence tag (EST) sequences can be powerful, if the species lacks whole genome sequence information. In this study by using the EST based computational approach, 69 conserved miRNAs belonging to 44 miRNA families were identified in Korean ginseng. The digital gene expression patterns of predicted conserved miRNAs were analyzed by deep sequencing using small RNA sequences of flower buds, leaves, and lateral roots. We have found that many of the identified miRNAs showed tissue specific expressions. Using the insilico method, 346 potential targets were identified for the predicted 69 conserved miRNAs by searching the ginseng EST database, and the predicted targets were mainly involved in secondary metabolic processes, responses to biotic and abiotic stress, and transcription regulator activities, as well as a variety of other metabolic processes.

그리드 컴퓨팅을 이용한 BLAST 성능개선 및 유전체 서열분석 시스템 구현 (Performance Improvement of BLAST using Grid Computing and Implementation of Genome Sequence Analysis System)

  • 김동욱;최한석
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.81-87
    • /
    • 2010
  • 본 논문에서는 현재 생물정보학 연구에서 가장 많이 사용하고 있는 BLAST의 문제점을 분석하고 이에 따른 해결책을 제시하기 위하여 그리드 컴퓨팅을 이용한 G-BLAST(Grid Computing을 이용한 Basic Local Alignment Search Tool)를 제안한다. 본 연구에서 제안하고 있는 G-BLAST을 이용한 시스템은 이기종 분산 환경에서 수행이 가능한 서열분석 통합 소프트웨어 패키지이며 기존 서열분석 서비스의 취약점인 검색 성능을 개선하여 BLAST 검색 기능을 강화 하였다. 또한, BLAST 결과를 사용자가 관리 및 분석이 용이하도록 데이터베이스 및 유전체 서열분석 서비스 시스템을 구현하였다. 본 논문에서는 G-BLAST시스템의 성능확인을 위하여 병렬컴퓨팅 성능테스트 기법을 도입하여 구현된 시스템을 기존 BLAST와 속도 및 효율부분에서 비교하여 성능개선을 확인하였으며 서열결과 분석에 필요한 자료를 사용자관점에서 제공해주고 있다.

Toward Functional Genomics of Plant-Pathogen Interactions: Isolation and Analysis of Defense-related Genes of Rot Pepper Expressed During Resistance Against Pathogen

  • Park, Do-Il;Lee, Sang-Hyeob
    • The Plant Pathology Journal
    • /
    • 제18권2호
    • /
    • pp.63-67
    • /
    • 2002
  • To understand plant-pathogen interactions, a complete set of hot pepper genes differentially expressed against pathogen attack was isolated. As an initial step, hundreds of differentially expressed cDNAS were isolated from hot pepper leaves showing non-host resistance against bacterial plant pathogens (Xanthomonas campestris pv. glycines and Pseudomonas syringae pv. syringae) using differential display reverse transcription polymerase chain reaction (DDDRT-PCR) technique. Reverse Northern and Northern blot analyses revealed that 50% of those genes were differentially expressed in pepper loaves during non-host resistance response. Among them, independent genes without redundancy were micro-arrayed for further analysis. Random EST sequence database were also generated from various CDNA libraries including pepper tissue specific libraries and leaves showing non-host hypersensitive response against X. campestris pv. glycines. As a primary stage, thousands of cDNA clones were sequenced and EST data were analyzed. These clones are being spotted on glass slide to study the expression profiling. Results of this study may further broaden knowledge on plant-pathogen interactions.

Global Approaches to Identify Genes Involved during Infection Structure Formation in Rice Blast Fungus, Magnaporthe grisea

  • Park, Woo-Bong
    • The Plant Pathology Journal
    • /
    • 제19권1호
    • /
    • pp.34-42
    • /
    • 2003
  • The ascomycete Magnaporthe grisea is a pathogen of rice blast and is known to form specialized infection structures called appressoria for successful infection into host cells. To understand the molecular mechanism underlying infection process, appressorium-related genes were identified through global approaches including EST sequencing, differential hybridization, and sup-pression subtractive hybridization. EST database was generated on >2,000 cDNA clones randomly selected from appressorium stage cDNA library. Large number of ESTs showed homology to known proteins possibly involved in infection-related cellular development (attachment, germination, appressorium formation, and colonization) of rice blast fungus. The 1051 ESTs showing significant homology to known genes were assigned to 11 functional categories. Differential hybridization and suppression subtractive hybridization were applied to identify genes showing an appressorium stage specific expression pattern. A number of genes were selected as up-regulated during appressorium formation compared with the vegetative growing stage. Clones from various cDNA libraries constructed in different developmental stages were arrayed on slide glass for further expression profiling study. functional characterization of genes identified from these global approaches may lead to a better understand-ing of the infection process of this devastating plant disease, and the development of novel ways to protect host plant.

EST-SSR 마커 적용을 통한 수박 F1 품종 순도 검정 (Application of EST-SSR Marker for Purity Test of Watermelon F1 Cultivars)

  • 최영미;황지현;김광환;이용재;강점순;최영환;손병구;박영훈
    • 농업생명과학연구
    • /
    • 제46권4호
    • /
    • pp.85-92
    • /
    • 2012
  • 본 연구는 ICuGI Database를 활용하여 수박 상용 F1 품종의 순도검정용 EST-SSR 마커를 개발하기 위해 수행되었다. 총 353개 EST-SSR primer set을 선발하여 (주)NH종묘의 수박 F1 품종 7종과 각 품종의 양친 11종에 대해 검정하였다. 이중 1차 테스트한 96개 primer set 중, '오렌지'는 primer WMU0056, '흑보'는 WMU0400, '신동'은 WMU0056와 WMU0400, '새로나'는 WMU0056, WMU0400, WMU0529에 대해 각 품종의 양친들이 다형성이 보였고 F1 개체에서는 이형접합의 유전자형을 보였다. '해동' F1의 순도검정용 마커를 찾기 위해 추가적인 122개의 primer set에 대해 PCR을 수행한 결과, WMU0056, WMU0400, WMU0580, WMU1211, WMU4136, WMU448이 순도검정에 적합한 것으로 나타나, WMU0056와 WMU0400이 '해동'에서도 유용할 수 있었다. '꿀나라'와 '황피'의 경우에는 공시된 타 품종들에 비해 양친간 다형성율이 각각 5%와 2%로 매우 낮아 모든 353개 primer set을 테스트하였으며, 그 결과 '꿀나라'는 WMU5339, '황피'는 WMU7003이 순도검정 마커로 적합한 것으로 확인되었다. 개발된 마커를 이용하여 실제 농가채종된 4개의 F1 품종의 순도를 검정한 결과, 모두 97.5% 이상의 순도로 확인되었다. 이와 같이 ICuGI Database에 공시된 수박 EST-SSR 마커는 공우성의 유전자 특이적 마커로서 F1 순도검정에 효과적으로 사용될 수 있었다.

배추의 조직 특이적 발현유전자 데이터베이스 (The Brassica rapa Tissue-specific EST Database)

  • 유희주;박신기;오미진;황현주;김남신;정희;손성한;박범석;문정환
    • 원예과학기술지
    • /
    • 제29권6호
    • /
    • pp.633-640
    • /
    • 2011
  • 배추는 배추속 식물의 A genome을 대표하는 모델로서 다양한 배추과 작물의 유전학 및 유전체학과 육종연구의 기반이 되는 중요한 작물이다. 최근 들어 배추 유전체 해독이 완료됨에 따라 유전체의 기능 연구가 보다 활발히 진행될 것으로 기대된다. 유전체 정보로부터 유전자의 구조를 예측하고, 기능을 분석하여 프로모터를 포함한 유용 유전자를 개발하기 위한 필수 재료로 이용되는 것이 다양한 조직 또는 실험 처리로부터 생성된 발현 유전자 데이터이다. 2011년 7월 현재 공공 데이터베이스에는 39개의 cDNA library로부터 분석된 147,217개의 배추 발현유전자가 보고되어 있다. 그러나 이들 발현 유전자들은 체계적으로 분석되거나 데이터베이스 형태로 정리되어 있지 않기 때문에 연구자들이 유전자 서열로부터 유용한 정보를 추출하여 사용하기 어려운 문제점이 있다. 따라서 해독 완료된 배추 유전체와 함께 발현 유전자 정보를 보다 잘 활용하기 위하여 배추의 조직 특이적 발현유전자 데이터베이스인 BrTED를 개발하였다. 데이터베이스는 EST 서열 처리-정보 검색 단위와 조직특이성 발현 특성 분석 단위로 이루어져 있으며, 각 정보들은 상호 연결되어 유기적인 검색 환경을 제공하게 하였다. BrTED는 23,962개의 단일 조합 유전자서열을 포함하고 있으며, 각 서열들의 유전자 주석과 암호화하고 있는 단백질의 기능을 동시에 제공한다. 또한 각 단일 조합 유전자서열들의 조직별 발현 특이성을 통계 분석을 통해 조사하여 연구자의 검색 기준에 따라 제공한다. BrTED의 실효성을 검증하기 위하여 데이터베이스를 통해 조직 특이적 발현 유전자 29개를 선발하고, 이들의 발현 특성을 RT-PCR로 확인한 결과, 선발한 유전자 모두 목표한 조직에서 특이적이거나 강한 발현을 보였다. BrTED는 조직 특이적 발현유전자를 신속하게 선발할 수 있는 공공 데이터베이스로서 배추의 기능 유전체 연구뿐만 아니라 근연 배추속 작물의 유전학과 유전체학 연구에 유용한 공공 연구 자원으로 이용될 수 있을 것이다.