• 제목/요약/키워드: Page Clone

검색결과 47건 처리시간 0.024초

토큰 크기 및 출현 빈도에 기반한 웹 페이지 유사도 (Web Page Similarity based on Size and Frequency of Tokens)

  • 이은주;정우성
    • 한국IT서비스학회지
    • /
    • 제11권4호
    • /
    • pp.263-275
    • /
    • 2012
  • It is becoming hard to maintain web applications because of high complexity and duplication of web pages. However, most of research about code clone is focusing on code hunks, and their target is limited to a specific language. Thus, we propose GSIM, a language-independent statistical approach to detect similar pages based on scarcity and frequency of customized tokens. The tokens, which can be obtained from pages splitted by a set of given separators, are defined as atomic elements for calculating similarity between two pages. In this paper, the domain definition for web applications and algorithms for collecting tokens, making matrics, calculating similarity are given. We also conducted experiments on open source codes for evaluation, with our GSIM tool. The results show the applicability of the proposed method and the effects of parameters such as threshold, toughness, length of tokens, on their quality and performance.

Bacillus subtilis LYH201균주의 섬유소 분해효소의 유전자 Cloning 및 특성분석 (Gene Cloning of Cellulose Degradation Enzyme of Bacillus subtilis LYH201 Strain)

  • 이영한;박상렬
    • 한국토양비료학회지
    • /
    • 제34권5호
    • /
    • pp.333-341
    • /
    • 2001
  • 퇴비화 촉진 미생물인 Bacillus subtilis LYH201균주가 분비하는 섬유소 분해효소를 분자생물학적으로 연구한 결과는 다음과 같다. 섬유소를 분해하는 유전자는 유전자은행에 의해 구한 약 5,000개의 clone 중 CMC 배지 상에서 활성을 가지는 clone을 선발하여 bglC(pLYH7-39)로 명명하였다. 섬유소를 분해하는 bglC 유전자는 Pvu II, EcoRI, SspI의 제한효소 site를 가지고 있었으며, BglC는 Clostridium acetobutylicum GUN_CLOAB(P15704)와 57%의 identity와 71%의 homology를 나타내어 상동성이 가장 높았으며, CMC-SDS-PAGE 분석으로 56 kDa의 분자량을 나타냈고, 온도는 $50^{\circ}C$, pH는 7에서 활성이 가장 높았다.

  • PDF

Characterization of Leuconostoc mesenteroides B-742CB Dextransucrase Expressed in Escherichia coli

  • Park, Mi-Ran;Ryu, Hwa-Ja;Kim, Do-Man;Choe, Jun-Yong;John F. Robyt
    • Journal of Microbiology and Biotechnology
    • /
    • 제11권4호
    • /
    • pp.628-635
    • /
    • 2001
  • Recombinant E. coli DH5$\alpha$ harboring a dextransucrase gene (dsrB742) produced an extracellular dextransucrase in a 2% sucrose medium. The enzyme was purified by DEAE-Sepharose and Phenyl-Sepharose column chromatographies upto a 142.97-fold purification with a 11.11% recovery to near homogeneity. The enzyme had a calculated molecular mass of 168.6 kDa, which was in good agreement with the activity band of 170 kDa on a nondenaturing SDS-PAGE. An expression plasmid was constructed by inserting the dsrB742 into a pRSET expression vector. The activity after expression in E. coli BL21(DE3)pLysS increased about 6.7-fold compared to the extracellular dextransucrase from L. mesenteroides B-742CB. The expressed and purified enzyme from the clone showed similar biochemical properties (acceptor reaction, size of active dextransucrase, optimum pH, and temperature) to B-742CB dextransucrase, however, the ability to synthesize ${\alpha}$-(1$\rightarrow$3) branching decreased in comparison to that of L. mesenteroides B-742CB dextransucrase.

  • PDF

Cloning and Sequencing of the ${\alpha}-1{\rightarrow}6$ Dextransurcrase Gene from Leuconostoc mensenteroides B-742CB

  • Kim, Ho-Sang;Kim, Do-Man;Ryu, Hwa-Ja;Robyt, John-F.
    • Journal of Microbiology and Biotechnology
    • /
    • 제10권4호
    • /
    • pp.559-563
    • /
    • 2000
  • A dextransucrase gene (dsrB742) that expresses a dextransucrase to synthesize mostly ${\alpha}-1{\rightarrow}6$ linked dextran with a low amount (3-5%) of ${\alpha}-1{\rightarrow}3$ branching was cloned and sequenced from Leuconostoc mesenteroides B-742CB. The 6.1-kb PstI fragments were ligated with pGEM-3Zf(-) and transformed into E. coli $DH5{\alpha}$. The recombinant clone (pDSRB742) synthesized dextran on an agar plate containing 2% (w/v) sucrose. The dextran synthesized was hydrolyzed with Penicillium endo-dextranase. The hydrolyzate was composed of glucose, isomaltose, isomaltotriose, and branced pentasaccharide. The nucleotide sequence of dsrB742 showed one open reading frame (ORF) composed of 4,524 bp encoding dextrasnsucrase. The deduced amino acid sequence revealed a calculated molecular mass of 168.6 kDa. It also showed an activity band of 184 kKa on a non-denaturing SDS-PAGE (10%). The amino acid sequence of DSRB742 exhibited a 50% similarity with DSRA from L. mesenteroides B-1299, a 70% similarity with DSRS from L. mesenteroides B-512 (F, FMCM) and a 45-56% similarity with Streptococcal GTFs.

  • PDF

클로닝된 Bacillus thuringiensis subsp. kurstaki HDI 살충성 단백질 유전자의 대장균에서의 발현 (Expression in Eschepichia coli of a Cloned Bacillus thuringiensis subsp. kurstaki HDI In-secticidal Protein Gene.)

  • 황성희;차성철;유관희;이형환
    • 한국미생물·생명공학회지
    • /
    • 제26권6호
    • /
    • pp.497-506
    • /
    • 1998
  • Bacillus thurintensis subsp. kurstaki HD1 살충성 단백질 ICP 유전자가 있는 NdeI 단편 3.856 kb를 클로닝하여 제조한 pHLN2-80(-) 클론이 pHLN1-80(-)에 비해서 대장균에서 ICP발현량이 과다발현되는 현상을 규명하고자 하였다. 본 연구에서는 상기의 pHLN2-80(+) 클론의 발현량을 조절하는 원인을 규명하기 위하여 ICP의 아미노산 서열은 변화되지 않는 범위 내에서 pHLN1-80(+) 클론에 있는 Plac프로모터와 ICP유전자 프로모터의 일부인 -80 bp프로모터의 염기서열, 전사 개시점과 종결부위의 변이가 ICP유전자발현에 미치는 영향을 조사하였다. pHLN1-80(+)에 5'-말단에 존재하는 -80 bp 프로모터만을 보유한 pHLNK-80 클론은 ICP 생산은 매우 저조하였다. Plac프로모터와 -80 bp 프로모터의 구조 골격을 일부 변이 시킨 pHLNF1-80클론의 ICP생산량은 pHLN2-80(-)가 생산한 양보다는 낮아서 과다발현이 안되었다. Plac프로모터 상류를 약 350bp을 제거하여 만든 클론 pHLND2-80의 ICP 생산량은 모클론인 pHLN2-80(-) 보다 매우 높게 과다발현 되었다. ICP 유전자의 과다발현 현상에 대한 전사 개시점과 전사종결 부위의 역할을 알아보기 위해서 -72bp ICP유전자프로모터를 갖는 클론 pHLD1-72는 재조합 클론 pHLN2-80(-)가 생산한 양보다 적은 양의 ICP을 생성하였고, 클론 pHLD2-72는 재조합 클론 pHLN2-80(-)보다 적은 ICP을 발현하여 과다 발현되었으며, 클론 pHLN2-72는 모클론인 pHLN2-80(-)보다 약간 높은 ICP 생산량을 보여 과다발현되었다. 클론 pHLN2-72를증식하여 파쇄액을 만든 후에 Bombyx mori유충에 대한 살충력 검사에서 클론 pHLN2-72이 생산한 ICP는 pHLN1-80(+)이 생산한 ICP보다 약 90배의 살충력을 보였다. SDS-PAGE와 Western blot 분석에서도 클론 pHLN2-72는 재조합 클론 pHLN2-80(-)보다 약간 높게 ICP가 생성이 되었었다. 이상의 결과는 과다발현에 Plac프로모터와 종결부위가 반드시 필요하며, -72 bp ICP 프로모터가 -80 bp 프로모터보다 과다발현률이 높았으며, ICP 유전자는 반드시 Plac프로모터의 전사 방향에 역방향으로 삽입이 되어야 하는 것으로 나타났다.

  • PDF

Bacillus thuringiensis crylAa1 Type Gene의 클로닝과 발현 (Cloning and Expression of Bacillus thuringiensis crylAa1 Type Gene.)

  • 이형환;황성희;권혁한;안준호;김혜연;안성규;박수일
    • 한국미생물·생명공학회지
    • /
    • 제32권2호
    • /
    • pp.110-116
    • /
    • 2004
  • B. thuringiensis subsp. kurstaki HD1 살충성 결정체 단백질 icp 유전자를 클로닝하여 두개의 클론 pHLNl-80(+) 및 pHLN2-80(-)을 제조하였으며, pHLNl-80(+) 클론에는 icp 유전자의 전사개시부위가 정방향으로 클론이 되었고, 유전자 프로모터의 일부인 -80 bp를 가지고 있고, pHLN2-80(-) 클론은 핀자의 전사개시부위가 역방향으로 클로닝이 되었다. 상기 두 클론을 대장균에서 발현을 조사한 결과 icp 유전자가 역으로 삽입된 pHLN2-80(-) 클론은 pHLNl-80(+)클론보다 ICP발현량이 현격히 증가하는 것을 확인하였다. pHLN2-80(-) 플라스미드에서의 -80 bp 프로모터에서 SD서열(-14 bp sequences) 상류부위를 제거한 후 동일한 살충성 결정체 단백질 icp 유전자의 과다발현 현상이 일어나는지 조사하기 위해 icp 유전자가 역방향으로 클로닝된 pHLRBSl-14와 icp 유전자가 정방향으로 클로닝된 pHLRBS2-14 클론을 제조하였다. 또한 상이한 클로닝 운반체에서도 과다 발현이 일어나는지를 보기위하여 pHLNl-80(+)과 pHLN2-80(-) 플라스미드에서와 동일한 구조가 되도록 icp 유전자를 pUC18과 pUC19플라스미드에 각각 클로닝하여 pHLNUCl-80과 pHLNUC2-80 클론을 제조하였다. pHLRBSl-14과 pHLRBS2-14클론을 대장균에서 발현을 시킨 후에 파쇄하여 SDS-PAGE와 Western blot으로 분석을 한 결과는 클론 pHLRBSl-14는 클론 pHLRBS2-14보다 많은 양의 ICP를 생산하였고, pHLRBSl-14는 pHLN2-80(-) 클론 보다는 적게 ICP를 생산하였다. 이러한 발현 현상은 -80 bp promoter 에서 결실된 SD서열의 상류부위가 발현에 직접적인 영향을 주고 있다는 것을 의미한다. pHLNUC1-80이 역방향으로 클로닝된 pHLNUC2-80 클론보다 적게 ICP 의 발현을 하였다. 이 결과는 상기 클론이 icp 유전자 과다발현이 특정 클로닝 운반체에만 국한되어 일어나는 것이 아니며 유전자와 프로모터 간의 구조적 배열에 의하거나 프로모터에 있는 transcription-supressing regions이 교란되어서 일어난 것임을 시사한다. 그러나 왜 전사개기부위가 역삽입의 경우에 과다발현이 되는지 아직은 판단하기 어려우며 앞으로 더욱 연구를 계속하여야 할 과제로 남아있다.

Bacillus sp. N32 균주가 생산하는 항균 단백질 특성 (Characterization of antimicrobial proteins produced by Bacillus sp. N32)

  • 이미혜;박인철;여윤수;김수진;윤상홍;이석찬;정태영;구본성
    • 농약과학회지
    • /
    • 제10권1호
    • /
    • pp.56-65
    • /
    • 2006
  • 작물 근권 토양으로부터 분리한 5,000여 길항 균주로부터 Erwinia 및 Pseudomonas등의 세균과 Trichoderma, Colletotrichum 등 곰팡이의 성장을 동시에 억제하는 Bacillus sp. N 32 균주를 선발 동정 하였다. 특히 Bacillus sp. N32 균주는 고추 탄저병균인 Colletotrichum gloeosporioides에 대하여 열에 저항성이 있는 단백질과 열에 민감한 단백질의 2종류의 항균 단백질을 동시에 생산함을 단백질 침전과 활성 검정을 통하여 확인하였다. 이 항균 단백질들을 FPLC를 이용한 gel filtration chromatography방법으로 분리한 후 SDS-PAGE와 bioautography로 항균력을 확인하였다. 또한 이 항균 단백질의 유전자들을 선발하기 위하여 기존의 알려진 그람양성 세균의 대표적인 열 저항성 항균 펩타이드 생합성 유전자 서열을 primer로 이용한 PCR 방법으로 fengycin의 생합성 유전자 단편을 분리하고 이 PCR 산물을 이용하여 Bacillus sp. N32 균주의 cosmid library로부터 fengycin의 생합성 유전자 cluster중 일부를 분리하여 염기서열을 분석하였다. 또한 열에 민감한 항균 단백질 생산 유전자는 이 항균 단백질을 SDS-PAGE 및 electroblotting으로 분리한 뒤 N-terminal 부위의 15개의 아미노산 서열을 분석하고 이를 DNA 염기배열로 치환한 다음 probe로 이용하여 ${\lambda}-ZAP$ library로부터 항균 단백질 생산 유전자가 포함된 다수의 clone을 선발하였다.

Cloning and Characterization of Cellulase Gene (cel5B) from Cow Rumen Metagenome

  • Kang, Tae-Ho;Kim, Min-Keun;Barman, Dhirendra Nath;Kim, Jung-Ho;Kim, Hoon;Yun, Han-Dae
    • 농업생명과학연구
    • /
    • 제46권2호
    • /
    • pp.129-137
    • /
    • 2012
  • A carboxymethyl cellulase gene, cel5B, was cloned, sequenced, and expressed in Escherichia coli. pRCS20 in E. coli was identified from metagenomic cosmid library of cow rumen for cellulase activity on a carboxymethyl cellulose agar plates. Cosmid clone (RCS20) was partially digested with Sau3AI, ligated into BamHI site of pBluescript II SK+ vector, and transformed into E. coli $DH5{\alpha}$. The insert DNA of 1.3 kb was obtained, designated cel5B, which has the activity of hydrolyzation of CMC. The cel5B gene had an open reading frame (ORF) of 1,059 bp encoding 352 amino acids with a signal peptide of 48 amino acids and the conserved region, VIYEIYNEPL, belongs to the glycosyl hydrolase family 5. The molecular mass of Cel5B protein expressed from E. coli $DH5{\alpha}$ exhibited to be about 34 kDa by CMC-SDS-PAGE. The optimal pH was 8.0, and the optimal temperature was about $50^{\circ}C$ for its enzymatic activity.

Matrix-Assisted Laser Desorption/Ionization Time-of-Flight (MALDI-TOF)- Based Cloning of Enolase, ENO1, from Cryphonectria parasitica

  • Kim, Myoung-Ju;Chung, Hea-Jong;Park, Seung-Moon;Park, Sung-Goo;Chung, Dae-Kyun;Yang, Moon-Sik;Kim, Dae-Hyuk
    • Journal of Microbiology and Biotechnology
    • /
    • 제14권3호
    • /
    • pp.620-627
    • /
    • 2004
  • On the foundation of a database of genome sequences and protein analyses, the ability to clone a gene based on a peptide analysis is becoming more feasible and effective for identifying a specific gene and its protein product of interest. As such, the current study conducted a protein analysis using 2-D PAGE followed by MALDI- TOF and ESI-MS to identify a highly expressed gene product of C. parasitica. A distinctive and highly expressed protein spot with a molecular size of 47.2 kDa was randomly selected and MALDI-TOF MS analysis was conducted. A homology search indicated that the protein appeared to be a fungal enolase (enol). Meanwhile, multiple alignments of fungal enolases revealed a conserved amino acid sequence, from which degenerated primers were designed. A screening of the genomic $\lambda$ library of C. parasitica, using the PCR amplicon as a probe, was conducted to obtain the full-length gene, while RT-PCR was performed for the cDNA. The E. coli-expressed eno 1 exhibited enolase enzymatic activity, indicating that the cloned gene encoded the C. parasitica enolase. Moreover, ESI-MS of two of the separated peptides resolved from the protein spot on 2-D PAGE revealed sequences identical to the deduced sequences, suggesting that the cloned gene indeed encoded the resolved protein spot. Northern blot analysis indicated a consistent accumulation of an eno1 transcript during the cultivation.

Cloning and Expression of a Farnesyl Diphosphate Synthase in Centella asiatica (L.) Urban

  • Kim, Ok Tae;Ahn, Jun Cheul;Hwang, Sung Jin;Hwang, Baik
    • Molecules and Cells
    • /
    • 제19권2호
    • /
    • pp.294-299
    • /
    • 2005
  • A cDNA encoding farnesyl diphosphate synthase (FPS; EC2.5.1.1/EC2.5.1.10) was isolated from Centella asiacita (L.) Urban, using degenerate primers based on two highly conserved domains. A full-length cDNA clone was subsequently isolated by rapid amplification of cDNA ends (RACE) PCR. The sequence of the CaFPS (C. asiatica farnesyl diphosphate synthase) cDNA contains an open reading frame of 1029 nucleotides encoding 343 amino acids with a molecular mass of 39.6 kDa. The deduced CaFPS amino acid sequence exhibits 84, 79, and 72%, identity to the FPSs of Artemisia annua, Arabidopsis thaliana, and Oryza sativa, respectively. Southern blot analysis suggested that the C. asiatica genome contains only one FPS gene. An artificially expressed soluble form of the CaFPS was identified by SDS-PAGE. It had high specific activity and produced farnesyl diphosphate as the major isoprenoid.