• 제목/요약/키워드: input sequencing

검색결과 28건 처리시간 0.029초

레퍼런스 시퀀스의 특성을 고려한 HLA 영역에서의 CNVR 탐지 (CNVR Detection Reflecting the Properties of the Reference Sequence in HLA Region)

  • 이종근;홍동완;윤지희
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.712-716
    • /
    • 2010
  • 본 논문에서는 레퍼런스 시퀀스에 기가 시퀀싱데이터를 매핑하여 얻어지는 커버리지 데이터를 이용한 모양 기반의 단위반복변이 영역 (CNVR) 추출 방식을 제안한다. 제안하는 CNVR 검색 알고리즘은 후보 영역 추출 단계와 후처리 단계로 이루어진다. 후보 영역 추출 단계에서는 추출하고자 하는 CNV의 모양을 입력 변수로 조절하여 다양한 높이 및 크기를 갖는 CNV 후보 영역을 추출한다. 다음, 후처리 단계에서는 레퍼런스 시퀀스와 기가 시퀀싱 데이터에 포함되어 있는 시퀀싱 에러 문제를 보완하기 위하여, 레퍼런스 시퀀스의 에러 영역 보정, GC-content 영역 보정 등의 정제 과정을 거친 후, 최종 CNVR을 추출한다. 제안된 방식의 유용성을 보이기 위하여 "1000 게놈 프로젝트"에 의하여 공개된 실 데이터를 이용한 다양한 실험을 수행하였으며, DGV를 이용하여 추출된 CNVR의 정확도를 검증하였다. 실험 결과에 의하면 제안된 방식은 HLA 영역에 존재하는 반복되거나 결실되는 다양한 모양의 CNV를 효율적으로 검출하였다.

직업교육 유관 기관간 교수·학습자료 공유 시스템 구축에 관한 연구 (Research on establishment of the network system of teaching and learning material for the organizations linking to vocational education)

  • 김선태
    • 대한공업교육학회지
    • /
    • 제30권1호
    • /
    • pp.133-148
    • /
    • 2005
  • This research attempts to establish a strategy through which to secure the introduction of the KEM 2.0 system. Another aim of this research is to eventually establish a service system which can be used to automatically generate and provide the metadata information contained in the Cylearn system. in order to facilitate Korean vocational high school students access to teaching-learning materials. The main research tasks associated with this research were: 1) To establish the components of the file server system while taking into consideration the environment in which each educational organization operates; 2) To utilize the KEM 2.0 in order to optimize the configuration of the Cylearn system and the related software. To do so, the KEM 2.0. should be applied in close coordination with Edunet: The results of this research can be summarized as follows: First, a strategy to introduce the KEM 2.0 was established. To achieve this, the researcher analyzed the characteristics of the sequencing and presentation methods and suggested teaching-learning materials based on the KEM 2.0.s sequencing system. Second, the file server was constructed using the KEM 2.0. The established file server took into account the environmental conditions in which the Edunet system operates so as to facilitate the creation of a network system with Edunet. Third, the Cylearn service system was linked to Edunet. The researcher developed a module using the KEM 2.0. that could be used to transmit the metadata related to teaching-learning materials to Edunet. To achieve this, an input device and a databank which could be used to transfer the generated metadata to Edunet were developed. The input device and databank developed using the KEM 2.0. were used to transfer the metadata to Edunet by linking the Cylearn system to the Edunet system.

A Pattern Matching Extended Compression Algorithm for DNA Sequences

  • Murugan., A;Punitha., K
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.196-202
    • /
    • 2021
  • DNA sequencing provides fundamental data in genomics, bioinformatics, biology and many other research areas. With the emergent evolution in DNA sequencing technology, a massive amount of genomic data is produced every day, mainly DNA sequences, craving for more storage and bandwidth. Unfortunately, managing, analyzing and specifically storing these large amounts of data become a major scientific challenge for bioinformatics. Those large volumes of data also require a fast transmission, effective storage, superior functionality and provision of quick access to any record. Data storage costs have a considerable proportion of total cost in the formation and analysis of DNA sequences. In particular, there is a need of highly control of disk storage capacity of DNA sequences but the standard compression techniques unsuccessful to compress these sequences. Several specialized techniques were introduced for this purpose. Therefore, to overcome all these above challenges, lossless compression techniques have become necessary. In this paper, it is described a new DNA compression mechanism of pattern matching extended Compression algorithm that read the input sequence as segments and find the matching pattern and store it in a permanent or temporary table based on number of bases. The remaining unmatched sequence is been converted into the binary form and then it is been grouped into binary bits i.e. of seven bits and gain these bits are been converted into an ASCII form. Finally, the proposed algorithm dynamically calculates the compression ratio. Thus the results show that pattern matching extended Compression algorithm outperforms cutting-edge compressors and proves its efficiency in terms of compression ratio regardless of the file size of the data.

Construction of PANM Database (Protostome DB) for rapid annotation of NGS data in Mollusks

  • Kang, Se Won;Park, So Young;Patnaik, Bharat Bhusan;Hwang, Hee Ju;Kim, Changmu;Kim, Soonok;Lee, Jun Sang;Han, Yeon Soo;Lee, Yong Seok
    • 한국패류학회지
    • /
    • 제31권3호
    • /
    • pp.243-247
    • /
    • 2015
  • A stand-alone BLAST server is available that provides a convenient and amenable platform for the analysis of molluscan sequence information especially the EST sequences generated by traditional sequencing methods. However, it is found that the server has limitations in the annotation of molluscan sequences generated using next-generation sequencing (NGS) platforms due to inconsistencies in molluscan sequence available at NCBI. We constructed a web-based interface for a new stand-alone BLAST, called PANM-DB (Protostome DB) for the analysis of molluscan NGS data. The PANM-DB includes the amino acid sequences from the protostome groups-Arthropoda, Nematoda, and Mollusca downloaded from GenBank with the NCBI taxonomy Browser. The sequences were translated into multi-FASTA format and stored in the database by using the formatdb program at NCBI. PANM-DB contains 6% of NCBInr database sequences (as of 24-06-2015), and for an input of 10,000 RNA-seq sequences the processing speed was 15 times faster by using PANM-DB when compared with NCBInr DB. It was also noted that PANM-DB show two times more significant hits with diverse annotation profiles as compared with Mollusks DB. Hence, the construction of PANM-DB is a significant step in the annotation of molluscan sequence information obtained from NGS platforms. The PANM-DB is freely downloadable from the web-based interface (Malacological Society of Korea, http://malacol.or/kr/blast) as compressed file system and can run on any compatible operating system.

다구치방법과 시뮬레이션을 이용한 통합된 자동생산시스템의 최적운영방안의 결정 (Determination of the Optimal Configuration of Operation Policies in an Integrated-Automated Manufacturing System Using the Taguchi Method and Simulation Experiments)

  • 임준묵;김길수;성기석
    • 산업공학
    • /
    • 제11권3호
    • /
    • pp.23-40
    • /
    • 1998
  • In this paper, a method to determine the optimal configuration of operating policies in an integrated-automated manufacturing system using the Taguchi method and computer simulation experiments is presented. An integrated-automated manufacturing system called direct-input-output manufacturing system(DIOMS) is described. We only consider the operational aspect of the DIOMS. Four operating policies including input sequencing control, dispatching rule for the storage/retrieval(S/R) machine, machine center-based part type selection rule, and storage assignment policy are treated as design factors. The number of machine centers, the number of part types, demand rate, processing time and the rate of each part type, vertical and horizontal speed of the S/R machine, and the size of a local buffer in the machine centers are considered as noise factors in generating various manufacturing system environment. For the performance characteristics, mean flow time and throughput are adopted. A robust design experiment with inner and outer orthogonal arrays are conducted by computer simulation, and an optimal configuration of operating policies is presented which consists of a combination of the level of each design factor. The validity of the optimal configurations is investigated by comparing their signal-to-noise ratios with those obtained with full factorial designs.

  • PDF

컨베이어 벨트를 이용한 혼합 모델 조립 라인에서의 미완료 작업량을 최소화하기 위한 제품 투입 순서 결정

  • 김시원;정봉주
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2000년도 추계학술대회 및 정기총회
    • /
    • pp.157-160
    • /
    • 2000
  • This study is concerned with how to optimize the Input sequence of product models with sequence -dependent setup time in Mixed-Model Assembly Line (MMAL) using conveyor system. Usually MMAL consists of a number of stations linked by conveyor belt and each station has a work zone limited by upstream and downstream boundaries. To avoid improper interference between operators in the adjacent stations and excess of machine moving range, operators are forced to complete their operations within their predetermined work zone. In this study, our goal is to determine sequence of models for minimizing the total work unfinished within their work zone. A generalized formulation of the product sequencing problem in MMAL is presented and we developed an optimal procedure using Branch & Bound. Also we developed a heuristic procedure using local search.

  • PDF

다단계-병렬 흐름 생산시스템하에서의 제품별 로트 투입순서 결정

  • 김중순;강석호
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1993년도 추계학술대회발표논문집; 서강대학교, 서울; 25 Sep. 1993
    • /
    • pp.10-10
    • /
    • 1993
  • 본 연구에서는 다품종(multiple products) 다단계(multi-stage) 흐름 생산시스템에서의 제품별 로트 투입순서결정무제를 다루었다. 다단계 흐름 생산시스템의 투입순서 결정문제에 대한 기존연구는 각 단계의 기계대수가 1대인 경우에 관한 것이 대부분이지만, 본 연구에서는 각 단계의 기계대수가 복수이고 각 제품의 생산량이 로트로 주어지며, 또한 각 단계마다의 이송이 로트로 이루어지는 것이 아니라 1단위로 이루어지는 생산시스템을 대상으로 하였다. 그리고 각 제품의 생산준비기간은 투입순서와 관계 없이 일정하며 앞 단계에서 제품이 도착하지 않더라도 생산준비는 먼저 수행될 수 있다고 가정하였다. 제품별 로트 투입순서 결정문제에서 사용된 성능평가기준(performance measure)은 총작업소요시간(makespan)이며 순열투입순서(permutation schedule)만을 대상으로 하였다. 결정기법으로는 투입순서 결정문제에서 효율적인 것으로 알려져 있는 분지한계법(Branch & Bound)이 사용되었으며 분지한계법에서 이용되는 부분투입순서(partial sequence)에 대한 하한값(lower bound)을 제시하였다. 제시된 기법을 사용하면 현실적인 크기의 제품별 로트 투입순서 결정문제를 적당한 시간내에 충분히 해결할 수 있을 것으로 보인다. 제시된 해법으로 해결된 수치예제가 주어져 있다.

  • PDF

연속회분식 반응 공정에서 동역학적 계수 및 미생물합성에 사용된 영양물질 산정 (Estimation of Kinetic Coefficient and Assimilated Nutrients Mass in SBR Process)

  • 지대현;신상우;이광호;이재근
    • 한국물환경학회지
    • /
    • 제23권5호
    • /
    • pp.607-612
    • /
    • 2007
  • In this study, we investigated the variations of the kinetic coefficients and Chemical Oxygen Demand (COD), N and P mass used for assimilation of a sequencing batch reactor (SBR) system with the variation of SRTs; SRTs of 7.5, 10.0, 12.5, 15.0 and 20.0 days were tested in one cycle of SBR operation to determine the optimum conditions for the operation of the SBR and estimate its COD, nitrogen and phosphorus removal efficiencies. The SBR system was operated under the conditions as follows: an operation time of 6 hours per cycle, a hydraulic retention time (HRT) of 12 hours, an influent COD loading of $0.4kg/m^3/day$, and an influent nitrogen loading of $0.068kgT-N/m^3/day$. The yield coefficient (Y) and decay rate coefficient ($k_d$) were estimated to be 0.4198 kgMLVSS/kgCOD and $0.0107day^{-1}$ by calculating the removal rate of substrate according to the variation of SRT. Considering total nitrogen amount removed by sludge waste process, eliminated by denitrification, and in clarified water effluent with reference to 150 mg/cycle of influent nitrogen amount, the percentage of nitrogen mass balance from the ratio of the nitrogen amount in effluent (N output) to that in influent (N input) for Runs 1~5 were 95.5, 97.0, 95.5, 99.5, and 95.5%, respectively, which is well accounted for, with mass balances close to 100%.

소규모 고도하수처리를 위한 변형 연속회분식공정에 관한 연구 (The Study of Modified Sequencing Batch Reactor Process for Small Advanced Wastewater Treatment)

  • 한운우;김규형
    • 한국지반환경공학회 논문집
    • /
    • 제9권3호
    • /
    • pp.35-43
    • /
    • 2008
  • 본 연구는 소규모 하수고도처리시설에 대해 변형 연속회분식공정을 적용하여 그 효용성을 평가하였다. 변형 연속회분식공정은 단일 반응조 내에서 유기물질 및 질소, 인 등이 제거되며 유입수의 유량 및 수질특성에 의해 적합한 운전방식을 선택할 수 있다. 각 공정의 기능 향상을 위해 원수 유입조건의 제어, 간헐 폭기방식에 의한 무산소 및 호기조건의 적절한 분배 그리고 처리수와 잉여슬러지의 고액분리를 위한 처리수 배출장치의 적용으로 설계된 유량 및 수질에 비해 낮은 부하 조건임에도 1일 3Cycle 운전모드로써 안정적인 처리효율을 나타냈다. 평가결과 유기물질 제거효율은 BOD의 경우 평균 120.4mg/L에서 6.8mg/L로 94.4%, CODMn은 95.7mg/L에서 11.0mg/L로 88.5%의 처리효율을 나타냈다. T-N의 제거효율은 평균 32.2mg/L의 유입수 농도에 대해서 약 69.6%, T-P의 경우는 유입수 농도 4.65mg/L에 대해 73.6%의 처리효율을 나타냈다. 동절기 평균 T-N과 T- P의 처리효율은 58.8%, 68.5%로 약간 감소하였지만 안정적인 처리효율을 나타냈다. 1차 무산소 호기조건에서 BOD는 90%, T-N은 67% T-P는 46%정도로 제거되었으며 T-P는 2차 무산소 호기조건에서 약 70%정도 제거되었다. 따라서 유입수의 간헐유입과 무산소 호기조건의 적정한 분배에 의해 질산화, 탈질 및 인의 과잉섭취에 유기물이 적절히 이용된 것으로 평가되어 소규모 고도하수처리시설에 적합한 공정으로 판단된다.

  • PDF

통합자동생산시스템에서 최적운영방안 결정을 위한 유전자 알고리즘의 개발 (A genetic algorithm for determining the optimal operating policies in an integrated- automated manufacturing system)

  • 임준목
    • 한국산업정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.62-72
    • /
    • 1999
  • 본 논문에서는 자동창고시스템과 자재취급시스템이 통합된 통합자동생산시스템의 하나인 DIO가공시스템을 고려한다. DIO가공시스템에서는 스태커크레인이 가공물의 저장을 위한 운반은 물론 각 기계 사이의 가공물 운반역할을 담당하게 된다. 이러한 시스템에서 일어날 수 있는 문제로 크게 시스템 설계와 관련된 문제와 시스템운영과 관련된 문제로 구분하고 본 논문에서는 시스템의 운영정책에 관련된 문제만을 다룬다. 시스템의 운영과 관련된 문제로는 가공물투입순서, 가공물의 저장위치, 스태커크레인의 작업배정, 가공물선택 등으로 크게 4가지로 나누어서 고려한다. 각각의 운영정책에 대해서 기존의 연구결과로부터 DIO가공시스템의 특성을 반영하는 몇 가지씩의 운영정책을 대안으로 제시하고 최적의 운영정책 결정을 위한 방법론으로 컴퓨터시뮬레이션과 유전자알고리즘을 통합한 방법론을 제시한다. 또한 실험을 통해서 기존의 연구결과와 비교 검토함으로서 제시된 알고리즘의 우수성을 검증한다.

  • PDF