• Title/Summary/Keyword: biological information processing

검색결과 275건 처리시간 0.023초

PubMine: An Ontology-Based Text Mining System for Deducing Relationships among Biological Entities

  • Kim, Tae-Kyung;Oh, Jeong-Su;Ko, Gun-Hwan;Cho, Wan-Sup;Hou, Bo-Kyeng;Lee, Sang-Hyuk
    • Interdisciplinary Bio Central
    • /
    • 제3권2호
    • /
    • pp.7.1-7.6
    • /
    • 2011
  • Background: Published manuscripts are the main source of biological knowledge. Since the manual examination is almost impossible due to the huge volume of literature data (approximately 19 million abstracts in PubMed), intelligent text mining systems are of great utility for knowledge discovery. However, most of current text mining tools have limited applicability because of i) providing abstract-based search rather than sentence-based search, ii) improper use or lack of ontology terms, iii) the design to be used for specific subjects, or iv) slow response time that hampers web services and real time applications. Results: We introduce an advanced text mining system called PubMine that supports intelligent knowledge discovery based on diverse bio-ontologies. PubMine improves query accuracy and flexibility with advanced search capabilities of fuzzy search, wildcard search, proximity search, range search, and the Boolean combinations. Furthermore, PubMine allows users to extract multi-dimensional relationships between genes, diseases, and chemical compounds by using OLAP (On-Line Analytical Processing) techniques. The HUGO gene symbols and the MeSH ontology for diseases, chemical compounds, and anatomy have been included in the current version of PubMine, which is freely available at http://pubmine.kobic.re.kr. Conclusions: PubMine is a unique bio-text mining system that provides flexible searches and analysis of biological entity relationships. We believe that PubMine would serve as a key bioinformatics utility due to its rapid response to enable web services for community and to the flexibility to accommodate general ontology.

생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝 (Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences)

  • 강태호;유재수
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.155-162
    • /
    • 2008
  • DNA 염기 서열이나 단백질 아미노산 서열과 같은 생물학적 서열 데이터들은 일반적으로 많은 수의 항목들을 가지고 있다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 수 백개의 항목으로 이루어진 연속된 서열들이 존재한다. 이들 서열들에서 빈번하게 발생하는 연속 서열을 검색하는 것은 생물학적 서열 분석에서 중요한 부분을 차지하고 있다. 이전에는 순차 패턴을 효과적으로 발견하고자 하는 많은 연구들이 수행되었으며 대부분의 기존 순차패턴 마이닝 기법들은 Apriori 알고리즘을 기반으로 한다. PrefixSpan 알고리즘은 Apriori 기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로 부터 서열 패턴을 확장해나가는 방식이다. 따라서 길이가 긴 연속 서열을 포함하는 생물학적 데이터서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 길이가 긴 생물학적 데이터 서열들로부터 빈번하게 발생하는 연속 서열들을 검색하기에는 효율적이지 않다. 본 논문에서는 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색성능이 보다 우수함을 보인다.

피치동기 다중 스펙트럼을 이용한 청각보철장치의 음성신호처리 및 DSP 시스템 설계 (Speech Signal Processing using Pitch Synchronous Multi-Spectra and DSP System Design in Cochlear Implant)

  • 신중인;박석준;신대규;이재혁;박상희
    • 대한의용생체공학회:의공학회지
    • /
    • 제20권4호
    • /
    • pp.495-502
    • /
    • 1999
  • 본 연구에서는 내이의 손상에 의한 감각성 난청환자들의 청력회복을 위한 청각보철장치내의 가장 중요한 부분인 어음발췌기의 음성신호처리 알고리즘 및 하드웨어를 개발하였다. 증폭, 저역통과 필터, AGC의 역할을 수행하는 외이 및 중이는 아날로그 시스템으로 모델링하였고, 시간 지연된 다중 필터 및 변환기의 역할을 수행하는 내이는 실시간 처리가 가능한 고속 DSP 회로로 구현되었다. 특히 내이의 기저막특성은 비선형 자중 필터뱅크로 모델링한후, 피치와 동기화된 다중 스펙트럼을 출력할 수 있는 (pitch-synchronous multi-spectra : PSMS) 전략을 이용함으로서 청각계의 tonotopy와 periodicity를 만족시킬 수 있었다. 또한 주요, 음성신호처리의 대부분이 S/W로 수행되므로 다양한 실험을 위한 시스템 수정이 용이하며, C 언어로 프로그램이 개발되었기 때문에 다른 프로세스를 사용하는 H/W에도 쉽게 이식될 수 있다는 장점을 가진다.

  • PDF

저전력 임베디드 보드 환경에서의 딥 러닝 기반 성별인식 시스템 구현 (Gender Classification System Based on Deep Learning in Low Power Embedded Board)

  • 정현욱;김대회;;노용만
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권1호
    • /
    • pp.37-44
    • /
    • 2017
  • 사물 인터넷(IoT) 산업이 확산되면서 사용자의 정보를 특별한 조작 없이 물체가 스스로 인식하는 일이 매우 중요해졌다. 그중에서도 성별(남, 여)은 생물학적인 구조가 달라 성향이 다르고 사회적으로도 기대하는 바가 다르기 때문에 매우 중요한 요소이다. 하지만 얼굴 이미지를 기반으로 한 성별 인식과 관련된 연구는 동일한 성별이라도 다양한 생김새를 가지고 있어서 여전히 도전적인 분야이다. 그리고 성별인식 시스템을 사물 인터넷에 적용하기 위해서는 디바이스 크기를 소형화 시켜야 하며 저전력으로 구동이 가능해야 한다. 따라서 본 논문에서는 저전력으로 실제 사물에서 성별을 인식할 수 있는 기능을 탑재하기 위해 딥 러닝 기반의 성별 인식 알고리즘을 제안하고 이를 모바일 GPU 임베디드 보드에 포팅하여 최종적으로 실시간 성별인식 시스템을 구현하였다. 실험에서는 소비전력과 초당 처리 가능한 프레임 수를 PC환경과 모바일 GPU 임베디드 환경에서 측정하여 저전력 환경에서도 성별 인식이 가능함을 증명하였다.

Mathematical modeling for flocking flight of autonomous multi-UAV system, including environmental factors

  • Kwon, Youngho;Hwang, Jun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.595-609
    • /
    • 2020
  • In this study, we propose a decentralized mathematical model for predictive control of a system of multi-autonomous unmanned aerial vehicles (UAVs), also known as drones. Being decentralized and autonomous implies that all members make their own decisions and fly depending on the dynamic information received from other unmanned aircraft in the area. We consider a variety of realistic characteristics, including time delay and communication locality. For this flocking flight, we do not possess control for central data processing or control over each UAV, as each UAV runs its collision avoidance algorithm by itself. The main contribution of this work is a mathematical model for stable group flight even in adverse weather conditions (e.g., heavy wind, rain, etc.) by adding Gaussian noise. Two of our proposed variance control algorithms are presented in this work. One is based on a simple biological imitation from statistical physical modeling, which mimics animal group behavior; the other is an algorithm for cooperatively tracking an object, which aligns the velocities of neighboring agents corresponding to each other. We demonstrate the stability of the control algorithm and its applicability in autonomous multi-drone systems using numerical simulations.

Adaptive Selective Compressive Sensing based Signal Acquisition Oriented toward Strong Signal Noise Scene

  • Wen, Fangqing;Zhang, Gong;Ben, De
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권9호
    • /
    • pp.3559-3571
    • /
    • 2015
  • This paper addresses the problem of signal acquisition with a sparse representation in a given orthonormal basis using fewer noisy measurements. The authors formulate the problem statement for randomly measuring with strong signal noise. The impact of white Gaussian signals noise on the recovery performance is analyzed to provide a theoretical basis for the reasonable design of the measurement matrix. With the idea that the measurement matrix can be adapted for noise suppression in the adaptive CS system, an adapted selective compressive sensing (ASCS) scheme is proposed whose measurement matrix can be updated according to the noise information fed back by the processing center. In terms of objective recovery quality, failure rate and mean-square error (MSE), a comparison is made with some nonadaptive methods and existing CS measurement approaches. Extensive numerical experiments show that the proposed scheme has better noise suppression performance and improves the support recovery of sparse signal. The proposed scheme should have a great potential and bright prospect of broadband signals such as biological signal measurement and radar signal detection.

대용량 DNA서열 처리를 위한 서픽스 트리 생성 알고리즘의 개발 (Suffix Tree Constructing Algorithm for Large DNA Sequences Analysis)

  • 최해원
    • 한국산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.37-46
    • /
    • 2010
  • 서픽스 트리는 데이터의 내부구조를 자세히 나타내고 선형시간 탐색이 가능한 효과적인 자료구조로서 DNA 서열분석 등에 유용하다. 그러나 서열을 서픽스 트리로 구축하는 경우 트리의 크기가 원본의 최소 30배 이상으로 커지므로 테라바이트(TB)급의 대용량 DNA 서열의 경우에 메모리상의 응용은 매우 어려운 문제점이 있다. 이에 본 논문에서는 디스크를 이용한 대용량 DNA의 서픽스 트리 응용기법을 제시한다. 이때 DNA 서열구조를 고려한 서픽스 트리 선형 탐색 특성 유지를 보장한다. 이를 검증하기 위하여 9G Byte의 유전자 단편 서열을 이용해 424G Byte의 서픽스 트리를 디스크에 구축한 다음, 임의의 질의 서열에 대해 KMP알고리즘과 비교한 결과 질의 응답시간에서 우수한 성능을 보였다.

Gene Expression Profiling of Eukaryotic Microalga, Haematococcus pluvialis

  • EOM HYUNSUK;PARK SEUNGHYE;LEE CHOUL-GYUN;JIN EONSEON
    • Journal of Microbiology and Biotechnology
    • /
    • 제15권5호
    • /
    • pp.1060-1066
    • /
    • 2005
  • Under environmental stress, such as strong irradiance or nitrogen deficiency, unicellular green algae of the genus Haematococcus accumulate secondary carotenoids, i.e. astaxanthin, in the cytosol. The induction and regulation of astaxanthin biosynthesis in microalgae has recently received considerable attention owing to the increasing use of secondary carotenoids as a source of pigmentation for fish aquacultures, and as a potential drug in cancer prevention as a free-radical quencher. Accordingly, this study generated expressed sequence tags (ESTs) from a library constructed from astaxanthin-induced Haematococcus pluvialis. Partial sequences were obtained from the 5' ends of 1,858 individual cDNAs, and then grouped into 1,025 non-overlapping sequences, among which 708 sequences were singletons, while the remainder fell into 317 clusters. Approximately $63\%$ of the EST sequences showed similarity to previously described sequences in public databases. H. pluvialis was found to consist of a relatively high percentage of genes involved in genetic information processing ($15\%$) and metabolism ($11\%$), whereas a relatively low percentage of sequences was involved in the signal transduction ($3\%$), structure ($2\%$), and environmental information process ($3\%$). In addition, a relatively large fraction of H. pluvialis sequences was classified as genes involved in photosynthesis ($9\%$) and cellular process ($9\%$). Based on this EST analysis, the full-length cDNA sequence for superoxide dismutase (SOD) of H. pluvialis was cloned, and the expression of this gene was investigated. The abundance of SOD changed substantially in response to different culture conditions, indicating the possible regulation of this gene in H. pluvialis.

Construction of PANM Database (Protostome DB) for rapid annotation of NGS data in Mollusks

  • Kang, Se Won;Park, So Young;Patnaik, Bharat Bhusan;Hwang, Hee Ju;Kim, Changmu;Kim, Soonok;Lee, Jun Sang;Han, Yeon Soo;Lee, Yong Seok
    • 한국패류학회지
    • /
    • 제31권3호
    • /
    • pp.243-247
    • /
    • 2015
  • A stand-alone BLAST server is available that provides a convenient and amenable platform for the analysis of molluscan sequence information especially the EST sequences generated by traditional sequencing methods. However, it is found that the server has limitations in the annotation of molluscan sequences generated using next-generation sequencing (NGS) platforms due to inconsistencies in molluscan sequence available at NCBI. We constructed a web-based interface for a new stand-alone BLAST, called PANM-DB (Protostome DB) for the analysis of molluscan NGS data. The PANM-DB includes the amino acid sequences from the protostome groups-Arthropoda, Nematoda, and Mollusca downloaded from GenBank with the NCBI taxonomy Browser. The sequences were translated into multi-FASTA format and stored in the database by using the formatdb program at NCBI. PANM-DB contains 6% of NCBInr database sequences (as of 24-06-2015), and for an input of 10,000 RNA-seq sequences the processing speed was 15 times faster by using PANM-DB when compared with NCBInr DB. It was also noted that PANM-DB show two times more significant hits with diverse annotation profiles as compared with Mollusks DB. Hence, the construction of PANM-DB is a significant step in the annotation of molluscan sequence information obtained from NGS platforms. The PANM-DB is freely downloadable from the web-based interface (Malacological Society of Korea, http://malacol.or/kr/blast) as compressed file system and can run on any compatible operating system.

지형정보시스템기법을 이용한 친환경적 골프코스 설계 (Application of Geographical Information System on Golf Course Design for Reduction of Environmental Impacts)

  • 주영규;이활희;이무춘
    • 아시안잔디학회지
    • /
    • 제20권1호
    • /
    • pp.93-105
    • /
    • 2006
  • 최근 많은 수의 골프장 건설로 인하여 국토의 상당면적이 원지형의 변화 또는 파괴되고 있으며 주변 생태계가 급속한 변이를 겪고 있다. 골프코스 건설을 위해서는 정밀하고 효율적인 설계를 요하지만 기존의 통상적 설계방식으로는 사업의 방대성으로 인한 설계자료의 처리에 한계를 가지고 있었다. 특히 공사 후의 경관 변화에 대한 예측이나 환경영향 저감대책에 대하여 적절한 대안을 제시할 적절한 수단이 없었다. 따라서 이러한 문제점을 해결하기 위하여 지형정보시스템(GIS)을 골프코스 설계에 적용하여 건설에 따른 물리적 영향을 최소화시킬 수 있는 친환경적인 골프코스 설계 기법개발에 대하여 연구하였다. 연구된 내용은 지형정보시스템을 기초자료입력 단계에서부터 최종 성과물 단계까지 적용시켜 전 설계과정을 전산화하며, 부수적으로 골프 경기의 기능적 효과 증대 토지이용의 적정성, 코스유지 관리의 용이성 등을 사전 검토할 수 있는 친환경적 전산설계기법을 개발 연구하였다.