• Title, Summary, Keyword: 생물학적 정보

Search Result 712, Processing Time 0.052 seconds

Design of Intelligent Information Processing Module (지능형 정보처리 모듈 설계)

  • 김종수;김성주;김성현;김용민;전홍태
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • /
    • pp.409-414
    • /
    • 2004
  • 생물학적 뇌 정보처리 메커니즘을 보다 정확하게 구현할 수 있는 시스템은 입력에 대한 정확한 인지 능력, 상황 판단 능력, 학습 및 추론 능력, 출력의 결정 능력 등의 성능 구현은 물론이며, 감정과 비교될 수 있는 시스템의 상태를 평가하여 판단 및 결정에 적용함으로써 매우 뛰어난 지능형 시스템이 될 수 있다. 공학적인 의미에서 살펴본다면 정보 처리 과정을 입력의 처리, 정보의 전달, 제어 입력의 결정에 대한 의미로 정의할 수 있지만 생물학적으로 입력을 분석하고 정보를 처리 및 전달하며 출력을 제어하는 모델인 두뇌의 정보처리 메커니즘에 비교한다면 현재의 공학적인 정보처리 방식 및 제어기의 성능은 극히 미약한 수준이라고 할 수 있다. 이런 이유에서 최근 많은 공학자들은 생물학적인 뇌의 정보처리 개념에 대한 규명을 시도하고 있으며, 실제 공학적인 모델로 개발하여 설명하고 구현하는 연구를 진행하고 있다. 본 논문에서는 생물학적인 두뇌의 정보처리 메커니즘을 해석하고 공학적인 개념의 정립과 정보처리 흐름을 규명하고 정의함으로써 출력에 반영할 수 있는 모듈을 설계하고자 한다. 본 논문에서 제안된 모듈은 공학적인 분야는 물론 생물학적 뇌 연구에도 활용될 수 있을 것으로 기대된다.

  • PDF

Construction of the Aging Related Gene Database using Text-mining (서지분석을 통한 노화 관련 유전자 정보 데이터베이스 구축)

  • Yu, Seok Jong;Park, Junho;Yoo, Jaesoo
    • Proceedings of the Korea Contents Association Conference
    • /
    • /
    • pp.41-42
    • /
    • 2013
  • 최근 노령화가 급속히 진행되면서 노화에 대한 연구가 활발히 진행되고 있다. 하지만 노화현상은 광범위한 표현형을 지니고 있는 생명현상으로 이에 대한 체계적인 연구를 지원하기 위한 웹포털 사이트가 필요한 실정이다. 특히 노화에 따른 질병과의 연관성 및 관련 유전자에 대한 정보를 수집하고 이를 체계적으로 분석할 수 있는 통합정보시스템은 향후 노화연구를 지원하기 위한 가장 핵심적인 요소라고 할 수 있다. 본 연구에서는 기존 노화와 관련된 461개의 유전자를 기반으로 관련된 질병과의 연관성을 OMIM 데이터베이스를 활용하여 분석하였다. 또한 관련 단백질의 기능을 GO데이터베이스 분석을 통해 유전자의 기능을 분석하였다. Pubmed에서 제공하는 노화관련 논문들의 MeSH 정보 분석을 통해서 노화와 관련된 용어를 분석하였다. 노화와 관련된 64개의 유전자를 키워드로 NCBI의 pubmed 데이터베이스로부터 관련논문을 다운로드 받아 생물학적 상호작용 정보를 추출했다. 생물학적 상호작용은 NCBI에서 제공하는 Metamap 데이터베이스를 기반으로 각각의 생물학적 용어를 정의했다. 현재 노화 유전자 64개에 대해 128,729개의 생물학적 상호작용 정보를 추출했고, 8대 노인성만성질환에 대해 301,176개의 생물학적 상호작용 정보를 추출하였다.

  • PDF

Genomic Sequence alignments and its application for Computing Linear Structure Similarity

  • 조환규;황미녕;강은미;이미경
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • /
    • pp.64-88
    • /
    • 2002
  • 생물체의 유전자 서열들간의 유사성을 서로 비교해보는 일은(sequence alignment)는 분자생물학 연구에서 아주 기본적인 작업에 속한다. 이 작업은 컴퓨터 과학적 입장에서 살퍼보면 일종의 스트링 분석작업인데, 그 과정에는 매우 복잡한 생물학적인 가정이 내포되어 있다. 본 발표의 목적은 크게 두가지인데 하나는 컴퓨터과학 연구자들에게 서열정렬(sequence alignment)이 가지는 분자생물학적 의미에 대하여 개략적인 이해를 돕도록 하는 것이며, 다른 한편으로 분자생물학자들에게는 스트링처리방법을 이용한 서열정렬 문제에서 어떤 기술적인 한계가 있으며 그 한계를 극복하기 위한 새로운 방법론에 대하여 소개하여 컴퓨터과학적 이해의 폭을 넓히는 것이다. 그리고 생물체의 서열정보의 정렬과 매우 유사한 개념으로 각종 선형구조체(linear object)를 추상화 할 수 있른데, 그들간의 유사성도 같은 분자생물학적 방법론을 차용하여 분석할 수 있음을 보인다. 동시에 이것을 이용하여 각종 인터넷 문서나 프로그램, 등의 표절과 무단도용 등을 추적할 수 있는 방법론을 기존의 genomic sequence alignment tool을 차용해서 매우 효율적으로 할 수 있음을 보인다.

  • PDF

Implementing Biological Network Analysis System through Oriental Medical Literature Analysis (한의학 분야 문헌 분석을 통한 생물학적 네트워크 분석시스템 개발)

  • Yu, Seok Jong;Cho, Yongseong;Lee, Junehawk;Seo, Dongmin;Yea, Sang-Jun;Kim, Chul
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.10
    • /
    • pp.616-625
    • /
    • 2015
  • Currently, oriental medicine research is focused with modern research technology and validate it's various biochemical effect by combining with molecular biology technology. But there are few searching system for finding biochemical mechanism which is related to major compounds in oriental medicine. In this research, we aimed developing korean herb database based on text-mining system by analyzing PubMed data. We have developed prototype system for searching chemical, gene and biological relation in oriental medicine. It is characterized by modern oriental medicine research trend with major chemical, gene and protein information. Analysis results can be searched on the prototype system with visualization of the biological interactions.

Structure Searching of Biological Sequence using DCG in Constraint Logic Programming Language (제한 논리 프로그래밍 언어에서 DCG를 이용한 생물학적 서열의 구조 검색)

  • 이근우;이수현;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.352-354
    • /
    • 2001
  • 생물학적 서열의 구조 검색은 생물학적 특성을 예측하는데 많은 도움을 주며, 서열에서 나타나는 구조의 패턴은 촘스키의 형식 언어로 기술 가능하다. 본 논문에서는 문맥무관문법의 확장된 표기법인 DCG를 이용하여 구조 검색을 위한 구조 패턴의 생성 규칙을 정의하였다. 또한 구조 검색의 효율향상을 위하여 구조와 관련한 제한(constraint)을 정의하였고 이를 제한 논리 프로그래밍 언어로 구현하였다. 구현된 구조 검색 엔진은 웹 인터페이스를 통하여 접근할 수 있다.

  • PDF

Digit Recognition by Molecular Immunocomputing (분자 면역 컴퓨팅에 의한 숫자 인식)

  • 김수동;신기루;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.274-276
    • /
    • 2003
  • 신경과학이 발전함에 따라 기억현상의 분자생물학적, 세포생물학적 메커니즘이 밝혀지고 있으며, 신경계의 특징을 계산학적 측면으로 응용한 신경망 분야는 상당한 연구성과가 축적되어 하나의 학문 분야로까지 자리매김하고 있다. 면역학이 발전함에 따라 연역현상의 분자생물학적, 세포생물학적 메커니즘이 밝혀지고 있으며, 특히 연역기억현상의 산물인 항체를 이용한 설러 가지 생물학적 실험 방법이 고안되어 사용되고 있는 한편, 연역 현상의 특징을 계산학적 측면으로 응용하려는 다양한 시도가 근래 이루어지고 있다. 본고에서는 항원과 항체 분자를 이용한 면역생물학적 실험 방범을 적용하여 문자, 인식 문제를 해결하는 분자 면역 컴퓨팅의 개념을 도입하고, 이 개념을 도입하여 숫자를 인식하는 문제에 적용하는 사례를 제시하였다.

  • PDF

Biological Language Resource Construction and Named Entity Recognition System using UMLS (ULMS를 이용한 언어자원 구축 및 생물학적 개체명 인식 시스템)

  • Lee, Hyun-Sook;Kim, Tae-Hyun;Jang, Hyun-Chul;Park, Soo-Jun;Park, Seon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.833-836
    • /
    • 2003
  • 본 논문에서는 생물학적 문헌으로부터 유의미한 정보를 추출하는 바이오 텍스트 마이닝의 기본 단계인 생물학적 개체명 인식 모델을 제안하였다. 기존의 생물학적 개체명 인식은 규칙 혹은 코퍼스 구축뿐만 아니라 개체명 인식에 요구되는 기본 자원을 구축하는데만도 많은 시간과 비용이 요구되므로 한정된 도메인을 대상으로 연구가 진행되어 왔다. 본 논문에서 제안하는 개체명 인식 방법은 이러한 비용 문제 및 새로운 도메인으로의 이식성 문제를 극복하기 위해 UMLS 로부터 통계적인 방법으로 정보를 추출해 기본적인 언어자원을 구축하고 이를 이용해 규칙을 생성함으로써 개체명인식을 수행한다. 본 연구에서 제안하는 방법은 바이오 텍스트 마이닝 연구의 도메인 한정적인 문제를 해결하는데 기여할 수 있을 것으로 기대된다.

  • PDF

Mining Frequent Contiguous Sequence Patterns in Biological Sequences (생물학적 서열들에서 빈발한 연속 서열 패턴 마이닝)

  • Kang, Tae-Ho;Yoo, Jae-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.27-31
    • /
    • 2007
  • 생물학적 서열 데이터는 크게 DNA 염기 서열과 단백질 아미노산 서열이 있다. 이들 서열은 일반적으로 많은 수의 항목들을 가지고 있어 그 길이가 매우 길다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 부분 연속 서열들이 존재하는데 이들 서열들을 찾아내는 것은 다양한 서열 분석에서 유용하게 사용될 수 있다. 이를 위해 초기에는 Apriori 알고리즘을 기반으로 하는 순차패턴 마이닝 알고리즘들을 활용하는 방법들이 많이 제시되었다. 그중 PrefixSpan 알고리즘은 Apriori기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로부터 서열 패턴을 확장해나가는 방식으로 길이가 긴 연속 서열을 포함하는 생물학적 데이터 서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 원본 데이터베이스보다 크기가 큰 별도의 프로젝션 데이터베이스를 사용함으로서 많은 비용부담이 발생하고 특히 길이가 긴 서열에 대해서는 더욱 효율적이지 못하다. 이에 본 논문에서 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색 성능이 우수함을 증명한다.

  • PDF

Development of Unified Modeling System for Biological Networks (생물학적 네트워크의 통합적 모델링 시스템 개발)

  • Yu, Seok Jong;Park, Junho;Yoo, JaeSoo
    • Proceedings of the Korea Contents Association Conference
    • /
    • /
    • pp.275-276
    • /
    • 2013
  • 생명현상은 다양한 단백질들 간의 상호작용으로 외부의 환경에 대처하고 생명유지를 위한 다양한 생화학반응을 수행한다. 이러한 복잡한 생명현상의 과정을 이해하기 위해서 생명과학자들은 유전자 조절네트워크, 신호전달네트워크, 대사네트워크 등 다양한 종류의 네트워크를 모델링하고 있다. 하지만 각각의 모델링방법은 각 분야별로 다양하게 존재하고 있는 실정이다. 본 연구에서는 이러한 다양한 종류의 생물학적 네트워크를 통합적으로 모델링할 수 있는 통합적 모델링 시스템을 설계하고 구현하였다. 특히 신호전달 과정에 대한 블리온 모델링기법, 유전자 발현조절 및 대사과정에 대한 ODE(Ordinary Differential Equation)모델링 그리고 유전적 표현형을 분석할 수 있는 Flux 모델링을 하나의 모델링 시스템에서 설계 하였다. 또한 이 같은 다양한 종류의 모델링을 지원하기 위해서 SBML포멧을 기준으로 가시적인 모델링 시스템을 구현하였다. 특히 연구자가 모델링한 생물학적 모델이 다른 형태의 모델링기법에도 적용될 수 있도록 전환할 수 있도록 하였다. 이러한 통합적인 모델링 시스템은 향후 복잡해지는 생물학적 네트워크를 손쉽게 모델링 할 수 있는 시스템으로 활용될 것이다.

  • PDF

A Study on Construction and Management Tools for Biological Named Entity Dictionary (생물학적 개체명 사전을 위한 구축 및 관리 도구에 관한 연구)

  • Jang, Hyun-Chul;Kim, Tae-Hyun;Lee, Hyun-Sook;Park, Soo-Jun;Park, Seon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.853-856
    • /
    • 2003
  • 바이오 텍스트 마이닝을 위한 정보 추출의 첫 단계는 생물학적 문헌으로부터의 유전자, 단백질, 세포조직 등과 같은 생물학적 개체명의 인식이다. 생물학적 개체명의 명명법상 특징이 매우 다양하고 저자의 개성에 의해 쉽게 좌우되어 단순히 규칙이나 학습 방법 만으로는 쉽게 개체명들을 인식할 수 없다. 또한, 생물학 관련 문헌에 나오는 가능한 모든 개체명과 이들의 모든 변형을 수록하는 것은 현실적으로 불가능하므로 이를 해결하기 위해 이미 알려진 개체명에 대해서 기본적으로 사전을 탐색하고 알려지지 않은 용어들을 규칙과 통계 기반 방법을 통하여 인식하는 것이 효과적이다. 그러나 만족할 만한 수준의 양질의 사전을 구축하는 것은 쉽지 않을 뿐만 아니라 많은 비용이 소요되며, 어느 순간 만족할 만한 성능을 낼 수 있는 사전을 구축했다. 할지라도 유지 관리 하는 것이 결코 쉬운 일이 아니며 마찬가지로 많은 비용을 필요로 하게 된다. 따라서, 잘 구축된 자원으로부터 필요한 정보를 추출하여 적절한 사전을 자동으로 구축하여 활용하는 방법을 사용할 경우, 사전 구축 및 관리에 드는 많은 비용을 줄이면서도 상당히 효과적인 성능을 얻을 수 있을 것이다. 본 연구에서는 바이오 텍스트 마이닝 엔진을 위한 생물학적 개체명 사전을 자동으로 구축하고 이를 쉽게 관리하도록 하는 도구를 개발하였다.

  • PDF