• 제목/요약/키워드: 유전자 데이터

검색결과 660건 처리시간 0.032초

바이오 셀 정보 추출을 위한 확률 모델 (Probabilistic model for bio-cells information extraction)

  • 석경휴;박성호
    • 한국전자통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.649-656
    • /
    • 2011
  • 본 논문에서는 유전자 생물학 분야의 여러 각도로 세포 간 네트워크를 분석하고, 유전자 생물학 분야를 정보공학 네트워크에 응용하여 수치학적인 표현 모델로 분석 연구하고자 한다. 확률적 그래프 모델을 사용하여 데이터 네트워크로부터 생물학적 통찰력을 확률적 함수적으로 응용해, 복잡한 세포 간 네트워크 보다 단순한 하부모델로 구성하여 유전자 베이스네트워크 논리를 유전자 표현 레벨로 나타낸다. 유전자 데이터로부터 확률적 그래프 모델들을 분석하여 유전자 표현 데이터를 정보공학 네트워크 모델의 방법으로 확장 추론한다.

텍스트마이닝 기법과 구글데이터를 이용한 질병관련 유전자 식별 (Disease related Gene Identification Using Literature and Google data)

  • 김정우;김현진;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1084-1087
    • /
    • 2013
  • 텍스트마이닝은(Text mining) 바이오분야에서 사용되는 도구 중 하나이다. 본 논문에서는 전립선암(Prostate cancer)과 관련된 질병 유전자(Disease gene)를 찾기 위해 텍스트마이닝을 이용하여 유전자 네트워크(Gene-network)를 구축하였다. 추가적으로 구글(Google) 검색을 통해 네트워크 내의 유전자 노드(Node)들 사이의 간선(Edge)에 새로운 가중치(Weight)를 추가하고 네트워크를 재구성하였다. 구축된 네트워크에서 노드와 노드 사이의 가중치를 기반으로 전립선암과 관련된 질병 유전자를 추출하였다. 본 논문의 방법은 성공적으로 네트워크를 구축하고 질병 유전자를 찾았으며, 구글 데이터를 사용하지 않고 네트워크를 구축하는 경우보다 더 높은 정확성을 입증했다.

센서 네트워크에서 데이터 전송 보장을 위한 유전자 알고리즘 기반의 라우팅 방법 (Genetic Algorithm Based Routing Method for Efficient Data Transmission for Reliable Data Transmission in Sensor Networks)

  • 김진명;조대호
    • 한국시뮬레이션학회논문지
    • /
    • 제16권3호
    • /
    • pp.49-56
    • /
    • 2007
  • 무선 센서 네트워크는 전쟁장 탐색, 침입자 추적 그리고 고속 도로 감시 등과 같은 많은 응용분야가 있다. 이러한 응용분야는 사용자의 관심 대상이 되는 지역에서 발생 하는 사건 모니터링 하기 위하여 센서 노드로부터 감지된 데이터를 수집한다. 이러한 응용분야에서 가장 중요한 목적은 데이터의 원활한 수집이다. 라우팅 프로토콜에 의존하는 데이터 전달 베이스 스테이션에게 전달되지 않을 수도 있다. 이러한 문제를 해결하기 위하여 우리는 센서 노드의 균등한 에너지 소비를 고려하여 데이터 전달 보장을 위한 유전자 알고리즘 기반의 라우팅 방법을 제안 한다. 제안하는 유전자 알고리즘은 전파 방해 지역, 데이터 전송에 필요한 에너지양 그리고 센서 노드의 평균 잔여 에너지를 고려한 효율적인 라우팅 경로를 탐색한다. 또한 유전자 알고리즘에서 사용하는 적합도는 함수는 퍼지 규칙이 적용되어 정리된다. 우리는 시뮬레이션을 통하여 제안된 방법을 기존의 LEACH와 계층적 PEGASIS에 대하여 비교 한다. 시뮬레이션 결과는 제안된 방법이 에너지의 효율적인 사용과 데이터 전송 성공률에 대한 효율성을 보여 준다.

  • PDF

데이터 마이닝의 능률적인 군집화를 위한 유전자 알고리즘 적용에 관한 연구 (A Study on Gene Algorithm Application for Efficient Clustring of Data Mining)

  • 최호진;홍성표
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.41-44
    • /
    • 2009
  • 데이터 마이닝의 대표적인 기법인 군집화는 군집내의 유사성을 최대화하고, 군집들간의 유사성을 최소화 시키도록 데이터의 집합을 분할하는 것이다. 대용량의 데이터베이스에서 최적의 효율화를 내기 위해서는 원시데이터에 대한 접근 횟수를 줄이고, 이것을 알고리즘 적용 대상이 데이터 구조의 크기를 줄이는 군집화 기법에 많은 관심이 보이고 있다. 본 논문에서는 유전자 알고리즘을 이용하여 자동으로 군집의 개수를 결정하는 군집화 알고리즘을 제안하는 적합도 함수는 보다 양질의 군집을 찾아내는 것으로 평가 되었다. 또한 유전자 알고리즘 중 8가지를 세부 분석하여 평가하였다.

  • PDF

전산 클로닝을 위한 Clustered EST 데이터베이스 구축 (Buliding Clustered EST database for In Silico Cloning)

  • 이진관;최은선;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.105-108
    • /
    • 2001
  • cDNA(complementary DNA)를 복제(cloneing)하여 염기 서열화 한 EST(Expressed Sequence Tag) 데이터는 여러 생물체들의 염기서열 정보들과 비교를 통해 유사점을 찾거나 기능적 부위 검색을 통해 유전자 기능을 추정한 수 있어 기능 유전체 연구에 많이 사용되고 있다. EST 데이터를 식물은 특정종(Species)별로, 동물의 경우 종의 조직별로 클러스터링 함으로써 아직 알려지지 않은 종의 유전자를 밝혀낼 수 있음은 물론 유전자의 발현에 따른 단백질의 기능도 알아낼 수 있다. 따라서 이 논문에서는 NCBI에서 flatfile 형태로 제공하는 EST 데이터를 분석하여 관계형 데이터베이스로 모델링하고 구축하였다. 또한 EST 데이터의 효율적인 사용을 위하여 데이터를 특정 종의 조직별로 클러스터링하여 제공하는 시스템을 설계하고 구현하였다.

  • PDF

DNA 마이크로어레이 데이터의 분류를 위한 종분화 진화 기반의 최적 다중 분류기 (Multiple Optimal Classifiers based on Speciated Evolution for Classifying DNA Microarray Data)

  • 박찬호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.724-726
    • /
    • 2004
  • DNA 마이크로어레이 기술의 발전은 암의 조기 발견 및 예후 예측을 가능하게 해주었으며, 이와 관련된 많은 연구가 진행 중이다. 마이크로어레이 데이터의 분류에서 관련 유전자들의 선택은 필수적이며, 유전자 선택방법은 분류기와 짝을 이루어 특징-분류기를 형성한다. 이제까지 여러 가지 특징-분류기를 사용하여 마이크로어레이 데이터를 분류해 왔지만, 알고리즘의 한계와 데이터의 결함 등으로 인하여 최적의 특징-분류기를 찾기 어려웠다. 따라서 앙상블 분류기를 이용하여 높은 분류성능을 얻는 방법이 시도되어왔으며. 최적의 것을 찾기 위하여 유전자 알고리즘이 사용되기도 했다. 본 논문에서는 이를 발전시켜 다양한 최적의 앙상블을 생성하기 위해 종분화 방법을 사용한다. 림프종 암 데이터에 대하여 leave-one-out cross-validation을 적용한 결과, 제안한 방법으로 다양한 최적해를 탐색하는 것을 확인할 수 있었다.

  • PDF

선별 시스템 기반 표지 유전자를 포함한 난소암 마이크로어레이 데이터 분류 (Classification of Ovarian Cancer Microarray Data based on Intelligent Systems with Marker gene)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.747-752
    • /
    • 2011
  • 마이크로어레이 분류는 전형적으로 분류기 디자인과 에러 추정이 현저하게 작은 샘플에 기반한다는 것과 교차 검증 에러 추정이 대다수의 논문에 사용된다는 주목할 만한 두 가지 특징을 소유한다. 마이크로어레이 난소 암 데이터는 수 만개의 유전자 발현으로 구성되어 있고, 이러한 정보를 동시에 분석하기 위한 어떤 체계적인 절차도 없다. 본 논문에서는, 통계에 따라 유전자의 우선순위를 정함으로써 표지유전자를 선택하였고, 널리 보급되어 있는 분류 규칙인 선형 분류 분석, 3-nearest-neighbor와 결정 트리 알고리즘은 표지 유전자를 선택한 데이터와 선택하지 않는 데이터의 분류 정확도 비교를 위해 사용되어졌다. ANOVA를 이용하여 선택된 표지 유전자를 포함하는 마이크로어레이 데이터 셋에 선영 분류분석 규칙을 적용한 결과 97.78%의 가장 높은 분류 정확도와 가장 낮은 예측 에러 추정치를 나타내었다.

종양 분류를 위한 특징 추출 및 분류 기법 (Feature Selection and Classification Methods for Tumor Classification)

  • 박윤정;이민수;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.799-801
    • /
    • 2005
  • 현재 마이크로어레이 기술은 대량의 유전자 발현 데이터 특히 종양과 관련한 데이터들을 쏟아내고 있다. 이 데이터를 기반으로 종양의 종류에 따른 유전자들의 차별적 발현 양상을 분석하고 발현량의 변화가 두드러지는 유전자들에 기반하여 종양을 분별할 수 있는 분류 모델을 구축한 후, 이것을 종양을 진단하거나 예측하는데 이용할 수 있다. 대부분의 종양은 생성 매커니즘에 따라 세부 부류로 나눌 수 있고 세부 부류에 따라 치료 방법이나 예후가 달라지므로, 정확하게 종양의 세부 부류를 진단하는 것이 매우 중요하다. 본 논문에서는 종양의 종류에 따라 발현량이 민감하게 변화하는 유전자들을 뽑아내기 위한 특징 추출 방법들과 추출된 특징들에 기반해서 종양의 종류를 분별할 수 있는 기계학습 알고리즘들의 조합들의 성능을 비교분석 하였다.

  • PDF

진화 알고리즘 기반 FPNN의 최적 동정 및 비선형 데이터로의 응용 (Optimized Identification of Genetic Algorithms based FPNN and Its Application to Nonlinear Data)

  • 이인태;이동윤;김현기;오성권
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.305-308
    • /
    • 2005
  • 본 논문은 유전자 알고리즘 기반 퍼지 다항식 뉴럴네트워크(Genetic Algorithm-based Fuzzy Polynomial Neural Networks ; GAs-based FPNN)를 이용하여 비선형 데이터의 최적화 추론 알고리즘을 제안한다. FPNN의 각 노드는 GMDH와 퍼지규칙을 기초로 만들었다. FPNN의 각 노드는 퍼지 다항식 뉴론(Fuzzy Polynomial Neuron : FPN)이라고 표현하다. 제안된 모델은 구조 선택에 있어서 유전자 알고리즘(Genetic Algorithms : GAs)을 이용하였다. 유전자 알고리즘을 사용하여 입력의 차수와 입력의 개수 그리고 후반부 추론의 형태를 최적 선택하였다. 비선형 데이터에 대한 모델 설계를 위해 최적화 알고리즘인 유전자 알고리즘 기반 FPNN 모델 설계가 유용하고 효과적임을 보인다.

  • PDF

화장품 추천을 위한 개인의 피부 유형 및 유전자를 이용한 빅데이터 분석 기반 모바일 서비스 (Big-data Analysis based Mobile Services using Individual Skin-type and Genes for Cosmetic Recommendation)

  • 이은주;송재오;김이나;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.495-496
    • /
    • 2018
  • 사람의 피부는 개인마다 상태의 차이가 있으며, 개인의 피부 상태에 따가 피부고민도 다르다. 이에 따라, 일반 소비자들의 화장품 사용에 대한 선호도는 나만의 것, 내 피부에 맞는 화장품, 자세한 카운슬링 순으로 선호도가 나타나고 있다. 민간기관에서도 유전자 검사가 가능해짐으로써 상기와 같이 피부에 대한 유전자 분석도 활성화되고 있는 실정으로, 본 논문에서는 개인의 피부 유형과 유전자 정보를 고려하고 소셜 네트워크에서의 데이터를 수집하여 빅데이터 분석을 통한 맞춤형 추천 서비스를 제안한다.

  • PDF