• 제목/요약/키워드: topographic clustering

검색결과 7건 처리시간 0.017초

Gene Expression Pattern Analysis via Latent Variable Models Coupled with Topographic Clustering

  • Chang, Jeong-Ho;Chi, Sung Wook;Zhang, Byoung Tak
    • Genomics & Informatics
    • /
    • 제1권1호
    • /
    • pp.32-39
    • /
    • 2003
  • We present a latent variable model-based approach to the analysis of gene expression patterns, coupled with topographic clustering. Aspect model, a latent variable model for dyadic data, is applied to extract latent patterns underlying complex variations of gene expression levels. Then a topographic clustering is performed to find coherent groups of genes, based on the extracted latent patterns as well as individual gene expression behaviors. Applied to cell cycle­regulated genes of the yeast Saccharomyces cerevisiae, the proposed method could discover biologically meaningful patterns related with characteristic expression behavior in particular cell cycle phases. In addition, the display of the variation in the composition of these latent patterns on the cluster map provided more facilitated interpretation of the resulting cluster structure. From this, we argue that latent variable models, coupled with topographic clustering, are a promising tool for explorative analysis of gene expression data.

응집 계층 군집화 기법을 이용한 이종 공간정보의 M:N 대응 클래스 군집 쌍 탐색 (Detection of M:N corresponding class group pairs between two spatial datasets with agglomerative hierarchical clustering)

  • 허용;김정옥;유기윤
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.125-134
    • /
    • 2012
  • 본 연구는 두 공간정보의 대응 클래스 군집 쌍 탐색을 중심으로 의미론적 정합과정에서 발생하는 M:N 대응관계를 분석하는 방법을 제안한다. 객체의 공유 관계를 이용하여 클래스의 유사도를 측정하고 높은 유사도를 가지는 클래스들을 군집화함으로써 M:N 대응관계를 탐색하고자 한다. 클래스 사이의 유사도를 그래프 모형으로 표현하고 그래프 임베딩 기법을 적용하여 투영공간에서 클래스 사이의 거리가 클래스 중첩분석에 의한 국지적 유사도에 반비례하도록 개별 클래스들의 투영좌표를 계산하고 군집화를 수행함으로써 계층적 대응 군집 쌍을 탐색할 수 있다. 제안된 방법을 평가하기 위하여 경기도 수원시의 수치지형도와 연속지적도에 적용하여 수치지형도의 면 객체 레이어와 연속지적도의 필지 지목의 대응 군집 쌍을 탐색하였다. 탐색된 대응 클래스 쌍의 F-measure를 측정한 결과 약 0.80에서 0.35 사이의 다양한 값을 얻을 수 있었으며, 클래스 명칭과는 상이한 다양한 대응관계를 얻을 수 있었다.

디지털영상의 특정영역 인식과 처리 방안 (Methods on Recognition and Recovery Process of Censored Areas in Digital Image)

  • 김감래;김욱남;김훈정
    • 한국측량학회지
    • /
    • 제20권1호
    • /
    • pp.1-11
    • /
    • 2002
  • 본 연구에서는 보안목표물의 효율적인 활용에 목적을 두고 있으며 이를 위하여 항공사진 영상에 표현된 보안 삭제구역에 대한 문제점을 분석하고 영상의 특정영역 인식을 위하여 클러스터링과 레이블링을 실시하였으며, 후처리 알고리즘을 통하여 디지털 영상 데이터의 다양한 활용성을 극대화시키려 하였다. 이러한 연구성과를 토대로 영상의 밝기 값은 지형ㆍ지물의 수량에 따라 증가하는 것으로 나타났으며, 이는 영상 전체에 포함되어 있는 지형·지물의 정보량 판단에 유용한 평가자료로 활용할 수 있는 것으로 평가되었다. 또한 영상인식 및 후 처리에 있어서 도심지나 교외지의 경우 기존 보안목표물의 삭제를 위한 처리절차와 유사하게 인식되는 지형ㆍ지물의 다수 포함으로 인해 산악지에 비해 좋은 결과 값이 도출되지 않았으며. 이는 지형·지물의 수량이 인식 및 처리에 절대적인 영향을 미치는 것으로 나타났다.

RapidEye 위성영상의 시계열 NDVI 및 객체기반 분류를 이용한 북한 재령군의 논벼 재배지역 추출 기법 연구 (Extraction of paddy field in Jaeryeong, North Korea by object-oriented classification with RapidEye NDVI imagery)

  • 이상현;오윤경;박나영;이성학;최진용
    • 한국농공학회논문집
    • /
    • 제56권3호
    • /
    • pp.55-64
    • /
    • 2014
  • While utilizing high resolution satellite image for land use classification has been popularized, object-oriented classification has been adapted as an affordable classification method rather than conventional statistical classification. The aim of this study is to extract the paddy field area using object-oriented classification with time series NDVI from high-resolution satellite images, and the RapidEye satellite images of Jaeryung-gun in North Korea were used. For the implementation of object-oriented classification, creating objects by setting of scale and color factors was conducted, then 3 different land use categories including paddy field, forest and water bodies were extracted from the objects applying the variation of time-series NDVI. The unclassified objects which were not involved into the previous extraction classified into 6 categories using unsupervised classification by clustering analysis. Finally, the unsuitable paddy field area were assorted from the topographic factors such as elevation and slope. As the results, about 33.6 % of the total area (32313.1 ha) were classified to the paddy field (10847.9 ha) and 851.0 ha was classified to the unsuitable paddy field based on the topographic factors. The user accuracy of paddy field classification was calculated to 83.3 %, and among those, about 60.0 % of total paddy fields were classified from the time-series NDVI before the unsupervised classification. Other land covers were classified as to upland(5255.2 ha), forest (10961.0 ha), residential area and bare land (3309.6 ha), and lake and river (1784.4 ha) from this object-oriented classification.

클라우드 환경에서 IoT 정보 오류를 고려한 지형 정보 기반의 키 관리 기법 (A Key Management Technique Based on Topographic Information Considering IoT Information Errors in Cloud Environment)

  • 정윤수;최정희
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.233-238
    • /
    • 2020
  • 클라우드 환경에서는 센서 및 웨어러블 장치를 이용한 IoT 기기가 다양한 환경에서 응용되고 있으며 그에 따른 IoT 기기에서 생성되는 정보를 정확하게 판별하는 기술들이 활발하게 연구되고 있다. 그러나, 전력 및 보안과 같은 IoT 환경의 제약사항으로 인하여 IoT 장치에서 발생하는 정보가 매우 취약하기 때문에 금전 피해 및 인명 피해가 증가하고 있다. 본 논문에서는 IoT 정보를 정확하게 수집·분석하기 위해서 IoT 정보 오류를 고려한 지형 정보 기반의 키 관리기법을 제안한다. 제안 기법은 IoT 장치를 클라우드 환경에서 임의로 배치할 경우 IoT 장치의 연결성을 확보하기 위해서 IoT 배치 오류를 허용하는 동시에 지형 정보를 n개의 그룹으로 그룹핑 하도록 한다. 특히, 각 그룹핑 된 지형 정보에는 전체 키 풀에서 랜덤하게 선택된 임의의 키를 할당한 후 IoT 정보에 포함된 지형 정보의 키와 확률적으로 높은 키 값을 IoT 장치의 연결성으로 확보할 수 있도록 한다. 특히, 제안 기법은 확률적 딥러닝을 이용하여 IoT 지형 정보의 키를 시드로 추출하기 때문에 IoT 장치에 대한 정보 오류를 낮출수 있다.

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

GIS Software를 이용한 한국 산악 지형의 경사도 산출 정확도에 관한 연구 -원자료의 등고선 간격과 해상력을 중심으로- (A Study on the Accuracy of Calculating Slopes for Mountainous Landform in Korea Using GIS Software - Focused on the Contour Interval of Source Data and the Resolution -)

  • 신진민;이규석
    • Spatial Information Research
    • /
    • 제7권1호
    • /
    • pp.1-12
    • /
    • 1999
  • 토지정보체계(Geographical Information System, GIS)에서 지형표고를 나타내는 수치지형정보(Digital Terrain Model, DTM)는 토공량 계산 조경, 토목, 가시구역 분석, 무선중계국 위치선정 등 GIS가 활용되면서 여러 분야에서 이용되고 있다. DIM의 표고정보 및 이를 활용한 경사도와 같은 2차 정보의 정확도는 광활하고 평탄한 지형에서는 격자 간격, 원자료의 해상력 등이 크게 문제되지 않을 수 있으나 한국과 같이 지형의 기복이 심하고 다양한 형태의 지형에서는 적절한 해상력, 원자료의 정확성 등이 지형 표현에 있어 중요한 요소가 되고 있다. 그러므로 본 연구의 목적은 95소프트웨어를 이용한 경사도 산출시 등고선의 정확도, 해상력, DTM의 자료구조에 따른 차이점을 분석하여 한국의 산악 지형에 적절한 해상력을 구하고자 하는 데 있다. 이를 위해 현재 세계적으로 많이 쓰이고 있는 DTM의 자료구조인 고도행렬식 기법(altitude matrices)을 활용한 격자형(raster) 자료구조인 Idrisi(ver. 2.0)와 비정규삼각망(Triangulated Irregular Network, TIN)자료구조인 ArcView(ver. 3.0a)를 사용하여 덕유산 국립공원의 1:25,000 지형도에서 생성한 DIM을 이용하여 경사도를 산출한 후 각각의 경사도 차이에 대해 비교 분석한 결과 다음과 같은 결론을 얻었다. 1) 해상력이 낮을수록 원자료의 등고선 간격이 클수록 지형의 smoothing 효과가 나타났다. 2) 격자형 자료구조인 Idrisi와 TIN자료구조인 ArcView사이의 경사도 값 차이는 해상력이 떨어질수록 큰 차이를 보였다. 3) 30개의 표본점을 선택해 오차 비교 결과 경사도 오차의 경우 격자형 자료구조인 Idrisi와TIN자료구조인 ArcView모두 해상력에 따른 큰 차이가 없었으며 표고차의 경우 ArcView는 l0m 등고선 간격에서 생성한 해상력 10, 20, 30m DTM에서 각각 4.9, 6.2, 5.9m로서 큰 차이가 없었고 Idrisi는 해상력 10, 20, 30m DTM에서 각각 6.3, 9.1, 10.9m로서 해상력이 감소할수록 표고 값의 오차가 늘었다. 4) Idrisi ArcView 모두 산정상부, 계곡 바닥과 같은 지형의 지성선을 고려하지 못하였다.

  • PDF