• 제목/요약/키워드: Co-clustering

검색결과 221건 처리시간 0.027초

RapidEye 영상과 LiDAR DEM을 이용한 낙동강 범람원 내 토지 이용 현황 분석 (Analysis of Land Uses in the Nakdong River Floodplain Using RapidEye Imagery and LiDAR DEM)

  • 정윤재
    • 한국지리정보학회지
    • /
    • 제17권4호
    • /
    • pp.189-199
    • /
    • 2014
  • 범람원(floodplain)은 제방과 하천 사이에 존재하는 평탄하고 낮은 지역을 의미하며, 범람원 내 토지 이용 현황 분석은 하천유역의 효과적인 자원관리를 위해서 반드시 필요하다. 본 논문에서는 공간정보 자료인 LiDAR DEM 자료와 RapidEye 영상을 이용하여 낙동강 하천 범람원 내 토지 이용 현황 분석에 관한 연구를 진행하였다. 우선, DEM으로부터 제방 경계선을 추출하여 RapidEye 영상에서 연구대상지역 내 범람원의 범위를 설정하였다. 범람원의 범위를 설정한 뒤, RapidEye 영상에 ISODATA 클러스터링 및 post-classification 과정을 적용하여 범람원 내 토지피복 분류 작업을 진행하였다. ISODATA 클러스터링을 적용하여 분류된 범람원 내 토지피복은 91%의 분류 정확도를 가진다. 분류된 토지피복 클러스터들을 구성하는 픽셀들의 개수를 계산하여, 낙동강 범람원 내 토지 이용 현황에 관한 분석을 수행하였다. 본 연구를 통하여, 연구대상지역 범람원 내 하천의 면적은 46%, 나지의 면적은 36%, 습지의 면적은 11%, 그리고 초지의 면적은 7%라는 사실을 알 수 있었다.

도시 내 이민자 자영업의 시공간적 역동성 - 시카고 거주 한국인 이민자를 사례로 - (Spatio-Temporal Dynamics of Immigrant Self-employment: A Case Study of Korean Immigrants in Chicago)

  • 정수열;임석회
    • 한국경제지리학회지
    • /
    • 제15권3호
    • /
    • pp.376-389
    • /
    • 2012
  • 이민자 집단에 있어 자영업은 생존과 사회경제적 지위 상승의 중요한 수단이다. 지리학적 관점에서는 이민자들의 주거 집중이 이민자 자영업이 성장하는데 중요한 역할을 한다고 보아 왔다. 하지만 최근 이민자들의 거주지가 분산되어 집거권의 역할이 축소될 가능성이 점쳐 지고 있다. 본 연구는 이민자들의 주거 분산에 따른 자영업에 대한 집거권이 행하는 역할이 어떻게 변화해 가는지 시카고 대도시권에 거주하고 있는 한국인 자영업자들을 사례로 분석하였다. 먼저 Public Use Microdata Sample(PUMS) 통계자료를 통해 한인 자영업의 전반적인 변화상을 점검하였다. 주거 분산에 대한 한인 자영업자들의 반응과 대응을 설문조사를 통해 살펴보았다. 반응이라는 측면에서 자영업자들을 '영향이 있었다'는 그룹과 '영향이 별로 없었다'는 그룹으로 나누고 각각의 특성이 고객확보, 노동력수급, 자재수급, 사업정보획득, 그리고 사업경험이라는 측면에서 서로 다르다고는 것이 밝혀졌다. 두 그룹이 민족네트워크에 의존하는 정도와 활용하는 방법에서 상이하여 그러한 반응을 보인 것으로 판단되었다. 본 연구는 이민자 기업가주의의 발흥에 있어 주거 집중의 중요성은 해당 자영업의 민족적 네트워크의 의존도와 활용방법에 달려있다는 점을 밝혔다.

  • PDF

비대칭 대역폭 위성망에서의 TCP 성능 향상을 위한 단말국 ACK 필터링 및 패킷 스케줄링 기법 (TCP Performance improvement over Asymmetric Bandwidth Satellite Network using ACK filtering and Packet scheduling)

  • 김용신;최훈;안재영;김영한
    • 대한전자공학회논문지TC
    • /
    • 제37권4호
    • /
    • pp.1-8
    • /
    • 2000
  • 상향 링크와 하향 링크의 대역폭이 다른 대역폭 비대칭 환경에서 TCP는 단말국 링크에서의 지연 및 손 실로 인해 전송율이 감소하는 문제점이 있다. 또한, 양방향 TCP 트래픽하에서는 연속적인 이터패킷이 버퍼에 주입됨으로써 전체 링크 효율이 저하된다. 이러한 문제를 해결하기 위한 방안으로서 본 논문에서는 단 말국 ACK 필터링 기법과 단말국 패킷 스제줄링 기법을 제안한다. ACK 필터링은 대역폭이 제한된 상향 링 크에서 단말국의 송신 버퍼에 쌓인 ACK 패킷들을 제거하고 최근의 ACK 패킷만을 전송하고, 패킷 스케줄 링은 데이터 패킷과 ACK 패킷을 번갈아 전송하여 양방향 TCP 트래픽에서 발생하는 'clustering'과 'ack compression' 현상을 억제하는 기법이다. 모의 실험을 통해서 대역폭 비대칭 위성망에서 역방향 TCP 연결 의 데이터 전송을 보장하는 동시에 순방향 TCP 트래픽에서도 높은 전송율을 얻게되는 것을 확인하였다.

  • PDF

군집 특정 변량효과를 포함한 유한 혼합 모형의 베이지안 분석 (Bayesian analysis of finite mixture model with cluster-specific random effects)

  • 이혜진;경민정
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.57-68
    • /
    • 2017
  • 대량의 데이터에 있어 전반적인 특성 및 구조를 파악하는데 유용하기 때문에 다양한 분야에서 군집분석을 사용하고 있다. Dempster 등 (1977)에서 정의된 expectation-maximization(EM) 알고리즘은 가장 보편적으로 사용되는 군집분석 방법이다. 선형모형의 유한혼합물(finite mixture of linear model) 기법 또한 군집분석 방법 중 많이 사용되는 방법이며 베이지안 군집방법은 Bernardo와 Giron (1988)이 군집에 대한 가중치 확률만 모를 경우 처음 적용하였다. 우리는 이 연구에서 일반적인 선형모형의 유한혼합물이 아닌 군집특정(cluster-specific) 변량효과를 모형에 포함하여 베이지안 분석방법인 깁스표집법(Gibbs sampling)을 사용한다. 제안한 모형의 특성 및 표집법에 대하여 설명하였고 모의실험 및 실제 데이터 분석을 통하여 모형의 유용성을 파악하였다. Hurn 등 (2003)의 CO2 데이터에 모형을 적용하여 변량효과가 없는 모형, 개체특정(subject-specific) 변량효과 모형과 비교하였다.

Separating nanocluster Si formation and Er activation in nanocluster-Si sensitized Er luminescence

  • 김인용;신중훈;김경중
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2009년도 제38회 동계학술대회 초록집
    • /
    • pp.109-109
    • /
    • 2010
  • $Er^{3+}$ ion shows a stable and efficient luminescence at 1.54mm due to its $^4I_{13/2}\;{\rightarrow}\;^4I_{15/2}$ intra-4f transition. As this corresponds to the low-loss window of silica-based optical fibers, Er-based light sources have become a mainstay of the long-distance telecom. In most telecom applications, $Er^{3+}$ ions are excited via resonant optical pumping. However, if nanocluster-Si (nc-Si) are co-doped with $Er^{3+}$, $Er^{3+}$ can be excited via energy transfer from excited electrical carriers in the nc-Si as well. This combines the broad, strong absorption band of nc-Si with narrow, stable emission spectra of $Er^{3+}$ to allow top-pumping with off-resonant, low-cost broadband light sources as well as electrical pumping. A widely used method to achieve nc-Si sensitization of $Er^{3+}$ is high-temperature annealing of Er-doped, non-stoichiometric amorphous thin film with excess Si (e.g.,silicon-rich silicon oxide(SRSO)) to precipitate nc-Si and optically activate $Er^{3+}$ at the same time. Unfortunately, such precipitation and growth of nc-Si into Er-doped oxide matrix can lead to $Er^{3+}$ clustering away from nc-Si at anneal temperatures much lower than ${\sim}1000^{\circ}C$ that is necessary for full optical activation of $Er^{3+}$ in $SiO_2$. Recently, silicon-rich silicon nitride (SRSN) was reported to be a promising alternative to SRSO that can overcome this problem of Er clustering. But as nc-Si formation and optical activation $Er^{3+}$ remain linked in Er-doped SRSN, it is not clear which mechanism is responsible for the observed improvement. In this paper, we report on investigating the effect of separating the nc-Si formation and $Er^{3+}$ activation by using hetero-multilayers that consist of nm-thin SRSO or SRSN sensitizing layers with Er-doped $SiO_2$ or $Si_3N_4$ luminescing layers.

  • PDF

GCNXSS: An Attack Detection Approach for Cross-Site Scripting Based on Graph Convolutional Networks

  • Pan, Hongyu;Fang, Yong;Huang, Cheng;Guo, Wenbo;Wan, Xuelin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.4008-4023
    • /
    • 2022
  • Since machine learning was introduced into cross-site scripting (XSS) attack detection, many researchers have conducted related studies and achieved significant results, such as saving time and labor costs by not maintaining a rule database, which is required by traditional XSS attack detection methods. However, this topic came across some problems, such as poor generalization ability, significant false negative rate (FNR) and false positive rate (FPR). Moreover, the automatic clustering property of graph convolutional networks (GCN) has attracted the attention of researchers. In the field of natural language process (NLP), the results of graph embedding based on GCN are automatically clustered in space without any training, which means that text data can be classified just by the embedding process based on GCN. Previously, other methods required training with the help of labeled data after embedding to complete data classification. With the help of the GCN auto-clustering feature and labeled data, this research proposes an approach to detect XSS attacks (called GCNXSS) to mine the dependencies between the units that constitute an XSS payload. First, GCNXSS transforms a URL into a word homogeneous graph based on word co-occurrence relationships. Then, GCNXSS inputs the graph into the GCN model for graph embedding and gets the classification results. Experimental results show that GCNXSS achieved successful results with accuracy, precision, recall, F1-score, FNR, FPR, and predicted time scores of 99.97%, 99.75%, 99.97%, 99.86%, 0.03%, 0.03%, and 0.0461ms. Compared with existing methods, GCNXSS has a lower FNR and FPR with stronger generalization ability.

A streamlined pipeline based on HmmUFOtu for microbial community profiling using 16S rRNA amplicon sequencing

  • Hyeonwoo Kim;Jiwon Kim;Ji Won Cho;Kwang-Sung Ahn;Dong-Il Park;Sangsoo Kim
    • Genomics & Informatics
    • /
    • 제21권3호
    • /
    • pp.40.1-40.11
    • /
    • 2023
  • Microbial community profiling using 16S rRNA amplicon sequencing allows for taxonomic characterization of diverse microorganisms. While amplicon sequence variant (ASV) methods are increasingly favored for their fine-grained resolution of sequence variants, they often discard substantial portions of sequencing reads during quality control, particularly in datasets with large number samples. We present a streamlined pipeline that integrates FastP for read trimming, HmmUFOtu for operational taxonomic units (OTU) clustering, Vsearch for chimera checking, and Kraken2 for taxonomic assignment. To assess the pipeline's performance, we reprocessed two published stool datasets of normal Korean populations: one with 890 and the other with 1,462 independent samples. In the first dataset, HmmUFOtu retained 93.2% of over 104 million read pairs after quality trimming, discarding chimeric or unclassifiable reads, while DADA2, a commonly used ASV method, retained only 44.6% of the reads. Nonetheless, both methods yielded qualitatively similar β-diversity plots. For the second dataset, HmmUFOtu retained 89.2% of read pairs, while DADA2 retained a mere 18.4% of the reads. HmmUFOtu, being a closed-reference clustering method, facilitates merging separately processed datasets, with shared OTUs between the two datasets exhibiting a correlation coefficient of 0.92 in total abundance (log scale). While the first two dimensions of the β-diversity plot exhibited a cohesive mixture of the two datasets, the third dimension revealed the presence of a batch effect. Our comparative evaluation of ASV and OTU methods within this streamlined pipeline provides valuable insights into their performance when processing large-scale microbial 16S rRNA amplicon sequencing data. The strengths of HmmUFOtu and its potential for dataset merging are highlighted.

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 (A Study on Differences of Contents and Tones of Arguments among Newspapers Using Text Mining Analysis)

  • 감미아;송민
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.53-77
    • /
    • 2012
  • 본 연구는 경향신문, 한겨레, 동아일보 세 개의 신문기사가 가지고 있는 내용 및 논조에 어떠한 차이가 있는지를 객관적인 데이터를 통해 제시하고자 시행되었다. 본 연구는 텍스트 마이닝 기법을 활용하여 신문기사의 키워드 단순빈도 분석과 Clustering, Classification 결과를 분석하여 제시하였으며, 경제, 문화 국제, 사회, 정치 및 사설 분야에서의 신문사 간 차이점을 분석하고자 하였다. 신문기사의 문단을 분석단위로 하여 각 신문사의 특성을 파악하였고, 키워드 네트워크로 키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised Learning 기법을 활용하여 각각의 논조에 대해 분류하였으며, 마지막으로는 분류 성능 평가를 위해 정확률과 재현률, F-value를 측정하여 제시하였다. 본 연구를 통해 문화 전반, 경제 전반, 정치분야의 통합진보당 이슈에 대한 신문기사들에 전반적인 내용과 논조에 차이를 보이고 있음을 알 수 있었고, 사회분야의 4대강 사업에 대한 긍정-부정 논조에 차이가 있음을 발견할 수 있었다. 본 연구는 지금까지 연구되어왔던 한글 신문기사의 코딩 및 담화분석 방법에서 벗어나, 텍스트 마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있다. 향후 지속적인 연구를 통해 분류 성능을 보다 높인다면, 사람들이 뉴스를 접할 때 그 뉴스의 특정 논조 성향에 대해 우선적으로 파악하여 객관성을 유지한 채 정보에 접근할 수 있도록 도와주는 신뢰성 있는 툴을 만들 수 있을 것이라 기대한다.

적외선 영상에서의 시계열 특징 추출을 이용한 Gunnery 분류 기법 연구 (Gunnery Classification Method Using Profile Feature Extraction in Infrared Images)

  • 김재협;조태욱;천승우;이종민;문영식
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.43-53
    • /
    • 2014
  • Gunnery 표적으로부터 발생하는 영상특징은 장비의 위치를 탐지하고 종류를 판별하는 주요 정보로 활용될 수 있다. 본 논문에서는 Gunnery 영상에서 표적 영역의 밝기값을 획득하여 특징을 추출하고 분류하는 기법을 제안한다. 제안하는 기법에서는 38~40개의 신호 기반 특징과 2개의 모델 기반 특징을 추출하여 분석하고 분류모델에 적용한다. 다중 클래스 분류를 위하여 트리(tree) 기반의 분류 모델을 설계하였으며, 시스템에서 요구하는 Gunnery의 종류와 특성에 따라 유사도를 정의하여 트리 구조를 설계하였다. 트리 구성 단계에서는 각 레벨마다 SVM(Support Vector Machine)을 이용하여 분류 하였으며 시스템에서 요구하는 분류 성능을 만족함을 확인하였다.

Genome Wide Expression Analysis of the Effect of Woowhangchongshim-won on Rat Brain Injury

  • ;;;;;조수인
    • 대한한방내과학회지
    • /
    • 제30권3호
    • /
    • pp.594-603
    • /
    • 2009
  • Objectives : ICH breaks down blood vessels within the brain parenchyma, which finally leads to neuronal loss, drugs to treat ICH have not yet been established. In this experiment, we measured the effect of Woowhangchongshim-won (WWCSW) on intracerebral hemorrhage (ICH) in rat using microarray technology. Methods : We measured the effect of WWCSW on ICH in rat using microarray technology. ICH was induced by injection of collagenase type IV, and total RNA was isolated. Image files of microarray were measured using a ScanArray scanner, and the criteria of the threshold for up- and down-regulation was 2 fold. Hierarchical clustering was implemented using CLUSTER and TREEVIEW program, and for Ontology analysis. GOSTAT program was applied in which p-value was calculated by Chi square or Fisher's exact test based on the total array element. Results : WWCSW-treatment restored the gene expression altered by ICH-induction in brain to the levels of 76.0% and 70.1% for up- and down-regulated genes, respectively. Conclusion : Co-regulated genes by ICH model of rat could be used as molecular targets for therapeutic effects of drug including WWCSW. That is, the presence of co-regulated genes may represent the importance of these genes in ICH in the brain and the change of expression level of these co-regulated genes would also indicate the functional change of brain tissue.

  • PDF