• Title/Summary/Keyword: community clustering

Search Result 138, Processing Time 0.026 seconds

자연초지에서 식생구성비율에 의한 식생군락간의 유사성 (The Similarity between Plant Communities as Affected by Botanical Composition in Natural Grassland)

  • 박근제
    • 한국초지조사료학회지
    • /
    • 제15권2호
    • /
    • pp.87-92
    • /
    • 1995
  • The ecological behaviour and forage value of natural grassland communities and the similarity between plant communities near Wit~enhausen in middle part of Gennany were investigated from June to August. 1993. The total number of plant communities at different place surveyed during the study period was twelve. The ecological behaviour and forage value of the natural grassland communities except mesobromion (half dry grassland community) were relatively good for roughage production. The correlation coefficients between plant eornmunilies were greatly affected by botanical composition. The clustering analysis showed that the communities of relatively similar botanical composition were grouped closely, and the other communities were clustered to the same group although the degree of similarity between communities was low.

  • PDF

The use of support vector machines in semi-supervised classification

  • Bae, Hyunjoo;Kim, Hyungwoo;Shin, Seung Jun
    • Communications for Statistical Applications and Methods
    • /
    • 제29권2호
    • /
    • pp.193-202
    • /
    • 2022
  • Semi-supervised learning has gained significant attention in recent applications. In this article, we provide a selective overview of popular semi-supervised methods and then propose a simple but effective algorithm for semi-supervised classification using support vector machines (SVM), one of the most popular binary classifiers in a machine learning community. The idea is simple as follows. First, we apply the dimension reduction to the unlabeled observations and cluster them to assign labels on the reduced space. SVM is then employed to the combined set of labeled and unlabeled observations to construct a classification rule. The use of SVM enables us to extend it to the nonlinear counterpart via kernel trick. Our numerical experiments under various scenarios demonstrate that the proposed method is promising in semi-supervised classification.

인터넷 게시물의 댓글 분석 및 시각화 (Analysis and Visualization for Comment Messages of Internet Posts)

  • 이윤정;지정훈;우균;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권7호
    • /
    • pp.45-56
    • /
    • 2009
  • 오늘날 인터넷 사용자들은 블로그나 뉴스, 인터넷 게시판 등의 매체에서 댓글을 통해 다른 사람의 의견을 살피고 자신의 의견을 나타내고 있다. 그러나 현재 대부분의 블로그나 인터넷 포털 사이트의 경우 기사나 댓글들을 순차적인 목록 형태로 제공하므로 사용자가 원하는 내용의 댓글을 검색하거나 살펴보는 것은 힘든 일이다. 또한 댓글 사용자가 증가함에 따라 스팸 댓글이나 악플 등이 사회 문제가 되기도 한다. 본 논문에서는 다음 아고라(Daum AGORA) 웹 블로그의 게시글과 댓글을 통계적으로 분석하고 유사도를 기반으로 클러스터링하는 시스템을 제안한다. 본 시스템은 클러스터링 결과를 시각화하여 간단한 스크린 뷰(screen view)로 보여준다. 또한, 본 시스템은 생물정보학에서 잘 알려진 정렬 기법인 Needleman-Wunsch 알고리즘을 이용해 스팸 댓글을 필터링한다.

Change of Sludge Consortium in Response to Sequential Adaptation to Benzene, Toluene, and o-Xylene

  • Park, Jae-Yeon;Sang, Byoung-In
    • Journal of Microbiology and Biotechnology
    • /
    • 제17권11호
    • /
    • pp.1772-1781
    • /
    • 2007
  • Activated sludge was sequentially adapted to benzene, toluene, and o-xylene (BTX) to study the effects on the change of microbial community. Sludge adapted to BTX separately degraded each by various rates in the following order; toluene>o-xylene>benzene. Degradation rates were increased after exposure to repeated spikes of substrates. Eleven different kinds of sludge were prepared by the combination of BTX sequential adaptations. Clustering analyses (Jaccard, Dice, Pearson, and cosine product coefficient and dimensional analysis of MDS and PCA for DGGE patterns) revealed that acclimated sludge had different features from nonacclimated sludge and could be grouped together according to their prior treatment. Benzene- and xylene-adapted sludge communities showed similar profiles. The sludge profile was affected from the point of the final adaptation substrate regardless of the adaptation sequence followed. In the sludge adapted to 50 ppm toluene, Nitrosomonas sp. and bacterium were dominant, but these bands were not dominant in benzene and benzene after toluene adaptations. Instead, Flexibacter sp. was dominant in these cultures. Dechloromonas sp. was dominant in the culture adapted to 50 ppm benzene. Thauera sp. was the main band in the sludge adapted to 50 ppm xylene, but became vaguer as the xylene concentration was increased. Rather, Flexibacter sp. dominated in the sludge adapted to 100 ppm xylene, although not in the culture adapted to 250 ppm xylene. Two bacterial species dominated in the sludge adapted to 250 ppm xylene, and they also existed in the sludge adapted to 250 ppm xylene after toluene and benzene.

무선 센서 네트워크에서 확률 기반의 클러스터링을 이용한 계층적 데이터 전송 프로토콜 (A Probability-based Clustering Protocol for Data Dissemination in Wireless Sensor Networks)

  • 김문성;조상훈;임형진;추현승
    • 인터넷정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.153-160
    • /
    • 2009
  • 무선 센서 네트워크를 위한 데이터 전송의 설계 중에서 가장 중요한 이슈 중 하나는 에너지 효율적인 측면이다. 이를 위해 최근 여러 연구들이 진행되고 있으며 그중에서 가장 대표적인 프로토콜은 SPMS이다. SPMS의 주요 특징 중 하나는 에너지 소비를 줄이기 위한 수단으로 최단경로를 사용한다는 것이다. 그러나 반복적인 최단 경로의 사용으로 인하여 네트워크 라이프타임의 최대화는 불가능하다. 본 논문에서는 에너지 잔존량과 거리를 메트릭으로 사용하는 확률 함수 기반의 데이터 전송 프로토콜을 제안한다. 시뮬레이션 결과, 제안 프로토콜은 에너지 효율적인 데이터 전송을 하며 SPMS보다 네트워크 라이프타임이 약 78%증가하였다.

  • PDF

Spatial Analysis of Colorectal Cancer Cases in Kuala Lumpur

  • Shah, Shamsul Azhar;Neoh, Hui-Min;Syed Abdul Rahim, Syed Sharizman;Azhar, Zahir Izuan;Hassan, Mohd Rohaizat;Safian, Nazarudin;Jamal, Rahman
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권3호
    • /
    • pp.1149-1154
    • /
    • 2014
  • Background: In Malaysia, data from the Malaysian Health Ministry showed colorectal cancer (CRC) to be the second most common type of cancer in 2007-2009, after breast cancer. The same was apparent after looking at males and females cases separately. In the present study, the Geographic Information System (GIS) was employed to describe the distribution of CRC cases in Kuala Lumpur (KL), Malaysia, according to socio-demographic factors (age, gender, ethnicity and district). Materials and Methods: This retrospective review concerned data for patients diagnosed with colorectal cancer in the years 1995 to 2011 collected from the Wilayah Persekutuan Health Office, taken from the cancer notification form (NCR-2), and patient medical records from the Surgical Department, Universiti Kebangsaan Malaysia Medical Centre (UKMMC). A total of 146 cases were analyzed. All the data collected were analysed using ArcGIS version 10.0 and SPSS version 19.0. Results: Patients aged 60 to 69 years accounted for the highest proportion of cases (34.2%) and males slightly predominated 76 (52.1%), Chinese had the highest number of registered cases at 108 (74.0%) and staging revealed most cases in the 3rd and 4th stages. Kernel density analysis showed more cases are concentrated up in the northern area of Petaling and Kuala Lumpur subdistricts. Spatial global pattern analysis by average nearest neighbour resulted in nearest neighbour ratio of 0.75, with Z-score of -5.59, p value of <0.01 and the z-score of -5.59. Spatial autocorrelation (Moran's I) showed clustering significant with p<0.01, Z score 3.14 and Moran's Index of 0.007. When mapping clusters with hotspot analysis (Getis-Ord Gi), hot and cold spots were identified. Hot spot areas fell on the northeast side of KL. Conclusions: This study demonstrated significant spatial patterns of cancer incidence in KL. Knowledge about these spatial patterns can provide useful information to policymakers in the planning of screening of CRC in the targeted population and improvement of healthcare facilities to provide better treatment for CRC patients.

아까시나무림의 군락분류와 군락생태 (Syntaxonomy and Synecology of the Robinia pseudoacacia Forests)

  • 조광진;김종원
    • The Korean Journal of Ecology
    • /
    • 제28권1호
    • /
    • pp.15-23
    • /
    • 2005
  • 아까시나무 우점림의 식생유형에 대한 분류와 분포양식 그리고 생태식물상적 특성을 규명하였다. 전통적인 식물사회학적 방법과 식생조사자료 및 식생유형간의 유사성 분석을 위하여 주좌표분석법(Principal Coordinates Analysis)과 상관 계수(correlation coefficient)가 이용되었다. 생태식물상의 분석에는 출현 식물종들의 특질(넌출형, 일이년생 생명환, 삼림식생요소, 체감도시화지수)이 이용되었다. 이러한 분석은 출현종의 상대기여도를 바탕으로 하는 입지-식생조사구 매트릭스의 식물군락표 및 군락합성표를 토대로 이루어졌다. 아까시나무 우점림은 총 77과 193속 323종으로 이루어져 있었으며, 아까시나무-닭의장풀군집(전형아군집, 떡갈나무아군집, 자귀나무아군집, 소나무아군집, 굴참나무아군집, 가중나무아군집), 아까시나무-갈대군락(전형하위군락, 띠하위군락)으로 분류되었으며, 크게 네 가지 식생형(도시형, 농촌형, 하천형, 복합형)으로 구분되었다. 아까시나무-닭의장풀군집은 졸참나무-작살나무아군단의 냉온대 남부 저산지대의 아까시나무 조림식생을 대표하는 식생단위이며, 아까시나무-갈대군락은 하천(정수역)형으로 기재되었다. 가중나무아군집은 높은 체감도시화지수에 의하여 도시형 아까시나무림으로 규정되었다. 하천형을 제외한 우리나라의 아까시나무 우점림은 지속군락으로 고려되었다.

Profile of Non-Communicable Disease Risk Factors Among Employees at a Saudi University

  • Amin, Tarek Tawfik;Al Sultan, Ali Ibrahim;Mostafa, Ola Abdelmoniem;Darwish, Amr Ahmed;Al-Naboli, Mohamed Rashad
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권18호
    • /
    • pp.7897-7907
    • /
    • 2014
  • Background: There is paucity of studies defining the prevalence of non-communicable disease (NCD) risk factors in Saudi Arabia despite the surging epidemic of obesity, change in dietary habits and sedentary lifestyle. Objectives: This cross-sectional study aimed to assess the prevalence of NCDs risk factors among employees at King Faisal University in Al Hassa, Saudi Arabia and to determine the possible correlates for clustering of NCDs risk factors among them. Materials and Methods: All employees were invited to participate; the World Health Organization STEPwise approach was used for data collection which consisted of a personal interview to collect socio-demographic characteristics, NCD history, tobacco use, vegetables and fruit consumption, and physical activity (PA), followed by anthropometric measurements namely weight, height and waist circumference and blood pressure measurements, subjects were finally subjected to biochemical tests with determination of fasting plasma glucose, serum triglycerides, cholesterol and high density lipoproteins. Results: Of the surveyed employees (n=691), daily current smokers accounted for 22.7%. 94.9%, 95.1% and 86% consumed < 5 servings per day of vegetables, fruits and both fruits and vegetables respectively, 73% were physically inactive, 64% were overweight or obese, 22.1% had hypertension, and 21.5% were diabetics. Elevated cholesterol levels were found in 36.6%, low high density lipoproteins in 36.8%, and elevated triglycerides in 36.1%. Only 3% had no NCD risk factors, and 57.6% had ${\geq}3$ factors. Multivariate logistic regression showed that gender (being male, adjusted odds ratio 'aOR'=1.51), aged ${\geq}50$ years (aOR=3.06), < college education (aOR=1.75), current smokers (aOR=2.37), being obese (aOR=6.96) and having a low PA level (aOR=4.59) were the significant positive predictors for clustering of NCD risk factors. Conclusions: Over fifty percent of the studied university's employees had multiple (${\geq}3$) NCD risk factors. Screening and health promotion initiatives should be launched at least targeting the modifiable factors to avert the excessive risk for cardiovascular disease, diabetes mellitus and several types of cancers.

충청권 농촌지역 쇠퇴 특성 및 유형에 관한 연구 (A Study on Classifications and Characteristics of Declined Rural Area in Chungcheong Region)

  • 조진희;박형근;모혜란;이한수
    • 대한토목학회논문집
    • /
    • 제35권1호
    • /
    • pp.203-215
    • /
    • 2015
  • 본 연구는 농촌지역의 쇠퇴도를 진단하고, 농촌생활권의 기초단위인 읍 면 지역에 대한 공간적 쇠퇴 특성과 유형을 도출하는데 목적을 두고 있다. 이를 위해, 충청권 27개 시 군을 대상으로 거시적 차원의 쇠퇴수준과 잠재수준을 분석하여 도시차원의 쇠퇴현상을 진단한다. 다음으로 공간단위를 세분화하여 충청권의 274개 읍 면지역을 대상으로 쇠퇴수준을 분석하고, K-평균군집분석을 적용하여 쇠퇴유형 및 쇠퇴특성을 도출한다. 충청권 시 군 별 쇠퇴수준 및 잠재수준 분석결과, 충남지역의 청양군, 서천군, 태안군이 높은 쇠퇴도를 보이고 있으며, 충북지역의 전통적 낙후지역인 남부 3군(보은, 옥천, 영동)과 단양군, 괴산군의 쇠퇴도가 높게 나타나고 있다. 또한, 충청권의 읍 면지역 중 쇠퇴의 경향을 보이는 166개 읍 면지역에 대한 군집분석 결과 인구 및 주택 노후화지역(29), 경제기반 취약지역(16), 중심지접근성 취약지역(42), 주거환경 열악지역(51), 노령인구 취약지역(28)의 5개 군집유형의 쇠퇴특성이 도출되었다. 충청권 농촌지역의 쇠퇴특성과 유형화를 시도한 본 연구는 농촌지역 활성화 정책 수립에 있어 기초자료로 활용될 것으로 기대되며, 향후 연구에서는 읍 면지역 차원을 넘어 농촌정체성의 기초단위가 되는 농촌마을을 대상으로 종합적인 진단과 맞춤형 정책발굴 연구가 이어질 것으로 기대된다.

사이트 포트폴리오 구성을 위한 사용자 관점의 웹사이트 클러스터링 (User Perspective Website Clustering for Site Portfolio Construction)

  • 김민규;김남규
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.59-69
    • /
    • 2015
  • 많은 사용자들이 인터넷을 통해 정보검색, 쇼핑, 커뮤니티 참여 등의 일상 생활을 영위하고 있으며, 이들 인터넷 사용자들로부터 수익을 창출하기 위한 웹사이트들의 경쟁은 점점 치열해지고 있다. 각 사이트의 운영자 및 마케팅 담당자들은 경쟁 우위를 차지하기 위해 다양한 전략을 수립하고 있으며, 이 과정에서 타 사이트와의 제휴가 이루어지는 경우도 비일비재하다. 이는 타 사이트와의 제휴를 통해 타사의 고객 정보를 부분적으로 공유할 수 있을 뿐 아니라 포인트 공유, 상호 추천 등 보다 다양한 전략의 운용이 가능하기 때문이다. 제휴를 통해 긍정적인 성과를 거두기 위해서는 현재 자사의 고객은 아니지만 미래의 자사 고객이 될 수 있는 잠재 고객을 다수 확보하고 있는 타 사이트를 제휴 대상으로 선정하는 것이 매우 중요하다. 하지만 많은 사이트 중 이와 같이 자사에 도움이 되는 제휴 대상 사이트를 식별하는 것은 쉬운 일이 아니다. 따라서 본 논문에서는 방문 고객의 유사성 관점에서 사이트 클러스터링을 수행하고, 이에 근거하여 유사 고객군을 공유하고 있는 제휴 사이트 대상을 식별할 수 있는 방안을 제시한다. 또한 제안 방법론의 실무적용 가능성을 평가하기 위해, 웹사이트 150,295개에 대한 패널 5,000명의 실제 방문 기록 약 1억 4천만 건에 대해 실험을 수행하고 그 결과를 제시한다.