• 제목/요약/키워드: 군집 적합도

검색결과 336건 처리시간 0.03초

선형 점자료에 있어서의 시.공 복합 군집의 탐색 (Detecting Space-Time Clusters in Linear Point Data)

  • 홍상기
    • 대한지리학회지
    • /
    • 제33권2호
    • /
    • pp.325-338
    • /
    • 1998
  • 본 연구에서는 시.공 복합적인 선형 점 자료를 대상으로 시간과 공간을 함께 고려했을 때 자료 내에 군집(cluster)-시.공 복합 군집(space-time cluster)-이 존재하는 가를 검증하는 방법에 대해 논의하고, 실제 교통사고지점의 분포자료를 분석하여 군집의 유무를 통계적으로 검증하였다. 통계 분석의 결과 다음과 같은 사실이 확인되었다. 첫째, Knox의 분할표 방법과 Mantel의 역수 변환을 이용한 일반화된 회귀분석방법 모두 임계 거리 및 임계 시간 간격의 선택이 분석결과에 영향을 미친다. 둘째, 이러한 임의성을 극복하기 위해 다양한 임계 거리 및 임계 시간 간격(혹은 부가 상수)에 대해 반복 실험한 결과, 일부 임계값의 조합에서 시간과 공간이 서로 독립적이라는 귀무가설을 기각할 수 있는 증거가 발견되었다. 셋째, 시.공 복합 군집의 파악에 가장 적합한 임계 거리와 임계 시간 간격은 공간적으로는 7000m, 시간적으로는 14일 혹은 21일이다. 마지막으로, 통계 분석과정에서 자료에 존재하는 중복 기록 사고들의 존재가 밝혀짐으로써 시.공 복합군집 검증이 탐험적 자료 분석(exploratory data analysis)의 도구로서 가지는 가치를 확인할 수 있었다.

  • PDF

세그먼트 적합성 판단을 위한 계층적 최근접 검색 기법 (Hierarchical Nearest-Neighbor Method for Decision of Segment Fitness)

  • 신복숙;차의영;이임건
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.418-421
    • /
    • 2007
  • 이 논문에서는 곤충 발자국의 패턴을 판별하기 위한 전 단계로 추출되는 군집화된 세그먼트들 중에서, 곤충 발자국의 패턴을 분석하는 데에 부적합한 세그먼트들을 제거하기 위한 계층적 최근접 검색 기법을 제안한다. 발자국 형태와 거의 구별되지 않는 비정형적인 노이즈는 발자국과 서로 구별되는 특징을 규명하기 전까지는 영상처리 전 단계에서 완전히 제거될 수 없어 군집화 기법에 의해 추출된 세그먼트에도 이러한 노이즈를 내포하게 된다. 따라서 모든 세그먼트의 적합성을 평가하여, 노이즈 정보로 인해 타당성이 부족한 세그먼트를 제거함으로써 다음 단계에 수행되는 세그먼트들에 대한 곤충 발자국 패턴의 특징값 추출 성능이 향상될 수 있다.

  • PDF

강원도 강우관측 자료를 이용한 지역빈도분석 (Regional frequency analysis using rainfall observation data in Gangwon Province)

  • 전영일;김상욱;서동일;한재욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.211-211
    • /
    • 2023
  • 본 연구에서는 지역빈도분석을 이용하고 있는 홍수량 산정 지침에서 활용되고 있는 전국대상의 강우관소에 대한 확률강우량과 강원지역에 위치한 강우관측소만을 대상으로 산정한 확률강우량을 비교하였다. 이를 위해서 강원도 지역의 48개 지점의 지속기간별 강우자료를 수집한 후, K-means 기법을 이용하여 6개의 군집으로 구분하였다. 강원도 대부분이 산악지형임을 고려해 산악효과를 야기하는 지형인자와 강우자료의 관계를 파악하였다. 국가수자원관리종합정보시스템에서 수집한 강우자료를 사용하여 지속시간별 최대강우량과 산악효과를 야기하는 지형인자로 선정한 고도 이외에 위도, 경도를 각각 추가인자로 고려해 지역빈도분석을 수행하였다. 위 지형인자와 강우자료를 이용하여 수문학적 동질한 특성을 가지는 군집을 구성하였으며, 위도와 경도를 인자로 추가하면 더욱 강한 상관성을 보임을 알 수 있었다. 군집분석결과를 통해 모수를 추정하고 적절한 분포를 선택하였으며, 이상치검정과 적합도 검정을 통해 최종 분포를 결정하였다. 고도와 위도, 경도를 모두 고려해 이용한 지역빈도분석 결과 강원도의 실제 강우특성과 마찬가지로 고도의 높낮이에 따라 강우형태를 전국단위 지역빈도분석과 비교하였다. 최종적으로 현재 활용되고 있는 홍수량 산정 지침의 확률강우량과 강원지역에 위치한 강우관측소만을 대상으로 한 지역빈도분석의 차이의 발생원인과 강원지역에서의 특이성을 결론으로 제시하였다.

  • PDF

효율적 군집화를 위한 탐색 방법 연구 (A Study of Search Methodology for Efficient Clustering)

  • 전진호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.571-573
    • /
    • 2010
  • 경제, 경영, 의료 및 공학 등 실세계의 많은 시스템들은 복잡한 현상을 갖는다. 이러한 특징의 시스템들을 이해하는 방법은 시스템에 대한 모델을 세우고 분석하는 것이다. 모델을 세우고 분석하는 과정은 두 단계로 이루어진다. 첫째, 데이터에 대하여 효율적 군집을 결정하는 과정, 둘째, 각 군집에 대한 적합한 모델을 생성하는 과정이다. 본 연구에서는 효율적 군집화를 위한 탐색 방법에 대하여 살펴본다.

  • PDF

군집 주제의 유의어와 유사도를 이용한 문서군집 향상 방법 (Enhancing Document Clustering Method using Synonym of Cluster Topic and Similarity)

  • 박선;김경준;이진석;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.30-38
    • /
    • 2011
  • 본 논문은 군집 주제의 유의어와 유사도를 이용하여 문서군집의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 비음수 행렬분해의 의미특징을 이용하여 군집 주제(topic)의 용어들을 선택함으로서 문서 군집 집합의 내부구조를 잘 표현할 수 있으며, 군집 주제의 용어들에 워드넷의 유의어를 사용하여서 확장함으로써 문서를 용어집합(BOW, bag-of-words)으로 표현하는 문제를 해결할 수 있다. 또한 확장된 군집 주제의 용어와 문서집합에 코사인 유사도를 이용하여서 군집의 주제에 적합한 문서를 잘 군집하여서 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

개선된 ISODATA 알고리즘을 이용한 공격 자동탐지 (Automatic Attack Detection based on Improved ISODATA Algorithm)

  • 김애숙;최재영;최형일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.169-172
    • /
    • 2010
  • 본 논문에서는 기존의 ISODATA 알고리즘을 네트워크 공격탐지에 더욱 적합하도록 개선하여 공격을 탐지하는 새로운 방법을 제안한다. 수많은 인터넷상의 트래픽 정보들을 군집화하여 유사도를 비교하는 방법을 통해 공격을 판단한다. 기본적인 절차는 송신자 IP와 Port, 수신자 IP와 Port 정보를 이용하여 송신자와 수신자 사이의 관계를 분석하고 그 특징 값들을 이용하여 개선된 군집화 알고리즘을 이용하여 군집화를 수행한다. 그리고 얻어진 패턴의 특징값을 인공신경망에 학습하여 공격유형을 분류하고 탐지하도록 한다. 기존의 공격탐지 방법과 비교했을 때, 계산양이 적고 속도가 빠르다는 장점이 있으며 제안하는 방법의 우수성을 실험을 통해 증명하였다.

  • PDF

자갈하상 하천에서 부착미생물군집의 거동 (Dynamics of Attached Microbial Community on the River with Gravel Riverbed)

  • 박재영;최이송;오종민
    • 한국수자원학회논문집
    • /
    • 제38권3호
    • /
    • pp.235-244
    • /
    • 2005
  • 본 연구는 국가하천인 오산천에서 수행되었으며, 하천의 자정기능을 증대시키기 위해 부착미생물군집을 중심으로 하천에서 거동을 정량적으로 조사하였다. 하천현장에서 장기간에 걸친 모니터링을 통해 다음과 같은 결과를 도출하였다. 부착미생물군집의 현존량은 소보다는 여울구간에서 더 높았으며, 여울구간에서도 흐름 유속이 상대적으로 빠른 급여울지역에서 더 많았다. 또한, 부착미생물군집이 하상기질에 부착하는 초기에는 빠른 유속이 부착미생물군집의 증식에 부정적으로 작용하지만, 부착미생물군집이 기질에 적응하여 증식하게 되는 중${\cdot}$후반기에는 유속이 오히려 증식을 돕는데 긍정적으로 작용하였다. 강우, 댐이나 저수지 방류와 같은 외부압력에 의해 교란이 발생하였을 때, 흐름의 세기와 외부압력의 형태에 따라 탈리되는 정도가 서로 다르고, 부착미생물군집 전량이 탈리되지 않기 때문에 회복속도는 비교적 빠른 것으로 관측되었다. 따라서 본 연구를 통해서 부착미생물군집은 하천의 자정작용에 부정적 혹은 긍정적으로 작용하는 것을 알 수 있었다. 따라서 하천의 자정작용을 향상시키기 위해서는 그 하천의 수질특성에 적합한 하상형태가 적용되어야 하며, 각 구간에 적합한 하도구조물을 설치하여 각 구간별 정화작용을 극대화 시킬 수 방법이 모색되어야 할 것으로 사료된다.

단어 분별도에 기반한 뉴스 검색 문서 요약 (Search Resulted News Summarization using Word Discriminability)

  • 이상건;이혜민;김기령;서덕호;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.175-178
    • /
    • 2014
  • 다양한 언론사로부터 기사를 제공받아 서비스하는 인터넷 포털의 뉴스에서는 수많은 중복 기사가 실시간으로 등록된다. 이로 인하여 인터넷 포털에서 관심 있는 주제의 기사를 검색하여 찾아보려는 경우 검색키워드를 포함한 기사의 수가 지나치게 많아 원하는 정보를 적절하게 얻기 어렵다. 본 논문에서는 이러한 문제점을 해결하기 위해서 검색 기사 중 유사한 문서를 군집화하고 군집에 대한 다중문서요약을 사용자에게 제시하여 검색된 기사를 효율적으로 활용할 수 있는 방법을 제시한다. 다중문서 요약에서는 뉴스 기사에 적합한 단어 가중치인 분별도(discriminability)를 제안하여 사용하여 군집화된 기사로부터 유사 문장을 군집한다. 시스템에서는 군집된 기사의 대표 문장 군집에서 대표 문장, 즉 키워드에 대한 주제별 기사의 요약문을 결과로 제시하여, 효율적인 뉴스 검색을 지원한다.

  • PDF

Temporal 데이터의 효율적 군집 추정을 위한 기준 연구 (A Study of Criterion for Efficient Clustering Estimation of Temporal Data)

  • 전진호;김민수
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.139-144
    • /
    • 2011
  • 실세계에서 사용되는 많은 정보시스템들은 복잡한 동적 현상을 나타낸다. 이러한 동적 현상을 갖는 정보시스템들을 이해하는 방법은 시스템에서 발생된 데이터들을 통하여 모델을 세우고 분석하는 것으로서 동적 현상을 이해할 수 있다. 모델을 세우고 분석하는 과정은 두 단계로 이루어진다. 첫 번째는 시스템에서 발생되는 대용량의 데이터에 대하여 효율적 군집을 결정하는 과정이며, 두 번째 과정은 각 군집에 대한 적합한 모델을 결정하는 과정이다. 본 연구에서는 두 과정 증 첫 번째 과정인 대용량 temporal 데이터들에 대하여 정확한 군집 수를 추정하기 위한 기준들을 살펴보고 인공적으로 실험데이터를 생성하여 실험을 하였다. 실험 결과 살펴본 베이지안정보기준이 올바른 군집 수를 추정하는 결과를 갖는 것을 확인하였다.

Q&A 문서의 검색 결과 요약을 활용한 질의응답 시스템 (Question and Answering System through Search Result Summarization of Q&A Documents)

  • 유동현;이현아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권4호
    • /
    • pp.149-154
    • /
    • 2014
  • 지식iN과 같은 사용자 참여 질의응답 커뮤니티에서 원하는 질문에 대한 답을 찾기 위해서는 검색 결과로 제공되는 다양한 문서를 일일이 확인하여 판단하는 과정이 필요하다. 만일 사용자가 원하는 답변을 자동으로 정제하여 제시할 수 있다면, 질의응답의 사용성이 크게 향상될 수 있다. 본 논문에서는 질의응답 데이터 분석을 통해 사용자의 질문의 유형을 단어, 목록, 도표, 글의 4가지 유형으로 분류하고, 문서 내 통계적 특성을 활용하여 각 분류별 답변을 자동으로 제시하기 위한 방식을 제안한다. 단어, 목록, 글 유형은 질의어에 대해 검색된 질문을 군집화하고, 군집 내 빈도와 질의어에 대한 근접도, 답변 신뢰도 등으로 계산된 답변 내 어휘의 적합도를 활용하여 요약한 답변을 사용자에게 제시한다. 도표형은 답변들에서 사용자의 의견 정보를 추출하여 의견 통계를 도표로 제시한다.