• 제목/요약/키워드: 클러스터링모형

검색결과 60건 처리시간 0.024초

문장 클러스터링에 기반한 자동요약 모형 (A Text Summarization Model Based on Sentence Clustering)

  • 정영미;최상희
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.159-178
    • /
    • 2001
  • 본 연구에서는 문장 클러스터로부터 대표문장을 선정하여 요약문을 생성하는 자동요약 모형을 제시하고. 학습문서 집단을 미용하여 최적의 요약 환경을 구축한 후 요약 실험을 수행하였다. 학습 과정에서 문장의 클러스터링 기법으로는 7개의 계층적 기법들을 비교한 결과 클러스터를 구성하는 문장 수의 편차가 가장 적고 단일 문장 클러스터를 가장 적게 생성하는 센트로이드 기법이 선택되었다. 또한 각 클러스터를 대표하는 문장의 선정을 위해 용어 및 문장 가중치를 합산한 문장값과 클러스터-문장 벡터간 유사도의 두 기준을 비교한 결과 문장값 기준이 선택되었다. 용어 가중치로는 역문장빈도와 표제어 가중치, 그리고 문장의 위치 가중치가 자동요약 성능을 개선시키는 것으로 나타났으며, 적절한 요약문의 길이는 전체 문서의 1/3인 것으로 나타났다. 실험문서 집단으로는 문서의 길이와 특성이 다른 신문기사와 잡지기사의 두 집단을 이용하였다. 요약 모형의 검증 실험 결과 요약 정확률은 신문기사 집단에서는 53%, 잡지기사 집단에서는 47%인 것으로 나타났다. 두 실험 모두 랜덤하게 생성한 베이스라인 요악문보다 성능이 우수하였으나, 리드문장들로 구성된 베이스라인 요약문과의 비교에서는 짧은 길이의 신문기사의 경우 요약 모형의 성능이 오히려 떨어지는 것으로 나타났다.

  • PDF

객체지향개발에서의 속성 클러스터링과 클래스 계층구조생성 (Clustering Characteristics and Class Hierarchy Generation in Object-Oriented Development)

  • 이건호
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1443-1450
    • /
    • 2004
  • 객체지향 소프트웨어 개발 초기단계에서 클래스의 결정은 많은 객체와 관련된 속성들의 클러스터링을 하는 복잡한 문제이다. 클래스의 재사용을 위해 라이브러리에 클래스의 등록은 반복적인 시행착오에 의존하여왔다. 클래스를 등록하는 전통적인 방법과 모델링 혹은 설계단계에서 클래스와 그 계층구조의 정의를 위한 통합적인 방법에 대해 논의한다. 속성 클러스터링 문제를 위해 객체들의 속성 유사도에 근거하여 0-1 정수프로그램 위한 모형을 제시하고 또한 네트워크 기법을 이용한 클러스터링 알고리즘을 제안한다. 클래스 계층구조를 생성하기 위한 규칙을 제시하였으며 계층구조그래프 생성알고리즘을 제안한다. 본 연구결과를 이용하여 실제 현장의 문제를 사례로 제시한다.

기상예보정보를 활용한 월 댐유입량 예측 (Monthly Dam Inflow Forecasts by Using Weather Forecasting Information)

  • 정대명;배덕효
    • 한국수자원학회논문집
    • /
    • 제37권6호
    • /
    • pp.449-460
    • /
    • 2004
  • 본 논문에서는 월 댐유입량을 예측하는데 있어서 기상예보정보를 활용한 뉴로-퍼지 시스템의 적용성을 검토하였다. 뉴로-퍼지 알고리즘으로 퍼지이론과 신경망이론의 결합형태인 ANFIS(Adaptive Neuro-Fuzzy Inference System)을 이용하여 모형을 구성하였다. ANFIS의 공간분할에 의한 제어규칙의 선정에 있어 퍼지변수가 증가함에 따라 제어규칙이 기하급수적으로 증가하는 단점을 해결하기 위해 퍼지 클러스터링(Fuzzy Clustering)방법 중 하나인 차감 클러스터링(Subtractive Clustering)을 사용하였다. 또한 본 연구에서는 정성적인 기상예보정보를 정량화 시키는 방법을 제안하였다. AMFIS를 이용하여 월 댐유입량 예측 시, 관측자료만으로 구성된 모형에 의한 예측결과와 관측자료에 기상예보정보를 더하여 구성된 모형에 의한 예측결과를 비교하였다. 그 결과 ANFIS는 기상예보정보를 활용하여 댐유입량을 예측했을 때가 관측자료만으로 예측했을 때보다 예측능력이 더욱 정확함을 보였다.

마코프 모델에 기반한 시계열 자료의 모델링 및 예측 (Modeling and Prediction of Time Series Data based on Markov Model)

  • 조영희;이계성
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.225-233
    • /
    • 2011
  • 주식 가격이나 경제 지표, 사회적 현상의 추세나 변화 등은 통상 시간에 따라 변화하기 때문에 시계열 자료로 구분된다. 시계열 자료는 시간 축에 대해 변화하는 자료의 표현 가치뿐 아니라 그 변화 추세나 향후 방향성까지 제시할 수 있다는 점에서 이에 대한 방법론에 대해 많은 연구와 노력이 지속되어 왔다. 본 논문에서는 전통적으로 예측 모형을 구축하여 예측하는 방법을 취하되 그 모형이 복잡하고 정교한 모델을 활용하여 예측 정확도를 높이려는 시도와는 달리 자료 클러스터링 방법과 자료 구간 선정을 통해 예측정확도를 높이려 시도하였다. 기본 모델은 마코프 모델이다. 구간별 유사 구간을 추출하여 모델링하는 구간별 모델링 방법과 클러스터링을 통한 그룹별 모델링을 통해 모델의 예측정확도를 개선하려 시도하였다. 실험을 통해 클러스터링을 거친 그룹별 마코프 모델이 정확도를 개선 시켰으나 예측율은 현저히 떨어지는 결과를 낳았다.

비정형 응용을 위한 워크스테이션 클러스터링 환경에서의 병렬 입출력 시스템 (A Parallel I/O System on Workstation Clustering Environment for Irregular Applications)

  • 노재춘;박성순;알록 샤우드리
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권5호
    • /
    • pp.496-505
    • /
    • 2000
  • 워크스테이션 클러스터 환경은 그 가격 대 성능비가 일반적으로 MPPS보다 좋고, 그 소프트웨어나 하드웨어가 쉽게 이후에 개선될 수 있기 때문에 병렬처리 분야에서 새로운 대안으로 연구되고 있다. 본 논문에서는 ‘집단적 입출력 클러스터링 (Collective I/O Clustering)’이라 불리는 워크스테이션 클러스터를 위한 실행사간 라이브러리의 설계 및 구현 방안을 제시한다. 이 라이브러리에서는 통신 및 입출력 시스템 하에서 완벽하게 통합되는 워크스테이션 클러스터 상에서 비정형 응용 프로그램의 입출력을 위해 , 사용자에 친숙한 프로그래밍 모형을 제공한다,. 이 집단적 입출력 클러스터링에서는 두 가지 형태의 입출력 방식이 가능하다 첫 번째 입출력 방식에서 할당되는 모든 프로세서들은 연산 노드뿐만 아니라, 입출력 서버의 역할도 수행하는 형태이다. 두 번째 입출력 방식에서는 오직 일부분의 프로세서들만이 입출력 서버의 역할을 수행하는 형태이다. 그리고 본 논문에서는 통신과 입출력 비용을 최적화하기 위해 압축과 소프트웨어 캐슁 기능을 집단적 입출력 클러스터링에 적용한 결과를 보인다. 모든 성능실험 결과는 아르곤 연구소에서 보유하고 있는 IBM SP2를 사용하여 얻었다.

  • PDF

확률론적 클러스터링 기법을 이용한 한반도 태풍경로 및 종관기후학적 분석 (Assessment of Typhoon Trajectories and Synoptic Pattern Based on Probabilistic Cluster Analysis for the Typhoons Affecting the Korean Peninsula)

  • 김태정;권현한;김기영
    • 한국수자원학회논문집
    • /
    • 제47권4호
    • /
    • pp.385-396
    • /
    • 2014
  • 최근 빈번하게 발생하는 태풍사상은 극심한 홍수 및 바람 재해를 유발 시키고 있다. 이러한 점에서 본 연구에서는 1951년부터 2012년까지 한반도에 내습한 총 197개의 태풍사상을 대상으로 태풍의 발생위치 및 태풍의 궤적을 기준으로 태풍을 범주화 할 수 있는 확률론적 클러스터링 기법을 개발하였다. 모의실험을 통하여 개발된 모형의 적합성을 확인할 수 있었으며, 태풍 경로에 적용이 가능한 방안으로 평가되었다. 1951년부터 2012년까지 한반도 내습한 197개의 태풍사상을 대상으로 확률론적 클러스터링 기법을 적용한 결과 한반도를 내습한 태풍사상은 총 7개의 클러스터로 분류되었으며, 대부분 위도 $10^{\circ}{\sim}20^{\circ}N$, 경도 $120^{\circ}{\sim}150^{\circ}E$ 해수면에서 발생하여 한반도를 향하여 진행하는 것으로 나타났다. 클러스터 B의 경우 약 25.4%의 발생빈도를 가지며, 전선의 방향도 한반도를 직접 향하고 있어 상대적으로 한반도에 영향이 가장 큰 클러스터로 분석되었으며 한반도 전체에 걸쳐서 강한 양(positive)의 강우량 Anomaly를 갖는 것을 확인할 수 있었다.

트랜잭션 중심의 발견적 화일 수직분할 방법

  • 박기택;김재련
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1995년도 춘계공동학술대회논문집; 전남대학교; 28-29 Apr. 1995
    • /
    • pp.899-908
    • /
    • 1995
  • 관계형 데이타베이스 환경에서 데이타 분할은 트랜잭션 혹은 질의에 요구되는 데이타량과 직접적인 관련이 있다. 본 논문에서 고려하는 데이타 분할은 중복이 없는 수직 분할로 다음 두 단계로 이루어져 있다. 첫째 단계에서는, 각 속성들간의 친밀도를 최대화시키는 0-1 정수 모형으로 속성들을 클러스터링한다. 이 단계의 결과를 초기 단편이라 한다. 두번째 단게에서는, 트랜잭션에 기반한 분할 방법을 이용하여 비용요소가 직접적으로 고려되지 않은 초기 단편을 변환시킨다. 트랜잭션에 기반한 분할 방법이란 트랜잭션 위주로 속성들을 나누는 것이다. 이 단계에서는 트랜잭션 수행에 요구되는 논리적인 액세스량을 비교 척도로 한다. 즉, 이 논문에서 제안한 수직 분할은 친밀도를 최대로 하는 최적화 모형으로 초기 분할을 한 후, 트랜잭션에 근거한 분할 방법을 이용한 발견적 기법으로 해를 개선시켜 나간다.

  • PDF

고속도로 통행료 수납자료의 특성을 반영한 통행시간 예측 모형 설계 (Design of Travel Time Forecasting Model Based on TCS Data Characteristics)

  • 김동근;최진우;김태민;박진웅;김효민;양영규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1595-1597
    • /
    • 2011
  • 과거에는 고속도로 상에 일정간격으로 설치하여 운영 중인 VDS(Vehicle Detection System)에서 주기적으로 검지되는 지점자료나 실제로 도로를 주행하면서 교통상황을 측정하는 프로브 차량(Probe Vehicle)들을 이용하여 통행시간을 추정해 왔으나 단순한 현시점에서의 통행시간을 나타내는 점이나 설치구간이 조밀하지 못한 곳에서의 정확성 등 많은 문제점이 있어왔다. 이에 본 연구에서는 고속도로 통행료 수납자료(Toll Collection System)를 출발시각 기준으로 정렬하고, 이를 Fuzzy c-means 클러스터링 기법을 사용하여 고속도로 통행료 수납자료의 특성에 따라 분류한 후 하나의 대푯값으로 추출하여 Kalman Filter 기법에 적용하는 고속도로 통행시간 예측 모형을 설계한다.

클러스터링 방법을 이용한 차종인식 모형 (Recognition Model of the Vehicle Type usig Clustering Methods)

  • 조형기;민준영;최종욱
    • 한국정보처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.369-380
    • /
    • 1996
  • 최근에 이르기까지 교통분야에서 차량에 관한 정보를 수집하기 위하여 사용되고 있는 검지쳬계는 유도식 루프검지기 (Inductive Loop Detector,ILD)이다. 유도식 검지기로 부터 수집되는 교통자료는 점유시간(차량이 검지기를 점유한시간)과 비점유시간(통행 차량과 차량간의 시간차)및 교통량이 기초 수집자료가 된다. 특히 점유 시간은 신호의 현시 길이를 결정 및 과포화제어를 위한 대기행렬예측 등 다양한 관제알고리즘에 있어서 핵심적인 자료이므로 높은 신뢰도가 요구된다. 이러한 신뢰도는 검지로 부터 수집될 수 있는 자료들을 토대로 통행 차종을 식별함으로써 향상시킬 수 있으며, 관련 관제 알고리즘의 신뢰도 향상은 물론 최근 관심이 고조되고 있는 무인자동감시 체계 및 교통정보 자동 수집장치의 개발을 유도할 수 있다. 본 논문에서는 통행하는 차량들에 대하여 수집 되는 기초자료를 기반으로 인식하기 위한 방법으로 통계적 클러스터링 방법 두 가지와 신경망 클러스터링 방법 등 세가지 방법을 제시하고, 결과로서 무인 자동감시 체계에 관한 활용 방법을 제시한다.

  • PDF

클러스터링과 지구통계학 기법을 이용한 지하공간정보 모델 생성시스템 개발 (Development of Subsurface Spatial Information Model System using Clustering and Geostatistics Approach)

  • 이상훈
    • 한국지리정보학회지
    • /
    • 제11권4호
    • /
    • pp.64-75
    • /
    • 2008
  • 지반조사자료 관리를 위한 현재의 DB시스템은 점으로 표현되는 시추조사에 한정되었기 때문에 여타 GIS데이터와의 활용이 제한적이었다. 시추공 자료를 이용한 보간으로 지하의 공간적 분포특성을 찾고자 하는 연구들이 있었지만, GIS와의 상호운영이나 지반공학적 특성을 고려치 못하여 실무적으로 활용하기에는 어려웠다. 본 연구에서는 지반정보DB에서 필요한 지반공학 자료를 추출하여 지하공간정보 모델을 생성하였다. 지반정보 클러스터링 프로그램(GEOCL)을 개발하여 시추공구성(비), 지층분류, 지반강도에 대한 클러스터를 생성하였다. 생성된 클러스터의 공간적 분포를 고려하여 지구통계기법의 하나인 권역 크리깅(권역 크리깅)으로 보간을 수행하였다. 최종적으로 수치표고모형과 통합하여 지하공간정보 모델을 생성하고, 지하공간정보 가시화 프로그램(SSIVIEW)를 통해 3차원으로 가시화하였다. 개발된 지하공간정보 모델은 건설공사의 지반해석과 기초설계에 적극 활용되리라 기대된다.

  • PDF