• Title/Summary/Keyword: incremental conceptual clustering

Search Result 4, Processing Time 0.016 seconds

Incremental Conceptual Clustering Using Modified Category Utility (변형된 Category Utility를 이용한 점진 개념학습)

  • Kim Pyo Jae;Choi Jin Young
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.193-197
    • /
    • 2005
  • 점진적 개념 학습 알고리즘인 COBWEB은 클래스 정보가 주어지지 않은 사례들(instances)을 분류하기 위하여 사례의 속성과 값에 근거하여 학습하며 각 노드가 유사한 사례들의 집합인 클래스에 해당하는 분류 트리를 생성하는 알고리즘이다. 유사한 사례들을 같은 클래스로 분류하기 위한 기준으로 category utility가 사용되며 이는 클래스 내부의 유사도와 클래스간의 차이점을 최대화하는 방향으로 클래스를 분류한다 기존의 COBWEB에 사용되는 category utility는 클래스 사이즈와 예측 정확성 사이의 tradeoff 관계로 볼 수 있으며, 이로 인하여 예측 정확성은 약간 감소하나 클래스 사이즈가 커지는 방향으로 학습이 진행 될 수 있는 편향성(bias)를 가지고 있다. 이는 분류 트리에 불필요한 클래스 노드들(spurious nodes)을 생성하게 하여 학습 결과인 클래스 개념을 이해하는뎨 어렵게 한다. 본 논문에서는 클래스와 그에 속하는 사례들의 속성-값 분포를 고려하여 클래스와 속성의 연관성에 비례한 가충치를 더한 변형된 category utility를 제안하고, dataset에 대한 실험을 통하여 제안된 category utility가 기존의 큰 클래스 사이즈를 선호하는 bias를 완화시킴을 보이고자 한다.

  • PDF

Korean Noun Clustering Via Incremental Conceptual Clustering (개념분류기법을 적용한 한국에 명사분류)

  • Jung, Yeon-Su;Cho, Jeong-Mi;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.50-55
    • /
    • 1995
  • 많은 언어관계들이 의미적으로 유사한 단어들의 집합에 적응된다. 그러므로 단어들을 의미가 비슷한 것들의 집합으로 분류하는 것은 아주 유용한 일이다. 본 논문에서는 말뭉치로부터의 동사와 명사의 분포정보를 이용하여 명사들을 분류하고자 한다. 한국어에서는 명사마다 문장에서 그 명사를 특정한 격으로 사용할 수 있는 동사들이 제한되어 있다. 그러므로 본 논문에서는 말뭉치에서 나타나는 명사와 그 명사를 특정한 격으로 사용하는 동사들의 분포정보로부터 명사들을 분류하는 방법을 제시한다. 형태소 해석된 50만 단어 말뭉치에서 가장 빈도수가 높은 명사 85단어를 대상으로 실험하였다. 명사와 동사의 구문정보를 사용하므로 의미적으로는 다르지만 쓰임이 비슷한 단어들도 같은 부류로 분류되었다. 의미적으로 애매성을 가지는 명사들의 경우도 실험결과를 나쁘게하는 요인이 되었다. 그리고, 좀더 좋은 결과를 얻기 위해서는 동사들도 의미가 유사한 것들로 분류한 후, 명사와 동사의 분포정보가 아닌 명사와 동사들의 집합의 분포정보를 이용하는 것도 종은 방법이 될 것이다.

  • PDF

Development of the Approximate Cost Estimating Model Using Statistical Inference for PSC Box Girder Bridge Constructed by the Incremental Launching Method (통계적 기법을 활용한 ILM압출공법 교량 상부공사 개략공사비 산정모델 개발 연구)

  • Kim, Sang-Bum;Cho, Ji-Hoon
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.33 no.2
    • /
    • pp.781-790
    • /
    • 2013
  • This research focuses on development of the conceptual cost estimation models for I.L.M box girder bridge. The current conceptual cost estimation for public construction projects is dependent on governmental average unit price references which has been regarded as inaccurate and unreliable by many experts. Therefore, there have been strong demands for developing a better way of conceptual cost estimating methods. This research has proposed three different conceptual cost estimating method for a P.S.C. girder bridge built with the I.L.M method. Model (I) attempts to seek the proper breakdown of standard works that are accountable for more than 95 percentage in total cost and calculates the amount of standard work's materials from the standard section and volume of I.L.M box girder bridge. Model (II) utilizes a correlation analysis (coefficient over 0.6 or more) between breakdown of standard works and input data that would be considered available information in preliminary design phase. Model(III) obtains conceptual estimating through multiple-regression analysis between the breakdown of standard works and all of input data related to them. In order to validate the clustering of coverage in the preliminary design phase, the variation of I.L.M cost coverage from multiple-regression analysis[model(III)] has been investigated which result in between -3.76% and 11.79%, comparing with AACE(Association for the Advancement of Cost Engineering) which informs its variation between -5% and +15% in the design phase. The model proposed from this research are envisioned to be improved to a great distinct if reliable cost date for P.S.C. girder bridges can be continually collected with reasonable accuracies.

Development of an Activity-Based Conceptual Cost Estimating Model for P.S.CBox Girder Bridge (대표공종 기반의 P.S.C 박스 거더교 개략공사비 산정모델 개발 -상부공사 중심으로-)

  • Cho, Ji-Hoon;Kim, Sang-Bum
    • Proceedings of the Korean Institute Of Construction Engineering and Management
    • /
    • 2008.11a
    • /
    • pp.197-201
    • /
    • 2008
  • Conceptual cost estimates for domestic highway projects have generally been conducted using governmental unit-price references. Inaccuracies in governmental unit-price data has repeatedly addressed in the Korean construction industry which often lead to poor decision making and cost management practices. Thus, needs for developing a better way of conceptual cost estimating has been widely recognized. This research is considered as the first step in developing such model using real-world cost data based on actual construction activities. The data analyzed in this paper includes 41 P.S.C (Prestressed Concrete) Box bridges which broke into 4 categories based on construction methods such as I.L.M(Incremental Launching Method), M.S.S(Movable Scaffolding System), F.S.M(Full Staging Method), and F.C.M(Free Cantilever Method). Actual design documents; including actual cost estimating documents, drawings and specifications were carefully reviewed to effectively break down cost structures for PSC girder bridges. Among more than 40 cost categories for each P.S.C girder bridge type, 7 of them were identified which accounted for more than 95% of total construction cost (ILM: 99.47%, MSS: 99.22%, FSM: 98.18%, and FCM: 98.12%). In order to validate the clustering of cost categories, the variation of each cost category has been investigated which resulted in between -1.16 % and 0.59%.

  • PDF