• 제목/요약/키워드: Categorization reduction

검색결과 22건 처리시간 0.019초

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

염분농도에 따른 호소 퇴적물 내 질소 및 인 용출 특성 분석 (Analysis of Nitrogen and Phosphorus Benthic Diffusive Fluxes from Sediments with Different Levels of Salinity)

  • 이슬기;주진철;문희선;이동휘;김동준;최지원
    • Ecology and Resilient Infrastructure
    • /
    • 제10권3호
    • /
    • pp.85-96
    • /
    • 2023
  • 국내 호소를 상류 저수지 (<0.3 psu), 하구 저수지 (0.3 - 2 psu), 기수성 석호 (>2 psu)로 분류하여 호소별 퇴적물 총질소 (T-N), 총인 (T-P) 농도의 차이를 일원분산분석 (ANOVA) 하였으며, 실험실 코어 배양법 (laboratory core incubation)을 이용해 송지호 (11.80 psu), 간월호 (0.73 psu), 장군 저수지 (0.08 psu)의 호기 (aerobic)와 무산소 (anoxic) 조건에서의 질소 및 인 용출량 (benthic nutrient flux)을 측정하였다. 국내 호소의 퇴적물 내 총질소와 총인 농도는 염분 농도가 다른 호소별로 유의한 차이가 있는 것으로 분석되었다 (p<0.05). 사후 검정 (post-hoc)을 통해 총질소의 경우 상류 저수지 (2,918 mg/kg)와 하구 저수지 (2,094 mg/kg)에서 유의한 차이를 확인하였고 (p<0.001), 총인의 경우 상류 저수지 (789 mg/kg)와 기수성 석호 (533 mg/kg)가 유의한 차이를 보였다 (p<0.01). 실험을 통해 산정된 NH4+-N의 용출량은 간월호에서 가장 높게 나타났으며, 폐쇄성 수역인 물리적인 특성과 염분으로 인한 질산화의 저해 등에 의한 것으로 판단된다. NO3--N의 용출량은 호기 조건에서 염분이 높은 호소일수록 낮게 나타났으나 무산소 조건에서는 염분이 높은 호소일수록 용출량이 높게 관측되었고, 이는 염분이 질산화 및 탈질이 억제되었기 때문이다. PO43--P의 경우 송지호, 간월호, 장군 저수지 순으로 용출량이 높게 나타나, 염분이 음이온 흡착 경쟁 등을 통해 인산염의 용출을 촉진시키는 것으로 조사되었다. 퇴적물의 용출량 산출 시 미생물 군집, 성장률, 산화, 환원, 영양염류의 결합 형태 등의 요인이 염분에 의해 영향을 받으므로 염분화 된 호소의 퇴적물 용출 조사 시 염분에 의한 영향을 고려해야 할 것으로 사료된다.