• 제목/요약/키워드: 가중치 부여

검색결과 1,009건 처리시간 0.028초

웹문서 자동 분류를 위한 하이퍼링크 기반 특징 가중치 부여 기법 (A Hyperlink-based Feature Weighting Technique for Web Document Classification)

  • 이아람;김한준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.417-420
    • /
    • 2012
  • 기계학습을 이용하는 문서 자동분류 시스템은 분류모델의 구성을 위해서 단어를 특징으로 사용한다. 자동분류 시스템의 성능을 높이기 위해 보다 의미있는 특징을 선택하여 분류모델을 구성하기 위한 여러 연구가 진행되고 있다. 특히 인터넷상에서 사용되는 웹문서는 단어 외에도 태그정보, 링크정보를 가지고 있다. 본 논문에서는 이 두 가지 정보를 이용하여 웹문서 자동분류 시스템의 성능을 향상 시키는 방법 제안 한다. 태그 정보와 링크 정보를 이용하여 적절한 특징을 선택하고, 각 특징의 중요도를 계산하여 가중치를 구한다. 계산된 가중치를 각 특징에 부여하여 분류 모델을 구성하고 나이브 베이지안 분류기를 통하여 성능을 평가하였다

가중치 부여 부정 트리 패턴 추출 (Weighted Negative Tree Pattern Discovery)

  • 백주련;김진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.23-26
    • /
    • 2019
  • 사물인터넷(IoT)은 지금의 우리가 살고 일하는 모든 방식을 변화시키고 있다. IoT를 통해 데이터를 생성하고 저장하고 연결된 장치와 상호작용하여 비즈니스는 물론 우리의 일상 생활을 개선하고 있는 것이다. 무수히 많은 센서들이 연결된 세상은 센서들에 의해 그 어느 때보다 거대한 양의 데이터들을 생산하고 있다. JSON, XML 같은 트리 구조의 데이터 타입은 대량 데이터 저장 전송 교환 등에 주요하게 사용되는데 이는 트리 구조가 이형 데이터 간의 유연한 정보 전송과 교환을 가능하게 하기 때문이다. 반면에, 효용성 높은 정보나 감추어져 있는 정보들을 트리 구조의 대량 데이터들로부터 추출하는 것은 일반 데이터 구조에 비해 훨씬 어려우며 더 난해한 문제들을 발생시킨다. 본 논문에서는 트리 구조의 대량 스트리밍 데이터로부터 가중치가 부여된 주요한 부정 패턴들을 추출하기 위한 방법을 공식화한다.

  • PDF

단어 빈도 가중치를 이용한 자동 문서 분류 (Automatic Document Classification Based on Word Frequency Weight)

  • 노현아;김민수;김수형;박혁로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.581-584
    • /
    • 2002
  • 본 논문에서는 범주 내의 키워드 빈도에 의해 문서를 자동으로 분류하는 방법을 제안한다. 문서 자동분류 시스템에서는 문서와 문서를 비교하기 위해서 분류 자질(feature)에 적절한 가중치를 부여할 필요가 있다. 본 논문에서는 수작업으로 분류된 신문기사를 이용하여 자질의 가중치를 학습하는 방법을 사용하였다. 기존의 용어가중치 방법은 각 범주별로 가장 많이 등장한 명사부터 순서대로 추출하여 가중치를 주는 방법을 사용한 것에 비해 본 논문에서는 명사의 출현 횟수뿐만 아니라 출현위치를 함께 고려하여 가중치를 계산하는 방법을 제안한다. 또한 단어 빈도 가중치 방법의 변형된 방식을 사용함으로써 기존의 단어 빈도 가중치 방법과 비교하여 분류 정확도 측면에서 9%이상 성능 향상을 있음을 보인다.

  • PDF

단어기반 웹 문서 검색을 위한 효과적인 단어 가중치의 계산 (Efficient Term Weighting For Term-based Web Document Search)

  • 권순만;박병준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.169-171
    • /
    • 2004
  • 웹(WWW)은 방대한 양의 정보들과 함께 그에 따른 웹의 환경과 그에 따른 정보도 증가하게 되었다. 그에 따라 사용자가 찾고자 하는 정보가 잘 표현된 웹 문서를 효과적으로 찾는 것은 중요한 일이 되었다. 단어기반의 검색에서는 사용자가 찾고자 하는 단어가 나타난 문서들을 사용자에게 보여주게 된다. 검색 단어를 가지고 문서에 대한 가중치를 계산하게 되는데, 본 논문에서는 이러한 단어기반의 검색에서 단어에 대한 가중치를 효과적으로 계산하는 방법을 제시한다 기존의 방식은 단어가 나타난 빈도수에 한정되어진 계산을 하게 되는 반면, 수정된 방식은 태그별로 분류를 통한 차별화 된 가중치를 부여하여 계산된다. 기존의 방식과 비교한 결과 본 논문에서 제시한 수정된 방식이 더 높은 정확도를 나타냈다.

  • PDF

소프트웨어 제품 품질평가를 위한 가중치 측정 시스템 (A Weight Measurement System for Software Product Quality Evaluation)

  • 구자경;김길조;안유환;안유환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.635-637
    • /
    • 1999
  • 소프트웨어 제품 품질 측정이란 다양한 소프트웨어의 특성들을 통하여 소프트웨어 제품의 품질을 정확하게 측정하는 것이다. 이를 위해서는 소프트웨어의 종류 및 사용환경에 따라 품질 특성들에 대한 다양한 가중치를 부여하여 평가할 필요가 있다. 본 논문에서는 AHP를 사용하여 품질 특성들에 대한 상대 중요도를 제공하여 특성들에 대한 가중치를 반환하는 가중치 측정시스템을 개발하였다. 본 시스템은 ETRI 소프트웨어 품질보증 연구팀에서 개발하고 있는 소프트웨어 제품 품질 측정도구와 연계되어 사용될 수 있으며 다른 분야에서도 독립적으로 활용될 수 있다.

  • PDF

키 프레임 특징들에 적응적 가중치 부여를 이용한 검색 성능 개선 (Improvement of Retrieval Performance Using Adaptive Weighting of Key Frame Features)

  • 김강욱
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.26-33
    • /
    • 2014
  • 비디오 검색 및 색인은 먼저 압축 비디오에서 장면전환을 검출하여 샷(shot)으로 분리한 후 샷 내에 키프레임 특징 정보들의 유사도 비교를 통해 이루어진다. 일반적으로 내용기반 영상 및 비디오 검색에서는 컬러, 형태, 질감의 세 가지 대표적인 영상 특징들이 주로 사용된다. 그러나 여러 특징들이 결합되어 사용되는 검색 시스템이라 할지라도 각 특징들에 대한 가중치가 적합하게 부여되지 않으면 검색되는 결과 영상의 순위가 크게 변하여 검색 성능이 떨어지게 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 특징들이 결합되어 사용될 때 각 특징에 대한 가중치를 적응적으로 부여해서 비디오 검색 성능을 개선하고자 한다. 제안한 방법을 3,200개 키 프레임으로 구성된 비디오 데이터베이스에서 실험을 하였고 다양한 성능평가 방법을 통해 제안한 방법이 기존 고정가중치 부여를 이용한 방법과 비교하여 검색 성능이 개선됨을 볼 수 있었다.

가중치 알파 쉐이프를 기반으로 하는 산포된 자료의 볼륨 모델링 (Volume Modeling of Scattered Data based on Weighted Alpha Shapes)

  • 백정민;이건
    • 정보처리학회논문지A
    • /
    • 제13A권3호
    • /
    • pp.267-274
    • /
    • 2006
  • 본 논문은 주어진 자료 점들에게 가중치를 부여하여 볼륨 자료를 여러 단계별로 상세함을 표현하는 방법을 제시하고자 한다. 단계별로 상세함을 표현하기 위하여 웨이브렛 변환 과 알파쉐이프와의 관계를 얻고자 연구하였다. 산포된 자료란 자료점들 사이에 특별한 상관관계가 없는 자료들의 수집이라 정의할 수 있다. 볼륨 트라이베리에이트 공간상에 보간의 정확도는 3 차원 공간상에 흩어진 자료들의 위치정보 뿐만 아니라 자료들이 갖고 있는 값 (명암도)에도 영향을 받는다. 자료 점들에게 각각 해당되는 웨이브렛 계수를 가중치로 부여 하여 근사치의 정확도를 개선할 수 있다.

소프트웨어 제품을 위한 평가 선정 모형의 조사 및 적용성에 관한 연구 (A Study on Survey and Applicability of Evaluation and Selection Models for Software Products)

  • 박호인;정호원
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1706-1718
    • /
    • 1997
  • 다양한 소프트웨어 제품의 급격한 증가로 인하여 소프트웨어 제품의 평가·선정을 위한 체계적이고 객관적인 방법이 필요하게 되었다. 본 연구에서는 소프트웨어 제품의 효과적 평가·선정을 위해 평가 과정의 핵심인 가중치 부여와 모형의 선정에 중점을 둔다. 이를 위해 첫째, 계층적 분석 과정을 이용하여 평가 속성에 일관적 가중치를 부여한다. 둘째, 소프트웨어 제품의 선정 문제의 성격에 알맞은 모형을 조사${\cdot}$분류하여 모형별 장${\cdot}$단점을 분석한다. 적용 모형은 4개의 보상모형과 7개의 비보상모형으로 구성되어 있다. 선정된 모형은 특정 소프트웨어 제품(데이터베이스 모델러)에 응용되어 모형별로 제품을 평가한다. 본 연구는 가중치 부여 및 모형의 장·단점 분석과 응용 절차를 통하여 사용자의 다양한 요구사항에 대한 모형의 적용성을 제고하고자 한다.

  • PDF

변별적 가중치 학습을 이용한 3GPP2 SVM의 실시간 음성/음악 분류 성능 향상 (Enhancement of Speech/Music Classification for 3GPP2 SMV Codec Employing Discriminative Weight Training)

  • 강상익;장준혁;이성로
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.319-324
    • /
    • 2008
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 3GPP2 Selectable Mode Vocoder (SMV) 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 MCE (minimum classification error)방법을 도입하여, 각 특징 백터별로 다른 가중치를 적용하는 음성/음악 결정법 (decision rule)을 제시한다. 구체적으로 SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 가중치를 적용한 값을 기하 평균한 값을 문턱값과 비교하는 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 제안한 방법의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 가중치를 적용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

학술지 기사에 대한 메타데이터 품질의 계량화 방법에 관한 연구 (A Study on Quantitative Measurement of Metadata Quality for Journal Articles)

  • 이용구;김병규
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.309-326
    • /
    • 2011
  • 기존 메타데이터의 품질 측정 방법은 오류가 발생한 레코드를 단순히 계수하여 그 비율로 품질을 측정하였다. 이러한 한계를 극복하기 위해 메타데이터 요소별로 상대적 중요 정도를 나타내는 가중치를 적용함으로서, 메타데이터 품질을 체계적으로 계량화 하는 측정 방법을 제시하고자 하였다. 구체적인 가중치 부여 방법으로 엔트로피, 이용자 과업, 그리고 이용 통계를 활용하였다. 또한 이들을 결합하여 통합 가중치를 제시하고 실제 서비스 되고 있는 학술지 기사 메타데이터에 적용하였다. 실험 결과, 엔트로피 가중치 방법은 데이터 자체의 특성을 잘 반영하며, 이용자 과업을 적용한 방법은 이용자의 정보요구를 해결하는 필요한 메타데이터 요소를 제시하며, 통합 가중치는 특정 메타데이터 요소의 오류에 영향을 받지 않으면서 균형 잡힌 측정값을 제시하여 계량화 방법에 적합한 것으로 나타났다.