• 제목/요약/키워드: 가중치부여

검색결과 777건 처리시간 0.029초

XML 문서의 내용기반 검색을 위한 인덱싱 모델 및 색인어의 가중치 부여 (Indexing Model and Weight Assignment on Keywords for Contents based Retrieval in XML Documents)

  • 한예지;한창우;서동혁;김수희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.103-105
    • /
    • 2004
  • 본 논문에서는 XML 문서의 내용을 효율적으로 검색하기 위해 필요한 메타데이터의 스키마몰 개발하고 이론 바탕으로 구축되는 내용기반 인덱싱 모델을 제안한다. 제안하는 내용기반 인덱싱 모델은 엘리먼트타입에 따라 랭킹 검색과 불리언 검색을 지원한다. 랭킹 검색 결과의 재현도와 정확도를 높이기 위해, 검색 결과의 출력 기준 노드가 리프 노드와 내부 노드인 경우를 구별하여 색인어에 대한 가중치를 부여하고, 이를 이용하여 질의와 엘리먼트간의 유사도를 계산하는 방법을 제안한다.

  • PDF

인지무선 시스템에서 부사용자의 거리에 따른 가중치가 적용된 협력 스펙트럼 센싱 (Cooperative Spectrum Sensing in Cognitive Radio Systems with Weight Value Applied)

  • 윤희석;윤재순;배인산;장성진;김재명
    • 한국위성정보통신학회논문지
    • /
    • 제9권3호
    • /
    • pp.91-97
    • /
    • 2014
  • 본 논문은 에너지 검출 기반 협력 스펙트럼 센싱을 이용하여 주사용자와 부사용자 사이의 거리에 따른 검출 확률에 가중치를 부여하는 기법을 제안하고, 이에 따른 분석 및 모의실험 결과를 나타낸다. 주사용자와 부사용자 사이의 거리는 모두 다르다고 가정하였고, 이들 사이의 무선 채널은 레일레이(Rayleigh) 채널로 모델링하였다. 제안하는 가중치 부여 기법을 적용한 협력 스펙트럼 센싱을 수행한 결과가 가중치를 적용하지 않은 스펙트럼 센싱을 수행한 결과에 비해 커버리지를 확대 할 수 있고, 이 검출 확률에 가중치를 적용한 것이 가중치를 적용하지 않은 이전의 방식에 비해 센싱 효율이 향상 되는 것을 알 수 있었다.

의사연관피드백과 용어 가중치에 의한 문서요약 (Document Summarization using Pseudo Relevance Feedback and Term Weighting)

  • 김철원;박선
    • 한국정보통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.533-540
    • /
    • 2012
  • 본 논문은 의사연관피드백과 의미특징기반의 용어 가중치에 의한 문서요약 방법을 제안한다. 제안된 방법은 의사연관피드백을 이용하여 사용자의 간섭을 최소화 시키며, 의미특징으로부터 유도된 용어의 가중치는 문장집합의 내부 특징을 잘 나타나기 때문에 문서요약의 질을 향상할 수 있다. 또한 가중치가 부여된 의미특징과 확장된 질의를 이용하여서 사용자의 요구사항과 제안방법의 요약결과 사이의 의미적 차이를 감소시킨다. 실험결과 제안방법이 용어의 가중치를 부여하지 않은 방법에 비해서 좋은 성능을 보인다.

신경망을 적용한 온톨로지 기반의 Focused Crawling (Ontology-Based Focused Crawling Combined with Neural Network)

  • ;강보영;남궁현;김홍기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.128-133
    • /
    • 2007
  • Focused crawling은 검색시스템의 구축을 위한 웹 문서 수집단계에서, 미리 정의된 토픽 집합들과 관련성을 가지는 웹 문서를 수집하기 위하여 제안되었다. 이러한 focused crawling 연구에서 보다 효과적인 웹 문서 수집을 위해 주어진 토픽에 대한 양질의 배경지식을 제공할 수 있도록 온톨로지가 활발히 활용되어왔다. 그러나 기존의 온톨로지 기반 focused crawling 연구는 토픽과 웹 문서 간의 관련성 측정을 위하여, 주어진 토픽과 관련있는 온톨로지 내 각 개념들에 직관에 의존한 가중치를 부여하여 활용하였다. 하지만 이러한 직관에 의존한 가중치부여 기법은 안정된 수집결과를 도출할 수 있는 최적화된 가중치 값을 얻기가 힘든 한계가 있다. 따라서 본 논문에서는 이러한 개념에 대한 가중치가 학습에 의하여 자동으로 결정되도록, 인공신경망을 적용한 온톨로지 기반 focused crawling 기법을 제안한다. 웹 상에서 제안된 시스템의 성능을 실험한 결과 기존의 온톨로지 기반 수집 기법에 비하여 보다 향상된 결과를 보임을 알 수 있었다.

  • PDF

기계학습에 기초한 자동분류의 성능 요소에 관한 연구 (An Analytical Study on Performance Factors of Automatic Classification based on Machine Learning)

  • 김판준
    • 정보관리학회지
    • /
    • 제33권2호
    • /
    • pp.33-59
    • /
    • 2016
  • 국내 학술회의 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히 구현이 쉽고 컴퓨터 처리 속도가 빠른 로치오 알고리즘을 사용하여 "한국정보관리학회 학술대회 논문집"의 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 분류기 생성 방법, 학습집합 규모, 가중치부여 기법, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 파라미터(${\beta}$, ${\lambda}$)와 학습집합의 크기(5년 이상)를 적절하게 적용하는 것이 효과적이며, 동등한 성능 수준이라면 보다 단순한 단일 가중치부여 기법을 사용하여 분류의 효율성을 높일 수 있음을 발견하였다. 또한 국내 학술회의 논문의 분류는 특정 논문에 하나 이상의 범주가 부여되는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있으므로, 이러한 환경을 고려하여 주요 성능 요소들의 특성에 기초한 최적의 분류 모델을 개발할 필요가 있다.

영상 특징들에 자동 가중치 부여를 이용한 검색 성능 개선 (Improvement of Retrieval Performance using Automatically Weighted Image Features)

  • 김강욱;박종호;황창식
    • 대한전자공학회논문지SP
    • /
    • 제37권6호
    • /
    • pp.17-21
    • /
    • 2000
  • 내용기반 영상 검색에서는 컬러, 형태, 질감의 세 가지 대표적인 영상 특징들이 주로 사용된다. 한 가지 특징만을 사용하는 검색 방법은 영상의 내용이 복잡하거나 비교대상이 되는 영상의 수가 많아질수록 좋은 성능을 보이지 못한다. 그래서 여러 가지 영상 특징들을 결합한 방법들이 많이 연구되고 있다. 그러나 여러 특징들을 결합해서 사용하는 검색 시스템이라 할지라도 각 특징들에 대한 가중치가 적합하게 부여되지 않으면 검색되는 결과 영상들의 순위가 크게 변하여 검색 성능이 떨어지게 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 영상 특징들이 결합해서 사용될 때 각 특징에 대한 가중치를 자동적으로 부여해서 검색 성능을 개선하고자 한다. 제안한 방법을 992개의 테스트 영상들로 구성된 데이터 베이스에서 실험을 하고 다양한 성능평가 방법을 통해 그 타당성을 확인하였으며 제안한 방법을 고정가중치 부여를 이용한 방법과 비교하여 검색 성능이 개선됨을 볼 수 있었다.

  • PDF

MBTI 일치유형에 가중치를 부여한 매칭 적합도 산출 시스템 (Matching Fidelity Calculation System with Weighted MBTI Match Type)

  • 김성호;권오봉
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.1-11
    • /
    • 2018
  • 인터넷과 정보통신 기술의 발달은 남자와 여자의 만남, 데이트의 방식과 환경을 바꾸어 놓았다. 인터넷과 온라인 안에서 고객이 원하는 대상과의 만남을 위해서 MBTI 일치유형을 고려한다. MBTI 일치유형은 적절한 설문조사를 통하여 확정하고 각 유형에 적합한 선호유형을 특정한다. 각 MBTI 유형에 따라 선호유형이 다르며, 같은 선호유형이더라도 남자와 여자 각각의 선호유형이 다르다. 이와 같은 문제들을 해결하기 위하여 남, 녀 각각의 선호유형에 가중치를 부여하고, 부여된 가중치는 둘 사이의 적합도를 계산하기 위하여 평균을 사용한다. MBTI 일치유형에 가중치를 부여한 시스템은 사람들의 사회적인 성격을 사용하기 때문에 온라인 데이트 시스템에서 매치될 확률이 매우 높으며, 교수학습 시스템, 교정 시스템 등 대인 관계 시스템에 사용될 수 있다.

단어기반 웹 문서 검색을 위한 효과적인 단어 가중치의 계산 (Efficient Term Weighting For Term-based Web Document Search)

  • 권순만;박병준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.169-171
    • /
    • 2004
  • 웹(WWW)은 방대한 양의 정보들과 함께 그에 따른 웹의 환경과 그에 따른 정보도 증가하게 되었다. 그에 따라 사용자가 찾고자 하는 정보가 잘 표현된 웹 문서를 효과적으로 찾는 것은 중요한 일이 되었다. 단어기반의 검색에서는 사용자가 찾고자 하는 단어가 나타난 문서들을 사용자에게 보여주게 된다. 검색 단어를 가지고 문서에 대한 가중치를 계산하게 되는데, 본 논문에서는 이러한 단어기반의 검색에서 단어에 대한 가중치를 효과적으로 계산하는 방법을 제시한다 기존의 방식은 단어가 나타난 빈도수에 한정되어진 계산을 하게 되는 반면, 수정된 방식은 태그별로 분류를 통한 차별화 된 가중치를 부여하여 계산된다. 기존의 방식과 비교한 결과 본 논문에서 제시한 수정된 방식이 더 높은 정확도를 나타냈다.

  • PDF

소프트웨어 제품 품질평가를 위한 가중치 측정 시스템 (A Weight Measurement System for Software Product Quality Evaluation)

  • 구자경;김길조;안유환;안유환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.635-637
    • /
    • 1999
  • 소프트웨어 제품 품질 측정이란 다양한 소프트웨어의 특성들을 통하여 소프트웨어 제품의 품질을 정확하게 측정하는 것이다. 이를 위해서는 소프트웨어의 종류 및 사용환경에 따라 품질 특성들에 대한 다양한 가중치를 부여하여 평가할 필요가 있다. 본 논문에서는 AHP를 사용하여 품질 특성들에 대한 상대 중요도를 제공하여 특성들에 대한 가중치를 반환하는 가중치 측정시스템을 개발하였다. 본 시스템은 ETRI 소프트웨어 품질보증 연구팀에서 개발하고 있는 소프트웨어 제품 품질 측정도구와 연계되어 사용될 수 있으며 다른 분야에서도 독립적으로 활용될 수 있다.

  • PDF

종이의 durability 개념 및 평가방법

  • 정양진;김태영;이승한
    • 한국펄프종이공학회:학술대회논문집
    • /
    • 한국펄프종이공학회 2007년도 춘계학술대회논문집
    • /
    • pp.257-263
    • /
    • 2007
  • 본 논문은 내구성(durability) 및 내오염성(soiling resistance)이 매우 중요한 성질로 인식되는 유통지의 평가방법을 제안하는데 목적이 있다. 즉, 종이의 내구성 및 내오염성의 측정 및 평가에 있어서, 재현성 및 반복성이 우수하고 합리적인 측정방법 및 평가방법을 구축하는데 목적이 있다. 연구목적에 적합한 시료의 준비, 오염물의 조성, 실험장치 및 실험후의 타당한 평가방법 등에 대하여 선행 연구결과를 고찰하였다. 기존 방법의 수정과 새로운 장치의 제작 및 평가방법의 설정을 통해 재현성이 높은 평가방법을 정립하고자 하였다. 유통지의 내구성을 평가하는 방법으로는 습식, 내오염성, 건식 내오염성, 구김기공도, 내세탁성, 잉크 내마모도 등의 항목을 측정하여 개별항목으로 내구성을 가늠하거나, 몇가지항목에 각기 다른 가중치를 부여하여 구한 내구성 지수(durability index)의 개념으로 내구성을 평가하기도 한다. 본 논문에서는 내구성에 영향하는 요소로 강도적 성질요소(strength property value)와 내오염성 요소(artificial soiling value)로 구분하였다. 강도적 성질요소에서는 전통적으로 내구성과 관련이 깊은 것으로 인식되어 온 내절도(folding endurance), 인열강도(tearing resistance) 및 구김기공도(crumpled porosity)를 인쇄하기 전 용지상태에서 측정하여 4:4:2의 가중치를 주어 구하였다. 내오염성 요소는 국가별 기후특성에 따라 연평균 상대습도가 60% 이상인 경우 인쇄 시료를 대상으로하여 습식 내오염성, 건식 내오염성 및 내석검성을 평가한 후 6:3:1의 가중치를 주어 구하였다. 또한 연평균 60% 미만인 국가의 경우 3:6:1의 가중치를 부여하였다. 이렇게 구해진 강도적 성질요소와 내오염성 요소에 있어 강도적 성질요소는 궁극적으로 내오염성 요소에 영향하기 때문에 3:7의 비율로 가중치를 부여하여 최종적으로 내구성 지수를 구하였다. 이때의 점수가 60점 이상이면 내구성 용지로 정의하였다. 본 논문에서는 현장실험을 통하여 시제품을 제조하였다. 상기 설명된 방법으로 내구성 지수를 구한 결과, 일반 유통지 제조방법으로 제조한 경우 내구성 지수가 약 45점이었다. 반면, 새로 개발된 방법에 의한 고내구성용지(durability paper)의 경우 70점 이상을 나타내어 내구성이 향상되었음을 확인할 수 있었다.

  • PDF