• 제목/요약/키워드: 데이타 가중치

검색결과 75건 처리시간 0.017초

주요 색상의 분포 블록기호를 이용한 영상검색과 유사도 피드백을 통한 이미지 검색 (Image Retrieval using Distribution Block Signature of Main Colors' Set and Performance Boosting via Relevance feedback)

  • 박한수;유헌우;장동식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.126-136
    • /
    • 2004
  • 이 논문은 색상과 위치정보를 이용한 새로운 내용기반 영상검색 알고리즘을 제안한다. 이를 위해서. 질의가 주어졌을 경우, 데이타베이스의 검색공간을 줄일 목적으로 두 가지 종류의 색인 키(Key)를 제시하는데 하나는 영상의 고유한 색상 구성적 특성을 나타내는 주요 색상세트(MCS, Main Colors' Set)이고 다른 하나는 주요 색상마다의 분포 및 위치적 특성을 나타내는 분포 블록기호(DBS, Distribution Block Signature)이다. 이 두 가지 필터(Filter)를 연속적으로 적용하면 영상 데이터베이스로부터 잠재성이 높은 유사 후보 영상만을 걸러내게 된다. 이어서 보다 높은 검색성능을 얻기 위해 새롭게 제안한 쿼드모델 (Quad Modeling)과 유사도 피드백 메커니즘을 이용한다. 이 방법은 색상과 위치정보에 대한 가중치를 역동적으로 조절함으로써 검색성능을 향상시킨다. 실험을 통해서 제안된 알고리즘이 성공적으로 영상검색에 사용될 수 있음을 보인다.

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저 (e-Cohesive Keyword based Arc Ranking Measure for Web Navigation)

  • 이우기;이병수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.22-29
    • /
    • 2009
  • 웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

적응성 가중메디안 필터를 이용한 방사선 투과영상의 양자 잡음 제거 (Reduction of Radiographic Quantum Noise Using Adaptive Weighted Median Filter)

  • 이후민;남문현
    • 비파괴검사학회지
    • /
    • 제22권5호
    • /
    • pp.465-473
    • /
    • 2002
  • 영상 데이타는 전송, 검출 및 처리과정에서 여러 잡음에 의해 훼손될 수 있다. 적응성 가중 메디안 필터라는 공간변화 필터를 사용하여 방사선 투과영상의 양자 잡음을 제거하였다. 제안된 필터는 처리 윈도우 내 각 픽셀의 국소 통계치의 변화에 따라 필터의 성능이 변화하여 에지를 최대한 보존하면서 잡음만을 제거하고자 이러한 국소 통계 값에 근거한 적응성 가중 메디안 휠터 (AWMF)를 제시한다. AWMF를 구현함에 있어 두 가지 방법으로 나뉘는데, 우선 국소 통계의 특성에 따라 3개의 영역으로 분류하여 가중치를 부여하는 간단한 비선형 필터이고, 다음으로는 잡음모델로부터 국소 통계의 특성에 따라 경계(edge) 영역과 균일 영역으로 구분하여 영상시스템에 적당한 균일 척도 값을 구하여 영상의 공간적인 변화 정도를 판단하는 기준이 되도록 하였다. 제안한 알고리듬은 IBM-PC 상에서 C 언어로 구현하였으며 AWMF가 다른 잡음 제거 필터들과의 성능 비교를 통하여 경계는 보존하면서 잡음은 최대한 제거하는 우수한 필터임을 검증하였다.

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.

데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크의 개발에 관한 연구 (A Study on the Development of Framework for Enhancing Data Quality in Data Warehouse Environments)

  • 정경수;김병곤;장상도
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 국제컨퍼런스 디지털컨텐츠 활용을 통한 지식경영의 확산
    • /
    • pp.191-201
    • /
    • 1999
  • 데이터 웨어하우스와 데이터 품질에 관한 문헌연구를 통하여 데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크를 개발하고자 하는 것이 본 연구의 목적이다. 데이터 웨어하우스 데이터 품질향상 활동을 지원하는 프레임워크를 개발하는 목적은 (1) 다양한 요구를 가진 사용자들이 웨어하우스 데이터에 접근하기 때문에, 사용자의 요구를 만족시키며 기업의 목적에 적합한 품질향상 활동을 지원하기 위해서이며, 다양한 기업활동을 가장 잘 지원할 수 있는 데이터 품질향상 지침을 관리자에게 제공하기 위해서 이다. (2) 웨어하우스 관리자의 데이터 품질향상 활동을 지원하기 위해서는 품질차원이나 데이터세트 등과같은 품질향상에 필요한 다양한 이슈를 관리자가 인식할 수 있도록 하기 위해서이다. (3) 데이터 웨어하우스 환경에서 데이터 품질 향상에 필요한 체계적이고 포괄적인 안목을 제공하기 위해서이다. 본 연구는 다음과 같은 단계로 수행하게 된다. 첫째, 데이터 웨어하우스의 개념과 데이터 웨어하우스의 구축단계 및 데이터 웨어하우스를 구성하는 프레임워크를 검토한다. 둘째, 데이터 웨어하우스 환경에서의 데이터 품질의 기준과 데이터 품질의 측정 및 데이터 품질의 향상 방안 등을 고찰한다. 셋째, 데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크를 개발하기 위하여 데이터 웨어하우스 데이터 풀질 향상과 관련된 기업활동, 데이터 세트, 품질의 속성 및 차원 등을 정의한다. 마지막으로 데이터 웨어하우스 환경하에서 데이터 품질을 향상할 수 있는 3차원 구조의 개념적 프레임워크를 제안하며, 나아가 제안한 모형에 대하여 데이터 품질 향상을 위한 프로젝트 활동의 사례를 통하여 모형의 타당성을 개념적으로 설명한다.통하여 각각의 제품을 비교하였으며, 둘째 소프트웨어 종류별 평가로 제품을 응용소프트웨어, 응용개발도구, 시스템 소프트웨어로 분류하여 평균값으로 비교하였다. 셋째, 국내외 제품별 평가분석으로 전체 제품을 국내제품과 국외제품으로 분류하여 비교하였으며, 마지막으로 총괄분석을 통해 가중치를 적용하여 전 제품의 점수를 비교하였다. 여기에서는 각 제품의 평균점수에 대한 차이를 95%의 유의수준으로 T-Test를 실시하였다.uted to the society, and what the socioeconomic impacts are resulted from the program. It would be useful for the means of (ⅰ) fulfillment of public accountability to legitimate the program and to reveal the expenditure of pubic fund, and (ⅱ) managemental and strategical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projects including scientific and technological effects. Since the HAN projects cons

  • PDF