• 제목/요약/키워드: 트리비교

검색결과 990건 처리시간 0.024초

유사도 평가를 위한 트리 비교 알고리즘 (A Tree-Compare Algorithm for Similarity Evaluation)

  • 김영철;유재우
    • 정보처리학회논문지A
    • /
    • 제11A권2호
    • /
    • pp.159-164
    • /
    • 2004
  • 기존의 트리 비교에 관한 연구는 대부분 노드에 가중치가 있거나 레이블이 있는 트리(장식이 있는 트리)에 대해서 연구되었다. 그러나 본 연구에서는 장식이 없는 서로 다른 두개의 트리를 비교하여 유사도를 평가하는 알고리즘을 제시하고 구현한다. 본 시스템에서 제시한 트리 유사도 평가 알고리즘은 비교할 두 개의 트리를 언파서에 의해 노드 스트링으로 변환된 후, 유사도 알고리즘에 의해서 평가되며, 0.0-1.0 사이의 유사 값을 돌려준다. 본 논문의 실험 부분에서는 여러 형태의 트리를 비교 분석하였으며, 두 트리 사이에 일치되는 노드와 불일치 되는 노드를 시각적으로 표현하였다. 본 연구를 활용하면, 특정한 프로그램이나 문서의 유사도 및 중복 코드 발견 등에 활용할 수가 있다.

메시지 다이제스트를 이용한 구조화된 문서의 변화 탐지 (Detecting Changes in Structured Documents using Message Digest)

  • 김동아;이석균
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.151-153
    • /
    • 2002
  • XML/HTML 문서와 같이 트리 구조로 표현되는 데이터의 변화 탐지는 NP-hard의 문제로 이에 대한 효율적인 구현은 매우 중요하다. 본 논문에서는 효율적인 변화 탐지를 위해 트리 구조의 데이터를 X-tree로 표현하고 이에 기초한 휴리스틱 알고리즘을 제안한다. X-tree에서는 모든 서브트리의 루트 노드에 서브트리의 구조와 소속 노드들의 데이터들을 128비트의 해시값으로 표현하여 저장함으로 신ㆍ구 버전의 X-tree들에 속한 서브트리들의 비교가 매우 효율적이다. 제시한 변화 탐지 알고리즘에서는 구 버전의 X-tree의 모든 서브트리들에 대해 신 버전의 X-tree에서 동등한 서브트리들을 찾고, 이들에 기초하여 이동 연산이 발생한 서브트리들과 갱신 연산이 발생한 서브트리들을 순차적으로 찾는다. 이때 이동 연산과 갱신 연산으로 대응되는 서브트리는 동등 서브트리로부터 루트 노드로 대응 관계를 확장하는 가운데 발견된다. 이후 깊이 우선으로 검색하면서 나머지 노드들을 대응시킨다. X-tree의 구조적 특징에 기인하여 노드들 간의 비교를 통해 대응 여부를 검사하는 대부분의 기존 연구와는 달리 서브트리의 비교를 통해 대부분의 대응 관계를 결정하므로 효율적인 변화 탐지가 가능하다. 본 알고리즘은 최악의 경우에서도 N을 신ㆍ구 버전 문서의 전체 노드 수라 할 때 O(N)의 시간 복잡도를 갖는다.

  • PDF

불변조건을 이용한 XML 비교 방법 (XML Change Detection with Inavariant Conditions)

  • 이은정;구용모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.43-46
    • /
    • 2005
  • 최근 데이터 표현 형식으로 XML 데이터가 많이 도입되면서 두 개의 XML 트리를 비교하여 차이를 구하는 것이 데이터 웨어하우징이나 XML 네이티브 데이터베이스 등에서 중요한 요소가 되었다. 기존의 XML 트리 비교 방법은 일반적으로 가격 모델 기반 노드 매핑을 도입하고 있다. 이러한 최소 가격 기반 노드 매핑을 통해 트리의 차이를 구하는 방식은 원래 데이터의 의미와 조건을 유지하지 못하는 경우가 생기는데, 본 논문에서는 이러한 문제를 해결하기 위하여 트리의 변경 과정에서 유지되는 불변 조건의 개념을 소개하고 이를 이용하여 트리 비교를 수행하기 위한 모델을 제시한다.

  • PDF

멀티캐스트 라우팅 트리의 비교 (Comparison of Multicast Routing Trees)

  • Park, Jung-Soo
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.300-302
    • /
    • 1999
  • 일반적인 멀티캐스트 라우팅 트리 구성 방식들은 크게 3가지로 분류된다. 즉, 소스기반 트리, 집중화된 공유 트리와 집중화되지 않은 공유 트리 방식이다. 이 논문에서는 이런 멀티캐스트 트리들의 링크 비용과 트리상의 최대 딜레이를 비교하고 평가하고자 한다.

  • PDF

주관식 문제 채점에서의 구문의미트리 비교 시스템에 대한 연구 (Research on Comparing System with Syntactic-Semantic Tree in Subjective-type Grading)

  • 강원석
    • 컴퓨터교육학회논문지
    • /
    • 제20권5호
    • /
    • pp.79-88
    • /
    • 2017
  • 질높은 주관식 문제 채점을 위해서는 답변 속에 들어있는 단어간의 구문의미적 관계를 분석하는 구문 의미 분석이 필요하다. 그러나 구문의미 분석의 결과인 구문의미트리는 단어간의 구조적 의미 관계를 내포하고 있어 단어의 나열인 일차원적인 벡터의 유사도 계산을 적용할 수가 없다. 본 연구는 단어의 지식과 함께 단어와 단어간의 구조적 의미 관계를 내포하는 구문의미트리를 비교하는 비교 시스템에 대한 연구를 한다. 본 연구에서는 구문의미트리 비교를 위해 유사성 계산 원칙을 제안하고 실험을 통해 검증하였다. 본 구문의미트리 비교 시스템은 구문의미분석의 결과를 비교할 수 있게 하여 주관식 문제 채점에 도움을 줄 것이고 문서 유사도 영역에도 활용할 수 있을 것이다.

구문의미트리 비교기를 이용한 주관식 문항 채점 시스템에 대한 연구 (Research on Subjective-type Grading System Using Syntactic-Semantic Tree Comparator)

  • 강원석
    • 컴퓨터교육학회논문지
    • /
    • 제21권6호
    • /
    • pp.83-92
    • /
    • 2018
  • 주관식 문항은 깊이 있는 사고능력 평가와 고등정신능력 평가에 적합하나 채점하기가 쉽지 않다. 동일한 채점기준을 갖더라도 채점자에 따라 다른 채점결과를 가져올 수 있으므로 객관적인 자동 채점 시스템이 필요하다. 그렇지만 채점 시스템은 표현 언어인 한국어 분석과 비교의 문제가 걸려있다. 본 연구는 한국어의 구문 분석을 구현하고 결과인 구문분석 트리를 비교하는 비교기를 이용하여 주관식 문항을 채점하는 채점 시스템을 설계, 개발하였다. 이 시스템은 단어 중심의 채점 시스템과 구문의미트리 중심의 채점 시스템을 복합한 시스템으로 구문의미트리 비교기를 활용하였다. 본 시스템의 실험 결과 제안한 구문의미트리 중심의 채점 시스템과 복합 채점 시스템이 더 나은 결과를 가져옴을 알 수 있었다. 본 연구는 한국어 구문의미분석과 주관식 채점 영역에 활용할 수 있고 또한 문서 분류에도 활용할 수 있을 것이다.

셀기반 시그니쳐 트리: 고차원 데이터의 유사어 검색을 위한 효율적인 색인 구조 (Cell-based Signature Tree: Efficient Indexing Structures for Similarity Search in High-Dimensional Feature Space)

  • 송광택;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.134-136
    • /
    • 2000
  • 본 논문에서는 고차원의 특징 벡터 공간에서의 객체에 대한 효율적인 검색을 지원하는 셀기반 시그니쳐 트리 색인 구조(CS-트리, CI-트리)를 제안한다. 특징 벡터 공간을 셀로써 분할하고 특징 벡터는 셀의 시그니쳐로 표현되며 트리에 저장된다. 특징 벡터 대신 시그니쳐를 사용하여 트리의 깊이가 낮아짐으로서 검색을 효율적으로 수행할 수 있다. 또한 셀에 적합한 새로운 가지치기 거리를 이용한 유사성 검색 알고리즘으로 수행할 수 있다. 또한 셀에 적합한 새로운 가지치기 거리를 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 성능 비교를 수행하여, 성능비교 결과 본 논문에서 제안하는 CS-트리와 CI-트리가 검색 시간 측면에서 최대 30%의 검색 성능이 개선됨을 보인다.

  • PDF

구문의미트리 비교기를 이용한 유사문서 판별기 (Discriminator of Similar Documents Using the Syntactic-Semantic Tree Comparator)

  • 강원석
    • 한국콘텐츠학회논문지
    • /
    • 제15권10호
    • /
    • pp.636-646
    • /
    • 2015
  • 정보사회에 문서 복제나 표절의 검출에 대한 필요성이 증대되고 있다. 그 필요성에 따라 많은 연구가 이루어지고 있으나 자연어 처리의 문제가 유사 문서 판별의 질 향상에 제약이 되었다. 최근 구문의미분석의 기술을 접목하여 유사문서 판별의 성능을 향상을 시도하였으나 구문의미분석의 결과인 구문의미트리를 비교하는 어려움이 있었다. 본 논문은 구문의미트리의 유사도를 계산하는 구문의미트리 비교기를 개발하고 이를 이용하여 유사문서를 판별하는 시스템을 설계, 구현한다. 본 시스템의 성능을 실험하기 위하여 휴먼 판별과 제안한 시스템의 판별과의 상관계수를 분석하였다. 실험결과, 구문의미트리 비교기를 이용한 유사문서 판별기의 성능을 검증할 수 있었다. 앞으로 문서 유형을 정의하고 각 유형에 맞는 판별 기법을 개발할 필요가 있다.

확률적 이진 검색 트리 성능 추정 (Estimation of performance for random binary search trees)

  • 김숙영
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.203-210
    • /
    • 2001
  • 이진 트리 검색에 관한 관계 모형들을 추정하고 이론 가설들을 검정하기 위하여 중복되지 않는 자연수들을 자료로 하는 3개 이상 7개 이하의 노드를 가진 모든 가능한 이진 검색 트리 들을 생성하였다. 노드 개수 별로 높이 및 균형도 에 따른 이진 검색 트리 생성 확률들을 추정하였으며 노드 개수와 트리의 높이, 검색에 필요한 비교 횟수의 관계를 나타내는 회귀 모형이 구축되었고 이진 검색 트리의 O(1g(n)) 이론이 적합도 검정 절차에 의하여 실험적으로 채택되었다. 이진 검색 트리의 균형에 따른 검색 성능의 유의적 차이들을 통계적으로 증명하기 위하여 균형도에 따라 확률적으로 생성된 이진 검색 트리들을 세 그룹으로 그룹화하고 그룹간의 검색 비교 횟수를 분산 분석 모형에 의하여 비교 분석하였다.

  • PDF

정보영재의 사고력 신장을 위한 교수-학습 프로그램의 모형별 결과 비교 분석 (A Comparative Analysis of the Teaching-Learning Program for the Thinking Extension of Information-Gifted by Models)

  • 정덕길;김병조;노영욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1162-1165
    • /
    • 2008
  • 이 논문은 정보영재 교육 중에서 프로그래밍을 위한 사고력 신장에 적합한 교육 프로그램 모형을 개발하고 이의 구현을 위하여 실제적인 예를 보여 교육 프로그램의 타당성과 유효성을 검증하였다. 이 논문은 트리와 트리 탐색을 이용한 사고력 신장 교육 프로그램으로 4단계로 구성되는 교육 프로그램을 제안하였으며, 구성되는 트리의 유형과 탐색 방법에 따라 세 가지 모형으로 세분화된다. 이 모델을 통하여 학생들은 문제를 트리로 표현하는 방법을 학습하게 되며, 트리로 구성된 문제를 해결하기 위하여 각각의 트리 모형에 따른 적절한 트리 탐색 방법을 통하여 문제를 해결하는 방법을 배우게 된다. 이 교육 프로그램 모형을 실제 교육 현장에서 적용하여 각 모형별로 그 결과를 비교 분석한다.