• 제목/요약/키워드: Similar Data

검색결과 9,284건 처리시간 0.031초

Extraction of similar XML data based on XML structure and processing unit

  • Park, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권4호
    • /
    • pp.59-65
    • /
    • 2017
  • XML has established itself as the format for data exchange on the internet and the volume of its instance is large scale. Therefore, to extract similar information from XML instance is one of research topics but is insufficient. In this paper, we extract similar information from various kind of XML instances according to the same goal. Also we use only the structure information of XML instance for information extraction because some of XML instance is described without its schema. In order to efficiently extract similar information, we propose a minimum unit of processing and two approaches for finding the unit. The one is a structure-based method which uses only the structure information of XML instance and another is a measure-based method which finds a unit by numerical formula. Our two approaches can be applied to any application that needs the extraction of similar information based on XML data. Also the approach can be used for HTML instance.

An Approach to Applying Multiple Linear Regression Models by Interlacing Data in Classifying Similar Software

  • Lim, Hyun-il
    • Journal of Information Processing Systems
    • /
    • 제18권2호
    • /
    • pp.268-281
    • /
    • 2022
  • The development of information technology is bringing many changes to everyday life, and machine learning can be used as a technique to solve a wide range of real-world problems. Analysis and utilization of data are essential processes in applying machine learning to real-world problems. As a method of processing data in machine learning, we propose an approach based on applying multiple linear regression models by interlacing data to the task of classifying similar software. Linear regression is widely used in estimation problems to model the relationship between input and output data. In our approach, multiple linear regression models are generated by training on interlaced feature data. A combination of these multiple models is then used as the prediction model for classifying similar software. Experiments are performed to evaluate the proposed approach as compared to conventional linear regression, and the experimental results show that the proposed method classifies similar software more accurately than the conventional model. We anticipate the proposed approach to be applied to various kinds of classification problems to improve the accuracy of conventional linear regression.

데이터 트래픽 Self-Similar 특성에 관한 연구 (Self-Similarity Characteristic in Data traffic)

  • 장우현;오행석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 추계종합학술대회
    • /
    • pp.272-277
    • /
    • 2000
  • 본 논문에서는 Self-similar 확률과 정의 및 트래픽외 특성, 그리고 최근 논문들에서 보고된 사례에 대한 동향과 실제의 데이터 트래픽 특성에 대한 분석연구를 통하여 Self-similar 패턴에 대한 연구 결과를 제시하고자 한다.

  • PDF

Self-Similar 특성을 이용한 이동전화 데이터 트래픽 특성 (Mobile Communications Data traffic using Self-Similarity Characteristic)

  • 이동철;양성현;김기문
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.915-920
    • /
    • 2002
  • 최근 몇 년 동안 몇몇 환경에서 트래픽 패턴이 Poisson 패턴보다 Self-similar 패턴에 더 가깝다는 것이 입증되어 왔다. 본 논문에서는 이러한 Self-similar 확률과정의 정의 및 트래픽의 특성, 그리고 최근 논문들에서 보고된 사례에 대해서 고찰해 봄으로써, 실제의 이동전화 데이터 트래픽 특성에 적합한지를 응용하고자 한다.

  • PDF

Self-Similar특성을 이용한 데이터 트래픽 특성에 관한 연구 (Self-Similarity Characteristic in Data traffic)

  • 이동철;김기문;김동일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 춘계종합학술대회
    • /
    • pp.173-178
    • /
    • 2001
  • 본 논문에서는 Self-similar 특성을 이용하여 트래픽의 특성을 분석하고, 최근 논문들에서 보고된 사례에 대한 동향과 실제 데이터 트래픽 특성에 대한 분석연구에 대하여 Self-similar 패턴의 분석 결과를 제시한다.

  • PDF

Self-Similar특성을 이용한 데이터 트래픽 특성에 관한 연구 (Self-Similarity Characteristic in Data traffic)

  • 이동철;김기문;김동일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.454-459
    • /
    • 2001
  • 본 논문에서는 Self-similar 특성을 이용하여 트래픽의 특성을 분석하고, 최근 논문들에서 보고된 사례에 대한 동향과 실제 데이터 트래픽 특성에 대한 분석연구에 대하여 Self-similar 패턴의 분석 결과를 제시한다.

  • PDF

이동전화 데이터 트래픽에서의 Self-Similar 특성 (Self-Similarity Characteristic in Mobile Communications Data traffic)

  • 이동철;정인명;김기문;김동일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.468-471
    • /
    • 2001
  • 최근 몇 년 동안 몇몇 환경에서 트래픽 패턴이 Poisson 패턴보다 Self-similar 패턴에 더 가깝다는 것이 입증되어 왔다. 본 논문에서는 이러한 Self-similar 확률과정의 정의 및 트래픽의 특성, 그리고 최근 논문들에서 보고된 사례에 대해서 고찰해 봄으로써, 실제의 이동전화 데이터 트래픽 특성에 적합한지를 응용하고자 한다.

  • PDF

2차원 배열 데이터에서 유사 구역의 효율적인 탐색 기법 (An Efficient Method for Finding Similar Regions in a 2-Dimensional Array Data)

  • 최연정;이기용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권4호
    • /
    • pp.185-192
    • /
    • 2017
  • 여러 과학 분야에서 측정 또는 시뮬레이션의 결과로 2차원 배열 데이터가 활발히 생성되고 있다. 현재 배열 데이터에 대한 다양한 질의 처리 기법들이 연구되고 있으나 2차원 배열 데이터에서 크기가 미리 알려져 있지 않은, 값이 서로 유사한 구역을 찾는 문제는 거의 다루어지지 않았다. 따라서 본 논문에서는 주어진 2차원 배열 데이터에서 사용자가 지정한 값 이상의 크기를 갖는, 원소 값들이 서로 유사한 구역을 빠르게 찾는 방법을 제안한다. 본 논문의 제안 방법은 2차원 배열의 각 원소 쌍에 대해, 해당 원소로만 이루어진 크기가 1인 구역부터 시작하여 두 구역을 동일한 모양을 유지하면서 오른쪽 및 아래쪽으로 단계적으로 확장시켜나간다. 만약 두 구역의 값의 차이가 사용자가 지정한 값 이상으로 커지면 확장을 중단한다. 따라서 제안 방법은 배열에서 유사 구역이 될 가능성이 있는 부분들만 접근하여 유사 구역을 효율적으로 찾아낼 수 있다. 본 논문에서는 성능 분석과 다양한 실험을 통해 제안 방법이 매우 효율적으로 유사 구역을 찾을 수 있음을 보인다.

비디오 데이타를 위한 그리드 기반의 유사 부분 궤적 검색 기법 (Similar sub-Trajectory Retrieval Technique based on Grid for Video Data)

  • 이기영;임명재;김규호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.183-189
    • /
    • 2009
  • 최근, PCS, PDA와 같은 이동기기 보급의 확산, GPS(Global Positioning System)의 활용, 유무선 네트워크의 급속한 발전 등으로 일반 사용자들조차 이미지, 오디오, 비디오 등과 같은 멀티미디어 데이타에 대한 활용이 증가하고 있다. 특히, 멀티미디어 데이타 중에서도 비디오 데이타는 텍스트나 이미지 데이타와는 달리 이동 객체에 대한 움직임 정보를 포함하고 있고 시간의 변화에 따라 공간의 변화를 가지는 시공간적 특성을 가진다. 객체의 공간적 위치가 시간의 흐름에 따라 계속 변하는 이동객체(Moving Object)들의 연속적인 움직임들의 모임을 궤적이라 하며, 데이타베이스에서 사용자로부터 주어진 질의 궤적과 유사한 궤적을 포함하는 데이타를 찾는 것을 유사 부분궤적 검색(Similar Sub-trajectory Retrieval)이라 한다. 그리고 이러한 유사 부분궤적 검색을 하기 위해선 사용자 질의 궤적과 주어진 유사정도(Tolerance) 내에서 유사한 데이타 궤적을 검색 할 수 있는 근사 매칭(Approximate Matching)이 가능해야 한다. 또한, 방대한 멀티미디어 데이타베이스에서 사용자가 원하는 데이타 만을 보다 빠른 시간 내에 찾을 수 있도록 기존 연구와는 다른 효과적인 검색방법이 요구된다. 이를 위해, 본 논문에서는 효과적인 검색을 위해 궤적을 그리드로 분할하여 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 그리드 기반 검색 기법을 제안한다.

  • PDF

데이터 트래픽에서의 Self-Similar 특성 (Self-Similarity Characteristic in Data traffic)

  • 김창호;황인수;최삼길;김동일;이동철;박기식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 춘계종합학술대회
    • /
    • pp.146-151
    • /
    • 1999
  • 기존의 큐잉 분석은 네트워크 용량설계 및 성능 예측을 할 때 상당히 유용하지만, 대부분의 실제 경우에서 큐잉 분석으로부터 예측된 결과는 실제 관측된 성능과는 상당히 다르다. 특히, 최근 몇 년 동안 몇몇 환경에서 트래픽 패턴이 Poisson 패턴보다는 차라리 Self-similar 패턴에 더 가깝다는 것이 입증되어 왔다. 본 논문에서는 이러한 Self-similar 확률과정의 정의 및 트래픽의 특성, 그리고 최근 논문들에서 보고된 사례에 대해서 고찰해 봄으로써, 실제의 데이터 트래픽 특성에 대해 더 나은 이해를 제공하고자 한다.

  • PDF