• 제목/요약/키워드: 혼합형 데이터

검색결과 180건 처리시간 0.024초

특징 래핑을 통한 숫자형 특징과 범주형 특징이 혼합된 데이터의 클래스 분류 성능 향상 기법 (Improving Classification Performance for Data with Numeric and Categorical Attributes Using Feature Wrapping)

  • 이재성;김대원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1024-1027
    • /
    • 2009
  • 본 논문에서는 혼합형 데이터에 대한 특징 선별 기법의 효율성을 비교하기 위해 특징 필터링과 특징 래핑을 통한 특징 선별 후, 클래스 분류 성능을 측정하였다. 혼합형 데이터는 숫자형 특징과 범주형 특징이 함께 혼합되어 있으므로, 숫자형 특징을 범주형 특징으로 이산화를 하여 단일형 데이터로 변환한 뒤 특징 선별 기법 등을 적용할 수 있다. 본 연구에서는 혼합형 데이터를 전처리하여 단일형 데이터로 변환하고, 널리 활용되는 특징 필터링 기법과 특징 래핑 기법을 통해 클래스 분류 성능을 높일 수 있는 특징 집합을 선별하였다. 선별된 특징 집합을 통한 클래스 분류 성능을 비교한 결과, 특징 필터링에 비해 특징 래핑을 통해 선별한 특징 집합을 활용하여 클래스 분류를 하였을 때 분류 정확도가 높은 것을 확인할 수 있었다.

혼합형 데이터에 대한 나무형 군집화 (Tree-structured Clustering for Mixed Data)

  • 양경숙;허명회
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.271-282
    • /
    • 2006
  • 본 논문에서는 범주형과 연속형 변수들이 혼합된 데이터에 적용할 수 있는 나무형 군집화 알고리즘을 제안하였다. 특히 혼합된 변수들이 공통의 의미를 갖도록 하기 위해 범주형 변수들을 전처리하는 방법을 고안하였다. 수치 예로서 SPSS의 신용(credit) 데이터와 독일신용자료(German credit data)에 알고리즘을 적용하고 그 결과를 검토하였다.

클러스터 데이터 매핑을 위한 혼합형 휴리스틱 (A Hybrid Heuristic for Clustered Data Mapping)

  • 박경모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.662-664
    • /
    • 2000
  • 병렬 컴퓨팅에서 중요 문제의 하나는 다중 태스크를 다중 프로세서 병렬 시스템의 여러 노드에 대한 최적의 매핑을 찾는 것이다. 이러한 매핑의 목적은 솔루션 품질에 손상 없이 총 실행시간을 최소화시키는 것이다. 이 분야에서는 많은 휴리스틱 방법들을 사용하여 나름대로 매핑 문제를 해결해 왔다. 본 논문에서는 효율적인 클러스터 데이터 매핑을 위한 혼합형 휴리스틱 기법에 대하여 기술한다. 제시하는 휴리스틱 기법은 유전알고리즘과 평균장어닐링 알고리즘을 혼합시킨 것으로 두 가지 방법의 장점들을 합하여 성능을 향상시킬 수 있음을 보여준다. 혼합형 휴리스틱 알고리즘의 솔루션과 실행시간을 기존 매핑 알고리즘들과 비교한 시뮬레이션 결과를 보고한다.

  • PDF

GIS 벡터맵 데이터 압축을 위한 혼합형 폴리라인 단순화 (Hybrid Polyline Simplification for GIS Vector Map Data Compression)

  • 임대엽;장봉주;이석환;권성근;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제16권4호
    • /
    • pp.418-429
    • /
    • 2013
  • 본 논문은 혼합형 폴리라인 단순화와 공간 에너지 집중을 이용한 GIS 벡터맵 데이터 압축을 제안한다. 제안한 방법에서는 GIS 벡터맵에서 폴리라인 속성을 가지는 레이어들에 대해, 최소 면적 오차 기반의 혼합형 폴리라인 단순화 및 공간 에너지 집중에 의하여 선택된 레이어 내의 폴리라인 데이터들을 압축한다. 제안한 단순화 및 공간 에너지 집중는 폴리라인의 형상을 유지하면서 데이터 압축 효과를 향상시킨다. 가시적 화질과 압축률을 통한 평가 결과로부터 제안한 방법이 기존 방법보다 우수한 화질과 높은 압축률을 보임을 확인하였다.

RDBMS를 이용한 XML 데이터의 혼합형 저장 기법 (A Hybrid Method of Storing XML Data Using RDBMS)

  • 전찬훈;강현철
    • 한국전자거래학회지
    • /
    • 제14권1호
    • /
    • pp.57-79
    • /
    • 2009
  • 웹 기반의 e-비지니스가 활성화되면서 웹 상의 데이터 교환 표준인 XML 데이터의 양이 폭발적으로 증가하고 있다. 현재 XML의 저장소로 가장 널리 사용되고 있는 RDB에 XML 데이터를 분해하여 저장하고 SQL을 통해 XML 질의를 처리하는 기법이 많이 연구되었지만, 대용량의 XML 데이터 저장에 따른 공간 부담을 어떻게 완화할 것인지에 대한 연구는 없었다. 본 논문에서는 XML 데이터를 분해하여 기존의 노드 단위로 저장하는 것과 더불어 자주 질의되지 않거나 시간의 경과 등으로 유효성이 떨어진 데이터를 서브트리 단위의 저장으로 전환할 수 있는 혼합형 저장 기법을 제시한다. 이를 바탕으로 XML 혼합형 저장 및 질의 처리 시스템을 설계 및 구현하고 기존의 노드 단위 저장 및 질의 처리 시스템과 공간 효율 및 질의 처리 성능을 실험을 통해 비교 평가함으로써 제시하는 기법의 효율성을 검증하였다.

  • PDF

ILP 프로세서에서 데이터 값 예측기의 성능 평가 (The Performance evaluation of Data Value Predictor in ILP Processor)

  • 박희룡;전병찬;이상정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.21-23
    • /
    • 1998
  • 본 논문에서 ILP (Instruction Level Parallelism)의 성능향상을 위하여 데이터 값들을 미리 예측하여 병렬로 이슈(issue)하고 수행하는 기존의 데이터 값 예측기(data value predictor)를 비교 분석하여 각 예측기의 예측율을 측정하고, 2-단계 데이터 값 예측기(Two-Level Data Value Predictor)와 혼합형 데이터 값 예측기(Hydrid Data Value Predictor)에서 발생되는 aiasing 을 측정하기 위해 수정된 데이터 값 예측기를 사용하여 측정한 결과 aliasing은 50% 감소하였지만 예측율에는 영향을 미치지 못함과 데이터 값 예측기의 예측율을 측정한 결과 혼합형 데이터 값 예측기의 예측율이 2-단계 데이터 값 예측기와 스트라이드 데이터 값 예측기(Stride Data Value Predictor)에서 평균 5.7%, 최근 값 예측기(Last Data Value Predictor)보다는 평균 38%의 예측 정확도가 높음을 입증하였다.

  • PDF

불균형한 입력을 효과적으로 처리하는 유연한 혼합형 라우터 설계 (Design of Flexible Hybrid Router to Process Unbalanced Input Effectively)

  • 정라미;김성천
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.648-650
    • /
    • 2000
  • 라우터의 기본적인 목적은 안정적으로 다량의 데이터를 전송하는 것이다. 현재 e양한 메시지를 효과적으로 처리하기 위한 여러 혼합형 라우터가 개발되고 있다. 이는 단순히 한가지 방식만 고수하는 것이 아니라 기존의 여러 기법을 혼합된 방식을 적용하는 것이다. 이러한 혼합형 기법은 기존의 단일 방식의 단점을 보완할 수 있어야 하며, 그에 따른 오버헤드를 감수할 수 있어야 한다. 이러한 목적으로 웜홀 스위칭(wormhole switching)과 파이프라인드 서킷 스위칭(Pipelined Circuit Switching)을 동시에 구현하기 위해 혼합형 라우터 구조가 제안되었다. 이 라우터는 두 스위칭 기법을 동시에 지원하여 다양한 메시지를 효과적으로 처리할 수 있는 특성이 있다. 그러나 이 구조는 각 스위칭 방식에 해당하는 내부 연결망을 독립적으로 구성함으로써 입력으로 들어오는 스위칭 비율이 불균형일 때 내부 자원을 효율적으로 사용할 수 없는 단점이 있다. 따라서 본 논문에서는 라우터의 내부 연결망을 공유하여 사용하는 새로운 혼합형 라우터를 제안하였다. 제안한 구조는 웜홀과 파이프라인드 서킷 스위칭을 지원하는 라우터로, 메시지를 전송할 때 내부 연결망을 서로 공유함으로써, 입력 메시지의 비율이 불균형할 때 효과적으로 자원을 이용할 수 있게 하였다. 시뮬레이션을 통하여 기존의 혼합형 라우터를 사용하는 것보다 더 높은 성능을 보인다는 것을 증명하였다.

  • PDF

XML 문서 저장 방법 비교 (Comparison of the Storage of XML Document)

  • 김경래;하상호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.265-270
    • /
    • 2001
  • XML은 강력한 데이터 표현능력들 인정받아 전자상거래와 같은 데이터 처리 분야에 적극적으로 도입되고 있다. 전자상거래는 인터넷의 확산과 더불어 급속도로 발전되었고. B2C의 성공은 기업간 전자상거래를 위한 비즈니스 모델들을 창출하였다. 이 비즈니스 모델들은 새로운 문서 기술 언어인 XML로 작성되고, 그 정보들은 각각의 기업의 데이터베이스에 저장된다. 저장에 필요한 데이터베이스로서 관계형 데이터베이스가 가장 일반적으로 사용되고 있으나, 관계형 데이터베이스의 단점을 보완한 객체지향형 데이터베이스가 개발되었고, 관계형 데이터베이스와 객체지향형 데이터베이스의 장점을 살린 혼합형이라 할 수 있는 객체 관계 데이터베이스가 개발되었다. 본 논문에서는 XML 문서의 저장에 관계형 데이터베이스와 객체 관계 데이터베이스를 사용하여 저장의 효율성을 비교한다.

  • PDF

정적 분류를 이용한 혼합형 결과간 예측기 (A Hybrid Value Predictor Using Static Classification)

  • 박홍준;고광현;조영일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.865-867
    • /
    • 2001
  • 데이터 종속성을 제거하기 위해서 명령어의 결과값을 예상하는 여러 결과값 예측기의 장점을 이용하여 놓은 성능을 얻을 수 있는 새로운 혼합형 예측 메커니즘을 제안한다. 제안된 혼합형 결과값 예측기는 예상 테이블을 모험적으로 갱신할 수 있기 때문에 부적절한(Stale) 데이터로 인해 잘못 예상되는 명령어의 수를 효과적으로 감소시킨다. 또한 정적 분류 정보를 사용하여 명령의 반입시 적절한 예측기에 할당함으로써 예상 정확도를 더욱 향상시키며, 하드웨어 비용을 효율적으로 감소시키도록 하였다. 5개의 SPECint 95 벤치마크 프로그램에 대해 SimpleScalar/PISA 3.0 툴셋을 사용하여 실험하였다. 16-이슈 폭에서 모험적 갱신을 사용한 평균 예상 정확도는 73%의 실험 결과가 나왔으며, 정적 분류 정보를 사용하였을 경우 예상 정확도가 88%로 증가된 결과를 얻었다.

  • PDF

KNHNAES (2013~2015) 에 기반한 대형 특징 공간 데이터집 혼합형 효율적인 특징 선택 모델 (A Hybrid Efficient Feature Selection Model for High Dimensional Data Set based on KNHNAES (2013~2015))

  • 권태일;이정곤;박현우;류광선;김의탁;박명호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.739-747
    • /
    • 2018
  • 고차원 데이터에서는 데이터마이닝 기법 중에서 특징 선택은 매우 중요한 과정이 되었다. 그러나 전통적인 단일 특징 선택방법은 더 이상 효율적인 특징선택 기법으로 적합하지 않을 수 있다. 본 논문에서 우리는 고차원 데이터에 대한 효율적인 특징선택을 위하여 혼합형 특징선택 기법을 제안하였다. 본 논문에서는 KNHANES 데이터에 제안한 혼합형 특징선택기법을 적용하여 분류한 결과 기존의 분류기법을 적용한 모델보다 5% 이상의 정확도가 향상되었다.