• 제목/요약/키워드: 데이타 변환

검색결과 305건 처리시간 0.037초

슬라이딩 윈도우 기반 다변량 스트림 데이타 분류 기법 (A Sliding Window-based Multivariate Stream Data Classification)

  • 서성보;강재우;남광우;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.163-174
    • /
    • 2006
  • 분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 입력되는 데이타를 사전에 분류하여 특성에 따라 선택적으로 데이타를 처리하는 데이타 분류 기법이 요구된다. 이 논문에서는 다차원 센서에서 주기적으로 수집되는 스트림 데이타를 슬라이딩 윈도우 단위로 데이타를 분류하는 기법을 제안한다. 제안된 기법은 전처리 단계와 분류단계로 구성된다. 전처리 단계는 다변량 스트림 데이타를 포함한 각 슬라이딩 윈도우 입력에 대해 데이타의 변화 특성에 따라 문자 기호를 이용하여 다양한 이산적 문자열 데이타 집합으로 변환한다. 분류단계는 각 윈도우마다 생성된 이산적 문자열 데이타를 분류하기 위해 표준 문서 분류 알고리즘을 이용하였다. 실험을 위해 우리는 Supervised 학습(베이지안 분류기, SVM)과 Unsupervised 학습(Jaccard, TFIDF, Jaro, Jaro Winkler) 알고리즘을 비교하고 평가하였다. 실험결과 SVM과 TFIDF 기법이 우수한 결과를 보였으며, 특히 속성간의 상관 정도와 인접한 각 문자 기호를 연결한 n-gram방식을 함께 고려하였을 때 높은 정확도를 보였다.

데이터 의존성과 벡터왜곡척도를 이용한 개선된 프랙탈 칼라영상 복호화 (An Improved Fractal Color Image Decoding Based on Data Dependence and Vector Distortion Measure)

  • 서호찬;정태일;류권열;권기룡;문광석
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.289-296
    • /
    • 1999
  • 본 논문에서는 데이타 의존성과 벡터왜곡척도를 이용하여 개선된 칼라영상을 복호화하였다. 프랙탈칼라영상의 복원방법은 Zhang과 Po의 벡터왜곡척도를 이용한 RGB 칼라 성분간의 상관관계를 고려하여 부호화한 압축파일을 사용하여 수렴 될 복원영상을 부호화시 만들어진 변환표의 정보를 바탕으로 참조된 정 의 역 부분이 기존의 독립적인 반복변환에 의해 수렴되었고 참조되지 않은 부분의 정의역은 데이타의존성을 갖는 영역으로 이미 수렴된 부분에 존재하므로 마지막 반복변환시 한번만에 복호화가 가능하다. 데이타의존성 부분이 차지 하는 만큼 복호화 과정에서 불필요한 계산량이 제거되었고, R영역에서 검색한 데이타 의존영역을 G,B영역에 그대로 사용하여 고속복호화가 가능하였다.

  • PDF

가상주소 변환 과정에 대한 부담의 줄임 (Peducing the Overhead of Virtual Address Translation Process)

  • 우종정
    • 한국정보처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.118-126
    • /
    • 1996
  • 메모리의 계층적 구조는 메모리의 접근 속도를 개선하고 프로그래밍 공간을 확장 하는데 유용한 메카니즘이다. 그러나 이 구조는 데이타의 참조를 위해서 적어도 두번- 주소 변환을 위한 TLB 와 원하는 데이타를 위한 데이타 캐시-의 메모리 접근이 필요하다. 만약 캐시의 크기가 가상 메모리의 페이지 크기와 캐시 메모리의 연관 정도의 곱보다 커지면 TLB접근과 데이타 캐시의 접근을 병렬로 수행하기 어려우며, 따라서 프로세서 타이밍의 임계 경로가 길어져 성능에 영향을 미친다. 이들의 병렬 접근을 성취하기 위하여 직접 사상 TLB와 조그마한 완전 연관 사상 TLB를 결합하나 혼합 사상 TLB를 제 안한다. 전자는 TLB 접근에 따른 지연시간을 줄 일 수 있으며 후자는 전자로부터 발생한 충돌 부재를 제거할 수 있게 된다. 트레이스 구동 모의 실험 결과에 의하면 제안된 TLB 는 4개의 엔트리로만 구성된 완전사상 TLB를 추가하더라도 부재율의 상승에 의한 영향이 주소변환에 따른 지연시간 축소에 위하여 상쇄되므로 효과적이다.

  • PDF

부분 문자열 선택도 추정을 위한 서픽스트리 변환 기법 (A Suffix Tree Transform Technique for Substring Selectivity Estimation)

  • 이홍래;심규석;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권2호
    • /
    • pp.141-152
    • /
    • 2007
  • 선택도 추측은 관계형 데이타베이스에서 질의 최적화의 한 중요한 요소이다. 숫자 데이타에 대한 조건식에 대하여 이 주제는 많은 연구가 되어 왔으나 부분문자열에 대한 조건식은 최근에 이르러서야 관심의 초점이 되고 있다. 우리는 이 논문에서 이 문제를 위한 새로운 서픽스 트리 변환 알고리즘을 제시한다. 제안하는 기법은 서픽스 트리의 노드들을 단순히 잘라 없애 버리기 보다는 기본적으로 비슷한 카운트를 갖는 노드들을 구조적 정보를 유지하면서 병합하여 전체 크기를 줄인다. 본 논문은 여러 제약 사항하에서 서픽스 트리를 그 크기를 줄이도록 변환을 하는 알고리즘을 제시하고 실생활 데이타를 대상으로 실험을 수행하여 우리가 제안하는 알고리즘이 기존의 알고리즘들보다 우수한 평균 상대 에러와 에러 분포 특성을 지니고 있음을 보인다.

EXPRESS 데이타를 XML 문서로 변환하는 번역기 (An EXPRESS-to-XML Translator)

  • 이기호;김혜진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권6호
    • /
    • pp.746-755
    • /
    • 2002
  • EXPRESS는 공학 분야의 제품 정보를 기술하는 언어로서 서로 다른 시스템 사이의 데이터 교환이 가능하게 한다 그러나 EXPRESS를 사용할 수 있는 소프트웨어의 종류는 제한적이며 이에 비용이 소요된다. 한편, XML은 웹 상에서 데이타의 관리 및 유지를 가능하게 한다. 웹은 사용 및 접근이 쉽고 저렴하기 때문에 XML로 쓰여진 데이타는 특정 애플리케이션이나 시스템에 의존하지 않아도 되므로 데이타 교환에도 유용하게 쓰일 수 있다. 따라서, EXPRESS로 기술된 정보를 XML로 표현할 경우, 누구나 사용하기 쉬운 웹 상에서 그 정보를 사용할 수 있으므로 제품 정보가 기존보다 더 폭넓고 손쉽게 사용되어 원활한 정보 교환이 이루어질 수 있다. 본 연구에서는 이를 위하여, EXPRESS 정보를 각각 그에 대응하는 XML DTD와 XML 스키마로 변환하는 방법을 제시한다. EXPRESS의 각 문법 요소들을 분류하고 이 요소들로 인해 발생할 수 있는 복합적인 경우를 고려하여, 이에 대응하는 XML DTD 요소와 XML 스키마 요소로 나타내는 번역 규칙을 제시한다. 또한, 이 번역 규칙에 의해 각각의 경우에 대응하는 XML DTD와 XML 스키마로 변환하는 번역기를 구현한다.

멀티미디어 검색 시스템의 설계 및 구현 (Design and Implementation of Multimedia Retrieval a System)

  • 노승민;황인준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.494-506
    • /
    • 2003
  • 최근 들어 멀티미디어 정보의 사용량이 증가하면서 멀티미디어 데이타베이스로부터 오디오나 비디오, 이미지 둥 다양한 형태의 멀티미디어 컨텐츠를 효과적으로 찾아내는 멀티미디어 검색 시스템의 필요성이 증가하였다. 본 논문에서는 기존의 주석 및 내용 기반 검색 기법을 상호 보완하고 효과적인 멀티미디어 데이타 검색을 지원하는 XML 기반의 새로운 검색 기법과 이를 위한 데이타 모델을 제시한다. 이미지 및 비디오에 대한 데이타 모델은 MPEG-7 표준에 정의되어 있는 멀티미디어 기술 구조(MDS)와 기술 정의 언어인 XML Schema를 사용하여 멀티미디어 데이타의 특성 및 계층구조를 표현하였고 오디오 데이타의 경우 음향 특징들로부터 추출된 음높이를 분석하여 UDR 스트링으로 변환하고 자주 검색된 멜로디의 관리를 통해 검색 성능을 향상하였다. 본 논문에서는 제안된 모델을 기반으로 검색 시스템을 구현하였으며 다양한 실험을 통하여 성능 평가를 하였다.

다중 Tier 온라인 서비스 상에서 대량 데이터 출력 성능 향상을 위한 비동기 통신 기법 (Asynchronous Communication Technique for Heavy Data Output Performance Improvement on Multi Tier Online Service Environment)

  • 김성룡;오재오;조윤호;이상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1195-1198
    • /
    • 2008
  • 본 논문은 다중 Tier 상에서 온라인 서비스 대량 데이타 처리를 빠르고 정확하게 클라이언트에 전달하는 기법을 제안한다. Tier 가 많은 온라인 서비스상에서 대량의 데이타를 빠르게 처리하는 데에는 많은 어려움이 있다. Tier 간 지연 시간의 최소화, 네트워크 대역폭를 고려한 트란잭션(Transaction)의 적절한 분할 통신, 이 기종간의 데이타 변환 시 처리속도 개선 등이 해결해야 할 주요한 요건이라고 할 수 있다. 하지만 이러한 문제들이 해결된다고 해서 괄목할 만한 성능의 개선은 쉽게 나타나지 않는다. 그 이유는 바로 Partial Query에 의한 데이타 통신이 꾸준히 반복 발생하기 때문이다. 온라인 서비스의 특성상 대량 데이타는 많은 사용자의 효율적인 트란잭션 처리를 위하여 분할(Partial) 처리되어 통신하는 방식을 기준으로 사용하고 있다. 이러한 방식을 준수 하기 위해서는 데이타 사이즈에 비례하는 반복의 증가가 불가피하다. 그래서 반복 횟수를 줄이는데 포커스를 두고 온라인 서비스 대량 데이타 처리에 대한 성능 데스트를 진행한 결과 반복이 최소화 될수록 성능은 최대한으로 유지되며, 다른 어떤 기술적인 요소를 개선하는 것보다 큰 효과를 볼 수 있음을 알 수 있었다.

중첩윤곽 형상에 의한 한글패턴의 정점검출 (A Vertex-Detecting of Hanguel Patterns Using Nested Contour Shape)

  • 고찬;이대영
    • 한국통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.112-123
    • /
    • 1990
  • 본 논문은 한글 문자인식을 위하여 중첩형상데이타에 의한 한글 패턴의 굴곡 특징점과 정점검출에 관하여 논한 것이다. 입력된 2진 문자패턴을 거리변환법에 의한 중첩데이타로 변환하고, 데이터의 특성분석에 의한 변환값의 새로운 파일로 구성하였다. 이 두 데이터 파일로 한글 인식에 유용한 정점들을 검출하는 알고리즘을 제안하였다. 이 알고리즘에서는 오인식의 원인이 되는 돌기부분의 제거, 자소 접촉 부분의 분리, 굴곡 특징 변환값에 따른 코드를 부여하도록 하였따. 여기서의 출력은 한글 문자인식에 활용될 수 있는 형태로 하였다.

  • PDF

VLSI /CAD 소프트웨어의 데이타 관리를 위한 계층적 인터페이스 시스템 (Hierarchy Interface System for a Data Management of VLSI/CAD Software)

  • 안성욱
    • 자연과학논문집
    • /
    • 제8권1호
    • /
    • pp.115-121
    • /
    • 1995
  • 기존의 상업용 데이타베이스 시스템들은 복잡한 오브젝트 들의 계층 구조에 의존하며 방대한 양의 데이타를 반복적으로 접근하는 CAD 데이타의 특성을 효과적으로 지원하지 못하여 CAD 데이타베이스의 중요성과 이의 효율적인 관리를 위한 연구의 필요성이 대두되었다. 본 논문에서는 CAD 데이타베이스의 효율적인 관리와 설계 도구들의 통합을 위한 좋은 환경을제공하기 위하여, 계층적 인터페이스 시스템을 설계하고 이의 구현을 위해 CAD 데이타베이스의 특성을 고려한 GROCO 모델을 제시하고자 한다. 배치기와 변환기의 두 개의 서브시스템으로 구성된 계층적 인터페이스 시스템은 CAD 데이타의 효율적인 관리를 위한 빠른 실용화를 위해 기존의 상업용 데이타베이스 관리 시스템과 CAD 도구들을 인터페이스 시키는시스템으로 개발되어 실제 CAD 도구들에 적용하고자 한다. GROCO 모델은 데이타의 의미들을 나타내기 위한 5개의 노드 타입들이 연결되어 방향 주기 그래프를 구성하고 있다. 이 모델은 이질적인 데이타들의 다양한 형태의 모임으로 구성된 복잡한 오브젝트들의 계층구조에 의해 이루어진 CAD 데이타의 특성을 효과적으로 지원하고자 한다.

  • PDF

분산 공간데이타베이스의 위치 불일치 해결을 위한 공간질의영역 변형 (Transformation of Spatial Query Region for Resolving Mismatchs in Distributed Spatial Databases)

  • 황정래;강혜영;이기준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권4호
    • /
    • pp.362-372
    • /
    • 2004
  • 분산 지리정보시스템을 구현하는데 가장 어려운 점 중의 하나는 공간데이타베이스의 불일치이다. 특히, 여러 가지 이유로 발생하는 분산 공간 데이타베이스 사이의 위치 불일치는 공간 질의의 결과를 부정확하게 만든다. 하나의 간단한 해결책은 가장 중요한 사이트에 따라 각 사이트의 공간데이타베이스에 있는 위치 데이타를 보정하는 것이다. 그러나, 이러한 방법은 각 사이트의 자율성이 중시되어야 하는 경우에는 실용적이지 않다. 본 논문에서는 위치 데이타가 불일치하는 여러 개의 공간데이타베이스에 대하여 공간질의를 처리하는 방법을 제시한다. 본 논문에서 제시하는 방법은 각 지역 공간데이타베이스를 수정하지 않고 자율성을 보장하는 방식으로 공간질의를 처리할 수 있도록 한다. 본 논문에서 제안하는 방법은 탄성변형방법을 이용하면서, 각 질의의 위치를 동적으로 변환하는 방법에 기초하고 있다. 이 방법의 정확성은 수학적으로 증명이 되었으며, 실험으로도 확인하였다. 더욱이, 이 방법의 유용성 검증을 위하여 상용 데이타베이스시스템을 이용하여 구현하였다.