• 제목/요약/키워드: 데이터 변환화일

검색결과 764건 처리시간 0.029초

인자 점수를 이용한 이상치 데이터의 군집화 (Outlier Data Clustering using Factor Score)

  • 전성해;임민택;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.77-80
    • /
    • 2002
  • 이상치를 포함한 학습 데이터의 군집화 전략은 일반적으로 이상치를 포함하여 학습하거나, 이상치를 제거하는 두 가지 선택이 가능하다. 이상치를 제거하지 않고 학습에 반영시켜야 할 경우 한 개 또는 소수의 이상치가 독자적인 군집을 형성하거나 객관적인 군집화를 방해하는 문제가 발생할 수 있다. 이 때 주어진 학습 데이터의 군집 결과가 이상치의 영향으로부터 벗어나기 위해 원래의 학습 데이터에 대한 변환 작업을 거친 후 군집화를 수행할 수 있다. 이러한 변환 방법으로서 본 논문에서는 차원 축소의 기법으로 알려진 인자 분석의 점수를 사용하였다. 인자 점수로 변환된 학습 데이터에 대해 계층적 군집화, K-means 그리고 자기조직화 지도 등과 같은 군집화 알고리즘을 적용하면 이상치가 자신만의 군집을 별도로 형성하지 않고 다른 학습 데이터의 군집에 소속되면서 이상회의 영향으로부터 벗어남을 실험을 통하여 확인하였다.

  • PDF

비식별 데이터의 유사성 보존에 관한 연구 (A Study on the Preservation of Similarity of privated Data)

  • 강동현;오현석;용우석;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.285-288
    • /
    • 2017
  • 비식별화 모델은 데이터 공유를 위한 모델로 원본데이터를 비식별화 변환 처리하여 개인정보를 보호함과 동시에 분석에 필요한 데이터를 외부에 제공하는 모델로 연구되어 왔다. 변환 방법으로는 삭제, 일반화, 범주화 기술 등이 주로 사용되며 변환 과정 중에는 재식별 가능성을 최소화하기 위해 k-익명성, l-다양성, t-근접성 혹은 differential privacy 등의 프라이버시 모델이 적용되고 있다. 하지만 변환된 비식별 데이터 세트는 필연적으로 원본 데이터 세트와 다른 값을 가지며 이는 결과적으로 최종 분석 결과에 영향을 주게 된다. 이를 위해 두 데이터 세트 간의 차이를 상이도(dissimilarity) 혹은 정보 손실율(information loss)이라는 지표로 측정 하고 있으며 본 지표는 비식별 데이터의 활용성을 평가 하는 데에 매우 중요한 역할을 한다. 본 연구에서는 비식별 데이터와 원본 데이터와 간의 차이를 도메인 기반의 절대적인 기준대비로 표현한 상이도 측정 방법을 제안하며, 그 유효성을 실데이터 기반의 실험을 통해 검증하였다.

건설도면의 GIS 데이터 변환을 위한 건물외곽선 단순화기법 비교 연구 (Comparative Study on the Building Outline Simplification Algorithms for the Conversion of Construction Drawings to GIS data)

  • 박우진;박승용;유기윤
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.437-444
    • /
    • 2008
  • 최근 유비쿼터스 시대를 맞아 건설 분야에서 이용되는 CAD 자료에서 GIS 자료로의 변환 및 융복합에 대한 요구가 증대되면서 상호변환을 위한 연구가 활발하게 진행되고 있다. 본 연구에서는 건설도면 CAD 데이터를 활용하여 수치지도의 건물데이터를 수정, 갱신하기 위한 방법론의 일환으로 건설도면의 건물외곽선을 추출하여 수치지도의 건물데이터 수준으로 일반화하는 선형 단순화 알고리즘을 비교 분석하였다. 선형 단순화 알고리즘은 Douglas-Peucker 알고리즘, Lang 알고리즘, Reumann-Witkam, Opheim 알고리즘을 적용하였으며 분석방법으로는 시각적 분석, 절점 수, 총길이, 면적 변화율 분석 그리고 각 절점이 수치지도 작성내규를 만족하는 비율을 이용하였다. 분석 결과 Douglas-Peycker 알고리즘이 시각적 측면과 절점 수 감소율 측면에서 상대적으로 우수한 단순화 결과를 보여주었으나 수치지도 작성내규 만족도 측면에서는 공통적으로 $50{\sim}60%$ 수준의 만족도를 보이고 있어 국내의 수치지도의 건물데이터를 작성하기 위한 단순화 기법으로는 한계가 있는 것으로 나타났으며 이를 만족시키기 위한 일반화 알고리즘의 개발이 필요하다고 판단된다.

  • PDF

Sync 코드워드의 패리티정보를 이용한 데이터변조 및 DC 억압방법 (The Coding Method Using the Parity of Sync Codeword)

  • 김진한;심재성;정규해;박현수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2172-2175
    • /
    • 2003
  • 본 논문에서는 DC 억압능력이 없거나 부족한 코드에 만족할 만한 DC 억압능력을 갖도록 하기 위한 멀티모드코드 방식을 제안한다. 제안한 멀티모드코드는 데이터열의 다중화를 위해 Pseudo Scrambling Technique를 사용하며, 다중화 된 데이터열의 변조를 위해 DC-free RLL(d, k) Code를 사용하는 특징을 가진다. 제안한 방법에서는 Sync 코드워드의 패리티를 다중화 정보로 사용하여 입력데이터를 2개의 데이터 열로 다중화하고, 2개로 다중화 된 데이터 열에 대해 DC-free RLL(d, k) Code를 사용하여 코드워드로 변환하며, 코드워드로 변환된 2 개의 코드워드 열에 대해 DC 성분이 적은 코드워드 열 하나를 선택하여 변조 스트림으로 출력한다. 본 논문에서는 Sync 코드워드의 패리티를 다중화 정보로 사용하여 별도의 Redundancy를 부가하지 않고 DC 억압성능을 향상시킬 수 있었다.

  • PDF

MMT 기반 V3C 데이터 패킷화 방안 (MMT based V3C data packetizing method)

  • 문형준;김연웅;박성환;남귀중;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.836-838
    • /
    • 2022
  • 3D Point Cloud는 3D 콘텐츠를 더욱 실감 나게 표현하기 위한 데이터 포맷이다. Point Cloud 데이터는 3차원 공간상에 존재하는 데이터로 기존의 2D 영상에 비해 거대한 용량을 가지고 있다. 최근 대용량 Point Cloud의 3D 데이터를 압축하기 위해 V-PCC(Video-based Point Cloud Compression)와 같은 다양한 방법이 제시되고 있다. 따라서 Point Cloud 데이터의 원활한 전송 및 저장을 위해서는 V-PCC와 같은 압축 기술이 요구된다. V-PCC는 Point Cloud의 데이터들을 Patch로써 뜯어내고 2D에 Projection 시켜 3D의 영상을 2D 형식으로 변환하고 2D로 변환된 Point Cloud 영상을 기존의 2D 압축 코덱을 활용하여 압축하는 기술이다. 이 V-PCC로 변환된 2D 영상은 기존 2D 영상을 전송하는 방식을 활용하여 네트워크 기반 전송이 가능하다. 본 논문에서는 V-PCC 방식으로 압축한 V3C 데이터를 방송망으로 전송 및 소비하기 위해 MPEG Media Transport(MMT) Packet을 만드는 패킷화 방안을 제안한다. 또한 Server와 Client에서 주고받은 V3C(Visual Volumetric Video Coding) 데이터의 비트스트림을 비교하여 검증한다.

  • PDF

3D 공간정보 데이터 포맷 변환 및 시각화 도구 개발 (Development of the Data Conversion and Visualization Tool for 3D Spatial Information)

  • 강병준;진식;;이재호;김인현
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.123-129
    • /
    • 2008
  • 본 연구에서는 국내 3차원 공간정보 데이터 표준 포맷인 3DF-GML 데이터 모델의 데이터 구조 분석을 수행하였다. 또한 3DF-GML 데이터 포맷과 기존 공간정보 데이터 포맷과의 전환 가능성을 검토하여 기존에 구축된 공간정보간의 연계 및 전환 가능성을 분석하였다. 이러한 분석 결과를 바탕으로 Shape파일, 3DS 데이터와 3DF-GML 데이터 간의 포맷 변환 도구를 개발하였으며, 변환된 3DF-GML 데이터의 유효성 검증을 위한 3DF-GML 가시화 도구를 개발하였다. 본 연구에서 제시한 3차원 공간정보 데이터 변환 및 가시화 도구는 국내 3차원 표준 포맷인 3DF-GML의 변환 및 가시화 기능을 제공해줌으로써, 다양한 응용 분야에서 3차원 공간정보 데이터 사용의 활성화에 크게 기여할 수 있을 것으로 기대한다.

  • PDF

XPATH를 이용하여 관계형 데이터를 XML문서로 출판 (Publishing Relational Data to XML Using XPATH)

  • 남궁숙;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.55-57
    • /
    • 2002
  • XML은 확장성, 호환성, 정보의 구조화의 우수성으로 인터넷상에서 정보 교환의 표준으로 자리 매김하고 있다 그러나 대부분의 비즈니스 데이터는 관계형 데이터베이스 시스템에 저장되어 있고 앞으로도 상당한 기간 동안 그러할 것이다. 이에 따라. 관계형 데이터를 XML 문서로 변환, 출판하기 위한 연구가 활발히 진행 중이다. 본 연구에서 관계형 데이터를 XPATH 질의어를 동하여 검색하고 XML 문서로 변환하기에 적합하도록 관계형 데이터베이스의 저장 스키마를 설계하였다. 그리고, XPATH 질의어를 SQL 문장으로 변환하여 관계형 데이터를 검색하였고, 질의 결과를 DOM 형식의 XML 문서로 생성하였다.

  • PDF

시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 (A Single Index Approach for Subsequence Matching that Supports Normalization Transform in Time-Series Databases)

  • 문양세;김진호;노웅기
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.513-524
    • /
    • 2006
  • 정규화 변환은 시계열 시퀀스를 구성하는 엔트리들의 전체적인 패턴을 분석하는데 매우 유용하다. 본 논문에서는 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 다양한 길이의 질의 시퀀스를 지원하기 위하여 여러 개의 색인을 생성해야 하고, 이에 따라 색인 저장 공간의 오버헤드와 색인 관리의 오버헤드가 발생한다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 질의 시퀀스에 대한 정규화 변환을 지원하는 효율적인 서브시퀀스 매칭 방법을 제안한다. 이를 위하여, 우선 정규화 변환을 일반화한 포함-정규화 변환(inclusion-normalization transform) 개념을 제시한다. 포함 정규화 변환이란 색인에 저장할 윈도우에 대해서 해당 윈도우를 포함하는 서브시퀀스의 평균과 표준편차로 정규화하는 것으로서, 기본적인 정규화 변환을 윈도우 및 서브시퀀스 개념을 사용하여 확장한 것이다. 다음으로, 포함-정규화 변환을 기존 서브시퀀스 매칭 연구에 적용하기 위한 이론적 근거를 정리로서 제시하고 증명한다. 그리고, 이 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시한다. 실제 주식 데이터에 대한 실험 결과, 제안한 방법은 기존 방법에 비해 최대 $2.5{\sim}2.8$배까지 성능을 향상 시킨 것으로 나타났다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 정규화 변환 이외의 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있다. 따라서, 제안한 방법은 정규화 변환을 포함하는 많은 다른 종류의 변환을 지원하는 서브시퀀스 매칭에 폭넓게 적용될 수 있는 좋은 연구결과라 사료된다.

루프 분산, 교환, 펼침 , 스칼라화에 기초한 데이터 지역성 개선을 위한 프로그램 변환체계 (A Program Transformation Framework for Improving Data Locality Based on Loop Distribution , Interchange, Unrolling, and Scalarization)

  • 우덕균;표창우;윤석한
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권4호
    • /
    • pp.557-567
    • /
    • 1999
  • 본 논문은 데이터 캐시를 효과적으로 사용하기 위하여 개발된 원시 프로그램의 루프 변환체제에 대하여 논하고 있다. DIUS로 명명된 이 체계는 외부 루프 펼침을 중심으로 루프 분산, 교환이 선행되고 , 마직막에 스칼라화가 적용되는 변환체계이다. 루프 교환은 회전 공간이 루프 단위로 변형되어 전반적으로 캐시 재사용 기회를 높이지만 일부 배열 참조에 대해서는 오히려 재사용 기회를 감소시킨다. 본 연구에서는 이 문제를 외부 루프 펼침으로 해결하였다. 외부 루프 펼침과 루프 교환을 루프 몸체의 문장들에 선별적으로 적용하기 위하여 루프 분산을 도입하였다. 외부 루프 펼침을 적용하면 배열 참조를 스칼라 참조로 변환하는 스칼라화의 효과가 증대되어 레지스터 사용의 효율성이 높아진다. SPEC CFP95 벤치마크에 대하여 DIUS를 적용한 결과 기하학적 평균으로 속도 향상 1.10을 얻었으며, 특정 프로그램들은 모두 캐시 미스수가 줄어들었음을 확인하였다. 이와 같은 성능향상은사용된 루프 변환기법들이 갖는 캐시와 레지스터의 효율적인 사용에 기인한다.

기본적인 SCORM 콘텐츠의 모바일 적응화 (Mobile Adaptation for Basic SCORM Contents)

  • 심진욱;장병철;이승욱;차재혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.757-760
    • /
    • 2004
  • 유비쿼터스 시대의 도래에 발맞춰 유저가 콘텐츠를 이용하는 방법과 사용하는 기기는 PC에 머물지 않고 점차 다양화, 소형화 되고 있다. 최근, 많은 콘텐츠 중에서 e러닝 콘텐츠에 대한 관심은 높아지고 있으며, 본 논문에서는 e러닝 콘텐츠를 다양한 디바이스에 적합한 콘텐츠로 동적 변환하는 모듈을 제안한다. CC/PP 기반의 디바이스 프로파일과 사용자 정보를 포함한 유저 프로파일, 콘텐츠 구성정보를 가진 콘텐츠 프로파일을 통합하여 특성을 추상화 한다. 추상화 된 프로파일을 기반으로 변환방법을 생성하여 콘텐츠에 적용함으로서 해당 디바이스에 적합한 콘텐츠로 적응화 한다. 기존 HTML의 경우 잘 구성된(Well-formed)문서가 아닌 경우가 많고, 문서 내에 데이터와 구조정보를 모두 포함하고 있으므로, 요구되는 데이터의 추출과 정형화된 변환룰의 적용에 어려움이 따른다. 그 대안으로 본 적응화 모듈은 문서의 데이터와 표현 구조를 분리 할 수 있는 XML/XSL 기반의 콘텐츠를 대상으로 하고 있으며, e러닝 콘텐츠의 특성에 적합한 콘텐츠 프리패치 및 캐시 기법을 적용하여 콘텐츠 동적변환에 따른 응답시간 오버헤드를 최소화 하였다.

  • PDF