• 제목/요약/키워드: 데이터 파편화

검색결과 19건 처리시간 0.03초

서로 다른 시계열 데이터들간 통합 활용을 고려한 해시 함수 기반 학습 모델 관리 플랫폼 (Learning model management platform based on hash function considering for integration from different timeseries data)

  • 유미선;문재원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.45-48
    • /
    • 2022
  • IoT 기술의 발전 및 확산으로 다양한 도메인에서 서로 다른 특성의 시계열 데이터가 수집되고 있다. 이에 따라 단일 목적으로 수집된 시계열 데이터만 아니라, 다른 목적으로 수집된 시계열 데이터들 또한 통합하여 분석활용하려는 수요 또한 높아지고 있다. 본 논문은 파편화된 시계열 데이터들을 선택하여 통합한 후 딥러닝 모델을 생성하고 활용할 수 있는 해시함수 기반 학습 모델 관리 플랫폼을 설계하고 구현하였다. 특정되지 않은 데이터들을 기반하여 모델을 학습하고 활용할 경우 생성 모델이 개별적으로 어떤 데이터로 어떻게 생성되었는지 기술되어야 향후 활용에 용이하다. 특히 시계열 데이터의 경우 학습 데이터의 시간 정보에 의존적일 수밖에 없으므로 해당 정보의 관리도 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 해시 함수를 이용해서 생성된 모델을 계층적으로 저장하여 원하는 모델을 쉽게 검색하고 활용할 수 있도록 하였다.

  • PDF

ICT와 업무의 변화 - 일의 파편화 관점에서 - (ICT and the Changing Nature of Work: Work Fragmentation)

  • 이세윤;박준기;이정우
    • 정보화정책
    • /
    • 제21권1호
    • /
    • pp.35-56
    • /
    • 2014
  • ICT가 도입되면서, 업무의 수행이 예전에 비해서 파편화되고 있다. 파편화는 업무의 연속성을 해친다는 측면에서 생산성에 부정적일 수 있지만, 일의 파편화를 잘 관리하여 조합한다면 업무의 모드를 효과적으로 미래형으로 전환하여 생산성을 향상시킬 수도 있을 것이다. 본 연구에서는 일의 파편화가 어떠한 유형으로 나타나고, 유형에 따라 업무의 특성들은 어떻게 다른지를 조사 분석 하였다. 이러한 연구목적을 달성하기 위해 파편화의 종류와 정도, 그리고 ICT 사용을 포함한 업무의 특성에 관해서 설문을 구성하였고 이를 활용하여 데이터를 수집하였다. 실제 기업 근무자들을 대상으로 수집한 300건의 설문 응답을 분석에 사용하였다. 군집분석을 통해 업무 시간/공간 편중형, 업무 시간 분산형, 업무 공간 분산형, 업무 시간/공간 파편형의 4가지 군집 유형을 도출하였다. 군집별로 업무 영역, 경력, 업무의 특성, ICT 사용에 대한 특성들의 차이를 분석하였다. 결론에서는 이렇게 변화하여 나가고 있는 업무 특성의 본질적인 변화를 수용하기 위해서는 어떠한 정책과 대응책이 필요한지, 본 분석의 시사점들을 중심으로 논의하였다.

서로 다른 특성의 파편화된 데이터 결합 방법 (The way to combine heterogeneous time series data)

  • 문재원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.689-690
    • /
    • 2021
  • 본 논문에서는 다양한 환경에서 수집된 서로 다른 시계열 데이터를 통합하여 분석 활용하기 위해 추가로 생성해야 할 시계열 데이터의 메타 정보를 정의하고 이를 기반하여 새로운 통합 데이터를 생성하는 방법을 소개한다. 시계열 데이터는 표준화된 기술 방법이 없고 다양한 소스에서 생성되기 때문에 이를 통합하고 활용할 경우 그 기준이 없기 때문에 전문적 지식이 없다면 처리에 어려움을 겪는다. 그러므로 서로 다른 특성의 데이터를 새로운 기준에 의거하여 통합하는 것을 목적으로 필요한 메타 정보를 정의하고 이를 기준으로 데이터를 재가공할 수 있도록 하였다.

  • PDF

파편화된 다수 동영상 파일의 동기화 재생 제어 (Synchronized Play Control for Multiple Fragmented Video Files)

  • 김현구;권정웅;남황우;전중남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1600-1602
    • /
    • 2015
  • 이 논문에서는 손상에서 복원 되었거나 기타 이유로 DVR 시스템의 관리에서 벗어난 파편화된 다채널 영상 파일들에 대한 다채널 영상 재생 기법을 제안한다. 이를 위해 영상에 매핑 된 메타데이터에 기반 하여 촬영 시간에 대응되는 올바른 시간적 위상에서 재생될 영상 파일을 실시간으로 불러오고, 재생이나 탐색 중에 시간을 동기화시키는 과정을 수행 한다. 그리고 오픈소스 영상 재생 API인 VLC Player를 활용하여 시스템을 설계 하였고, 구현한 시스템은 상용 DVR 시스템을 사용하지 않고도 다채널 영상 파일을 직관적으로 판독할 수 있는 환경을 제공한다.

전사적 빅데이터를 활용한 서비스 중심적 공공 조직 및 인사 관리 방안 (Service-oriented Public Organizations and Human Resources Based on Enterprise-wide Big Data)

  • 최정희;박승욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.361-362
    • /
    • 2023
  • 본 연구는 공공 조직 및 인사 관리의 새로운 패러다임으로서 서비스 중심적 접근법을 제시하였다. 특히 코로나19 팬데믹 이후의 불확실하고 경쟁적인 환경에서는 파편화된 데이터를 마이크로 서비스화하고 동적으로 재조합하는 것이 중요하며, 이를 실현하기 위한 모델로 KISTI의 ScienceON API Gateway와 시나리오 활용 서비스를 참고하였다. 이러한 접근법은 조직 및 인사 관리의 투명성과 효율성을 높이며, 서비스-이용자 간 상호작용을 강화하고, 조직의 변화를 촉진하는 데 기여할 것으로 기대된다.

바이트 평균의 Gray-Scale화를 통한 Signature가 존재하지 않는 멀티미디어 데이터 조각 파일 타입 분류 연구 (Classification of Non-Signature Multimedia Data Fragment File Types With Byte Averaging Gray-Scale)

  • 윤현호;김재헌;조현수;원종은;김견우;조재현
    • 정보보호학회논문지
    • /
    • 제30권2호
    • /
    • pp.189-196
    • /
    • 2020
  • 일반적으로 시그니처와 파일 메타정보가 없는 파편화된 파일은 복구가 어렵다. 특히 멀티미디어 파일은 파편화 가능성이 크고 높은 엔트로피를 가지고 있으므로 현재 시그니처 기반의 카빙으로는 복구하는 것이 거의 불가능하다. 이러한 문제를 해결하기 위해 파편화된 파일에 대한 연구가 진행되고 있지만 멀티미디어 파일에 대한 연구는 부족한 실정이다. 본 논문은 시그니처(Signature)와 파일 메타정보가 없는 파편화된 멀티미디어 파일의 타입을 분류하는 연구이다. 파일 타입에 따라 특정 바이트 값의 빈도 차이를 통해 각 파일 타입의 특징값을 추출하며, 그에 맞는 Gray-Scale 테이블을 설계하고 CNN(Convolutional Neural Networks) 모델을 이용하여 JPG, PNG, H.264, WAV 총 4가지 멀티미디어의 파일 타입을 분류하는 방법을 제시한다. 본 논문을 통해 시그니처와 파일 메타정보가 없는 파편화된 파일 타입의 분류 연구를 촉진하여 다양한 파일의 복구 가능성을 높일 수 있을 것으로 기대된다.

블록체인 기반 연합학습을 위한 레퍼런스 아키텍처 (A Reference Architecture for Blockchain-based Federated Learning)

  • 고은수;문종현;이광기;손채봉
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.119-122
    • /
    • 2022
  • 연합학습은, 데이터 샘플을 보유하는 다수의 분산 에지 디바이스 또는 서버들이 원본 데이터를 공유하지 않고 기계학습 문제를 해결하기 위해 협력하는 기술로서, 각 클라이언트는 소유한 원본 데이터를 로컬모델 학습에만 사용함으로써, 데이터 소유자의 프라이버시를 보호하고, 데이터 소유 및 활용의 파편화 문제를 해결할 수 있다. 연합학습을 위해서는 통계적 이질성 및 시스템적 이질성 문제 해결이 필수적이며, 인공지능 모델 정확도와 시스템 성능을 향상하기 위한 다양한 연구가 진행되고 있다. 최근, 중앙서버 의존형 연합학습의 문제점을 극복하고, 데이터 무결성 및 추적성과 데이터 소유자 및 연합학습 참여자에게 보상을 효과적으로 제공하기 위한, 블록체인 융합 연합학습기술이 주목받고 있다. 본 연구에서는 이더리움 기반 블록체인 인프라와 호환되는 연합학습 레퍼런스 아키텍처를 정의 및 구현하고, 해당 아키텍처의 실용성과 확장성을 검증하기 위하여 대표적인 연합학습 알고리즘과 데이터셋에 대한 실험을 수행하였다.

  • PDF

온라인 커뮤니티 사용자의 행동 패턴을 고려한 동일 사용자의 닉네임 식별 기법 (A Method for Identifying Nicknames of a User based on User Behavior Patterns in an Online Community)

  • 박상현;박석
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.165-174
    • /
    • 2018
  • 온라인 커뮤니티란 SNS와 달리 사용자들이 닉네임을 통해 익명으로 관심사와 취미를 공유하는 가상 그룹 서비스이다. 그런데 이런 익명성을 악의적으로 활용하는 사용자들이 존재하고, 닉네임의 변경으로 인해 동일 사용자의 데이터가 서로 다른 닉네임에 존재하는 데이터 파편화 문제가 발생할 수 있다. 또한 온라인 커뮤니티에서는 닉네임을 변경하는 일이 빈번하므로 동일 사용자를 식별하는데 어려움을 겪는다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 온라인 커뮤니티 특성을 고려한 사용자의 행동 패턴 특징 벡터를 제시하며, 관계 패턴이라는 새로운 암시적 행동 패턴을 제안함과 동시에 랜덤 포레스트 분류기를 이용한 동일 사용자의 닉네임을 식별하는 기법을 제안한다. 또한 실제 온라인 커뮤니티 데이터를 수집해 제안한 행동패턴과 분류기를 이용해 동일 사용자를 유의미한 수준으로 식별할 수 있음을 실험적으로 보인다.

자연스러운 범용 O2O 애플리케이션 사용자 인터페이스를 위한 상품 정보 자동 분류 (Automatic Classification of Product Data for Natural General-purpose O2O Application User Interface)

  • 이하나;임은수;조영인;윤영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.382-385
    • /
    • 2016
  • 본 논문은 현재 영역 별로 파편화된 여러 O2O(Online to Offline) 서비스들을 통합적으로 제공하기 위해 자연어를 통한 NUI(Natural User Interface)를 개발하여 사용자가 명시한 상품 정보의 항목을 자동으로 분류하고자 한다. 이를 위해 e-commerce 도메인 정보 학습에 적합한 나이브 베이즈 분류(Naive Bayes Classifier) 알고리즘을 사용한다. 학습에는 미국 e-commerce 사이트 Groupon의 상품 정보와 분류 체계를 사용하며, 학습 데이터의 특징을 분석하여 상품 정보에 특화된 학습 데이터 정제 및 TF-IDF(Term Frequency-Inverse Document Frequency)를 통한 단어 별 가중치를 적용하여 알고리즘의 정확도를 향상시킨다.

모바일 포렌식 증거 수집방안 연구: 제조사 백업 앱 기반 데이터 획득 기법 (A Study on Mobile Forensic Data Acquisition Method Based on Manufacturer's Backup Mobile App)

  • 최재원;김승주
    • 정보보호학회논문지
    • /
    • 제28권1호
    • /
    • pp.95-110
    • /
    • 2018
  • 스마트폰의 보급으로 사용자의 다양한 개인정보가 실시간으로 스마트폰에 기록되고 있다. 사용자 데이터의 유실을 방지하고 분실 및 도난, 휴대폰 교체 등에 대응하기 위해 제조사들은 다양한 스마트폰 백업프로그램을 사용자에게 제공한다. 과거 PC 기반의 백업프로그램 뿐만 아니라 현재는 스마트폰에서 직접 실행이 가능한 백업용 모바일 앱을 기본 제공하는 추세이다. 디지털 포렌식 데이터 획득의 관점에서 획득이 가능한지 여부와 원본 데이터의 무결성을 손상되지 않았는지는 중요한 요소이다. 특히 파편화된 안드로이드 스마트폰의 경우 원본 데이터의 무결성을 손상시키지 않으면서 획득 가능하게하기 위한 연구가 다양하게 진행되고 있다. 하지만, 최근 보안이 강화되어 출시되는 스마트폰은 기존 연구된 데이터 획득 기법을 그대로 적용하기에는 어려운 한계점들이 존재한다. 따라서 본 논문에서는 제조사에서 기본으로 제공하는 백업용 모바일 앱을 이용하여 기존 데이터 획득 방법을 그대로 적용하기 어려운 최신 스마트폰을 대상으로 무결성을 훼손시키지 않고 사용자의 데이터를 획득하는 과정에 대해 설명한다.