• 제목/요약/키워드: 데이터학술지

검색결과 1,384건 처리시간 0.029초

클라우드 스토리지 환경에서의 CCTV 데이터 중복제거 수행 기술 연구 (Study on CCTV Data De-duplication in Cloud Storage Environments)

  • 김원빈;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.172-173
    • /
    • 2018
  • CCTV 기술은 실시간으로 영상을 수집하여 저장소에 보관하는 기술을 의미한다. 이러한 환경에서 데이터 저장소의 가용성은 매우 중요하다. 데이터가 축적될수록 스토리지 공간의 확장은 매우 중요해지며, 이를 위해 최근에는 클라우드 스토리지를 이용하여 저장 공간을 비교적 수월하게 확장하고 이용할 수 있는 환경이 제시되고 있다. 하지만 이러한 환경에서도 데이터의 지속된 저장은 저장 공간의 추가 이용을 위한 비용의 증가로 직결되기 때문에 데이터를 효율적으로 저장하기 위한 방안의 논의되었다. 데이터 중복제거 기술은 이러한 기술 중 하나로 데이터의 중복된 저장을 방지하여 스토리지 공간을 보다 효율적으로 이용할 수 있도록 하는 기술이다. 하지만 CCTV 환경에 클라우드 스토리지와 데이터 중복제거 기술을 적용하면서 추가적인 보안 이슈가 발생하였다. 따라서 본 연구에서는 이러한 문제를 해결하기 위한 연구를 수행하며, 이를 통해 보다 효율적인 데이터 저장을 수행하는 동시에 안전하게 데이터를 보관하는 방법을 제안한다.

국내 학술지 출현 학과정보 데이터셋 구축 및 자동분류 (Dataset construction and Automatic classification of Department information appearing in Domestic journals)

  • 김병규;류범종;심형섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.343-344
    • /
    • 2023
  • 과학기술 문헌을 활용한 계량정보분석에서 학과정보의 활용은 매유 유용하다. 본 논문에서는 한국과학기술인용색인데이터베이스에 등재된 국내 학술지 논문에 출현하는 대학기관 소속 저자의 학과정보를 추출하고 데이터 정제 및 학과유형 분류 처리를 통해 학과정보 데이터셋을 구축하였다. 학과정보 데이터셋을 학습데이터와 검증데이터로 이용하여 딥러닝 기반의 자동분류 모델을 구현하였으며, 모델 성능 평가 결과는 한글 학과정보 기준 98.6%와 영문 학과정보 기준 97.6%의 정확률로 측정되었다. 향후 과학기술 분야별 지적관계 분석 및 논문 주제분류 등에 학과정보 자동분류 처리기의 활용이 기대된다.

  • PDF

FCM 클러스터링 기반 지도 학습 알고리즘을 이용한 당뇨병 예측 분석 (Diabetes Predictive Analytics using FCM Clustering based Supervised Learning Algorithm)

  • 박태언;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.580-582
    • /
    • 2022
  • 본 논문에서는 데이터를 정량화하여 특징을 분류하기 위한 방법으로 퍼지 클러스터링 기반 지도 학습 방법을 제안한다. 제안된 방법은 FCM 클러스터링을 기법을 적용하여 군집화를 수행한다. 그리고 군집화 된 데이터들 중에서는 정확히 분류되지 않은 데이터가 존재하므로 분류되지 않은 데이터에 대해 지도 학습 방법을 적용한다. 본 논문에서는 당뇨병의 유무를 타겟 데이터로 설정하고 나머지 8개의 속성의 데이터를 FCM 기반 지도 학습 방법을 적용하여 당뇨병의 유무를 예측한다. 당뇨병 예측에 대한 성능을 30회의 K-겹 교차검증 (K-Fold Corss Validation)을 이용하여 평가하였으며, 다층 퍼셉트론의 경우에는 훈련 데이터가 77.88%, 테스트 데이터가 62.78%로 나타났고 제안된 방법의 경우에는 훈련 데이터가 79.96%, 테스트 데이터 74.16%로 나타났다.

  • PDF

공공 클라우드 환경에 적합한 안전한 데이터 관리 기법 연구 (A Study on Secure Data Management Scheme in Cloud Environment in the Public Sector)

  • 위유경;곽진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.580-583
    • /
    • 2013
  • 하드웨어, 소프트웨어 등 각종 IT 자원을 필요한 만큼 빌려서 사용하고 사용한 정도에 따라 과금이 되는 클라우드 컴퓨팅이 대중적으로 보급됨에 따라 공공 서비스에서의 클라우드 컴퓨팅 활용방안에 대해서 관심이 증가하고 있다. 따라서 다수의 사용자가 하나의 공공 클라우드 스토리지를 사용하는 환경에 적합한 안전하고 효율적인 데이터 관리의 중요성이 요구되고 있다. 그러나 신원이 불분명한 사용자의 공공 클라우드 스토리지 무단접근과 악의적인 목적으로 공공 클라우드에 악성코드가 추가된 데이터의 업로드 및 데이터 위변조 등의 다양한 위협이 존재한다. 따라서 본 논문에서는 공공 클라우드 환경에 적합한 안전한 데이터 관리 기법에 대해 제안한다. 제안하는 기법은 공공 클라우드 서버로부터 인증정보를 전송받아 구성원임을 증명받고, 전송받은 서버 인증정보를 바탕으로 사용자 인증값을 생성하여 데이터와 함께 저장하여 데이터를 보호한다. 따라서 신원이 불분명한 사용자의 접근을 막고, 악의적인 데이터의 클라우드 스토리지 저장을 방지하고, 추가적으로 데이터의 출처를 명확하게 하여 공공 클라우드 스토리지의 신뢰성을 높일 수 있다.

스트림 데이터 처리를 위한 시계열 데이터베이스 병렬 접근 기반 읽기 지연 개선 기법 (Improving Read Latency for Stream Data Processing via Parallel Access of Time Series Database)

  • 황용하;노순현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.44-47
    • /
    • 2018
  • 시계열 데이터 처리를 위해 방대한 양의 데이터를 스토리지에서 빠르게 읽어와 처리하려는 움직임이 많아지고 있다. 이를 위해 스토리지의 read latency 를 개선하기 위한 여러 기법들이 제안되었지만, 이 기법들은 분산 노드의 스토리지 자원을 충분히 활용하지 못한다는 한계가 있다. 따라서 우리는 시계열 데이터를 실시간으로 처리하기 위해 스토리지에 병렬적으로 접근하여 read latency 를 개선하는 기법을 제안한다. 제안된 기법은 분산 환경에서 스토리지에 병렬적으로 접근하여, 각 노드에서 부분적으로 데이터를 읽어와 전체 데이터를 읽어오는 지연시간을 줄인다. 우리는 제안된 기법을 여러 노드로 구성된 분산 환경에서 구현하였다. 제안된 기법을 적용한 결과, 전체 데이터를 읽어오는 read latency 가 기존 기법보다 28.04% 줄어든 것을 확인하였다.

한국과학기술인용 DB를 반영한 JCR 분석연구 (Analysis of Korea Science Citation Database's effect on JCR)

  • 이종욱;양기덕;김병규;류범종
    • 정보관리연구
    • /
    • 제43권3호
    • /
    • pp.23-41
    • /
    • 2012
  • 전 세계적으로 이용되는 인용색인 서비스인 Web of Science(WoS)는 데이터 수록 범위에 한계가 있음이 인용색인 연구에서 지적되어 왔다. 또한 국내 학술논문이 인용하는 해외 문헌의 비율이 전체의 약 75%를 차지한다는 것이 인용패턴 분석연구에서 밝혀진 바 있다. 본 연구에서는 WoS DB의 데이터 수록 범위를 검증하기 위한 첫 번째 단계로써 WoS DB에 포함되어 있지 않은 국내 연구자의 인용문헌 즉, 한국과학기술인용 DB(Korea Science Citation Database: KSCD)에 수록된 참고문헌 데이터 일부를 JCR 학술지 영향력지수 산출과정에 포함시켜 학술지 영향력 지수(Impact Factor: IF)의 변화 및 그에 따른 학술지 순위변동 여부를 조사하였다. 구체적으로 국내 문헌정보학 분야 학술지에 수록된 참고문헌을 JCR 2009 문헌정보학 분야 학술지 IF 산출과정에 포함하였다. 하지만 학술지 IF의 변화와 그에 따른 순위 차이가 통계적으로 유의하지 않았고, 이에 데이터 범위를 넓혀 컴퓨터 공학 및 전자공학 분야 학술지 45종에 수록된 참고문헌을 추가로 분석하여 JCR 2010 전자공학 분야 학술지 IF 산출과정에 포함하였다. 그 결과, 부분적으로 통계적으로 유의한 학술지 순위 변화가 일어났다. 본 연구는 한정된 데이터를 사용하였음에도 불구하고 미미하지만 통계적으로 유의한 JCR 학술지 순위 변동을 보여줌으로써 WoS DB에 포함되지 않은 인용 데이터의 잠재적 가치를 제시하였다.

블록체인 트랜잭션을 활용한 클라우드 스토리지 데이터 책임 추적성 확보 방안 연구 (Framework for Securing Accountability of Cloud Storage Data by using Blockchain Transaction)

  • 박병주;곽진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.326-329
    • /
    • 2017
  • ICT 기술의 발달과 함께 클라우드의 사용이 활발해지고 있으며, 클라우드의 활용성 또한 증가하고 있다. 클라우드는 각각의 활용 용도에 따라 다양한 데이터가 저장되고 있으며, 클라우드 스토리지와 클라우드 스토리지에 저장된 데이터의 중요성 또한 증가하고 있다. 또한, 클라우드를 사용하는 이용자의 수가 증가하며 CSP에 아웃소싱 되는 데이터의 양이 증가하고 있지만, 지속적으로 보안사고가 발생하고 있으며, 신뢰 되지 않는 클라우드 환경에서는 악의적 사용자 또는 CSP에 의해 데이터 액세스 로그가 위조되거나 생략이 가능해 수정 불가능한 로깅 등을 통한 책임 추적성 확보가 필요하다. 따라서 이와 같은 문제를 해결하고 클라우드 스토리지 데이터의 책임 추적성 확보를 위해 본 논문에서는 블록체인 위 변조 불가능한 특성을 활용하여 신뢰 가능한 데이터 액세스 로깅을 통해 데이터 책임 추적성 확보가 가능한 프레임워크를 제안한다.

클라우드 환경에서 속성 재암호 기반의 데이터 공유 기법 (Data Sharing Scheme based on Attribute Re-Encryption in Cloud Computing)

  • 김수현;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.402-403
    • /
    • 2015
  • 클라우드 컴퓨팅 환경에서는 사용자의 데이터를 수많은 분산서버를 이용하여 데이터를 암호화하여 저장한다. 이러한 클라우드 스토리지에 사용자의 수많은 데이터가 저장됨에 따라 클라우드 스토리지의 신뢰성에 문제가 발생하고 있다. 비신뢰적인 관리자 및 공직자로부터 클라우드 서버에 저장된 사용자의 데이터를 안전하게 저장하기 위한 다양한 암호 기술들이 계속해서 연구되고 있다. 하지만 기존의 데이터 암호 기술들은 클라우드 스토리지 상에서 여러 사용자 간의 데이터 공유 서비스에 적용하기 힘든 단점을 가지고 있다. 따라서 본 논문에서는 비신뢰적인 클라우드 스토리지를 고려하여 속성기반 암호로 암호화된 키를 재암호화하여 다른 사용자와 안전하고 효율적으로 공유할 수 있는 데이터 공유기법을 제안한다.

원격 지도 학습 데이터 노이즈 제거를 위해 확장된 최단 의존 경로를 이용한 CNN 기반 관계추출 (A CNN-based Relation Extraction with Extended Shortest Dependency Path for Noise Reduction of Distant Supervision)

  • 남상하;한기종;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.50-54
    • /
    • 2018
  • 관계 추출을 위한 원격 지도 학습은 사람의 개입 없이 대규모 데이터를 생성할 수 있는 효율적인 방법이다. 그러나 원격 지도 학습은 노이즈 데이터 문제가 있으며, 노이즈 데이터는 두 가지 유형으로 나눌 수 있다. 첫 번째는 관계 표현 자체가 없는 문장이 연결된 경우이고, 두 번째는 관계 표현은 있는 문장이지만 다른 관계 표현도 함께 가지는 경우이다. 주로 문장의 길이가 길고 복잡한 문장에서 두 번째 노이즈 데이터 유형이 자주 발견된다. 본 연구는 두 번째 경우의 노이즈를 줄임으로써 관계 추출 모델의 성능을 향상시키기 위해 확장된 최단 의존 경로를 사용하는 CNN 기반 관계 추출 모델을 제안한다. 본 논문에서 제안한 방법의 우수성을 입증하기 위해, 한국어 위키피디아와 DBpedia 기반의 원격 지도 학습 데이터를 수집하여 평가한 결과, 본 논문에서 제안한 방법이 위 문제를 해결하는데 효과적이라는 것을 확인하였다.

  • PDF

PDA 지도 브라우징을 위한 동적 공간 색인 구조 (A Dynamic Spatial Indexing Structure for Map browsing on PDA)

  • 김은영;전봉기;서영덕;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.196-198
    • /
    • 2001
  • 컴퓨터와 통신 기술의 발달은 휴대용 단말기의 기능을 일반 PC의 수준으로 끌어올리며 휴대 단말기의 보급을 가속화하고 있다. 이에 따라 휴대용 무선 단말기에서의 지도서비스에 대한 다양한 요구가 나날이 높아지고 있다. 하지만 지도 서비스에 필수적인 기존의 공간색인은 서버나 PC와 같은 저장용량이 크고 연산처리속도가 높으며 유선망을 통해 다른 서버와 통신하는 컴퓨팅 시스템을 대상으로 하므로 PDA로 대표되는 휴대용 무선 단말기에 적용하기에는 부적할하다. 또한 휴대용 기기의 이동성을 고려할 때, 질의 수행 시 저장되지 않은 지도 데이터는 무선 통신을 이용하여 서버로부터 전송되어져야 한다. 그리고 새롭게 전송된 지도 데이터를 기존에 저장된 지도 데이터에 삽입하기 위해서 색인 재구축 비용이 발생한다. 즉, 서버와 무선통신을 하는 휴대용 단말기에서 지도서비스를 하기 위해서는 휴대 기기에 적합한 데이터 저장 및 색인구조가 필요하다. 이 논문에서는 무선단말기 특히 PDA 환경에서의 벡터지도시스템을 위해 공간 데이터의 최적화된 저장구조와, 비연속적인 다양한 지역에 대한 데이터를 효율적으로 통합.관리하는 동적색인구조를 제시한다.

  • PDF