• 제목/요약/키워드: 식별데이터

검색결과 1,576건 처리시간 0.033초

금융데이터의 성능 비교를 통한 연합학습 기법의 효용성 분석 (Utility Analysis of Federated Learning Techniques through Comparison of Financial Data Performance)

  • 장진혁;안윤수;최대선
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.405-416
    • /
    • 2022
  • AI기술은 데이터 기반의 기계학습을 이용하여 삶의 질을 높여주고 있다. 기계학습을 이용시, 분산된 데이터를 전송해 한곳에 모으는 작업은 프라이버시 침해가 발생할 위험성이 있어 비식별화 과정을 거친다. 비식별화 데이터는 정보의 손상, 누락이 있어 기계학 습과정의 성능을 저하시키며 전처리과정을 복잡하게한다. 이에 구글이 2017년에 데이터의 비식별화와 데이터를 한 서버로 모으는 과정없이 학습하는 방법인 연합학습을 발표했다. 본 논문은 실제 금융데이터를 이용하여, K익명성, 차분프라이버시 재현데이터의 비식별과정을 거친 데이터의 학습성능과 연합학습의 성능간의 차이를 비교하여 효용성을 분석하였으며, 이를 통해 연합학습의 우수성을 보여주고자 한다. 실험결과 원본데이터 학습의 정확도는 91% K-익명성을 거친 데이터학습은 k=2일 때 정확도 79%, k=5일 때76%, k=7일 때 62%, 차분프라이버시를 사용한 데이터학습은 𝜖=2일 때 정확도 52%, 𝜖=1일 때 50%, 𝜖=0.1일 때 36% 재현데이터는 정확도 82%가 나왔으며 연합학습의 정확도는 86%로 두번째로 높은 성능을 보여 주었다.

데이터 분석 기반 운전자 프로파일링 연구 동향

  • 곽병일
    • 정보보호학회지
    • /
    • 제33권4호
    • /
    • pp.41-46
    • /
    • 2023
  • 운전자의 편의성 및 안정성 향상을 위해, 차량에 탑재되는 다양한 센서 및 전자제어장치들은 주행 중 많은 양의 데이터들을 생성한다. 이렇게 생성된 많은 양의 데이터들의 분석은 개인화 서비스, 자동차 보험, 사고 예측와 같은 곳에 활용되고 있다. 최근 주행 중의 다양한 데이터 종류와 머신러닝 및 딥러닝 기반의 방법론을 통해 차량의 운전자를 식별하는 연구들이 진행되고 있다. 본 고에서는 차량에서의 데이터 분석에 기반한 운전자 식별 연구 동향을 설명하도록 하겠다.

소량 및 불균형 능동소나 데이터세트에 대한 딥러닝 기반 표적식별기의 종합적인 분석 (Comprehensive analysis of deep learning-based target classifiers in small and imbalanced active sonar datasets)

  • 김근환;황용상;신성진;김주호;황수복;추영민
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.329-344
    • /
    • 2023
  • 본 논문에서는 소량 및 불균형 능동소나 데이터세트에 적용된 다양한 딥러닝 기반 표적식별기의 일반화 성능을 종합적으로 분석하였다. 서로 다른 시간과 해역에서 수집된 능동소나 실험 데이터를 이용하여 두 가지 능동소나 데이터세트를 생성하였다. 데이터세트의 각 샘플은 탐지 처리 이후 탐지된 오디오 신호로부터 추출된 시간-주파수 영역 이미지이다. 표적식별기의 신경망 모델은 다양한 구조를 가지는 22개의 Convolutional Neural Networks(CNN) 모델을 사용하였다. 실험에서 두 가지 데이터세트는 학습/검증 데이터세트와 테스트 데이터세트로 번갈아 가며 사용되었으며, 표적식별기 출력의 변동성을 계산하기 위해 학습/검증/테스트를 10번 반복하고 표적식별 성능을 분석하였다. 이때 학습을 위한 초매개변수는 베이지안 최적화를 이용하여 최적화하였다. 실험 결과 본 논문에서 설계한 얕은 층을 가지는 CNN 모델이 대부분의 깊은 층을 가지는 CNN 모델보다 견실하면서 우수한 일반화 성능을 가지는 것을 확인하였다. 본 논문은 향후 딥러닝 기반 능동소나 표적식별 연구에 대한 방향성을 설정할 때 유용하게 사용될 수 있다.

GA-FS를 이용한 GAS 식별 시스템 설계 (Design of GAS Identification System using GA-FS)

  • 방영근;심재선;변형기;이철희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.1774-1775
    • /
    • 2011
  • 퍼지이론은 비선형적 데이터의 취급에 있어 강력한 수단이 될 수 있으며, 본 논문에서는 퍼지시스템을 인간의 후각을 모사한 GAS 식별 시스템의 설계에 적용하였다. 먼저, 다수의 센서들의 특성 분석에 따라 GA를 이용하여 그룹화를 시킨 후 각각의 그룹들에서 나타나는 데이터들의 특성에 맞게 퍼지시스템을 설계하여, 센서들의 유동적 특성에 따른 조합과 퍼지시스템의 비선형 데이터에 대한 기술능력을 모두 수용할 수 있는 식별 시스템을 설계하였다. 마지막으로 성능 검증을 통해 하나의 퍼지시스템을 선택함으로써, 유동적 특성이 큰 센서들의 성능을 배제할 수 있도록 하여 보다 정확한 식별이 가능하도록 시스템을 설계 하였다.

  • PDF

ATM Adaptation Layer Type 2 스위칭을 위한 소프트웨어 스위치 서버 구현 (Software ATM Switch Server for ATM Adaptation Layer Type 2)

  • 신동훈;김태석;권택근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.180-182
    • /
    • 2000
  • 기존의 ATM(Asynchronous Transfer Mode) 스위치는 하나의 셀 안에 하나의 음성 데이터를 전송하는 방식이었다. 이러한 방식으로는 적은 양을 갖는 실시간 가변 비트율의 음성 데이터의 서비스를 제공하기에는 비효율적이었다. 이에 ATM 네트워크에서 사용자에게 실시간 가변 비트율로, 적은 양의 음성 데이터를 멀티플랙싱하여 하나의 ATM 셀의 유료부하에 실어 보내는 방식인 AAL2(ATM Adaptation Layer Type 2) 프로토콜의 표준화가 이루어졌다. AAL2 스위치 서버는 AAL2 프로토콜로 인코딩된 ATM 셀을 스위칭하기 위해서 개발되었다. AAL2 스위치 서버는 CPS(Common Part Sublayer) 패킷을 추출해내는 부분과 CPS 패킷의 식별자를 갖고 식별자 스위칭하는 부분, 그리고 스위칭이 끝난 식별자를 갖는 CPS 패킷을 ATM 셀로 만들어 ATM 네트워크를 통해서 전송하는 부분으로 나뉜다. AAL2 스위치 서버를 3개의 부분으로 나누는 이유는 셀을 전송받는 부분과, 식별자 스위칭하는 부분, 다시 셀을 전송하는 부분으로 나누어 병렬 처리를 함으로써 스위치의 성능을 향상시킨다. 이 논문에서는 AAL2 스위치 서버를 구현하고, 그 활용방안에 대해서 알아보도록 한다.

  • PDF

구간 신경망에 의한 구간 벡터의 식별 (Classification of Interval Vectors by Interval Neural Networks)

  • 권기택
    • 한국산업정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.1-6
    • /
    • 2001
  • 본 논문에서는 구간 데이터 식별을 위한 구간 신경망의 학습 알고리즘을 제안한다. 제안된 기법은 각 데이터의 속성치가 구간으로 주어져 있는 경우의 패턴 식별 문제에 적용된다. 먼저, 구간 입력 벡터를 다루기 위한 구간 신경망의 구조를 제안하고, 평가 함수를 이용하여 학습 알고리즘을 도출한다. 평가 함수는 구간 신경 망으로부터의 구간 출력과 대응하는 목표 출력을 이용하여 정의된다. 마지막으로 컴퓨터 시뮬레이션에 의해 제안 기법의 구간 데이터 식별 능력을 나타내고, 통상의 역전파 신경망을 이용 기법과 비교한다.

  • PDF

지오센서 태그 데이터의 효율적인 처리를 위한 색인 기법 (High Performance Query Processing for Diverse Logistics Information Unit)

  • 전승우;김기홍;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.181-184
    • /
    • 2010
  • RFID 미들웨어에서 저장소 역할을 하는 EPCIS는 이전까지 물품의 식별 정보만을 저장 및 관리하고 있었다. 하지만, 최근에는 많은 물류 분야의 응용에서 물품의 식별 정보뿐만 아니라 센서 및 위치 정보 등을 포함하는 다양한 물류 정보를 EPCIS에서 저장 및 관리하도록 요구하고 있다. 하지만, 현재 EPCIS에서는 RFID 태그의 식별 정보 이외의 정보에 대하여 처리를 하지 않고 있으며, 설령 처리한다하더라도 비효율적인 조인으로 인한 속도 저하가 일어날 수 있다. 즉, 각 정보 소자에 대한 복합 정보를 요구하는 응용에서는 개별적인 시스템에 질의를 한 후 결과를 조합해야 하는 부담이 있다. 본 논문에서는 물품의 식별 정보, 센서 및 위치 정보를 포함하는 지오센서 태그 데이터에 대한 효율적인 처리를 지원하기 위한 다양한 물류 환경의 정보와 질의 조건의 특징을 분석하며, 분석된 내용을 바탕으로 데이터 모델링을 제시한다.

  • PDF

마이크로어레이 데이터의 게놈수준 분석을 위한 퍼지 패턴 매칭에 의한 유전자 필터링 방법 (A gene filtering method based on fuzzy pattern matching for whole genome microarray data analysis)

  • 이선아;이건명;이승주;김원재;김용준;배석철
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.145-148
    • /
    • 2007
  • 생명과학분야에서 마이크로어레이 기술은 세포에서의 RNA 발현 프로파일을 관찰할 수 있도록 함으로써 생명현상의 규명 및 약물개발 둥에서 분자수준의 생명현상에 대한 관찰과 분석이 가능 해지고 있다. 마이크로어레이 데이터분석에서는 특정한 처리나 과정에서 현저한 특성을 보이는 유전자를 식별하기 위한 분석뿐만 아니라 유전자 전체인 게놈수준에서의 분석도 이루어진다. 최근 유전자의 발현이 다양한 조절, 신호전달 및 대사경로에 의해서 영향을 받고 있다는 관점에서 게놈수준의 분석에 관심이 증가하고 있다. 약물반응 실험에서는 약물에 대한 게놈수준의 발현 프로파일을 관찰하는 것도 많은 정보를 제공할 수 있다. 약물실험에서는 대조군과 실험군들간에 관심 있는 상대적인 발현특성을 갖는 유전자군을 전체적으로 추출하는 것이 필요한 경우가 있다. 예를 들면 정상군은 두개의 실험군에 대해서 중간청도의 발현정도를 갖는 유전자군을 식별하는 분석을 하는 경우, 생물학적인 데이터의 특성상 절대값을 비교하는 방법으로는 유용한 유전자들을 효과적으로 식별해 낼 수 없다. 이 논문에서는 정상군과 실험군들의 발현정도값의 경향을 판단하기 위해서 각 유전자에 대해서 집단별 대표값을 선정하여 퍼지집합으로 집단의 값의 범위를 결정하고, 이를 이용하여 특정 패턴을 갖는 유전자들을 식별해내는 방법을 제안하고, 실제 데이터를 통해서 실험한 결과를 보인다.

  • PDF

대화형 텍스트 데이터 내 개인정보 식별에 대한 연구 (A Study on Identifying Personal Information on Conversational Text Data)

  • 차도현;권보근;윤희창;이구협;주종화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.11-13
    • /
    • 2022
  • 데이터 3 법을 필두로, 기업은 개인정보가 포함된 데이터를 활용하기 위해 비식별 처리가 필요하게 되었다. 기존 방식은, 비정형 텍스트 데이터에서 정규표현식을 통한 개인정보 식별은 데이터의 다양성에 의해 한계가 명확하며, 기존의 Named Entity Recognition(NER) 태스크로 해결하기에는 언어의 중의적 표현과 2 인 대화에서 나타나는 개인정보가 누구의 것인지 판단하지 못한다는 한계가 존재한다. 따라서 우리는 기존의 한계점을 극복하고 개선하기 위해 BERT 언어 모델에 화자 정보를 학습시키고, 하나의 어절에 2 개의 tag 를 labeling 하는 방법을 제안하여 정확한 개인정보 식별을 시도하였다.

신경회로망을 이용한 화자 식별 (Speaker Identification using Neural Network)

  • 황영수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.383-387
    • /
    • 1998
  • 신경회로망을 이용한 화자 식별에 대한 논문으로서, 화자 식별을 하기 위하여, 신경회로망중 패턴 인식의 성능이 우수하다는 ARTMAP을 이용하여 화자 식별 성능을 검토하였다. 본 논문에서 화자 식별 실험에 사용한 데이터는 25.6ms 와 51.2ms 구간의 모음들을 사용하였다. 실험 결과, 입력 모음에 따라 80.7%에서 98%까지의 인식률을 보였으며, 모음 '이'의 인식 결과가 화자 식별시 가장 좋은 결과를 보였다.

  • PDF