• 제목/요약/키워드: 데이터 검증

검색결과 7,195건 처리시간 0.044초

반전역(Semi-Global) 문자 정열을 이용한 비속어 수집 기법 (A Collecting Method for Swear Words Using Semi-Global Text Alignment)

  • 김성환;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.414-417
    • /
    • 2011
  • 단어 필터링 기법의 개발에 있어서 가장 큰 난제는 정상단어를 금지어로 인식하여 이를 차단하는 오탐지 문제이다. 이를 방지하기 위하여 다양한 문장에 대한 면밀하고 광범위한 검사가 필수적이나 일반적으로 쉽게 접근할 수 있는 데이터는 주로 단어 위주로 구성된 검증 데이터로 문장 또는 구절로 구성된 데이터의 양은 실제 검증에 활용하기에는 충분하지 못하다. 본 논문에서는 웹에서 수집한 방대한 양의 말뭉치 데이터에 반전역정열(Semi-Global Alignment)을 적용하여 주어진 금지어가 사용되거나 금지어와 유사한 단어가 존재하는 구간을 탐색함으로써 단어 필터링 시스템에서 범용적으로 사용될 수 있는 문장형 평가 데이터를 수집하는 시스템을 제안하고 해당 기법을 통하여 수집한 문장 단위 데이터를 분석하고 단어 필터링 시스템이 오탐지 방지를 위해 가져야할 요소들에 대하여 검토해 본다.

실시간 데이터 예측을 위한 인공지능 분석 방법 연구 (A Study on the Analysis Method of Artificial Intelligence for Real-Time Data Prediction.)

  • 홍필두
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.547-549
    • /
    • 2021
  • 인공지능 분석에서 모델을 만들고 이를 검증하는 과정은 이미 생성된 데이터를 가지고 수행하는 Batch Processing이기에 연산 처리시간이 필요한 작업이다. 우리는 주식이나 국방 정보와 같은 실시간으로 발생하는 데이터를 바로 앞에서 발생한 데이터를 가지고 실시간으로 모델을 세우고 검증하여 예측하는 것이 필요하다. 이를 위한 해결책으로, 인공지능 모델링 작업에 필요한 데이터를 시간 처리 순으로 분할하고 데이터를 여러 프로세스에서 분산 처리하는 기법을 적용하여 해결하였다.

  • PDF

독립된 데이터셋을 활용한 효율적인 딥러닝 기반 비프로파일링 부채널 분석 방안 (Efficient Non-Profiled Deep Learning-based Side-Channel Analysis with Independent Dataset)

  • 김주환;문혜원;김연재;박아인;한동국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.169-172
    • /
    • 2020
  • 비프로파일링 부채널 분석은 프로파일링 장비가 없는 환경에서 부채널 정보를 이용해 비밀정보를 분석하는 방법이다. 기존에 알려진 Timon의 비프로파일링 분석은 학습 데이터 집합만을 이용해 공격하므로 전력 파형의 수가 제한된다면 과적합이 발생하여 키 분석 성능이 떨어질 수 있다. 본 논문에서는 비프로파일링 환경에서의 딥러닝 기반 부채널 분석 성능을 향상시키기 위해 학습 데이터 집합과 독립적인 검증 데이터 집합을 활용해야 하는 실증적 근거를 제시한다. 이에 대한 실험으로 기존 기법과 제시한 기법의 성능을 비교해 봤을 때, 검증 데이터를 활용하면 더 적은 데이터로 비밀키 추출이 가능함을 보인다.

데이터 갱신요청의 연속성과 빈도를 고려한 개선된 핫 데이터 검증기법 (Improved Hot data verification considering the continuity and frequency of data update requests)

  • 이승우
    • 사물인터넷융복합논문지
    • /
    • 제8권5호
    • /
    • pp.33-39
    • /
    • 2022
  • 모바일 컴퓨팅 분야에서 사용되는 저장장치는 저전력, 경량화, 내구성 등을 갖추어야 하며 사용자에 의해 생성되는 대용량 데이터를 효과적으로 저장 및 관리할 수 있어야 한다. 낸드 플래시 메모리는 모바일 컴퓨팅 분야에서 저장장치로 주로 사용되고 있다. 낸드 플래시 메모리는 구조적 특징 때문에 데이터 갱신요청 시 제자리 덮어쓰기가 불가능하여 데이터 갱신요청이 자주 발생하는 요청과 그렇지 않은 요청을 정확히 구분하여 각 블록에 저장 및 관리함으로써 해결할 수 있다. 이러한 데이터 갱신요청에 분류기법을 핫 데이터 식별 기법이라고 하며 현재 다양한 연구가 진행되었다. 본 논문은 더 정확한 핫 데이터 검증을 위해 카운팅 필터를 사용하여 데이터 갱신요청 발생을 연속적으로 기록하고 또한 특정 시간 동안 요청된 갱신요청이 얼마나 자주 발생하는지를 고려하여 핫 데이터를 검증한다.

특징벡터간의 유사도 측정을 통한 홍채 검증 (Human Iris Verification Using Similarity between Feature Vectors)

  • 이종인;조성원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.297-300
    • /
    • 2000
  • 현재 연구되어지고 있는 홍채인식 시스템의 일반적인 구성을 보면 영상획득, 전처리, 특징추출, 인식/검증의 네 단계를 거치게 된다. 이 과정에서 최후 본인여부의 판단이 내려지는 것은 인식/검증의 마지막 단계인데, 전체 등록된 사용자의 수가 적을 경우 인식 방법을 통해 사용자를 확인할 수 있게 되어 그 정확도가 상당히 높을 수 있다. 하지만 등록된 사용자의 수가 많은 경우 인식방법에는 무리가 따르게 된다. 이에 따라 전자상거래와 같은 다수의 사용자를 보유하게 되는 시스템에서는 사용자 아이디를 함께 입력받아 본인 여부를 판단하는 검증 방법을 사용하는 것이 빠르고 효과적이라 할 수 있다. 본 논문에서는 기존에 사용되어지던 특징벡터의 일치율 또는 해밍 거리를 통한 검증방법에서 나아가 저용량 특징벡터에 적합하도록, 홍채영상으로부터 추출된 특징에 대해 적절한 양자화와 가중치를 두어 각 특징벡터 간의 내적을 통해 유사도를 측정함으로써 본인의 데이터와 타인의 데이터간의 차이를 크게 하여 향상된 성능의 홍채인식 시스템을 구현하는 방법을 제안한다.

  • PDF

신경망을 이용한 번호판 영역 검증에 관한 연구 (A Study of Car Plate Verification using Neural Network)

  • 강동구;이병모;최선아;김성우;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.667-669
    • /
    • 2002
  • 번호판 인식은 번호판 영역 추출 세그멘테이션, 인식의 3단계로 나눈다. 일반적으로 번호판 영역을 검출하는 과정에서 여러 후보영역이 추출되는데 검증 과정을 통해 그 중 하나를 선택한다. 따라서 적절한 검증 방법은 번호판 인식의 신뢰성을 높히기 위해 필수적이다. 본 논문은 다층 신경망에 사용하는 대표적인 알고리즘 중 하나인 역전과 알고리즘을 이용하여 번호판 후보 영역을 검증하는 방법을 제시한다. 신경망을 통한 학습을 위해 우선 적절한 훈련 이미지를 수집해야한다. 특히 번호판 이미지가 아닌 훈련 데이터를 수집하는 것은 어려운 문제이다. 본 논문에서는 효과석인 훈련 데이터 수집의 방법과 특징 벡터 생성에 대하여 제안하고 이 방법의 효용성을 실험을 통하여 검증한다.

  • PDF

우주활용을 위한 데이터 인터페이스 시뮬레이터의 하드웨어 접속 구현 및 시험

  • 김종우;서석배;이주희;임현수;최기혁;최해진
    • 한국우주과학회:학술대회논문집(한국우주과학회보)
    • /
    • 한국우주과학회 2003년도 한국우주과학회보 제12권2호
    • /
    • pp.65-65
    • /
    • 2003
  • 본 논문에서는 국제우주정거장의 데이터 인터페이스 구현 및 시험을 위하여 1553B와 FDDI 하드웨어를 이용한 시뮬레이터를 제작하였다. 데이터 인터페이스 시뮬레이터는 국제우주정거장과 탑재모듈에 대한 시뮬레이터와 탑재모듈의 제어부분, 상태를 확인하기 위한 모니터링 부분으로 구성되어진다. 국제우주정거장 시뮬레이터는 탑재모듈에 명령을 내리고 상태데이터를 받아 분석하며 탑재모듈에서 수집된 데이터를 수신하여 저장하는 기능을 갖는다. 탑재모듈은 국제우주정거장에서 오는 탑재 수집 데이터를 받아 분석/수행하고 탑재모듈에서 수집된 데이터를 시뮬레이션 하는 기능을 가지며, 모니터링 시스템은 데이터 통신간의 인터페이스 속도나 상태 등을 분석하고 전체적인 그래픽 인터페이스를 제공한다. 본 논문에서는 기존의 PC환경에서 직렬통신과 TCP/IP를 이용하여 시뮬레이션 한 것을, PCI 카드 타입의 1553B와 FDDI 데이터 인터페이스 하드웨어를 이용하여 구현하고 시험하였다. 시뮬레이터 시험 및 검증을 위해서 4가지 타입의 명령을 만들었으며, 국제우주정거장 모듈에서 명령을 내리면 탑재모듈에서 해당 명령을 수행하는 과정을 GUI 환경의 프로그램으로 모니터링 하여 검증하였다. 본 연구를 통하여 국제우주정거장과 탑재모듈 간의 요구사항 분석, 데이터 인터페이스 포맷 정의, 데이터 인터페이스 하드웨어 환경 구현 등의 성과가 있었으며, 추후 탑재모듈 특성이나 국제우주정거장의 구체적인 기능 추가에 의해 탑재모듈 개발을 위한 ETB로 활용할 수 있을 것으로 기대된다.

  • PDF

무인 수상정 전자 장치를 위한 통신 미들웨어 설계 및 구현 (Design and Implementation of a Communication Middleware for Electronic Devices of Unmanned Surface Vehicle)

  • 배종윤;최훈
    • 스마트미디어저널
    • /
    • 제8권3호
    • /
    • pp.53-61
    • /
    • 2019
  • 본 논문에서는 카메라 및 다양한 센서가 복합되어 고속의 데이터를 다중으로 처리하는 성능을 요구하는 전자광학장비의 안정적인 데이터 전송을 위해 Event 기반의 동기화 방식을 통한 Multi-Thread 환경의 다중 통신 미들웨어 설계 및 구현 방법을 제안하였다. 구현된 통신 미들웨어의 성능 검증을 위해 영상 데이터 및 센서 데이터를 전송하여 송신 주기 대비 수신 주기에 대한 차이를 비교하고, 다중으로 전송 및 처리할 수 있는 최대 통신 가능 수를 측정 및 분석하였다. 또한 전송되는 데이터의 무결성 검증과 Round Trip Time 측정 등의 실험을 통해 제안하는 통신 미들웨어의 성능을 검증하였다.

제품데이터품질(PDQ) 평가에 따른 함정 제품모델의 형상 품질검증 자동화 초기 시스템 (Initial System for Automation of PDQ-based Shape Quality Verification of Naval Ship Product Model)

  • 오대균;황인혁;류철호;이동건
    • 해양환경안전학회지
    • /
    • 제20권1호
    • /
    • pp.113-119
    • /
    • 2014
  • 우리 해군은 함정 제품모델(Naval Ship Product Model, NSPM)을 중심으로 하는 협업 제품개발 환경 구축을 통해 설계 데이터의 재사용성과 M&S의 활용도를 높이고 있다. 그 결과 설계결과의 신뢰성이 높아지고 있으며, 이를 활용한 운영, 건조 시뮬레이션을 통해 소요군의 요구사항이 면밀히 반영되도록 하는 연구도 진행 중에 있다. 이에 따라 설계 데이터의 DB 구축 및 그 품질에 대한 중요성이 부각되고 있으나, 그와 관련된 연구는 초기상태에 머물러 있는 실정이다. 본 연구에서는 저자들의 선행연구 결과인 함정 제품모델의 품질검증 방법론에 기초하여 함정 제품모델을 구성하고 있는 형상요소의 구체적인 품질검증 방안과 이를 자동화하기 위한 연구를 수행하였다. 함정 제품모델 데이터 중 상대적으로 중요하며, 검증과정에 많은 시간이 소요되고 있는 선각모델을 사례연구 대상으로 정의하였으며, 자동차산업에서 사용되고 있는 제품데이터품질(Product Data Quality, PDQ)을 형상검증 기준으로 활용하였다. 최종적으로 선각모델의 형상 품질검증을 위한 기준과 알고리즘을 제안하였으며 이에 기반 한 초기 시스템을 개발하였다.

DEVS 기반의 연속 교통류 시뮬레이션 시스템 검증 ($I^3D^2$ 교통류 시뮬레이션 시스템을 중심으로) (Validating DEVS based Traffic Simulation Model for Freeways)

  • 윤동영;김원규;송병흠;지승도
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2002년도 추계학술대회 논문집
    • /
    • pp.125-130
    • /
    • 2002
  • 본 연구는 DEVS를 기반으로 개발된 교통류 시뮬레이션 시스템인 $\ulcorner$I$^3$D$^2$ 교통류 시뮬레이션 시스템$\lrcorner$(이하 I$^3$D$^2$)의 검증을 그 목적으로 한다. I$^3$D$^2$는 본 연구진이 DEVS를 기반으로 개발한 범용 시뮬레이션 도구로써, 이미 서울시 강남 신호교차로와 내부순환로를 대상으로 하여 개발된 내용을 발표한 바 있다. I$^3$D$^2$는 헌재 단속류에서의 최적신호 생성 및 대기행렬 예측 문제, 그리고 연속류 시설의 용량 산정 문제등을 시뮬레이션 할 수 있다. 하지만 아직 문헌자료나 현장 데이터를 토대로 한 충분한 검증이 수행되지 못한 문제가 있다. 따라서 본 연구에서는 문헌자료를 토대로, I$^3$D$^2$를 검증한다. 이를 위하여 고속도로 또는 도시고속도로와 같은 연속 교통류의 대표적인 효과척도인 $\ulcorner$교통량 - 밀도 - 평균주행속도 (시간)$\lrcorner$ 간의 상관관계를 이용하여 미국 HCM과 우리나라의 도로용량편람에 정의되어 있는 기준을 토대로 I$^3$D$^2$ 검증을 수행하였다. 모델링은 서울시 올림픽대로의 양화대교 - 성산대교 - 가양대교 구간을 대상으로 했으며, 검증은 교통량에 따라 크게 3가지 교통류 상태(random, intermediate, constant)를 기준으로 시뮬레이션이 각각의 교통상태에서 예측한 평균주행시간의 정확도를 측정하면서 수행하였다. 검증 결과 random 상태에서는 문헌자료에 부합되는 예측결과를 보여주었으나, intermediate와 constant 상태에서는 문헌보다 다소 낮은 속도를 보여주었다 이러한 속도차는 추후 현장 데이터를 수집하여 보다 실질적인 검증을 통하여 조정되어야 할 것으로 판단된다.

  • PDF