• 제목/요약/키워드: pre-processing process

검색결과 477건 처리시간 0.027초

점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선 (Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting)

  • 김한준;장재영
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.457-464
    • /
    • 2008
  • 실제 운용 환경에서 자동문서분류시스템의 성공을 위해서 충분하지 못한 학습문서의 문제와 특징 공간들에 대한 사전지식이 없는 상황을 해결하는 것이 관건이다. 이런 맥락에서 많은 자동문서분류 시스템의 구축을 위해 나이브 베이즈 문서분류 알고리즘을 사용한다. 이는 기존 학습된 분류모델과 특징 공간을 점진적으로 갱신함으로써 분류모델을 향상시키는 것이 매우 용이하기 때문이다. 본 논문에서는 특징 가중치를 이용하여 문서분류기의 성능을 향상시키는 기법을 제안한다. 기본 아이디어는 문서분류 모델의 인자로서 특징들의 분포뿐만 아니라 각 특징들의 중요도를 반영하는 것이다. 속성 선택을 미리 수행하여 학습모델을 만드는 것이 아니라, 속성 중요도를 나이브 베이즈 학습 모델에 포함시킴으로써 보다 정확한 모델을 생성할 수 있다. 또한 동적 환경에서 점진적인 특징 가중치 부여를 위해 기존의 특징 갱신 기법을 확장한 알고리즘도 제안한다. 본 논문에서 제안된 기법을 평가하기 위해서 Reuters-21578과 20Newsgroup 문서집합 이용한 실험을 실시하여, 제안된 기법이 전통적인 나이브 베이즈 분류기의 성능을 크게 향상시킴을 증명한다.

제한된 자원을 갖는 장치에서 효과적인 얼굴 인증 방법 (An Effective Face Authentication Method for Resource - Constrained Devices)

  • 이경희;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1233-1245
    • /
    • 2004
  • 사용자를 인증하는데 생체인식(biometrics)을 사용하는 것은 보안성과 편리성에서 우수함에도 불구하고, 생체 정보를 사용하는 전형적인 인증 알고리즘은 스마트카드(smart cards)와 같은 자원이 한정된 장치에서는 실행되지 못할 수도 있다. 따라서, 제한된 자원을 갖는 장치에서 생체인식 과정이 수행되기 위해서는 적은 메모리와 처리 능력을 요구하는 가벼운 인증 알고리즘의 개발이 필요하다. 또한 생물학적 특징들 중에서 얼굴에 의한 인증은 인간에게 보다 친숙하고 얼굴 영상 획득이 비강제성을 띤다는 점에서 사용하기 가장 편리한 생체인식 기술이다. 본 논문에서는 생체인식 기술 연구의 일환으로 새로운 얼굴 인중 알고리즘을 제안한다. 이 얼굴 인증 알고리즘은 두 가지 면에서 새로운 특성을 갖는다. 그 하나는 유전자 알고리즘(GA: Genetic Algorithms) 에 의해 추출된 특징 집합(feature set)을 입력벡터로 사용하는 Support Vector Machines(SVM)을 얼굴인증에 이용함으로써 메모리 요구량을 감소시킨다는 것이다. 다른 하나는, 필요에 따라 특징 집합의 크기 조절에 대한 시스템 파라미터를 조절함으로써, 인식률은 다소 감소하더라도 인증 과정에 필요한 메모리양을 더욱 더 감소시킬 수 있다는 것이다. 이러한 특성은 메모리양이 한정된 장치에서 얼굴 인중 알고리즘을 수행할 수 있게 하는 데 상당히 효과적이다. 다양한 변화가 있는 얼굴 데이터베이스들에 대하여 실험한 결과, GA에 의해 선택된 식별력이 우수한 특징들을 SVM의 입력벡터로 사용하는 제안한 얼굴 인증 알고리즘이, GA에 의한 특징 선택 과정이 없는 알고리즘보다 정확성과 메모리 요구량에서 우수한 성능을 보임을 알 수 있다. 또한 시스템 파라미터의 변경 실험에 의해 선택될 특징의 개수가 조절될 수 있음을 보인다.

계량정보분석시스템 KnowledgeMatrix 개발 (Development of an Informetric Analysis System KnowledgeMatrix)

  • 이방래;여운동;이준영;이창환;권오진;문영호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.167-171
    • /
    • 2007
  • 데이터베이스로부터 지식을 발견하고 이를 연구기획자, 정책의사결정자들이 활용하는 움직임이 전세계적으로 활발해지고 있다. 이러한 연구분야 중 대표적인 것이 계량정보학이고 이 분야를 지원하기 위해서 주로 선진국을 중심으로 분석시스템이 개발되고 있다. 그러나 외국의 분석시스템은 실제 수요자의 요구를 충분히 반영하지 못하고 있고, 고가이면서 한글이 지원되지 않아 국내 연구기획자가 사용하기에 어려운 점이 있다. 따라서 한국과학기술정보연구원에서는 이러한 단점을 극복하기 위해서 계량정보분석시스템 KnowledgeMatrix를 개발하였다. KnowledgeMatrix는 논문 및 특허의 서지정보를 분석하여 지식을 발견하기 위한 목적으로 설계된 독립형(stand-alone) 시스템이다. KnowledgeMatrix의 주요구성을 살펴보면 행렬 생성, 클러스터링, 시각화, 데이터 전처리로 요약된다. 본 논문에서 소개하고 있는 KnowledgeMatrix는 외국의 대표적인 정보분석시스템과 비교했을 때 다양한 기능을 제공하고 있고 특히 영문데이터 처리 이외에 한글데이터 처리가 가능하다는 장점을 갖고 있다.

  • PDF

Wheel tread defect detection for high-speed trains using FBG-based online monitoring techniques

  • Liu, Xiao-Zhou;Ni, Yi-Qing
    • Smart Structures and Systems
    • /
    • 제21권5호
    • /
    • pp.687-694
    • /
    • 2018
  • The problem of wheel tread defects has become a major challenge for the health management of high-speed rail as a wheel defect with small radius deviation may suffice to give rise to severe damage on both the train bogie components and the track structure when a train runs at high speeds. It is thus highly desirable to detect the defects soon after their occurrences and then conduct wheel turning for the defective wheelsets. Online wheel condition monitoring using wheel impact load detector (WILD) can be an effective solution, since it can assess the wheel condition and detect potential defects during train passage. This study aims to develop an FBG-based track-side wheel condition monitoring method for the detection of wheel tread defects. The track-side sensing system uses two FBG strain gauge arrays mounted on the rail foot, measuring the dynamic strains of the paired rails excited by passing wheelsets. Each FBG array has a length of about 3 m, slightly longer than the wheel circumference to ensure a full coverage for the detection of any potential defect on the tread. A defect detection algorithm is developed for using the online-monitored rail responses to identify the potential wheel tread defects. This algorithm consists of three steps: 1) strain data pre-processing by using a data smoothing technique to remove the trends; 2) diagnosis of novel responses by outlier analysis for the normalized data; and 3) local defect identification by a refined analysis on the novel responses extracted in Step 2. To verify the proposed method, a field test was conducted using a test train incorporating defective wheels. The train ran at different speeds on an instrumented track with the purpose of wheel condition monitoring. By using the proposed method to process the monitoring data, all the defects were identified and the results agreed well with those from the static inspection of the wheelsets in the depot. A comparison is also drawn for the detection accuracy under different running speeds of the test train, and the results show that the proposed method can achieve a satisfactory accuracy in wheel defect detection when the train runs at a speed higher than 30 kph. Some minor defects with a depth of 0.05 mm~0.06 mm are also successfully detected.

윈도우 기반 응용프로그램 제공 서비스를 위한 Win32 API 메시지 인가 시스템의 개발 (Development of Win32 API Message Authorization System for Windows based Application Provision Service)

  • 김영호;정민아;원용관
    • 정보처리학회논문지C
    • /
    • 제11C권1호
    • /
    • pp.47-54
    • /
    • 2004
  • 컴퓨터 자원의 대용량화 및 네트워크 속도의 증가로 인하여 사용자가 네트워크를 통해 원격지의 서버에 접속하여 컴퓨터론 사용하는 요구가 증가되었다. 이에 따라 중앙집중형 컴퓨팅을 통한 응용프로그램 제공 서비스도 활성화되었다. 중앙집중형 컴퓨팅 시스템은 중앙의 대용량컴퓨터 시스템에 설치된 응용프로그램을 공유 프로토콜을 통하여 원격 사용자에게 제공하는 응용프로그램 공유 서비스(ASP: Application Service Provision) 시스템 모델이다. 중앙집중형 컴퓨팅 시스템을 통한 응용프로그램 공유 서비스는 기밀성, 가용성 무결성 등의 보안 사항이 반드시 유지되어야 한다. 기존 원격 컴퓨팅인 Telnet, FTP 접속은 단순히 파일 및 데이터의 접근 권한을 제어함으로 보안이 유지된다. 그러나 윈도우 기반 시스템의 경우 다수의 사용자가 통일한 권한을 통해 통일한 응용프로그램을 제공받기 때문에 사용자들 사이에 기밀성 및 무결성을 저해 할 수 있다. 또한 다수의 사용자가 하나의 응용프로그램에 파일열기, 복사, 서식 수정 등의 여러 기능 명령어를 전송하기 때문에 파일 및 데이터 접근 제어만을 통해서는 시스템의 기밀성 유지한 수 없다. 또한 기밀성의 문제는 곧 가용성 및 무결성의 문제로 이어질 수 있다. 본 논문에서는 윈도우 기반 중앙집중형 컴퓨팅 시스템의 응용프로그램 공유 서비스를 지원함에 있어 사용자가 실행하는 Win32 API 메시지 명령어 접근제어 시스템을 제안한다. 제안하는 시스템은 GUI(Graphical User Interface) 기반의 서버에서 사용자가 서버에 접속하여 발생하는 모든 메시지(마우스, 키보드, I/O, etc....)들을 감시한다. 감시된 메시지 기반의 명령어는 미리 설정된 사용자별 보안 정책에 기반 하여 해당 응용프로그램에게 전달 여부가 결정된다. 이러한 메시지 기반 상세 보안을 통해 기밀성 침해의 우려가 있는 메시지 명령어를 차단하고, 기능 명령어 차단에 의한 자원의 기밀성을 해결하였다.

미술·디자인계열 전공 실습교육을 위한 증강현실기반 이러닝(AREL: AR based e-Learning) 프레임워크 디자인 (AREL(AR based E-Learning) for PBE(Practice-Based Education) Framework Design in the Field of Art and Design Major)

  • 이기호
    • 만화애니메이션 연구
    • /
    • 통권43호
    • /
    • pp.363-386
    • /
    • 2016
  • 본 연구는 대학의 미술 디자인계열 전공 실습 교과목의 실습수업을 위한 이러닝 교수학습법을 개발하기 위해 기본 틀이 될 프레임워크를 디자인하는 연구이다. 특히 일방향적인 이러닝 교육방식에서 탈피하여 증강현실(AR)의 콘텐츠 재현 과정을 학습방법으로 적용함으로써 가상적 상황을 현실상황에 증강시켜 학습자로 하여금 학습환경에 대한 현실감을 높이는 데에 초점을 두고 있다. 본 프레임워크 구축 과정 및 교수학습법 개발은 이전에 발표된 "증강현실을 이용한 대학 e-Learing 실습교육"의 학습효과 실험연구를 위한 증강현실 기반의 실습교육 교수학습법 개발 과정에 관한 논문으로써 시기적으로는 이전 논문의 선행연구임을 밝히며, 기 발표 논문과 본 논문을 기반으로 본격적인 학습효과 실험에 들어가기 위한 교과과정 개발에 목적을 둔다. 학습방식에 따른 구분은 기본 학습유형에 따라 대면학습(FFL), 블랜디드학습(BL), 완전이러닝(EL), 그리고 증강현실 기반 이러닝(AREL) 4개 교수 학습방법으로 구분한다. 본 연구를 위해 FFL, BL, EL의 각 교수학습 프레임을 비교 분석하고 AREL의 교수학습유형과 비교분석 및 종합적 결합을 통해 효과적인 증강현실 기반의 교수학습 프레임워크 구축하였다. 또한 향후 학습효과 실험을 위한 AREL 실습교과목 교수학습 과정 설계 틀을 제시함으로써 연구를 마친다.

HEVC 부호화기 고효율 압축을 위한 인지시각 특징기반 양자화 방법 (Human Visual Perception-Based Quantization For Efficiency HEVC Encoder)

  • 김영웅;안용조;심동규
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.28-41
    • /
    • 2017
  • 본 논문에서는 사람의 인지특성을 기반으로 대조 민감도에 의해 나타나는 특성을 모델링 한 JND (Just Noticeable Difference) 모델을 비디오 코딩에 적용하여 압축률을 높이는 방법을 제안한다. 제안하는 방법은 JND 모델에 따른 임계치를 기준으로 양자화 단계에서 비가시 신호를 제한하여 주관적 화질을 유지하면서 비트율을 낮추는 방법으로, 변환을 통해 주파수 도메인으로 변환된 잔차 신호들을 양자화 단계에서 입력으로 받아 신호제한 및 양자화를 수행한다. 양자화 단계에서 주파수 도메인의 신호가 JND 관점에서 유사하게 인지되는 기준 임계치를 구해 잔차 신호에서 비가시 신호를 제한하고 양자화를 수행한 후, 최적의 율-인지왜곡 비용을 갖는 양자화 계수를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증은 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 적용했으며, CTC (Common Test Condition)의 Random Access 모드에서 HM 16.0을 통해 압축된 영상 대비 평균 4.11%, BQTerrace 영상의 양자화 파라미터 22에서 최대 17.22%의 비트율 절감을 보였으며, Low Delay 모드에서 평균 7.16%, 최대 22.55%, All intra 모드에서 평균 13.41%, 최대 21.64%의 비트율 절감을 보였다. 5명의 평가자들의 주관적 화질 측정으로 평균 DMOS (Difference Mean Opinion Score) 값은 최대 약 0.36 최소 0 정도의 분포를 보였다.

지표피복 데이터와 지리가중회귀모형을 이용한 인구분포 추정에 관한 연구 (Locally adaptive intelligent interpolation for population distribution modeling using pre-classified land cover data and geographically weighted regression)

  • 김화환
    • 한국지역지리학회지
    • /
    • 제22권1호
    • /
    • pp.251-266
    • /
    • 2016
  • 데시메트릭 매핑은 행정구역 단위로 집계된 인구자료를 행정구역 내부의 공간적 변이에 따라 재집계하여 고해상도의 인구분포 자료를 작성하는 가장 보편적인 기법이다. 본 연구에서는 데시메트릭 매핑을 이용한 인구분포 추정의 장단점을 검토하고, 그 개선방안으로서 지리가중회귀모형을 이용한 다변량 데시메트릭 매핑 기법을 제안하였다. 기존의 지표피복 데이터와 인구센서스 자료를 기반으로 지리가중회귀모형을 적용하여 각 집계단위별로 지표피복 유형과 인구밀도의 상관관계를 분석하고, 모형에서 산출된 회귀계수를 이용해 하위 공간구획의 인구 총수를 산정하였다. 그 결과 지리가중회귀모형 기반 다변량 데시메트릭 매핑 기법을 이용했을 때, 면적가중 보간법, 이진 데시메트릭 매핑, 피크노필렉틱 보간법, 최소자승회귀모형 기반 데시메트릭 매핑 기법 등 다른 지능형 보간법에 비해 정확한 인구분포 추정이 가능하다는 것을 확인하였다. 이는 지리가중회귀모형을 통해서 인구센서스 집계 단위별로 상이한 구역 내 공간적 이질성이 인구분포 추정에 적절히 반영되었기 때문인 것으로 평가할 수 있다.

  • PDF

P-형 실리콘에 형성된 정렬된 매크로 공극 (Ordered Macropores Prepared in p-Type Silicon)

  • 김재현;김강필;류홍근;서홍석;이정호
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2008년도 하계학술대회 논문집 Vol.9
    • /
    • pp.241-241
    • /
    • 2008
  • Macrofore formation in silicon and other semiconductors using electrochemical etching processes has been, in the last years, a subject of great attention of both theory and practice. Its first reason of concern is new areas of macropore silicone applications arising from microelectromechanical systems processing (MEMS), membrane techniques, solar cells, sensors, photonic crystals, and new technologies like a silicon-on-nothing (SON) technology. Its formation mechanism with a rich variety of controllable microstructures and their many potential applications have been studied extensively recently. Porous silicon is formed by anodic etching of crystalline silicon in hydrofluoric acid. During the etching process holes are required to enable the dissolution of the silicon anode. For p-type silicon, holes are the majority charge carriers, therefore porous silicon can be formed under the action of a positive bias on the silicon anode. For n-type silicon, holes to dissolve silicon is supplied by illuminating n-type silicon with above-band-gap light which allows sufficient generation of holes. To make a desired three-dimensional nano- or micro-structures, pre-structuring the masked surface in KOH solution to form a periodic array of etch pits before electrochemical etching. Due to enhanced electric field, the holes are efficiently collected at the pore tips for etching. The depletion of holes in the space charge region prevents silicon dissolution at the sidewalls, enabling anisotropic etching for the trenches. This is correct theoretical explanation for n-type Si etching. However, there are a few experimental repors in p-type silicon, while a number of theoretical models have been worked out to explain experimental dependence observed. To perform ordered macrofore formaion for p-type silicon, various kinds of mask patterns to make initial KOH etch pits were used. In order to understand the roles played by the kinds of etching solution in the formation of pillar arrays, we have undertaken a systematic study of the solvent effects in mixtures of HF, N-dimethylformamide (DMF), iso-propanol, and mixtures of HF with water on the macrofore structure formation on monocrystalline p-type silicon with a resistivity varying between 10 ~ 0.01 $\Omega$ cm. The etching solution including the iso-propanol produced a best three dimensional pillar structures. The experimental results are discussed on the base of Lehmann's comprehensive model based on SCR width.

  • PDF

관계형 데이터베이스 구성 요소의 의미 관계를 고려한 RDB to RDF 매핑 시스템 (An RDB to RDF Mapping System Considering Semantic Relations of RDB Components)

  • 성하정;김장원;이석훈;백두권
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.19-30
    • /
    • 2014
  • 시맨틱 웹의 확산을 위해 관계형 데이터베이스에 저장된 데이터를 온톨로지로 변환하는 연구가 활발히 진행 중이다. 관계형 데이터베이스에 저장된 데이터를 온톨로지로 변환하기 위한 연구들은 관계형 데이터베이스의 구성 요소와 RDF 구성 요소를 매핑하는 방식인 RDB to RDF 매핑 모델을 주로 사용한다. 하지만 지금까지 제안된 매핑 모델들은 그 표현방식이 서로 다르며, 이는 사용자의 접근성과 재사용성을 떨어트린다. 이로 인해 표준화된 매핑 언어의 필요성이 대두되었으며, W3C에서는 RDB to RDF 모델의 표준 매핑 언어로서 R2RML을 제안하였다. R2RML은 관계형 데이터베이스 스키마 정보만을 RDF로 변환하는 특징을 가진다. 이와 같은 이유로 관계형 데이터베이스의 테이블 명, 컬럼 명 사이의 관계정보에 대한 온톨로지를 추가할 수 없다. 이 논문에서는 이러한 문제를 해결하기 위해 관계형 데이터베이스 구성 요소의 의미 관계를 고려한 RDB to RDF 매핑 시스템을 제안한다. 제안 시스템은 R2RML에서 정의한 관계형 데이터베이스의 스키마 정보에 RDFS 속성 정보를 확장하여 매핑 정보를 생성한다. 이러한 매핑 정보는 관계형 데이터베이스에 저장된 데이터를 RDFS 속성 정보가 포함된 RDF로 변환시킨다. 이 논문에서는 제안 시스템을 자바 기반의 프로토타입으로 구현하며, 비교 평가를 위해 관계형 데이터베이스에 저장된 데이터를 RDF로 변환하는 실험을 수행하고 결과를 D2RQ, RDBToOnto, Morph와 비교한다. 제안 시스템은 다른 연구들에 비해 변환한 온톨로지가 풍부한 의미관계를 표현하며, 데이터 변환 시간에서 가장 우수한 성능을 보인다.