• 제목/요약/키워드: 결합 학습 모델

검색결과 412건 처리시간 0.026초

악성 URL 탐지를 위한 URL Lexical Feature 기반의 DL-ML Fusion Hybrid 모델 (DL-ML Fusion Hybrid Model for Malicious Web Site URL Detection Based on URL Lexical Features)

  • 김대엽
    • 정보보호학회논문지
    • /
    • 제33권6호
    • /
    • pp.881-891
    • /
    • 2023
  • 최근에는 인공지능을 활용하여 악성 URL을 탐지하는 다양한 연구가 진행되고 있으며, 대부분의 연구 결과에서 높은 탐지 성능을 보였다. 그러나 고전 머신러닝을 활용하는 경우 feature를 분석하고 선별해야 하는 추가 비용이 발생하며, 데이터 분석가의 역량에 따라 탐지 성능이 결정되는 이슈가 있다. 본 논문에서는 이러한 이슈를 해결하기 위해 URL lexical feature를 자동으로 추출하는 딥러닝 모델의 일부가 고전 머신러닝 모델에 결합된 형태인 DL-ML Fusion Hybrid 모델을 제안한다. 제안한 모델로 직접 수집한 총 6만 개의 악성과 정상 URL을 학습한 결과 탐지 성능이 최대 23.98%p 향상되었을 뿐만 아니라, 자동화된 feature engineering을 통해 효율적인 기계학습이 가능하였다.

구조 소음저감을 위한 격자 패널의 다중 진동제어 (Multiple Vibration Control of a Trim Panel to Reduce Structure-borne Noise)

  • 김인수;김영식
    • 한국정밀공학회지
    • /
    • 제16권2호통권95호
    • /
    • pp.153-163
    • /
    • 1999
  • 본 연구에서는 격자패널을 통한 소음전달을 감소시키기 위하여 외부 구조적 가진으로부터 유발된 경량 패널의 진동을 능동 제어하는 기법을 기술한다. 최적 되먹임제어기와 적응 앞먹임제어기가 결합된 혼합형 제어기가 진동제어기로 사용된다. 되먹임제어기는 주파수 영역의 모델규명법에 의해 추출된 다중 입/출력 패널진동계 모델에 대하여 LQG 최적기법을 이용하여 감쇠능을 향상시키도록 설계된다. 앞먹임제어기는 되먹임 궤환의 결합효과를 자동적으로 보정할 수 있는 제안된 학습법칙에 기초하여 패널의 잔류진동이 최소가 되도록 적응된다. 45.7${\times}$45.7${\times}$2.54 ${cm^3}$ 벌집형상의 고강도 패널, 4개의 관성형 구동기 및 이산신호처리장치에 의해 구현된 패널 진동계에 대한 능동제어 실험을 수행해 본 결과 600Hz 주파수대역에 대한 12dB 진동저감이 이루어 질 수 있었다.

  • PDF

기계학습에 의한 후두 장애음성 식별기의 성능 비교 (Performance comparison on vocal cords disordered voice discrimination via machine learning methods)

  • 조철우;왕수건;권익환
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.35-43
    • /
    • 2022
  • 본 논문은 후두 장애음성 데이터의 식별률을 CNN과 기계학습 앙상블 학습 방법에 의해 개선하는 방법에 대한 연구이다. 일반적으로 후두 장애음성 데이터는 그 수가 적으므로 통계적 방법에 의해 식별기가 구성되더라도, 훈련 방식에 따라 과적합으로 인해 일어나는 현상으로 인해 외부 데이터에 노출될 시 식별률의 저하가 발생할 수 있다. 본 연구에서는 다양한 정확도를 갖도록 훈련된 CNN 모델과 기계학습 모델로부터 도출된 결과를 다중 투표 방식으로 결합하여 원래의 훈련된 모델에 비해 향상된 분류 효율을 갖도록 하는 방법과 함께, 기존의 기계학습 중 앙상블 방법을 적용해 보고 그 결과를 확인하였다. 알고리즘을 훈련하고 검증하기 위해 PNUH(Pusan National University Hospital) 데이터셋을 이용하였다. 데이터셋에는 정상음성과 양성종양 및 악성 종양의 음성 데이터가 포함되어 있다. 실험에서는 정상 및 양성 종양과 악성종양을 구분하는 시도를 하였다. 실험결과 random forest 방법이 가장 우수한 앙상블 방법으로 나타났으며 85%의 식별률을 보였다.

기계학습과 사전을 이용한 개체명 세분화 (Fine Grained Classification of Named Entities Using Machine Learning and Dictionary)

  • 이기중;이도길;임해창;임수종
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.519-521
    • /
    • 2003
  • 개체명 인식은 효과적인 정보추출 시스템을 구축하기 위해 반드시 선행되어야 하는 작업이다. 지금까지의 개체명 인식에 관한 연구는 인명이나 조직, 장소와 같은 일반적인 개체명 인식 작업이 대부분이었다. 그러나, 효과적인 정보추출을 위해서는 이런 일반적인 개체명들을 더욱 세분화할 필요가 있다. 본 논문에서는 SVM기반 기계학습법과 기구축된 사전과의 편집거리 비교법을 이용하여 개체명을 세분화하는 방법을 제시한다. 실험은 개체명과 세분화된 범주가 부착된 공연 관련 문서 100개 중 80개는 학습집합, 20개는 실험집합으로 사용하였고 성능 평가 척도는 정확도(accuracy)를 이용해 개별적으로 평가하였다. 실험 결과 기계학습법과 사전을 이용한 방법을 결합한 모델이 가장 좋은 성능(정확도 72.91%)을 보였다.

  • PDF

한글 온라인 필기 인식을 위한 전처리 모듈 개발 (Development of Preprocessing module for Korean online handwriting recognition)

  • 정민진;정다빈;이강은;김성석;양순옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.63-65
    • /
    • 2019
  • 본 논문은 개발하고자 하는 기계학습 기반 한글 필기 인식 시스템의 첫 연구 결과를 담고 있다. 즉, 기계학습을 위해서는 학습용 및 테스트용 필기 데이터가 아주 많이 필요하므로, 이를 수집하고 전처리하는 방법을 제안하였다. 한글의 한 글자는 자음과 모음을 결합하여 생성되는데, 실제 만 개 이상의 글자가 생성될 수 있다. 따라서 각각의 글자 데이터를 수집하는 대신, 수집한 글자 데이터로부터 초성, 중성, 종성을 구분하여 최종적으로 자음, 모음 데이터로 저장하고자 한다. 아직 초기 연구이므로, 다양한 경우에 대한 분석이나 실험 결과는 없지만, 이를 활용하여 온라인 필기 인식 모델에 적용하여 인식 성능을 높이기 위한 추후 연구의 기반으로 활용하고자 한다.

다양한 앙상블 알고리즘을 이용한 한국어 의존 구문 분석 (Korean Dependency Parsing Using Various Ensemble Models)

  • 조경철;김주완;김균엽;박성진;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.543-545
    • /
    • 2019
  • 본 논문은 최신 한국어 의존 구문 분석 모델(Korean dependency parsing model)들과 다양한 앙상블 모델(ensemble model)들을 결합하여 그 성능을 분석한다. 단어 표현은 미리 학습된 워드 임베딩 모델(word embedding model)과 ELMo(Embedding from Language Model), Bert(Bidirectional Encoder Representations from Transformer) 그리고 다양한 추가 자질들을 사용한다. 또한 사용된 의존 구문 분석 모델로는 Stack Pointer Network Model, Deep Biaffine Attention Parser와 Left to Right Pointer Parser를 이용한다. 최종적으로 각 모델의 분석 결과를 앙상블 모델인 Bagging 기법과 XGBoost(Extreme Gradient Boosting) 이용하여 최적의 모델을 제안한다.

  • PDF

내압을 받는 축소규모 원전 격납건물 구성요소의 대리모델 기반 전역 민감도 분석 (Surrogate Model-Based Global Sensitivity Analysis of Components of a Test Mock-Up Nuclear Containment Building subjected to Internal Pressure)

  • 손호영;이종륜;주부석
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2023년 정기학술대회 논문집
    • /
    • pp.303-304
    • /
    • 2023
  • 확률론적 위험성 평가는 하중, 재료특성 등과 같은 불확실성 인자를 고려하여 구조물의 안전성을 평가하는 기법이지만 모든 불확실성을 고려하는 것은 현실적으로 불가능하다. 또한 원전 격납건물은 콘크리트, 철근, 라이너, 텐던이 복잡하게 결합되어 있다. 따라서 전역민감도 분석을 통해 격납건물의 불확실성 인자 검토하고 선정하는 작업은 필요하다. 따라서 본 연구는 대리모델을 기반으로 축소규모 원전 격납건물의 전역 민감도 분석을 수행하고 격납건물의 주요 영향인자를 분석하고자 한다. 유한요소 해석 모델을 기반으로 대리모델의 학습데이터를 생성하였으며 구축된 대리모델의 성능지표를 분석하였을 때 높은 회귀성능을 갖는 것으로 판단된다. 대리모델을 기반으로 전역 민감도 분석을 수행한 결과 콘크리트의 인장균열이 발생하는 내압수준에서 민감도 지수는 콘크리트의 압축강도가 높지만, 전체적인 내압 구간에서 민감도 지수는 텐던의 탄성계수 및 항복강도가 높은 것으로 나타났다.

  • PDF

k-최근접 템플릿기반 다중 분류기 결합방법 (Multiple Classifier Fusion Method based on k-Nearest Templates)

  • 민준기;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권4호
    • /
    • pp.451-455
    • /
    • 2008
  • 본 논문에서는 다중 분류기를 효과적으로 결합하기 위하여 k-최근접 템플릿방법을 제안한다. 이는 하나의 클래스를 여러개의 템플릿으로 모델링하기 위하여 분류기의 출력값을 기반으로 각 클래별 학습 샘플들을 여러개의 하위클래스로 분해하고, 각 하위클래스별 분류기 출력값의 평균을 계산하여 지역화된 템플릿을 생성한다. 그 뒤 평가샘플과 각 템플릿간의 거리를 계산하고, k개의 최근접 템플릿들 중 가장 많은 비율을 차지하는 클래스로 평가샘플을 분류한다. 본 논문에서는 클래스 분해를 위해 C-means 클러스터링 알고리즘을 이용하였으며, k값은 주어진 데이타 셋의 클래스 내 밀집도와 클래스 간 분리도에 따라 자동으로 결정하였다. 제안하는 방법은 각 클래스별로 여러 개의 모델을 사용하며, 이들 중 가장 유사한 하나의 모델과 매칭하는 대신 k개의 모델을 참조하기 때문에 안정적이고 높은 분류성능을 획득할 수 있다. 본 논문에서는 UCI와 ELENA데이타베이스를 이용한 실험을 통해 제안하는 방법이 기존의 결합 방법들에 비해 우수한 분류성능을 보임을 확인하였다.

RGB 영상 데이터 기반 손동작 인식 (Hand gesture recognition based on RGB image data)

  • 김기덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.15-16
    • /
    • 2021
  • 본 논문에서는 RGB 영상 데이터를 입력으로 하여 mediapipe의 손 포즈 추정 알고리즘을 적용해 손가락 관절 및 주요 부위의 위치를 얻고 이를 기반으로 딥러닝 모델에 학습 후 손동작 인식 방법을 제안한다. 연속된 프레임에서 한 손의 손가락 주요 부위 간 좌표를 얻고 차분 벡터의 x, y좌표를 저장한 후 Conv1D, Bidirectional GRU, Transformer를 결합한 딥러닝 모델에 학습 후 손동작 인식 분류를 하였다. IC4You Gesture Dataset 의 한 손 동적 데이터 9개 클래스에 적용한 결과 99.63%의 손동작 인식 정확도를 얻었다.

  • PDF

멀티 오믹스 데이터 및 생물학적 네트워크 정보를 이용한 드라이버 유전자 분류 (Cancer driver gene using multi-omics data and biological network information)

  • 박정호;조겨리
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.490-492
    • /
    • 2023
  • 시퀀싱(sequencing) 기술의 발달로 다양한 오믹스(omics) 데이터의 축적과 인공 지능 기술의 발달로 인하여 다양한 드라이버 유전자 분류기법이 제안되어왔다. 최근에는 암 데이터가 대용량으로 축적되며 기계 학습 기반의 다양한 기법들이 활발히 제안되었다. 특히 다양한 오믹스 데이터를 결합한 고차원 데이터에서 높은 정확도를 확보하기 위한 시도가 활발히 이루어지고 있다. 본 논문에서는 멀티 오믹스와 네트워크 관련 특징을 기반으로 암의 증식 및 발생에 중요한 역할을 하는 드라이버 유전자를 분류하는 딥러닝 모델을 제시한다. 또한 The Cancer Genome Atlas(TCGA) 데이터를 통해서 모델 학습 후 기존 통계 및 머신러닝 기반 기법과 비교하여 성능이 개선되었음을 확인하였다.