• Title/Summary/Keyword: 변형 기반 학습

Search Result 166, Processing Time 0.029 seconds

Machine Learning-based Phase Picking Algorithm of P and S Waves for Distributed Acoustic Sensing Data (분포형 광섬유 센서 자료 적용을 위한 기계학습 기반 P, S파 위상 발췌 알고리즘 개발)

  • Yonggyu, Choi;Youngseok, Song;Soon Jee, Seol;Joongmoo, Byun
    • Geophysics and Geophysical Exploration
    • /
    • v.25 no.4
    • /
    • pp.177-188
    • /
    • 2022
  • Recently, the application of distributed acoustic sensors (DAS), which can replace geophones and seismometers, has significantly increased along with interest in micro-seismic monitoring technique, which is one of the CO2 storage monitoring techniques. A significant amount of temporally and spatially continuous data is recorded in a DAS monitoring system, thereby necessitating fast and accurate data processing techniques. Because event detection and seismic phase picking are the most basic data processing techniques, they should be performed on all data. In this study, a machine learning-based P, S wave phase picking algorithm was developed to compensate for the limitations of conventional phase picking algorithms, and it was modified using a transfer learning technique for the application of DAS data consisting of a single component with a low signal-to-noise ratio. Our model was constructed by modifying the convolution-based EQTransformer, which performs well in phase picking, to the ResUNet structure. Not only the global earthquake dataset, STEAD but also the augmented dataset was used as training datasets to enhance the prediction performance on the unseen characteristics of the target dataset. The performance of the developed algorithm was verified using K-net and KiK-net data with characteristics different from the training data. Additionally, after modifying the trained model to suit DAS data using the transfer learning technique, the performance was verified by applying it to the DAS field data measured in the Pohang Janggi basin.

Korean Dialogue Modeling using MTRNN (MTRNN을 이용한 한국어 대화 모델 생성)

  • Shin, Chang-Uk;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.285-287
    • /
    • 2017
  • 본 논문에서는 Multi-layer sequence-to-sequence 구조를 이용해 한국어 대화 시스템을 개발하였다. sequence-to-sequence는 RNN 혹은 그 변형 네트워크에 데이터를 입력하고, 입력이 완료된 후의 은닉층의 embedding에 기반해 출력열을 생성한다. 우리는 sequence-to-sequence로 입력된 발화에 대해 출력 발화를 내어주는 대화 모델을 학습하였고, 그 성능을 측정하였다. RNN에 대해서는 약 80만 발화를, MTRNN에 대해서는 5만 발화를 학습하고 평가하였다. 모델의 결과로 나타난 발화들을 정리하고 분석하였다.

  • PDF

Korean Dialogue Modeling using MTRNN (MTRNN을 이용한 한국어 대화 모델 생성)

  • Shin, Chang-Uk;Cha, Jeong-Won
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.285-287
    • /
    • 2017
  • 본 논문에서는 Multi-layer sequence-to-sequence 구조를 이용해 한국어 대화 시스템을 개발하였다. sequence-to-sequence는 RNN 혹은 그 변형 네트워크에 데이터를 입력하고, 입력이 완료된 후의 은닉층의 embedding에 기반해 출력열을 생성한다. 우리는 sequence-to-sequence로 입력된 발화에 대해 출력 발화를 내어주는 대화 모델을 학습하였고, 그 성능을 측정하였다. RNN에 대해서는 약 80만 발화를, MTRNN에 대해서는 5만 발화를 학습하고 평가하였다. 모델의 결과로 나타난 발화들을 정리하고 분석하였다.

  • PDF

Learning User′s Moving Patterns for Location-based Services with Intelligent Agent (지능형 에이전트의 위치기반 서비스를 위한 사용자의 위치이동패턴 학습)

  • 한상준;강현지;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.562-564
    • /
    • 2004
  • 사용자의 위치정보는 에이전트가 상황에 적합한 서비스를 제공하는데 중요하게 사용될 수 있으며 정확한 위치 추적 및 활용 방안에 대한 활발한 연구가 진행되고 있다. 그 중에서 사용자의 다음 위치를 예측하는 것은 사용자에게 필요한 서비스를 명시적인 요청없이 미리 제공하는데 유용하게 쓰일 수 있다. 본 논문에서는 GPS신호를 이용하여 사용자의 위치 이동경로를 학습하고 사용자의 이동에 기반한 서비스 제공 방법을 제안한다. GPS에 의해 관측된 위치 이동경로는 시간 순서의 데이터에 적합하도록 SOM을 변형한 RSOM과 마르코프 모델을 이용하여 학습되며, 새로 관측된 사용자 위치 데이터에 대해 다음 이동 패턴을 예측하는 기능을 가진다. 실제 캠퍼스에서 수집된 데이터를 이용하여 제안한 방법의 가능성을 평가한다.

  • PDF

Development of Security Anomaly Detection Algorithms using Machine Learning (기계 학습을 활용한 보안 이상징후 식별 알고리즘 개발)

  • Hwangbo, Hyunwoo;Kim, Jae Kyung
    • The Journal of Society for e-Business Studies
    • /
    • v.27 no.1
    • /
    • pp.1-13
    • /
    • 2022
  • With the development of network technologies, the security to protect organizational resources from internal and external intrusions and threats becomes more important. Therefore in recent years, the anomaly detection algorithm that detects and prevents security threats with respect to various security log events has been actively studied. Security anomaly detection algorithms that have been developed based on rule-based or statistical learning in the past are gradually evolving into modeling based on machine learning and deep learning. In this study, we propose a deep-autoencoder model that transforms LSTM-autoencoder as an optimal algorithm to detect insider threats in advance using various machine learning analysis methodologies. This study has academic significance in that it improved the possibility of adaptive security through the development of an anomaly detection algorithm based on unsupervised learning, and reduced the false positive rate compared to the existing algorithm through supervised true positive labeling.

A Survey on Deep Learning-based Pre-Trained Language Models (딥러닝 기반 사전학습 언어모델에 대한 이해와 현황)

  • Sangun Park
    • The Journal of Bigdata
    • /
    • v.7 no.2
    • /
    • pp.11-29
    • /
    • 2022
  • Pre-trained language models are the most important and widely used tools in natural language processing tasks. Since those have been pre-trained for a large amount of corpus, high performance can be expected even with fine-tuning learning using a small number of data. Since the elements necessary for implementation, such as a pre-trained tokenizer and a deep learning model including pre-trained weights, are distributed together, the cost and period of natural language processing has been greatly reduced. Transformer variants are the most representative pre-trained language models that provide these advantages. Those are being actively used in other fields such as computer vision and audio applications. In order to make it easier for researchers to understand the pre-trained language model and apply it to natural language processing tasks, this paper describes the definition of the language model and the pre-learning language model, and discusses the development process of the pre-trained language model and especially representative Transformer variants.

Performance Comparison of Machine Learning Algorithms for Malware Detection (악성코드 탐지를 위한 기계학습 알고리즘의 성능 비교)

  • Lee, Hyun-Jong;Heo, Jae Hyeok;Hwang, Doosung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.01a
    • /
    • pp.143-146
    • /
    • 2018
  • 서명기반 악성코드 탐지는 악성 파일의 고유 해싱 값을 사용하거나 패턴화된 공격 규칙을 이용하므로, 변형된 악성코드 탐지에 취약한 단점이 있다. 기계 학습을 적용한 악성코드 탐지는 이러한 취약점을 극복할 수 있는 방안으로 인식되고 있다. 본 논문은 정적 분석으로 n-gram과 API 특징점을 추출해 특징 벡터로 구성하여 XGBoost, k-최근접 이웃 알고리즘, 지지 벡터 기기, 신경망 알고리즘, 심층 학습 알고리즘의 일반화 성능을 비교한다. 실험 결과로 XGBoost가 일반화 성능이 99%로 가장 우수했으며 k-최근접 이웃 알고리즘이 학습 시간이 가장 적게 소요됐다. 일반화 성능과 시간 복잡도 측면에서 XGBoost가 비교 대상 알고리즘에 비해 우수한 성능을 보였다.

  • PDF

A Method for Efficient Game Graphic Education Applied the MOD Type Game (MOD형 게임을 적용한 효율적인 게임그래픽 교육 방안)

  • Kim, Jong-Koo;Jung, Kwang-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.1037-1040
    • /
    • 2009
  • 본 논문에서는 게임그래픽 교육의 차별화를 위한 학습도구의 하나로 MOD형 게임을 이용한 학습방법을 도입하였다. MOD형 게임이란 수정 변형(Modification)이 가능한 게임이란 의미로, 그래픽 학습자들이 직접 작업한 소스를 게임에 적용해 볼 수 있는 기능을 제공하는 소프트웨어로 게임 그래픽의 특성을 이해하는데 필요한 실질적인 경험을 제공할 수 있다. MOD형 게임의 활용은 기존의 추상적 개념의 이론적 학습에서 불가능했던 실제적이고 구체적인 적용을 기반으로 하고 있기 때문에, 학습 효과와 게임그래픽 교육 방식과의 차별화를 가져온다.

Query-Based Summarization using Non-negative Matrix Factorization (비음수 행렬 인수분해를 이용한 질의 기반의 문서 요약)

  • Park Sun;Lee Ju-Hong;Ahn Chan-Min;Park Tae-Su;Kim Deok-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.394-396
    • /
    • 2006
  • 기존 질의기반의 문서요약은 질의와 문서간의 사전 학습으로 요약의 질을 높이거나, 문서의 고유 구조(inherent structure)를 반영하여 요약의 정확도를 높이기 위하여 문서를 그래프로 변환한다. 본 논문은 비음수 행렬 인수분해 (NMF, Non-negative Matrix Factorization)를 이용하여 질의 기반의 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 질의와 문서간에 사전학습이 필요 없다. 또한 문서를 그래프로 변형시키는 복잡한 처리 없이 NMF에 의해 얻어진 의미 특징(semantic feature)과 의미 변수(semantic variable)로 문서의 고유 구조를 반영하여 요약의 정확도를 높일 수 있다. 마지막으로 단순한 방법으로 문장을 쉽게 요약 할 수 있다.

  • PDF

Successive Optimization of Information Granules-based Fuzzy Neural Networks (정보 입자 기반 퍼지 뉴럴 네트워크의 연속적 최적화)

  • Park, Keon-Jun;Oh, Sung-Kwun;Kim, Hyun-Ki
    • Proceedings of the KIEE Conference
    • /
    • 2007.07a
    • /
    • pp.1815-1816
    • /
    • 2007
  • 본 논문에서는 데이터의 특성을 이용한 정보 입자 기반 퍼지 뉴럴 네트워크의 연속적 최적화를 제안한다. 데이터들간의 거리를 중심으로 C-Means 클러스터링 알고리즘을 이용하여 멤버쉽 함수를 정의하고 각 중심의 후반부 중심값을 이용하여 후반부 학습에 적용한다. 구조/파라미터 동정에 있어서 실수 코딩 기반 유전자 알고리즘을 이용하여 입력변수의 수, 입력 변수의 선택, 멤버쉽함수의 수, 후반부 형태와 같은 시스템의 입력 구조와 전반부 멤버쉽함수의 정점 및 학습율과 모멘텀 계수와 같은 파라미터를 최적으로 동정한다. 또한, 구조 연산과 파라미터 연산의 연속적 동조 방법을 이용하여 퍼지 뉴럴 네트워크를 최적화한다. 제안된 퍼지 뉴럴 네트워크는 삼각형 멤버쉽 함수를 이용하며, 후반부 추론에는 간략, 선형, 변형된 2차식을 이용한다. 제안된 퍼지 뉴럴 네트워크는 표준 모델로서 널리 사용되는 수치적인 예를 통하여 평가한다.

  • PDF