• 제목/요약/키워드: Learning/Training Algorithms

검색결과 432건 처리시간 0.023초

Automated Prioritization of Construction Project Requirements using Machine Learning and Fuzzy Logic System

  • Hassan, Fahad ul;Le, Tuyen;Le, Chau;Shrestha, K. Joseph
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.304-311
    • /
    • 2022
  • Construction inspection is a crucial stage that ensures that all contractual requirements of a construction project are verified. The construction inspection capabilities among state highway agencies have been greatly affected due to budget reduction. As a result, efficient inspection practices such as risk-based inspection are required to optimize the use of limited resources without compromising inspection quality. Automated prioritization of textual requirements according to their criticality would be extremely helpful since contractual requirements are typically presented in an unstructured natural language in voluminous text documents. The current study introduces a novel model for predicting the risk level of requirements using machine learning (ML) algorithms. The ML algorithms tested in this study included naïve Bayes, support vector machines, logistic regression, and random forest. The training data includes sequences of requirement texts which were labeled with risk levels (such as very low, low, medium, high, very high) using the fuzzy logic systems. The fuzzy model treats the three risk factors (severity, probability, detectability) as fuzzy input variables, and implements the fuzzy inference rules to determine the labels of requirements. The performance of the model was examined on labeled dataset created by fuzzy inference rules and three different membership functions. The developed requirement risk prediction model yielded a precision, recall, and f-score of 78.18%, 77.75%, and 75.82%, respectively. The proposed model is expected to provide construction inspectors with a means for the automated prioritization of voluminous requirements by their importance, thus help to maximize the effectiveness of inspection activities under resource constraints.

  • PDF

회랑 감시를 위한 딥러닝 알고리즘 학습 및 성능분석 (Deep Learning Algorithm Training and Performance Analysis for Corridor Monitoring)

  • 정우진;홍석민;최원혁
    • 한국항행학회논문지
    • /
    • 제27권6호
    • /
    • pp.776-781
    • /
    • 2023
  • K-UAM은 2035년까지의 성숙기 이후 상용화될 예정이다. UAM 회랑은 기존의 헬리콥터 회랑을 수직 분리하여 사용될 예정이기에 회량 사용량이 증가할 것으로 예상된다. 따라서 회랑을 모니터링하는 시스템도 필요하다. 최근 객체 검출 알고리즘이 크게 발전하였다. 객체 검출 알고리즘은 1단계 탐지와, 2단계 탐지 모델로 나뉜다. 실시간 객체 검출에 있어서 2단계 모델은 너무 느리기에 적합하지 않다. 기존 1단계 모델은 정확도에 문제가 있었지만, 버전 업그레이드를 통해 성능이 향상되었다. 1단계 모델 중 YOLO-V5는 모자이크 기법을 통한 소형 객체 검출 성능을 향상시킨 모델이다. 따라서 YOLO-V5는 넓은 회랑의 실시간 모니터링에 가장 적합하다고 판단된다. 본 논문에서는 YOLO-V5 알고리즘을 학습시켜 궁극적으로 회랑 모니터링 시스템에 대한 적합도를 분석한다.

클래스 영역을 보존하는 초월 사각형에 의한 프로토타입 선택 알고리즘 (Hyper-Rectangle Based Prototype Selection Algorithm Preserving Class Regions)

  • 백병현;어성율;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권3호
    • /
    • pp.83-90
    • /
    • 2020
  • 프로토타입 선택은 훈련 데이터로부터 클래스 영역을 대표하는 최소 데이터를 선택하여 낮은 학습 시간 및 저장 공간을 보장하는 장점을 제공한다. 본 논문은 모든 분류 알고리즘에 적용할 수 있는 초월 사각형을 이용한 새로운 훈련 데이터의 생성 방법을 설계한다. 초월 사각형 영역은 서로 다른 클래스 데이터를 포함하지 않으며 클래스 공간을 분할한다. 선택된 초월 사각형 내 데이터의 중간값은 프로토타입이 되어 새로운 훈련 데이터를 구성하고, 초월 사각형의 크기는 클래스 영역의 데이터 분포를 반영하여 조절된다. 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합 선택을 위해 집합 덮개 최적화 알고리즘을 설계했다. 제안하는 방법에서는 탐욕 알고리즘과 곱셈 연산을 포함하지 않은 거리 계산식을 이용하여 집합 덮개 최적화 알고리즘의 다항 시간을 요구하는 시간 복잡도 문제를 해결한다. 실험에서는 분류 성능의 비교를 위해 최근접 이웃 규칙과 의사 결정 트리 알고리즘을 이용하며 제안하는 방법이 초월 구를 이용한 프로토타입 선택 방법보다 우수하다.

분포형 광섬유 센서 자료 적용을 위한 기계학습 기반 P, S파 위상 발췌 알고리즘 개발 (Machine Learning-based Phase Picking Algorithm of P and S Waves for Distributed Acoustic Sensing Data)

  • 최용규;송영석;설순지;변중무
    • 지구물리와물리탐사
    • /
    • 제25권4호
    • /
    • pp.177-188
    • /
    • 2022
  • 최근 이산화탄소 지중저장 모니터링 기술 중 하나인 미소진동 모니터링 기술에 대한 관심이 증가하면서 과거에 주로 사용되었던 지오폰이나 지진계가 아닌 분포형 광섬유 센서(distributed acoustic sensing, DAS)의 적용도 증가하고 있다. 특히 DAS를 이용하여 모니터링을 수행하면 시×공간적으로 거의 연속된 자료가 기록되게 되어 자료의 양이 방대해지게 되고 빠르고 정확한 자료 처리가 중요하게 된다. 자료처리 중 이벤트 탐지 및 위상 발췌는 가장 기초적인 과정으로 모든 자료에 대해 필수적으로 수행되어야 한다. 이 논문에서는 기계학습 기반의 P, S파 위상 발췌 알고리즘을 개발하여 전통적인 위상 발췌 방법의 한계를 보완하고, 전이학습 방법을 이용하여 신호 대 잡음비가 낮은 단일 성분 자료만 존재하는 DAS 자료에도 적용이 가능하도록 하였다. 사용된 기계학습 모델은 위상 발췌에 뛰어난 성능을 보이는 합성곱 신경망 기반의 EQTransformer를 ResUNet의 특성을 포함하도록 수정하여 구성하였다. 훈련자료는 전세계적으로 기록된 지진파형 자료인 STEAD자료를 이용하였고 학습 자료에 포함되지 않은 특성들에 대해서도 좋은 성능을 보이도록 기본 자료를 다양하게 변형시킨 자료도 학습에 사용하였다. 개발된 알고리즘은 학습자료와 다른 특성을 갖는 K-net 및 KiK-net 자료에 의해 성능이 검증되었다. 또한, 전이 학습을 통해 DAS 자료의 특성에 맞게 변형시킨 후 포항 장기분지에서 측정된 DAS자료에 적용시켜 그 성능을 검증하였다.

Automatic Metallic Surface Defect Detection using ShuffleDefectNet

  • Anvar, Avlokulov;Cho, Young Im
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.19-26
    • /
    • 2020
  • 일반적으로 품질 관리는 많은 제조 공정, 특히 주조 또는 용접과 관련된 공정의 기본 구성 요소가 된다. 그러나 사람이 일일이 수동으로 품질 관리 절차를 하는 것은 종종 시간이 걸리고 오류가 발생하기 쉽다. 최근 고품질 제품에 대한 요구를 만족시키기 위해 지능형 육안 검사 시스템의 사용이 생산 라인에서 필수적이 되고 있다. 본 논문에서는 이를 위해 딥 러닝 기반의 ShuffleDefectNet 결함 감지 시스템을 제안하고자 한다. 제안된 결함 검출 시스템은 NEU 데이터 세트의 결함 검출에 대한 여러 최신 성능들보다 높은 평균 정확도 99.75% 정도를 얻는다. 이 논문에서 여러 다른 트레이닝 데이터로부터 최상의 성능을 탐지하고 탐지 성능을 관찰하였다. 그 결과 ShuffleDefectNet의 전체 아키텍처를 사용할 때 정확성과 속도가 크게 향상됨을 알 수 있었다.

CNN을 사용한 차선검출 시스템 (Lane Detection System using CNN)

  • 김지훈;이대식;이민호
    • 대한임베디드공학회논문지
    • /
    • 제11권3호
    • /
    • pp.163-171
    • /
    • 2016
  • Lane detection is a widely researched topic. Although simple road detection is easily achieved by previous methods, lane detection becomes very difficult in several complex cases involving noisy edges. To address this, we use a Convolution neural network (CNN) for image enhancement. CNN is a deep learning method that has been very successfully applied in object detection and recognition. In this paper, we introduce a robust lane detection method based on a CNN combined with random sample consensus (RANSAC) algorithm. Initially, we calculate edges in an image using a hat shaped kernel, then we detect lanes using the CNN combined with the RANSAC. In the training process of the CNN, input data consists of edge images and target data is images that have real white color lanes on an otherwise black background. The CNN structure consists of 8 layers with 3 convolutional layers, 2 subsampling layers and multi-layer perceptron (MLP) of 3 fully-connected layers. Convolutional and subsampling layers are hierarchically arranged to form a deep structure. Our proposed lane detection algorithm successfully eliminates noise lines and was found to perform better than other formal line detection algorithms such as RANSAC

Lightweight Named Entity Extraction for Korean Short Message Service Text

  • Seon, Choong-Nyoung;Yoo, Jin-Hwan;Kim, Hark-Soo;Kim, Ji-Hwan;Seo, Jung-Yun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제5권3호
    • /
    • pp.560-574
    • /
    • 2011
  • In this paper, we propose a hybrid method of Machine Learning (ML) algorithm and a rule-based algorithm to implement a lightweight Named Entity (NE) extraction system for Korean SMS text. NE extraction from Korean SMS text is a challenging theme due to the resource limitation on a mobile phone, corruptions in input text, need for extension to include personal information stored in a mobile phone, and sparsity of training data. The proposed hybrid method retaining the advantages of statistical ML and rule-based algorithms provides fully-automated procedures for the combination of ML approaches and their correction rules using a threshold-based soft decision function. The proposed method is applied to Korean SMS texts to extract person's names as well as location names which are key information in personal appointment management system. Our proposed system achieved 80.53% in F-measure in this domain, superior to those of the conventional ML approaches.

A Comparative Study on OCR using Super-Resolution for Small Fonts

  • Cho, Wooyeong;Kwon, Juwon;Kwon, Soonchu;Yoo, Jisang
    • International journal of advanced smart convergence
    • /
    • 제8권3호
    • /
    • pp.95-101
    • /
    • 2019
  • Recently, there have been many issues related to text recognition using Tesseract. One of these issues is that the text recognition accuracy is significantly lower for smaller fonts. Tesseract extracts text by creating an outline with direction in the image. By searching the Tesseract database, template matching with characters with similar feature points is used to select the character with the lowest error. Because of the poor text extraction, the recognition accuracy is lowerd. In this paper, we compared text recognition accuracy after applying various super-resolution methods to smaller text images and experimented with how the recognition accuracy varies for various image size. In order to recognize small Korean text images, we have used super-resolution algorithms based on deep learning models such as SRCNN, ESRCNN, DSRCNN, and DCSCN. The dataset for training and testing consisted of Korean-based scanned images. The images was resized from 0.5 times to 0.8 times with 12pt font size. The experiment was performed on x0.5 resized images, and the experimental result showed that DCSCN super-resolution is the most efficient method to reduce precision error rate by 7.8%, and reduce the recall error rate by 8.4%. The experimental results have demonstrated that the accuracy of text recognition for smaller Korean fonts can be improved by adding super-resolution methods to the OCR preprocessing module.

Classifications of Hadiths based on Supervised Learning Techniques

  • AbdElaal, Hammam M.;Bouallegue, Belgacem;Elshourbagy, Motasem;Matter, Safaa S.;AbdElghfar, Hany A.;Khattab, Mahmoud M.;Ahmed, Abdelmoty M.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권11호
    • /
    • pp.1-10
    • /
    • 2022
  • This study aims to build a model is capable of classifying the categories of hadith, according to the reliability of hadith' narrators (sahih, hassan, da'if, maudu) and according to what was attributed to the Prophet Muhammad (saying, doing, describing, reporting ) using the supervised learning algorithms, with a view to discover a relationship between these classifications, based on the outputs of this model, which might be useful to avoid the controversy and useless debate on automatic classifications of hadith, using some of the statistical methods such as chi-square, information gain and association rules. The experimental results showed that there is a relation between these classifications, most of Sahih hadiths are belong to saying class, and most of maudu hadiths are belong to reporting class. Also the best classifier had given high accuracy was MultinomialNB, it achieved higher accuracy reached up to 0.9708 %, for his ability to process high dimensional problems and identifying the most important features that are relevant to target data in training stage. Followed by LinearSVC classifier, reached up to 0.9655, and finally, KNeighborsClassifier reached up to 0.9644.

열화상 영상 데이터 기반 배전반 화재 발생 판별을 위한 딥러닝 모델 설계 (Design of a deep learning model to determine fire occurrence in distribution switchboard using thermal imaging data)

  • 박동준;김민영
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.737-745
    • /
    • 2023
  • 본 논문은 열화상 이미지를 활용하여 배전반 화재 발생을 감지하기 위한 인공지능 모델을 개발하는 연구에 대해 다룬다. 연구의 목표는 수집한 열화상 이미지를 전처리하여 객체 탐지 모델에 적합한 데이터로 가공하고, 이를 이용하여 배전반 내 화재 발생 여부를 판단하는 모델을 설계하는 것이다. 연구에서는 AI-HUB의 산업단지 내 학습용 열화상 이미지 데이터를 활용하였으며, CNN 기반 딥러닝 객체 검출 알고리즘 중 대표적인 모델인 Faster R-CNN과 RetinaNet을 사용하여 모델을 구축하고 두 개의 모델을 비교 분석하여 최적의 모델을 제안하고 있다.