• Title/Summary/Keyword: Neural-network

Search Result 11,709, Processing Time 0.038 seconds

Improved Deep Learning-based Approach for Spatial-Temporal Trajectory Planning via Predictive Modeling of Future Location

  • Zain Ul Abideen;Xiaodong Sun;Chao Sun;Hafiz Shafiq Ur Rehman Khalil
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1726-1748
    • /
    • 2024
  • Trajectory planning is vital for autonomous systems like robotics and UAVs, as it determines optimal, safe paths considering physical limitations, environmental factors, and agent interactions. Recent advancements in trajectory planning and future location prediction stem from rapid progress in machine learning and optimization algorithms. In this paper, we proposed a novel framework for Spatial-temporal transformer-based feed-forward neural networks (STTFFNs). From the traffic flow local area point of view, skip-gram model is trained on trajectory data to generate embeddings that capture the high-level features of different trajectories. These embeddings can then be used as input to a transformer-based trajectory planning model, which can generate trajectories for new objects based on the embeddings of similar trajectories in the training data. In the next step, distant regions, we embedded feedforward network is responsible for generating the distant trajectories by taking as input a set of features that represent the object's current state and historical data. One advantage of using feedforward networks for distant trajectory planning is their ability to capture long-term dependencies in the data. In the final step of forecasting for future locations, the encoder and decoder are crucial parts of the proposed technique. Spatial destinations are encoded utilizing location-based social networks(LBSN) based on visiting semantic locations. The model has been specially trained to forecast future locations using precise longitude and latitude values. Following rigorous testing on two real-world datasets, Porto and Manhattan, it was discovered that the model outperformed a prediction accuracy of 8.7% previous state-of-the-art methods.

Speech Emotion Recognition in People at High Risk of Dementia

  • Dongseon Kim;Bongwon Yi;Yugwon Won
    • 대한치매학회지
    • /
    • 제23권3호
    • /
    • pp.146-160
    • /
    • 2024
  • Background and Purpose: The emotions of people at various stages of dementia need to be effectively utilized for prevention, early intervention, and care planning. With technology available for understanding and addressing the emotional needs of people, this study aims to develop speech emotion recognition (SER) technology to classify emotions for people at high risk of dementia. Methods: Speech samples from people at high risk of dementia were categorized into distinct emotions via human auditory assessment, the outcomes of which were annotated for guided deep-learning method. The architecture incorporated convolutional neural network, long short-term memory, attention layers, and Wav2Vec2, a novel feature extractor to develop automated speech-emotion recognition. Results: Twenty-seven kinds of Emotions were found in the speech of the participants. These emotions were grouped into 6 detailed emotions: happiness, interest, sadness, frustration, anger, and neutrality, and further into 3 basic emotions: positive, negative, and neutral. To improve algorithmic performance, multiple learning approaches were applied using different data sources-voice and text-and varying the number of emotions. Ultimately, a 2-stage algorithm-initial text-based classification followed by voice-based analysis-achieved the highest accuracy, reaching 70%. Conclusions: The diverse emotions identified in this study were attributed to the characteristics of the participants and the method of data collection. The speech of people at high risk of dementia to companion robots also explains the relatively low performance of the SER algorithm. Accordingly, this study suggests the systematic and comprehensive construction of a dataset from people with dementia.

Multi-dimensional Contextual Conditions-driven Mutually Exclusive Learning for Explainable AI in Decision-Making

  • Hyun Jung Lee
    • 인터넷정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.7-21
    • /
    • 2024
  • There are various machine learning techniques such as Reinforcement Learning, Deep Learning, Neural Network Learning, and so on. In recent, Large Language Models (LLMs) are popularly used for Generative AI based on Reinforcement Learning. It makes decisions with the most optimal rewards through the fine tuning process in a particular situation. Unfortunately, LLMs can not provide any explanation for how they reach the goal because the training is based on learning of black-box AI. Reinforcement Learning as black-box AI is based on graph-evolving structure for deriving enhanced solution through adjustment by human feedback or reinforced data. In this research, for mutually exclusive decision-making, Mutually Exclusive Learning (MEL) is proposed to provide explanations of the chosen goals that are achieved by a decision on both ends with specified conditions. In MEL, decision-making process is based on the tree-based structure that can provide processes of pruning branches that are used as explanations of how to achieve the goals. The goal can be reached by trade-off among mutually exclusive alternatives according to the specific contextual conditions. Therefore, the tree-based structure is adopted to provide feasible solutions with the explanations based on the pruning branches. The sequence of pruning processes can be used to provide the explanations of the inferences and ways to reach the goals, as Explainable AI (XAI). The learning process is based on the pruning branches according to the multi-dimensional contextual conditions. To deep-dive the search, they are composed of time window to determine the temporal perspective, depth of phases for lookahead and decision criteria to prune branches. The goal depends on the policy of the pruning branches, which can be dynamically changed by configured situation with the specific multi-dimensional contextual conditions at a particular moment. The explanation is represented by the chosen episode among the decision alternatives according to configured situations. In this research, MEL adopts the tree-based learning model to provide explanation for the goal derived with specific conditions. Therefore, as an example of mutually exclusive problems, employment process is proposed to demonstrate the decision-making process of how to reach the goal and explanation by the pruning branches. Finally, further study is discussed to verify the effectiveness of MEL with experiments.

Classification of mandibular molar furcation involvement in periapical radiographs by deep learning

  • Katerina Vilkomir;Cody Phen;Fiondra Baldwin;Jared Cole;Nic Herndon;Wenjian Zhang
    • Imaging Science in Dentistry
    • /
    • 제54권3호
    • /
    • pp.257-263
    • /
    • 2024
  • Purpose: The purpose of this study was to classify mandibular molar furcation involvement (FI) in periapical radiographs using a deep learning algorithm. Materials and Methods: Full mouth series taken at East Carolina University School of Dental Medicine from 2011-2023 were screened. Diagnostic-quality mandibular premolar and molar periapical radiographs with healthy or FI mandibular molars were included. The radiographs were cropped into individual molar images, annotated as "healthy" or "FI," and divided into training, validation, and testing datasets. The images were preprocessed by PyTorch transformations. ResNet-18, a convolutional neural network model, was refined using the PyTorch deep learning framework for the specific imaging classification task. CrossEntropyLoss and the AdamW optimizer were employed for loss function training and optimizing the learning rate, respectively. The images were loaded by PyTorch DataLoader for efficiency. The performance of ResNet-18 algorithm was evaluated with multiple metrics, including training and validation losses, confusion matrix, accuracy, sensitivity, specificity, the receiver operating characteristic (ROC) curve, and the area under the ROC curve. Results: After adequate training, ResNet-18 classified healthy vs. FI molars in the testing set with an accuracy of 96.47%, indicating its suitability for image classification. Conclusion: The deep learning algorithm developed in this study was shown to be promising for classifying mandibular molar FI. It could serve as a valuable supplemental tool for detecting and managing periodontal diseases.

DTW 거리 기반 kNN을 활용한 시계열 데이터 정보 추출 및 회귀 예측 (Exploring Time Series Data Information Extraction and Regression using DTW based kNN)

  • 양현준;임채국;정우혁;우지환
    • 경영정보학연구
    • /
    • 제26권2호
    • /
    • pp.83-93
    • /
    • 2024
  • 본 연구는 도금욕 공정의 완성도 예측을 위한 시계열 데이터의 효과적인 표현을 목표로, Dynamic Time Warping(DTW) 및 k-Nearest Neighbors(kNN) 기반의 전처리 방법론을 제안한다. 제안된 DTW 기반 kNN 전처리 방법을 다양한 회귀 모델에 적용하여 비교한 결과, 기존 결정 나무(Decision tree) 대비 최대 RMSE에서 43%과 MAE에서 24% 개선된 성능 향상을 보였으며, 신경망 구조를 갖는 회귀 모델과 결합했을 때 성능 향상이 두드러졌다. 본 논문에서 제안하는 전처리 방법과 회귀 모델을 결합한 구조는 길이가 긴 시계열 데이터와 제한된 데이터 샘플이 있는 상황에서 적합할 것으로 사료되며, 데이터가 부족한 상황에서도 과적합의 위험을 감소시키며, 합리적인 예측을 가능하게 함을 시사한다. 그러나 DTW 및 kNN 알고리즘은 데이터 샘플이 많아질수록 연산량이 늘어난다는 한계가 존재하며, 향후 연구를 통해 이러한 계산 효율성의 문제를 개선할 수 있는 연구가 필요할 것으로 보인다.

Enhancing mechanical performance of steel-tube-encased HSC composite walls: Experimental investigation and analytical modeling

  • ZY Chen;Ruei-Yuan Wang;Yahui Meng;Huakun Wu;Lai B;Timothy Chen
    • Steel and Composite Structures
    • /
    • 제52권6호
    • /
    • pp.647-656
    • /
    • 2024
  • This paper discusses the study of concrete composite walls of algorithmic modeling, in which steel tubes are embedded. The load-bearing capacity of STHC composite walls increases with the increase of axial load coefficient, but its ductility decreases. The load-bearing capacity can be improved by increasing the strength of the steel pipes; however, the elasticity of STHC composite walls was found to be slightly reduced. As the shear stress coefficient increases, the load-bearing capacity of STHC composite walls decreases significantly, while the deformation resistance increases. By analyzing actual cases, we demonstrate the effectiveness of the research results in real situations and enhance the persuasiveness of the conclusions. The research results can provide a basis for future research, inspire more explorations on seismic design and construction, and further advance the development of this field. Emphasize the importance of research results, promote interdisciplinary cooperation in the fields of structural engineering, earthquake engineering, and materials science, and improve overall seismic resistance. The emphasis on these aspects will help highlight the practical impact of the research results, further strengthen the conclusions, and promote progress in the design and construction of earthquake-resistant structures. The goals of this work are access to adequate, safe and affordable housing and basic services, promotion of inclusive and sustainable urbanization and participation, implementation of sustainable and disaster-resilient architecture, sustainable planning and management of human settlements. Simulation results of linear and nonlinear structures show that this method can detect structural parameters and their changes due to damage and unknown disturbances. Therefore, it is believed that with the further development of fuzzy neural network artificial intelligence theory, this goal will be achieved in the near future.

이미지의 인지적 특징 정량화를 통한 CNN-ViT 하이브리드 미학 평가 모델 (CNN-ViT Hybrid Aesthetic Evaluation Model Based on Quantification of Cognitive Features in Images)

  • 김수은;임준식
    • 전기전자학회논문지
    • /
    • 제28권3호
    • /
    • pp.352-359
    • /
    • 2024
  • 본 논문에서는 이미지의 지역적 및 전역적 특징을 결합하여 이미지의 미학적 품질을 자동으로 평가할 수 있는 CNN-ViT 하이브리드 모델을 제안한다. 이 접근 방식에서는 CNN을 사용하여 색상 및 객체 배치와 같은 지역적 특징을 추출하고, ViT를 통해 전역적 특징을 반영하여 이미지의 미학적 가치를 분석한다. Color composition은 입력 이미지에서 주요 색상을 추출해 생성한 컬러 팔레트를 CNN에 통과시켜 얻은 값이며, Rule of Third는 이미지 속 오브젝트가 삼등분할점에 얼마나 근접한지를 정량적으로 평가한 점수로 사용된다. 이러한 값들은 모델에 이미지의 주요 평가 요소인 색채와 공간 균형에 대한 정보를 제공한다. 모델은 이를 바탕으로 이미지의 점수와 색상, 공간의 균형 간에 연관성을 분석하며, 인간의 평가 분포와 유사한 점수를 추측하도록 설계되었다. 실험 결과, AADB 이미지 데이터베이스에서 스피어만순위상관계수(SRCC)에서는 0.716을 기록하여 순위 예측에서 더 일관된 결과를 제공 했으며, 피어슨상관계수(LCC)에서도 0.72을 기록하여 기존 연구 모델보다 2~4% 정도 향상된 결과를 보였다.

뉴로퍼지방식 광유도식 무인반송차의 경로추종 제어 (A Path-Tracking Control of Optically Guided AGV Using Neurofuzzy Approach)

  • 임일선;허욱열
    • 제어로봇시스템학회논문지
    • /
    • 제7권9호
    • /
    • pp.723-732
    • /
    • 2001
  • 경로 추적의 성능을 향상시키기 위해서 이 논문에서는 광유도식 무인방송차(AGV)의 뉴로퍼지 컨트롤러를 제안한다. 2바퀴 각각 조향 기능이 있는 AGV의 전방과 후방에 센서들이 장작되어 있으며, 그 센서들의 정보를 이용하여 AGV의 경로를 유도하게 된다. 측정된 광센서가 연속적인 데이터가 아니기 때문에 광유도식 AGV 는 쉽게 경로를 이탈하게 되고 경로 추적 성능은 떨어지게 된다. 광센서의정보들은 on/off 신호에 의해 발생되므로 비연속적으로 얻어지게 되고, 동적 오착가 측정되어진다. 센서에 의해 정보를 얻은 후 동적 오차는 좌우측 바퀴의 각 속도를 이용한 데드 레코닝(Dead Reckoning) 방법에 의해 연속적으로 계산되어진다. 여기서, 추정 윤곽 오차는 측정 윤관오차를 윤곽오차의증북(Variation)의 합의로 정의된다. 뉴로퍼지 시스템은 퍼지 제어기와 신경회로망으로 이루어졌다. 추정 윤곽 오차를 줄이기 위해 역전파 (Back-Propagation) 학습에 의해 퍼지 맴버쉽 함수의 계수들은 적응적으로 조정된다. 제안된 기존의 퍼지 제어기와 비교분석된다. 성능 분석을 위해 제안된 제어 이론은 모의 실험에 의해 검증된다.

  • PDF

NARX 신경망 최적화를 통한 주가 예측 및 영향 요인에 관한 연구 (A Study on the stock price prediction and influence factors through NARX neural network optimization)

  • 전민종;이욱
    • 한국산학기술학회논문지
    • /
    • 제21권8호
    • /
    • pp.572-578
    • /
    • 2020
  • 주식 시장은 기업 실적 및 경기 상황뿐만 아니라 정치, 사회, 자연재해 등 예기치 못한 요소들에 영향을 받는다. 이런 요소들을 고려한 정확한 예측을 위해서 다양한 기법들이 사용된다. 최근 인공지능 기술이 화두가 되면서 이를 활용한 주가 예측 시도 또한 이루어지고 있다. 본 논문은 단순히 주식 관련 데이터뿐만 아닌, 거시 경제적 지표 등을 활용한 여러 종류의 데이터를 이용하여 주가에 영향을 미치는 요소에 관한 연구를 제안한다. KOSDAQ을 대상으로 1년 치 종가, 외국인 비율, 금리, 환율 데이터를 다양하게 조합한 후에 딥러닝의 Nonlinear AutoRegressive with eXternal input (NARX) 모델을 활용한다. 이 모델을 통해 1달 치 데이터를 생성하고 각 데이터 조합을 통해 만들어진 예측값을 RMSE를 통해 실제값과 비교, 분석한다. 또한, 은닉층에서 뉴런의 수, 지연 시간을 다양하게 설정하여 RMSE를 비교한다. 분석 결과 뉴런은 10개, 지연 시간은 2로 설정하고, 데이터는 미국, 중국, 유럽, 일본 환율의 조합을 사용할 때 RMSE 0.08을 보이며 가장 낮은 오차를 기록하였다. 본 연구는 환율이 주식에 가장 영향을 많이 미친다는 점과 종가 데이터만 사용했을 때의 RMSE 값인 0.589에서 오차를 낮췄다는 점에 의의가 있다.

머신러닝을 사용한 탄성파 자료 보간법 기술 연구 동향 분석 (Research Trend analysis for Seismic Data Interpolation Methods using Machine Learning)

  • 배우람;권예지;하완수
    • 지구물리와물리탐사
    • /
    • 제23권3호
    • /
    • pp.192-207
    • /
    • 2020
  • 탄성파 탐사를 수행할 때 경제적, 환경적 제약 또는 탐사 장비의 문제 등에 의해 탄성파 자료의 일부가 규칙적 또는 불규칙적으로 손실되는 경우가 발생하게 된다. 이러한 자료 손실은 탄성파 자료 처리와 해석 결과에 부정적인 영향을 주기 때문에 사라진 탄성파 자료를 복원할 필요가 있다. 탄성파 자료 복원을 위해 재탐사 또는 추가적인 탐사를 진행하는 경우 시간적, 경제적 비용이 발생하기 때문에, 많은 연구자들이 사라진 탄성파 자료를 정확히 복원하기 위한 보간 기법 연구를 진행해왔다. 최근에는 머신러닝 기술 발달에 따라 머신러닝 기법을 활용한 연구들이 진행되고 있고, 다양한 머신러닝 기술들 중에서도 서포트 벡터 회귀, 오토인코더, 유넷, 잔차넷, 생성적 적대 신경망 등의 알고리즘을 활용한 탄성파 자료의 보간 연구가 활발하게 진행되고 있다. 이 논문에서는 이러한 연구들을 조사하고 분석하여 복잡한 신경망 모델뿐 아니라 상대적으로 구조가 간단한 서포트 벡터 회귀 모델을 통해서도 뛰어난 보간 결과를 얻을 수 있다는 것을 확인했다. 추후 머신러닝 기법들을 사용하는 탄성파 자료 보간 연구들에서 오픈소스로 공개된 실제 자료를 이용하며 데이터 증식, 전이학습, 기존 기법을 이용한 규제 등의 기술을 활용하면 탄성파 자료 보간 성능을 향상시킬 수 있을 것으로 기대된다.