• 제목/요약/키워드: language models

검색결과 858건 처리시간 0.036초

The Korean Repeatable Battery for the Assessment of Neuropsychological Status-Update : Psychiatric and Neurosurgery Patient Sample Validity

  • Park, Jong-Ok;Koo, Bon-Hoon;Kim, Ji-Yean;Bai, Dai-Seg;Chang, Mun-Seon;Kim, Oh-Lyong
    • Journal of Korean Neurosurgical Society
    • /
    • 제64권1호
    • /
    • pp.125-135
    • /
    • 2021
  • Objective : This study aimed to validate the Korean version of the Repeatable Battery for the Assessment of Neuropsychological Status Update (K-RBANS). Methods : We performed a retrospective analysis of 283 psychiatric and neurosurgery patients. To investigate the convergent validity of the K-RBANS, correlation analyses were performed for other intelligence and neuropsychological test results. Confirmatory factor analysis was used to test a series of alternative plausible models of the K-RBANS. To analyze the various capabilities of the K-RBANS, we compared the area under the receiver operating characteristic (ROC) curves (AUC). Results : Significant correlations were observed, confirming the convergent validity of the K-RBANS among the Total Scale Index (TSI) and indices of the K-RBANS and indices of intelligence (r=0.47-0.81; p<0.001) and other neuropsychological tests at moderate and above significance (r=0.41-0.63; p<0.001). Additionally, the results testing the construct validity of the K-RBANS showed that the second-order factor structure model (model 2, similar to an original factor structure of RBANS), which includes a first-order factor comprising five index scores (immediate memory, visuospatial capacity, language, attention, delayed memory) and one higher-order factor (TSI), was statistically acceptable. The comparative fit index (CFI) (CFI, 0.949) values and the goodness of fit index (GFI) (GFI, 0.942) values higher than 0.90 indicated an excellent fit. The root mean squared error of approximation (RMSEA) (RMSEA, 0.082) was considered an acceptable fit. Additionally, the factor structure of model 2 was found to be better and more valid than the other model in χ2 values (Δχ2=7.69, p<0.05). In the ROC analysis, the AUCs of the TSI and five indices were 0.716-0.837, and the AUC of TSI (AUC, 0.837; 95% confidence interval, 0.760-0.896) was higher than the AUCs of the other indices. The sensitivity and specificity of TSI were 77.66% and 78.12%, respectively. Conclusion : The overall results of this study suggest that the K-RBANS may be used as a valid tool for the brief screening of neuropsychological patients in Korea.

소변 중 메트암페타민, 암페타민 및 대마 대사체 LC-MS/MS 정량분석에서 검량선 작성을 위한 R을 활용한 회귀모델 선택 (Regression model for the preparation of calibration curve in the quantitative LC-MS/MS analysis of urinary methamphetamine, amphetamine and 11-nor-Δ9-tetrahydrocannabinol-9-carboxylic acid using R)

  • 김진영;신동원
    • 분석과학
    • /
    • 제34권6호
    • /
    • pp.241-250
    • /
    • 2021
  • 검량선 작성은 기기분석을 통해 생체시료에서 분석물질의 농도를 측정하는 정량분석법 개발과 측정값의 정확도 향상에 있어서 필수적인 요소이다. 본 연구에서는 R 기반 통계분석기법을 이용하여 개별 분석물질 정량에 적합한 가중계수와 회귀모델 선정하기 위한 단계별 선택 기준을 적용하여 분석 프로그램을 설정하였다. 국내에서 남용빈도가 가장 높은 필로폰과 대마 복용여부 확인을 위해 액체크로마토그래피-질량분석법(LC-MS/MS)이 적용되었으며, 분석물질로 마약의 복용 여부를 확인에 일반적으로 사용되는 대상 마약의 모체와 대사체를 소변 시료에서 분석하였다. 검량선 작성에 있어서 가중계수 적용여부는 원본데이터의 이분산성 검정을 통해 확인하였고, 가중계수가 필요하다고 판단된 경우 분산분석을 통해 적정 가중계수를 선정하였다. 다음으로 편분산분석을 이용하여 회귀모델에 적합한 차수를 결정하였다. 분석물질인 메트암페타민, 암페타민, 대마 대사체에 대해 R 기반 프로그램에 적용한 결과, 단계별 결과 및 최종 모델식을 직관적으로 이해하기 쉽고 신속하게 얻을 수 있었다. 이러한 결과는 문서 파일로 저장이 가능하여 보관의 편의성을 제고하였으며, 본 연구를 통해 제작된 R 기반 프로그램을 활용하여 검량선 작성을 필요로 하는 다양한 약물분석 분야에 확대 적용할 수 있을 것으로 판단된다.

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

Water Level Prediction on the Golok River Utilizing Machine Learning Technique to Evaluate Flood Situations

  • Pheeranat Dornpunya;Watanasak Supaking;Hanisah Musor;Oom Thaisawasdi;Wasukree Sae-tia;Theethut Khwankeerati;Watcharaporn Soyjumpa
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.31-31
    • /
    • 2023
  • During December 2022, the northeast monsoon, which dominates the south and the Gulf of Thailand, had significant rainfall that impacted the lower southern region, causing flash floods, landslides, blustery winds, and the river exceeding its bank. The Golok River, located in Narathiwat, divides the border between Thailand and Malaysia was also affected by rainfall. In flood management, instruments for measuring precipitation and water level have become important for assessing and forecasting the trend of situations and areas of risk. However, such regions are international borders, so the installed measuring telemetry system cannot measure the rainfall and water level of the entire area. This study aims to predict 72 hours of water level and evaluate the situation as information to support the government in making water management decisions, publicizing them to relevant agencies, and warning citizens during crisis events. This research is applied to machine learning (ML) for water level prediction of the Golok River, Lan Tu Bridge area, Sungai Golok Subdistrict, Su-ngai Golok District, Narathiwat Province, which is one of the major monitored rivers. The eXtreme Gradient Boosting (XGBoost) algorithm, a tree-based ensemble machine learning algorithm, was exploited to predict hourly water levels through the R programming language. Model training and testing were carried out utilizing observed hourly rainfall from the STH010 station and hourly water level data from the X.119A station between 2020 and 2022 as main prediction inputs. Furthermore, this model applies hourly spatial rainfall forecasting data from Weather Research and Forecasting and Regional Ocean Model System models (WRF-ROMs) provided by Hydro-Informatics Institute (HII) as input, allowing the model to predict the hourly water level in the Golok River. The evaluation of the predicted performances using the statistical performance metrics, delivering an R-square of 0.96 can validate the results as robust forecasting outcomes. The result shows that the predicted water level at the X.119A telemetry station (Golok River) is in a steady decline, which relates to the input data of predicted 72-hour rainfall from WRF-ROMs having decreased. In short, the relationship between input and result can be used to evaluate flood situations. Here, the data is contributed to the Operational support to the Special Water Resources Management Operation Center in Southern Thailand for flood preparedness and response to make intelligent decisions on water management during crisis occurrences, as well as to be prepared and prevent loss and harm to citizens.

  • PDF

모델기반 통합 개발 플랫폼을 이용한 다기능 레이다 소프트웨어 개발의 타당성 연구 (A Feasibility Study on the Development of Multifunctional Radar Software using a Model-Based Development Platform)

  • 김승련;윤덕근;오선진;이의혁;민사원;오현수 ;김은희
    • 한국시뮬레이션학회논문지
    • /
    • 제32권3호
    • /
    • pp.23-31
    • /
    • 2023
  • 소프트웨어 개발에는 시스템 엔지니어링 프로세스와 유사한 요구 사항 분석, 설계, 구현, 단위 테스트 및 통합 테스트를 포함한 일련의 단계가 포함된다. 본 연구는 다기능 레이다 소프트웨어를 개발하기 위해 MathWorks사의 모델 기반 설계 플랫폼을 활용하고 타당성과 효율성을 평가하였다. 기존 레이다 소프트웨어의 개발은 통합적인 형태보다는 단일 알고리즘 단위로 이루어졌기 때문에, 요구 분석이나 통합 테스트가 별도로 이루어졌고, 이들에 대한 통합 관리를 위해 추가적인 도구나 노력을 요구하였다. 본 논문에서 적용한 모델 기반 플랫폼은 요구사항 분석 및 할당, 시뮬레이션을 통한 알고리즘 개발, 배포를 위한 자동 코드 생성, 통합 요구사항 테스트 및 결과 관리를 위한 통합 개발 환경을 제공한다. 이 플랫폼을 통해 다기능 레이다 소프트웨어의 다단계 모델을 개발하고, 테스트 하네스를 사용하여 검증하며, 요구 사항을 관리하고, 자동 코드 생성툴을 사용하여 하드웨어 배포 가능한 언어로 변환하는 전과정을 수행하였다. 이러한 모델 기반 통합 개발을 통해 잘못된 의사소통이나 기타 인적 요인으로 인한 오류를 줄이고 개발 일정과 비용을 절감할 수 있을 것으로 기대한다.

A Study on Deep Learning Model for Discrimination of Illegal Financial Advertisements on the Internet

  • Kil-Sang Yoo; Jin-Hee Jang;Seong-Ju Kim;Kwang-Yong Gim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.21-30
    • /
    • 2023
  • 인터넷 불법금융광고는 인터넷 카페, 블로그 등을 통해 통장매매, 신용카드·휴대폰결제현금화 및 개인신용정보매매 등 불법금융행위를 목적으로 한다. 금융감독당국의 노력에도 불구하고 불법금융행위는 줄어들지 않고 있다. 본 연구는 인터넷 불법금융광고 게시글에 파이썬 딥러닝 기반 텍스트 분류기법을 적용해 불법여부를 탐지하는 모델을 제안한다. 텍스트 분류기법으로 주로 사용되는 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit)을 활용한다. 그동안 수작업으로 심사한 불법확인 결과를 기초 데이터로 이용한다. 한국어 자연어처리와 딥러닝 모델의 하이퍼파라미터 조절을 통해 최적의 성능을 보이는 모델을 완성하였다. 본 연구는 그동안 이뤄지지 않았던 인터넷 불법금융광고 판별을 위한 딥러닝 모델을 제시하였다는데 큰 의미가 있다. 또한 딥러닝 모델에서 91.3~93.4% 수준의 정확도를 보임으로써 불법금융광고 탐지에 딥러닝 모델을 실제 적용하여 불법금융광고 근절에 기여할 수 있기를 기대해 본다.

집속초음파 치료의 한의 임상 활용에 대한 고찰 (Clinical Application of Focused Ultrasound in Korean Medicine)

  • 최유민;이마음;허나연;이은희;최혁용;서형식;황의형;장인수
    • Korean Journal of Acupuncture
    • /
    • 제40권3호
    • /
    • pp.79-89
    • /
    • 2023
  • Objectives : The purpose of this study is to investigate various application methods of focused ultrasound and apply them to clinical use in Korean medicine. Methods : Search was performed using the search engines of electronic databases, including PubMed, ScienceDirect, Cumulative Index to Nursing and Allied Health Literature (CINAHL), ScienceON, Oriental Medicine Advanced Searching Integrated System (OASIS), China National Knowledge Infrastructure (CNKI), Wanfang Data, Japan Science Technology Information Aggregator, Electronic (J-STAGE) and Citation Information by NII (CiNii), from inception to July 2023 without language limitation. Inclusion criteria were clinical studies including randomized controlled trials (RCTs), and animal experimental studies related with focused ultrasound treatments for acupoints or meridian sinews. Results : Total 17 papers, 7 for RCT, 6 for in vivo animal studies, and other experimental studies, were finally selected. Indications used in studies were shoulder pain, back pain, chronic back pain, and degenerative knee arthritis. In experimental studies, studies on animal models of hypoxic ischemic brain damage and hyperlipidemia were also conducted. As for the acupoints, LR3, LI4, and ST36 were used in clinical studies and, in animal experimental studies, GV20, KI1, and ST36 were used. As for the dose, 4 studies below 3 W/cm2 and 3 studies in the range of 0.625 to 5 W/cm2 in clinical studies, and all studies did not exceed 5 W/cm2. In animal experimental studies, 0.5 W/cm2, 2 W/cm2, 7.5 WW/cm2, 15 W/cm2, 10~20 W/cm2 were used. In all three studies describing the penetration depth during irradiation, it was less than 1 cm. Conclusions : We suggest that focused ultrasound is an appropriate treatment tool for stimulating the acupoints to transfer heat energy. Future studies with rigorous and well-designed RCTs for various diseases will be required to ascertain the focused ultrasound stimulate acupoints or meridian sinews.

Reddit 소셜미디어를 활용한 ChatGPT에 대한 사용자의 감정 및 요구 분석 (Analysis of Users' Sentiments and Needs for ChatGPT through Social Media on Reddit)

  • 나혜인;이병희
    • 인터넷정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.79-92
    • /
    • 2024
  • ChatGPT는 생성형 인공지능(Generative AI) 기술을 활용한 대표적인 챗봇으로서 과학기술 영역뿐만 아니라 사회, 경제, 산업, 문화 등 당양한 분야에서 유용하게 활용되고 있다. 본 연구는 글로벌 소셜미디어 레딧(Reddit)을 활용해 ChatGPT에 대한 사용자의 감정과 요구에 대한 탐색적인 분석을 수행한다. 이를 위해, 2022년 12월부터 2023년 8월까지의 댓글 10,796건을 수집하여 키워드 분석, 감성 분석, 니드마이닝(Needmining) 기반 토픽모델링을 실시하였다. 분석 결과, ChatGPT에 대한 댓글에서 출현 빈도가 가장 높은 단어는 "time"으로 답변의 신속성, 시간 효율성, 생산성 향상을 강조한 것으로 나타났다. 사용자들은 ChatGPT에 대해 신뢰와 기대의 감정과 동시에 사회적 영향에 대한 두려움과 분노의 감정을 표현하였다. 또한, 토픽모델링 분석을 통해 잠재적 니즈(Needs)를 포함한 14개의 주제를 도출하였고, 사용자들이 특히 ChatGPT에 대한 교육적 활용과 사회적 영향에 많은 관심을 보였다. 또한, ChatGPT와 관련된 언어모델, 직업, 정보, 의료, 서비스, 게임, 규제, 에너지, 윤리적 문제 등 다양한 주제들이 논의된 것을 알 수 있었다. 분석 결과를 바탕으로 사용자들의 요구를 반영하여 향후 실행계획의 방향을 제시하였다. 본 연구는 향후 ChatGPT를 이용하여 제품과 서비스를 개선하고, 새로운 서비스 플랫폼 기획 단계에서 유용한 정보를 제공할 것으로 기대된다.

Performance of ChatGPT on the Korean National Examination for Dental Hygienists

  • Soo-Myoung Bae;Hye-Rim Jeon;Gyoung-Nam Kim;Seon-Hui Kwak;Hyo-Jin Lee
    • 치위생과학회지
    • /
    • 제24권1호
    • /
    • pp.62-70
    • /
    • 2024
  • Background: This study aimed to evaluate ChatGPT's performance accuracy in responding to questions from the national dental hygienist examination. Moreover, through an analysis of ChatGPT's incorrect responses, this research intended to pinpoint the predominant types of errors. Methods: To evaluate ChatGPT-3.5's performance according to the type of national examination questions, the researchers classified 200 questions of the 49th National Dental Hygienist Examination into recall, interpretation, and solving type questions. The researchers strategically modified the questions to counteract potential misunderstandings from implied meanings or technical terminology in Korea. To assess ChatGPT-3.5's problem-solving capabilities in applying previously acquired knowledge, the questions were first converted to subjective type. If ChatGPT-3.5 generated an incorrect response, an original multiple-choice framework was provided again. Two hundred questions were input into ChatGPT-3.5 and the generated responses were analyzed. After using ChatGPT, the accuracy of each response was evaluated by researchers according to the types of questions, and the types of incorrect responses were categorized (logical, information, and statistical errors). Finally, hallucination was evaluated when ChatGPT provided misleading information by answering something that was not true as if it were true. Results: ChatGPT's responses to the national examination were 45.5% accurate. Accuracy by question type was 60.3% for recall and 13.0% for problem-solving type questions. The accuracy rate for the subjective solving questions was 13.0%, while the accuracy for the objective questions increased to 43.5%. The most common types of incorrect responses were logical errors 65.1% of all. Of the total 102 incorrectly answered questions, 100 were categorized as hallucinations. Conclusion: ChatGPT-3.5 was found to be limited in its ability to provide evidence-based correct responses to the Korean national dental hygiene examination. Therefore, dental hygienists in the education or clinical fields should be careful to use artificial intelligence-generated materials with a critical view.

프롬프트 엔지니어링을 통한 GPT-4 모델의 수학 서술형 평가 자동 채점 탐색: 순열과 조합을 중심으로 (Exploring automatic scoring of mathematical descriptive assessment using prompt engineering with the GPT-4 model: Focused on permutations and combinations)

  • 신병철;이준수;유연주
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권2호
    • /
    • pp.187-207
    • /
    • 2024
  • 본 연구에서는 GPT-4 기반의 ChatGPT를 활용한 서술형 평가 문항의 자동 채점 가능성을 탐색하기 위해 교사와 GPT-4 기반의 ChatGPT의 채점 결과를 비교, 분석하였다. 이를 위해 학생평가지원포털에 있는 고등학교 1학년 순열과 조합 단원에서 3개의 서술형 문항을 선정하였다. 문항 1, 2는 문제 해결 전략이 1가지인 문항이고, 문항 3은 문제 해결 전략이 2가지 이상인 문항이었다. 8년 이상의 교육 경력이 있는 교사 2명이 학생 204명의 답안을 채점하고, GPT-4 기반의 ChatGPT의 채점 결과와 비교하였다. 문항별로 Few-Shot-CoT, SC, 구조화, 반복 프롬프트 기법 등을 활용하여 채점을 위한 프롬프트를 구성하였고, 이를 GPT-4 기반의 ChatGPT에 입력하여 채점하였다. 채점 결과, 문항 1, 2는 교사의 채점 결과와 GPT-4의 채점 결과 사이에 강한 상관관계를 충족하였다. 문제 해결 전략이 2가지인 문항 3은 먼저 채점 전 학생 답안을 문제 해결전략별로 분류하는 프롬프트를 GPT-4 기반의 ChatGPT에 입력하여 답안을 분류하였다. 이후 유형별로 채점 프롬프트를 적용하여 GPT-4 기반의 ChatGPT에 입력하여 채점하였고, 채점 결과 역시 교사의 채점 결과와 강한 상관관계가 나타났다. 이를 통해 프롬프트 엔지니어링을 활용한 GPT-4 모델이 교사의 채점을 보조할 수 있는 가능성을 확인하였으며 본 연구의 한계점 및 향후 연구 방향을 제시하였다.