• 제목/요약/키워드: 평가 데이터셋

검색결과 483건 처리시간 0.031초

주파수 영역을 활용한 GAN (GAN using Frequency Domain)

  • 이채은;정성훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.567-569
    • /
    • 2023
  • GAN은 이미지 생성모델로서 이미지 공간에서 좋은 결과를 보여왔다. 우리는 이러한 GAN의 능력을 더욱 향상하기 위하여 본 연구에서 주파수 영역에서 이미지를 학습하고 생성하는 새로운 방법을 제안한다. 이를 위하여 먼저 학습데이터를 2D FFT로 주파수 영역으로 변환한 후 변환된 학습데이터를 GAN이 학습하게 한다. 학습 후에 GAN은 새로운 이미지를 생성하며 생성된 이미지를 2D IFFT하여 이미지 공간으로 변환한다. 이렇게 주파수 영역에서 이미지를 생성하는 방법은 이미지 공간에서 생성하는 방법보다 다양한 장점이 있다. 생성된 이미지의 품질을 평가하기 위하여 4개 데이터 셋에 4개의 평가지표를 사용하여 평가한 결과 주파수 영역에서 생성한 이미지가 IS, P&R, D&C 측면에서 더 좋은 것으로 평가되었다.

실시간 멀티미디어 데이터베이스 환경을 위한 효율적인 버퍼교체 기법 설계 및 구현 (Design and Implementation of an Efficient Buffer Replacement Method for Real-time Multimedia Databases Environments)

  • 신재룡;피준일;유재수;조기형
    • 한국멀티미디어학회논문지
    • /
    • 제5권4호
    • /
    • pp.372-385
    • /
    • 2002
  • 본 논문에서는 실시간 멀티미디어 데이터를 위한 효율적인 버퍼 교체 기법을 제안한다. 제안하는 기법은 실시간 특성을 고려하기 위해 다단계의 우선순위 레벨을 갖는다. 각 우선순위 레벨은 처음 참조된 데이터를 위한 콜드 셋(cold set)과 재 참조된 데이터를 위한 핫 셋(hot set)으로 구분된다. 희생 데이터 선정 작업은 버퍼 할당을 요구하는 트랜잭션의 우선순위 레벨보다 낮은 레벨만을 대상으로 콜드 셋의 최하위 레벨부터 핫 셋의 최상위 레벨까지 순차적으로 수행된다. 콜드 셋의 각 레벨에서는 가장 큰 미디어부터 교체 대상으로 선정하고, 핫 셋의 각 레벨에서는 가장 긴 참조 간격을 갖는 미디어부터 선정한다. 이로 인해 한정된 버퍼 공간에 많은 수의 인기 있는 미디어를 오랫동안 유지시킬 수 있으므로 버퍼 히트 비율이 증가되고, 많은 수의 서비스 요청을 처리할 수 있게 되어 전체적인 시스템 성능은 향상된다. 제안하는 기법에 대한 성능 평가에서는 Priority-Hints 기법을 대상으로 버퍼 히트 비율 및 트랜잭션의 마감시간 초과 비율을 비교한다. 이를 통해 기존의 기법들보다 제안하는 기법의 성능이 뛰어남을 보인다.

  • PDF

메타 가중치 학습을 활용한 내용 기반의 맞춤형 영화 추천시스템 설계 및 구현 (Design and Implementation of Contents-based Customized movie recommendation system using meta weight learning)

  • 안현우;유해운;김대열
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.587-590
    • /
    • 2020
  • 최근, 디지털 콘텐츠 산업이 폭발적으로 성장됨에 따라 고객 유치를 위한 개인화 추천 기술들이 많은 주목을 받고 있다. 개인화 추천 방식들을 큰 갈래로 나누어 본다면 협업 필터링 기술과 내용 기반 기술로 나눌 수 있다. 협업 필터링의 경우 개인화 추천에는 적합하지만 사용자 평가 데이터의 양이 방대해야 하며 초기에 평가자가 없는 콘텐츠에 대해 추천할 수 없는 초기 평가자 문제가 존재한다. 따라서 매일 방대한 양의 콘텐츠가 편입되는 분야에서 사용하기에 큰 결점이 될 수 있다. 본 논문에서는 영화들의 정보가 담긴 데이터 셋과 사용자 평가 데이터, 그리고 사용자의 선호 기준을 의미하는 메타 가중치를 활용한 내용 기반의 맞춤형 영화 추천 시스템을 제안한다. 논문에서는 먼저, 영화를 고를 때 일반적으로 중요시 보는 속성들을 활용하여 영화의 특징 벡터를 구성하고, 이를 사용자 평가와 결합하여 개인의 선호에 대한 특징 벡터를 구성하는 방법을 제안하며, 구성된 데이터와 코사인 유사도, 메타 가중치를 활용하여 사용자 선호와 유사한 영화들을 도출하는 방법을 제안한다. 또한, 평가데이터를 활용하여 구현된 추천시스템의 검증 프로세스를 구성하고, 검증 프로세스를 활용한 손실 함수를 설계하여 적합한 메타 가중치를 학습하는 방법을 제시한다. 본 논문에서 제안하는 시스템은 다수의 속성을 조합하여 활용하므로 추천 결과가 과도하게 특수화 되지 않을 수 있으며, 메타 가중치라는 요소를 통해 더욱 개인화 된 추천을 제공할 수 있다.

  • PDF

자연어 처리 모델을 활용한 블록 코드 생성 및 추천 모델 개발 (Development of Block-based Code Generation and Recommendation Model Using Natural Language Processing Model)

  • 전인성;송기상
    • 정보교육학회논문지
    • /
    • 제26권3호
    • /
    • pp.197-207
    • /
    • 2022
  • 본 논문에서는 코딩 학습 중 학습자의 인지 부하 감소를 목적으로 자연어 처리 모델을 이용하여 전이학습 및 미세조정을 통해 블록 프로그래밍 환경에서 이미 이루어진 학습자의 블록을 학습하여 학습자에게 다음 단계에서 선택 가능한 블록을 생성하고 추천해 주는 머신러닝 기반 블록 코드 생성 및 추천 모델을 개발하였다. 모델 개발을 위해 훈련용 데이터셋은 블록 프로그래밍 언어인 '엔트리' 사이트의 인기 프로젝트 50개의 블록 코드를 전처리하여 제작하였으며, 훈련 데이터셋과 검증 데이터셋 및 테스트 데이터셋으로 나누어 LSTM, Seq2Seq, GPT-2 모델을 기반으로 블록 코드를 생성하는 모델을 개발하였다. 개발된 모델의 성능 평가 결과, GPT-2가 LSTM과 Seq2Seq 모델보다 문장의 유사도를 측정하는 BLEU와 ROUGE 지표에서 더 높은 성능을 보였다. GPT-2 모델을 통해 실제 생성된 데이터를 확인한 결과 블록의 개수가 1개 또는 17개인 경우를 제외하면 BLEU와 ROUGE 점수에서 비교적 유사한 성능을 내는 것을 알 수 있었다.

조현병 환자의 재원일수 결정요인 : 건강보험 입원환자데이터셋 자료를 이용하여 (The Determinants of the Length of Stay in Hospital for Schizophrenic Patients: Using from the Health Insurance Claim Data of Inpatients)

  • 전윤희;정미영
    • 디지털융복합연구
    • /
    • 제18권1호
    • /
    • pp.257-263
    • /
    • 2020
  • 본 연구는 건강보험심사평가원 자료를 이용하여 조현병 환자의 인구사회학적 특성, 의료기관 특성, 입퇴원 특성이 재원일수에 미치는 영향을 분석하여 국가 보건 정책 질 향상을 위한 기초 자료로 활용하고자 시행하였다. 건강보험심사평가원 2016년 환자 데이터셋(HIRA-NIS)에서 조현병이 주진단인 4,692명의 진료비 명세서를 연구대상으로 하였다. 조현병 환자의 재원일수 영향 요인을 확인하기 위하여 인구사회학적 특성, 의료기관 특성, 입퇴원 특성을 설명변수로, 재원일수를 종속변수로 회귀분석을 실시하였다. 연구결과 재원일수에 주요하게 영향을 미치는 요인은 여자, 연령, 의료 급여, 병원급, 요양병원, 강원도, 정신질환 부진단, 기타 부진단 등으로 밝혀졌다. 공공 데이터를 이용하여 조현병 환자의 재원일수에 영향을 미치는 요인을 찾고자 함에 의의가 있으며, 중증도는 고려하고 있지 않아 향후 중증도에 따른 재원일수의 차이에 대한 연구가 진행되어야 할 것으로 보여 진다.

스마트인솔 기반 알츠하이머 중증도 분류를 위한 보행 분석 및 기계학습 기반 분류 모델 (Gait Analysis and Machine Learning-based Classification Model using Smart Insole for Alzheimer's Disease Severity Classification)

  • 전영훈;호티키우칸;곽정환;송종인
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.317-320
    • /
    • 2021
  • 본 연구는 주기적인 알츠하이머 병의 중증도 모니터링을 위해 스마트 인솔을 통한 보행 특징 추출과 머신러닝 기반 중증도 분류의 성능에 대해 살펴보았다. 최근 고령화가 가속화되는 추세에 있어 치매 환자가 급증하고 있으며, 중증도가 심해질수록 필요한 치료 비용 및 노력이 급증하기 때문에 조기 진단이 최선의 치료 전략으로 보여진다. 환자 친화적이고 저비용의 관성 측정 장치가 내장된 스마트 인솔만을 사용하여 다양한 보행 실험 패러다임에서 환자의 보행 특징을 추출하고, 이를 알츠하이머 병의 중증도 진단을 위한 머신러닝 기반 분류기를 훈련시켜 성능을 평가한 결과, 숫자세기와 같이 뇌에 부하를 주는 하위 작업이 포함된 복합 보행을 측정한 데이터셋을 사용하여 훈련된 분류 모델이 일반 걷기 데이터셋을 사용한 모델보다 성능이 높게 나타나는 것이 관찰되었다. 본 연구는 안전하고 환경적 제약이 적은 방법을 사용하여 시기 적절한 진단뿐만 아니라 주기적인 중증도 모니터링 시스템의 일환으로 활용될 수 있을 것이다.

  • PDF

숫자의 대소관계 파악을 위한 Explicit Feature Extraction(EFE) Reasoner 모델 (Explicit Feature Extraction(EFE) Reasoner: A model for Understanding the Relationship between Numbers by Size)

  • 안지수;민태원;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.23-26
    • /
    • 2023
  • 본 논문에서는 서술형 수학 문제 풀이 모델의 숫자 대소관계 파악을 위한 명시적 자질추출방식 Explicit Feature Extraction(EFE) Reasoner 모델을 제안한다. 서술형 수학 문제는 자연현상이나 일상에서 벌어지는 사건을 수학적으로 기술한 문제이다. 서술형 수학 문제 풀이를 위해서는 인공지능 모델이 문장에 함축된 논리를 파악하여 수식 또는 답을 도출해야 한다. 때문에 서술형 수학 문제 데이터셋은 인공지능 모델의 언어 이해 및 추론 능력을 평가하는 지표로 활용되고 있다. 기존 연구에서는 문제를 이해할 때 숫자의 대소관계를 파악하지 않고 문제에 등장하는 변수의 논리적인 관계만을 사용하여 수식을 도출한다는 한계점이 존재했다. 본 논문에서는 자연어 이해계열 모델 중 SVAMP 데이터셋에서 가장 높은 성능을 내고 있는 Deductive-Reasoner 모델에 숫자의 대소관계를 파악할 수 있는 방법론인 EFE 를 적용했을 때 RoBERTa-base 에서 1.1%, RoBERTa-large 에서 2.8%의 성능 향상을 얻었다. 이 결과를 통해 자연어 이해 모델이 숫자의 대소관계를 이해하는 것이 정답률 향상에 기여할 수 있음을 확인한다.

A New Similarity Measure based on Separation of Common Ratings for Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.149-156
    • /
    • 2021
  • 추천 시스템의 여러 구현 기법들 중 협력 필터링은 과거 평가 이력을 토대로 유사성이 높은 인접 이웃들을 선정하여, 그들이 선호했던 상품들을 추천하는데, 많은 상업 사이트에서 성공적으로 활용되고 있다. 유사도의 정확한 측정은 시스템의 성능을 좌우하는 매우 중요한 요소이다. 기존에 다양한 방식의 유사도 척도들이 개발되었는데, 대개 전통적인 유사도 척도와 기개발된 여러 계수들과의 통합 방식이었다. 본 연구에서는 새로운 방식의 유사도 척도를 제안한다. 두 사용자 간의 공통 평가 영역을 평가치 크기에 따라 분할하여 각 부분 영역별로 유사도를 측정하고 이들을 가중 통합함으로써, 유사한 영역이 구체적으로 파악되어 최종 유사도값에 반영된다. 두 종류의 개방형 데이터셋을 활용한 성능을 측정하였고, 그 결과 특히 밀집 데이터셋에서 제안 방법의 예측 정확도, 순위 정확도, 평균 정밀도 성능이 기존보다 우수하였다. 제안 척도는 다양한 상업 시스템에서 사용자들의 선호에 보다 적합한 상품을 추천하는데 유용하게 활용될 것으로 기대한다.

추천 시스템에서의 선형 모델과 비선형 모델의 성능 비교 연구 (Study Comparing the Performance of Linear and Non-linear Models in Recommendation Systems)

  • 성다훈;임유진
    • 정보처리학회 논문지
    • /
    • 제13권8호
    • /
    • pp.388-394
    • /
    • 2024
  • 추천 시스템은 기업의 매출 증가로 이어질 만큼 핵심적인 역할을 하기에 추천 시스템에 대한 연구는 과거부터 다양한 접근법과 모델들이 연구되어왔다. 그러나 이러한 다양성으로 인해 추천 시스템의 종류 또한 복잡하게 구성되고 있어 추천 모델을 선택하는 데 어려움이 따른다. 따라서 본 연구는 추천 시스템에서 적절한 추천 모델 선택의 어려움을 해결하고자, 다양한 추천 모델을 구분하는 통합적인 기준을 제공하고, 통일된 환경에서 이들의 성능을 비교 평가하였다. 실험은 MovieLens와 Coursera 데이터셋을 활용하였으며, 선형 모델(ADMM-SLIM, EASER, LightGCN)과 비선형 모델(Caser, BERT4Rec)을 HR@10과 NDCG@10 지표를 통해 성능을 평가하였다. 본 연구는 연구진과 실무자들에게 데이터셋 특성과 추천 상황에 맞는 최적의 모델을 선택하는 데 유용한 정보를 제공할 것이다.

위성영상을 활용한 토지피복 분류 항목별 딥러닝 최적화 연구 (A Study on Deep Learning Optimization by Land Cover Classification Item Using Satellite Imagery)

  • 이성혁;이명진
    • 대한원격탐사학회지
    • /
    • 제36권6_2호
    • /
    • pp.1591-1604
    • /
    • 2020
  • 본 연구는 고해상도 위성영상을 딥러닝 알고리즘에 적용하여 토지피복을 분류하고 공간객체별 알고리즘의 성능 검증에 대한 연구이다. 이를 Fully Convolutional Network계열의 알고리즘을 선정하였으며, Kompasat-3 위성영상, 토지피복지도 및 임상도를 활용하여 데이터셋을 구축하였다. 구축된 데이터셋을 알고리즘에 적용하여 각각 최적 하이퍼파라미터를 산출하였다. 하이퍼파라미터 최적화 이후 최종 분류를 시행하였으며, 전체 정확도는 DeeplabV3+가 81.7%로 가장 높게 산정되었다. 그러나 분류 항목별로 정확도를 살펴보면, 도로 및 건물에서 SegNet이 가장 우수한 성능을 나타내었으며, 활엽수, 논의 항목에서 U-Net이 가장 높은 정확도를 보였다. DeeplabV3+의 경우 밭과 시설재배지, 초지 등에서 다른 두 모델보다 우수한 성능을 나타내었다. 결과를 통해 토지피복 분류를 위해 하나의 알고리즘 적용에 대한 한계점을 확인하였으며, 향후 공간객체별로 적합한 알고리즘을 적용한다면, 높은 품질의 토지피복분류 결과를 산출할 수 있을 것으로 기대된다.