• 제목/요약/키워드: 평가 데이터셋

검색결과 463건 처리시간 0.031초

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.

사용자 성향의 시간적 변화를 고려한 협업 필터링 알고리즘에 관한 연구 (Study on Collaborative Filtering Algorithm Considering Temporal Variation of User Preference)

  • 박영용;이학성
    • 한국지능시스템학회논문지
    • /
    • 제13권5호
    • /
    • pp.526-529
    • /
    • 2003
  • 추천 시스템 또는 협업 필터링은 특정 사용자에게 잠재적으로 흥미가 있거나 가치가 있는 항목을 분류하는 방법이다. 유사한 성향을 갖는 사용자는 유사한 형태의 항목을 좋아하리라는 가정 하에, 이 방법은 사용자들의 성향에 관한 데이터베이스를 이용하여 아직 평가되지 못한 항목에 대한 평가값을 예측하는데 사용된다. 보통 추천하고자 하는 사람의 성향은 시간에 따라 변할 수 있고 이러한 시간적인 변화는 사용자 성향에 대한 분류 혹은 예측에 대한 정확성을 떨어뜨릴 수 있다. 본 논문에서는 협업 필터링 알고리즘의 예측 성능을 향상하기 위해서 사용자 성향의 시간적 변화를 이용한 방법을 제안하고자 한다. 이를 위해 기존의 통계적 협업 필터링의 일반적인 형태인 GroupLens 시스템의 상관 가중치가 최근 사용자의 유사성을 반영하기 위해 변형되었다. 제안된 방법은 EachMovie 데이터셋을 이용해 평가하였고 GroupLens 시스템과 비교하여 더 나은 예측 결과를 보였다.

데이터베이스 자산 가치평가 모형과 수명주기 결정 (Models of Database Assets Valuation and their Life-cycle Determination)

  • 성태응;변정은;박현우
    • 한국콘텐츠학회논문지
    • /
    • 제16권3호
    • /
    • pp.676-693
    • /
    • 2016
  • 특허와 같은 기술자산의 경제적 가치를 평가하는 방법론 및 모델은 다방면에서 제시되고 있으나, 데이터베이스 자산의 가치를 객관적으로 평가할 수 있는 구조화된 평가모델이 없으므로, 이에 대한 평가모델 및 수명주기 결정로직의 정립을 통해 DB 자산의 라이센싱, 사업화 이전, 기술금융(담보) 등의 용도에 적용 가능성을 높일 필요가 있다. 본 연구에서는 DB 자산가치의 평가산출시, 예상 수요고객집단의 크기 및 수요량, 데이터셋의 크기 및 중요도, 데이터베이스가 보유기업의 매출성과에 기여한 정도, 데이터베이스 자산의 수명 등이 입력변수로 적절한지를 분석한다. 대부분의 DB 자산은 계속 업데이트되어 수명이 종료하는 경우가 많지는 않으므로 SW 패키지제품의 내용연한과 같은 5년을 표준수명으로 보고 있으나, 본 연구에서는 DB 자산의 가치가 작아지고 업데이트가 일어나지 않는 경우에 대해, DB 사용빈도에 대한 반감기 개념에 기반하여 수명주기 추정로직 및 DB 자산의 가치평가 모형을 제안한다.

하이퍼그래프 모델을 이용한 fMRI Brain Network 의 허브 모듈 분석 (Searching for the Hub Module of fMRI Data with the Hypergraph Model)

  • 김준식;임병권;김은솔;양진산;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.2(A)
    • /
    • pp.27-31
    • /
    • 2010
  • 본 논문에서는 하이퍼그래프의 고유벡터를 척도로 하여 fMRI기반 Brain Network를 분석하여 중요한 허브노드를 찾는 방법론을 제시한다. 이 방법을 비디오게임을 수행하면서 촬영한 기능적 자기뇌영상(fMRI) 데이터인 PBAIC 2007 데이터셋에 대하여 그 유용성을 검증하였다. 이 데이터는 각 20분씩 세 세션을 촬영한 것이며 처음 두 세션에는 13가지의 감정 항목의 평가치가 각 스캔마다 주어진다. 한 피험자의 첫번째 세션 데이터로부터 13가지 감정 항목에 대하여 상관관계가 높은 각각의 복셀(voxel)들을 추출하였다. 이 13가지의 복셀들의 집합들을 각각 하이퍼에지로 보고 하이퍼그래프를 구성하였다. 하이퍼그래프로부 터 인접 행렬(adjacency matrix)를 구성한 후 고유치(eigenvalue)와 고유벡터(eigenvector)를 구하였다. 여기서 고유치가 가장 큰 고유벡터의 원소들은 각 복셀들의 중앙성(centrality), 즉 중요성을 나타내며 이로부터 감정과 관련된 중요한 허브 복셀들과 그들의 국소적 집합인 모듈을 찾았다. 모듈들은 감정 및 작업기억(working memory)과 관련된 뇌 영역들의 클러스터(cluster)로 추정된다.

  • PDF

3D 얼굴 모델 기반의 GAN을 이용한 게임 캐릭터 회전 기법 (A GAN-based face rotation technique using 3D face model for game characters)

  • 김한동;한종대;양희경;민경하
    • 한국게임학회 논문지
    • /
    • 제21권3호
    • /
    • pp.13-24
    • /
    • 2021
  • 본 논문은 게임 캐릭터 얼굴 일러스트레이션에 적용할 수 있는 안면 회전 기술(Face rotation) 기술을 제안한다. 기존의 진행된 연구들은 실제 사람의 얼굴 데이터에 대해서로 데이터를 한정하였으며 방대한 양의 데이터를 필요로 하였고 합성된 결과물이 좋지 못한 문제가 있었다. 본 논문에서는 기존 연구들의 존재하는 문제를 해결하기 위해 다음과 같은 방법을 도입하였다. 첫째, 입력 이미지가 갖고 있는 특징을 입힌 3D 모델을 회전시키고 다시 2D 이미지로 렌더링하여 학습 및 평가에 필요한 데이터 셋을 구축하였다. 둘째, 3D 모델을 통해 구축된 데이터에서 다양한 각도의 특징을 학습할 수 있는 적대적 생성 모델(Generative Adversarial Networks)을 설계하여 입력된 이미지를 원하는 각도로 합성할 수 있다. 논문에서는 실제 게임 캐릭터 얼굴 일러스트레이션 합성 결과를 제시한다. 합성 결과를 통해 논문에서 제안하는 방법이 잘 동작함을 확인할 수 있다.

Method of preventing Pressure Ulcer and EMR data preprocess

  • Kim, Dowon;Kim, Minkyu;Kim, Yoon;Han, Seon-Sook;Heo, Jungwon;Choi, Hyun-Soo
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.69-76
    • /
    • 2022
  • 본 논문에서는 MIMIC-IV(Medical Information Mart for Intensive Care) v2.0 데이터를 이용한 시계열 데이터의 정제 및 가공 방법을 제안한다. 더불어 해당 가공법을 기반으로 정제한 데이터셋을 활용하여 구축한 기계학습 기반의 욕창 조기 경보 시스템을 통해 해당 가공 방법의 유의성을 검증하였다. 구현된 욕창 조기 경보 시스템은 병변이 발생하기 전 12, 24시간에 미리 의료진에게 경보를 주는 시스템이다. 전자의무기록(Electronic Medical Record; EMR) 시스템과 연동하여 실시간으로 환자의 욕창 발생 위험도를 의료진에게 알려 중환자 의사결정을 지원하고, 나아가 효율적인 의료 자원 배분을 가능하게 한다. 여러 기계학습 모델 중 GRU 모델을 사용하였을 때, AUROC 평가지표를 기준으로 발생 전 12시간이 0.831, 24시간이 0.822로 가장 좋은 성능을 보였다.

조기 위험 검출을 위한 점진적 조기 텍스트 분류 시스템 (Incremental Early Text Classification system for Early Risk Detection)

  • 배소현;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.91-96
    • /
    • 2021
  • 조기 위험 검출은 실시간으로 들어오는 텍스트를 순차적으로 처리하면서 해당 대화에 위험이 있는지 조기에 분류하는 작업으로, 정확도 저하를 최소화하는 동시에 가능한 한 빨리 대화를 분류하는 것을 목적으로 한다. 이러한, 조기 위험 검출은 온라인 그루밍 검출, 보이스 피싱 검출과 같은 다양한 영역에 활용될 수 있다. 이에, 본 논문에서는 조기 위험 검출 문제를 정의하고, 이를 평가할 수 있는 데이터 셋과 Latency F1 평가 지표를 소개한다. 또한, 점진적 문장 분류 모듈과 위험 검출 결정 모듈로 구성된 점진적 조기 텍스트 분류 시스템을 제안한다. 점진적 문장 분류 모듈은 이전 문장들에 대한 메모리 벡터와 현재 문장 벡터를 통해 현재까지의 대화를 분류한다. 위험 검출 결정 모듈은 softmax 분류 점수와 강화학습을 기반으로 하여 Read 또는 Stop 판단을 내린다. 결정 모듈이 Stop 판단을 내리면, 현재까지의 대화에 대한 분류 결과를 전체 대화의 분류 결과로 간주하고 작업을 종료한다. 해당 시스템은 micro F1과 Latency F1 지표 각각에서 0.9684와 0.8918로 높은 검출 정확성 및 검출 신속성을 달성하였다.

  • PDF

적대적생성신경망을 이용한 연안 파랑 비디오 영상에서의 빗방울 제거 및 배경 정보 복원 (Raindrop Removal and Background Information Recovery in Coastal Wave Video Imagery using Generative Adversarial Networks)

  • 허동;김재일;김진아
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권5호
    • /
    • pp.1-9
    • /
    • 2019
  • 본 논문에서는 강우시 빗방울로 인해 왜곡된 연안 파랑 비디오 영상에서 빗방울 제거와 제거된 영역에 대한 배경 정보를 복원하기 위한 적대적생성신경망을 이용한 영상 강화 방법을 제안하고자 한다. 영상 변환에 널리 사용되는 Pix2Pix 네트워크와 현재 단일 이미지에 대한 빗방울 제거에 좋은 성능을 보여주고 있는 Attentive GAN을 실험 대상 모델로 구현하고, 빗방울 제거를 위한 공개 데이터 셋을 이용하여 두 모델을 학습한 후 빗방울 왜곡 연안 파랑 영상의 빗방울 제거 및 배경 정보 복원 성능을 평가하였다. 연안 파랑 비디오에 영상에 대한 빗방울 왜곡 보정 성능을 향상시키기 위해 실제 연안에서 빗방울 유무가 짝을 이룬 데이터 셋을 직접 획득한 후 사전 학습된 모델에 대하여 전이 학습에 사용하여 빗방울 왜곡 보정에 대한 성능 향상을 확인하였다. 모델의 성능은 빗방울 왜곡 영상으로부터 파랑 정보 복원 성능을 최대 신호 대 잡음비와 구조적 유사도를 이용하여 평가하였으며, 전이 학습을 통해 파인 튜닝된 Pix2Pix 모델이 연안 파랑 비디오 영상의 빗방울 왜곡에 대한 가장 우수한 복원 성능을 보였다.

교과서 메타데이터 요소 설계에 관한 연구 (A Study on the Design of Metadata Elements in Textbooks)

  • 오의경
    • 문화기술의 융합
    • /
    • 제9권4호
    • /
    • pp.401-408
    • /
    • 2023
  • 이 연구의 목적은 교과서 데이터베이스 구축을 위한 기초 작업으로서 교과서 메타데이터를 설계하는 것이다. 이를 위하여 독본류를 교과서의 범주로 정의하였고, 선행연구를 통하여 메타데이터 개발 방법론을 수립하였다. 국립중앙도서관 등 교과서를 수집, 축적, 서비스하는 기관의 목록 기술요소를 조사하여 서지적으로 필수적인 요소들이 누락되지 않도록 하였으며, Dublin Core, MODS, KEM의 요소들을 매핑하여 교과서를 기술하는데 적합한 요소들을 도출하였다. 마지막으로 발행유형, 장르, 교육과정기 요소를 추가하여 최종적으로 3개의 범주-서지, 맥락, 교과서 특성에서 14개의 요소로 구성된 교과서 메타데이터 요소 셋을 제시하였다. 14개의 요소는 표제사항, 저자사항, 발행사항, 형태사항, 식별기호, 언어, 소장처, 주제명, 해제, 장르, 목차, 이용대상자, 교육과정기, 교과정보이다. 우리는 이 연구에서국가지식자원으로 교과서 자원을 축적할 수 있는 조직화 방안을 논의하여 이 분야에 기여하였으며, 향후 연구에서 우리는 실제 교과서를 대상으로 메타데이터 요소를 적용하여 사용성을 평가하고 평가결과에 따라 수정 보완할 것을 제안하였다.

교육종단연구 분석을 위한 빅데이터 플랫폼 개발 및 적용 (Development and Application of a Big Data Platform for Education Longitudinal Study Analysis)

  • 박정;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.11-27
    • /
    • 2020
  • 본 논문에서는 교육종단연구 데이터를 효과적으로 저장·처리·분석하기 위한 데이터 플랫폼을 개발하고, 이를 서울교육종단연구(SELS)에 적용하여 유용성을 확인한다. 플랫폼은 데이터 전처리부와 데이터 분석부로 구성된다. 데이터 전처리부에서는 1) 마스킹 2) 요인화 3) 정규화·이산화 4) 데이터 유도 5) 데이터 웨어하우징 과정을 통해 교육종단연구 데이터 웨어하우스를 생성하게 된다. 데이터 분석부는 OLAP과 데이터 마이닝(DM)으로 구성된다. 먼저, OLAP에서는 측정값 선정, 스키마 설계를 거쳐 OLAP을 수행하게 된다. 이후 DM에서는 변수 선택, 연구모형 선택, 데이터 수정, 인수튜닝, 모형학습, 모형평가 및 해석단계를 거친다. 본 플랫폼에서 전처리 과정을 거쳐 생성된 데이터 웨어하우스는 다양한 연구자들에 의해 공유될 수 있고, 지속적인 연구결과 데이터 셋의 축적이 가능하므로 후속 연구자들은 추가적인 분석을 수월하게 수행할 수 있게 된다. 또한, 정책입안자들도 SELS 데이터 웨어하우스에 직접 접근하여 다차원 분석을 통해 온라인으로 분석할 수 있어 과학적인 의사결정이 가능하게 된다. 본 연구에서는 개발된 플랫폼의 유용성을 입증하기 위해 SELS 데이터를 플랫폼 상에서 구축하고 수학 학업성취도를 측정값으로 선정하여 OLAP 및 DM을 수행하였으며, 측정값에 영향을 주는 다양한 요인을 데이터 마이닝 기법을 사용하여 분석하였다. 이를 통해 데이터 기반 교육정책 시사점을 빠르고 효과적으로 도출할 수 있었다.