• Title/Summary/Keyword: 데이터예측

Search Result 6,818, Processing Time 0.034 seconds

Predicting Protein-Protein Interactions Using Various Amino Acid Properties (다양한 아미노산 속성을 이용한 단백질 상호작용 예측)

  • 최일영;정유진
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.310-312
    • /
    • 2004
  • 이 논문에서는, 단백질의 상호작용을 다양한 아미노산의 속성과 Support Vector Machine(SVM)을 사용하여 예측하였다. SVM을 사용한 단백질 상호작용의 예측 시스템에 단백질 상호작용에 중요한 작용을 하는 아미노산의 속성을 사용하고 있다. 이번 실험은 9가지의 아미노산의 속성의 조합 즉, 511(2$^{9}$ -1)가지의 아미노산 속성을 SVM 학습데이터로 사용하여 예측시스템의 결과를 비교한다. 실험에는 Database of Interacting Proteins(DIP)를 사용하였다. 실험을 위하여 DIP의 H.pylori를 학습용데이터로 사용하고, E.coli를 예측데이터(검증데이터)로 사용하였다. 실험에 따르면 H.pylori의 학습데이터와 E.coli를 예측데이터의 가공에 '소수성'을 사용한 방법보다 '방향성'을 사용한 방법이 더 높은 수치를 나타냈다.

  • PDF

Prediction of dairy cow mastitis with multi-sensor data using Multi-Layer Perceptron(MLP) (다중 센서 데이터와 다층 퍼셉트론을 활용한 젖소의 유방염 진단 예측)

  • Song, Hye-Won;Park, Gi-Cheol;Park, JaeHwa
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.788-791
    • /
    • 2020
  • 낙농업에서 경제적 손실을 불러일으키고 관찰 시간과 비용이 필요한 젖소의 유방염 관리는 중요하다. 그러나 지금까지의 연구는 유방염 진단에 초점을 맞추고 있고, 예측하려는 시도는 전무하다. 유방염에 걸린 개체는 며칠 동안 우유를 생산할 수 없기 때문에 낙농가에 막대한 피해를 준다. 따라서 젖소가 유방염에 걸려 증상이 나타나기 전에 미리 파악해 조처를 할 수 있도록 하는 것이 중요하다. 이에 본 연구는 유방염 예측을 위해 생체 데이터를 포함한 다중 센싱 데이터를 사용해 유방염 예측 모델을 개발하였다. 모델에 사용된 데이터는 충청남도의 농가에 설치된 로봇 착유기로 부터 수집하였으며, 일정 기간 동안의 다중 센싱 데이터를 바탕으로 다음 날의 유방염 여부를 예측한다. 많은 양의 비선형 데이터를 효과적으로 처리하기 위해 다층 퍼셉트론을 사용해 모델을 학습하였다. 그 결과, 81.6%의 예측 정확도를 보였으며 교차 검증을 통해 정확도뿐만 아니라 재현율까지 우수함을 확인할 수 있었다.

Prediction of Rice Prices and Search for a Period of Weather Affecting the Prices Based on a Linear Regression Model (선형회귀모델을 사용한 쌀 가격 예측 및 쌀 가격에 영향을 미치는 날씨의 시기 탐색)

  • Choi, Da-jeong;Seo, Jin-kyeong;Ko, Kwang-Ho;Paik, Juryon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.37-38
    • /
    • 2022
  • 농산물의 산지 가격이나 도매가격이 등락하면, 즉시 또는 일정한 시차 이후에 소비자가격도 등락한다. 본 논문에서는 선형회귀모델을 통해 쌀 가격을 예측하고 쌀 가격에 영향을 미치는 날씨의 시기를 찾아보고자 한다. 이에 따라 KAMIS, 기상자료개방포털, KOSIS에서 수집한 날씨, 생산량, 그리고 소비자물가 등락률 데이터를 이용하여 쌀 가격 예측을 수행하고, 날씨 데이터와 쌀 가격 데이터의 날짜 간격을 두어 날씨가 쌀 가격에 영향을 미치는 시기를 알아보았다. 모델 평가 결과, 2개월 간격을 두고 예측한 RMSE가 164.135로 가장 큰 영향을 미쳤다. 본 연구를 기반으로 향후 다른 농산물의 가격 예측도 가능할 것이며 농산물에 영향을 미치는 변수의 시기도 예측할 수 있을 것으로 기대한다.

  • PDF

A scoring method for evaluating the reliability of protein-protein interaction data (단백질 상호작용 데이터의 신뢰도 검증 기법)

  • 홍진선;한경숙
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.292-294
    • /
    • 2004
  • 단백질 상호작용 검출 방법의 발달로 많은 양의 데이터가 산출되고 있고, 이러한 상호작용 데이터의 방대한 양으로 인해 통계적 방법을 이용하여 데이터를 처리함으로서 유용한 지식을 얻을 수 있다 예측한 상호작용 데이터는 첫째, 대량의 데이터를 생산해내므로, 많은 false-positive를 내포하고 있고, 둘째, 예측한 상호작용을 검증시 실험을 하는 방법 외에는 신뢰도를 측정하기가 어렵다는 문제점이 있다. 본 연구에서는 점수 할당시스템을 사용함으로서 예측한 인간 단백질 상호작용 데이터의 false-positive를 줄이고, 각각 상호작용에 점수를 부설함으로서 상호작용 데이터의 신뢰도를 검증하는 방법을 제안하고 있다.

  • PDF

Performance Evaluation of Battery Remaining Time Estimation Methods According to Outlier Data Processing Policies in Mobile Devices (모바일 기기에서 이상치 데이터 처리 정책에 따른 배터리 잔여 시간 예측 기법의 평가)

  • Tak, Sungwoo
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.26 no.7
    • /
    • pp.1078-1090
    • /
    • 2022
  • The distribution patterns of battery usage time data per battery level are able to affect the performance of estimating battery remaining time in mobile devices. Outliers may mainly affect the estimation performance of statistical regression methods. In this paper, we propose a software framework that detects and processes outliers to improve the estimation performance of statistical regression methods. The proposed framework first detects outliers that degrade the estimation performance. The proposed framework replaces outliers with smoothed data. The difference between an outlier and its replaced data will be properly distributed into individual data. Finally, individual data are reinforced to improve the estimation performance. The numerical results obtained by experimenting the proposed framework confirmed that it yielded good performance of estimating battery remaining time.

Science Technology - 빅데이터가 범죄 예방하는 세상

  • Kim, Hyeong-Ja
    • TTA Journal
    • /
    • s.173
    • /
    • pp.58-59
    • /
    • 2017
  • 영화 <마이너리티 리포트>가 점점 현실화되고 있다. '빅데이터'를 기반으로 한 범죄 예측 지도가 만들어지고, 미국에서는 이를 활용한 '헌치램' 같은 범죄 예측 시스템이 이미 실용화되고 있다. 다음 범죄가 어디서 일어날지 예측해 영리하게 대처하는 빅데이터 세계를 들여다보자.

  • PDF

Processing of uncertain position of regularly sampling moving objects (주기적인 위치보고 이동체의 불확실 위치 처리)

  • 진희규;김동현;임덕성;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.241-243
    • /
    • 2004
  • 위치기반서비스 응용 분야에서 위치 데이터를 저장하기 위하여 일반적으로 이동체의 위치 데이터를 주기적으로 수집한다. 주기적으로 수집된 위치 데이터는 보고 주기 사이의 위치 변화를 반영하지 못하기 때문에 시간에 대한 선형 함수를 이용하여 예측된 위치 데이터와 오차가 발생한다. 따라서 오차가 존재하는 불확실한 미래 위치 데이터로 인하여 미래 위치 색인에서 검색의 정확도가 떨어지는 문제점이 발생한다. 이 논문에서는 주기적인 위치보고 이동체에서 발생하는 불확실한 위치 데이터를 처리하기 위해서 예측된 위치 데이터에 예측 오차분을 반영한 불확실성 영역을 사용한다 그리고 이동체의 불확실성 영역을 설정하기 위하여 최근 예측 오차 가중치 기법과 칼만 필터 기법을 제안하고 이를 기반으로 하는 불확실 위치 처리 기법을 이동체 미래 위치 색인에서 구현하고 성능 비교 평가를 수행한다. 성능 평가 결과에 따르면 기존의 선형함수 기반 예측 기법보다 불확실 위치 처리 기법이 영역 검색의 정확도가 향상되는 장점을 가진다.

  • PDF

A development of the gas pipeline risk prediction models (도시가스 배관 위험 예측 모델 개발)

  • Park, Giljoo;Kim, Young-Chan;Lee, ChangYeol;Jo, Young-do;Chung, Won Hee
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2017.11a
    • /
    • pp.360-361
    • /
    • 2017
  • 도시가스 배관의 안전을 위해 다양한 시스템이 가동되고 있지만 대부분 현장점검에 의존하는 한계점을 가지고 있다. 본 연구에서는 국내 도시가스 공급업체들 중 하나인 중부도시가스사의 실시간 배관운영 데이터를 분석해 배관의 위험을 예측한다. 배관의 압력, 출력전압, 출력전류, 방식전위, 전위값 데이터와 기타 도시가스 관련요인 데이터를 통합해 상관분석을 진행한다. 그리고 특정 공급권역의 실시간 배관 압력 데이터를 분석해 압력 수치를 예측한다. Random forest regression과 support vector regression(SVR) 알고리즘을 사용해 모델을 구성한 결과 배관 데이터의 시계열 정보를 추가한 데이터 셋과 random forest regression을 사용한 모델에서 가장 우수한 예측 성능을 보인다.

  • PDF

A Study on Classification Models for Predicting Bankruptcy using XAI (XAI 를 활용한 기업 부도예측 분류모델 연구)

  • Kim, Jihong;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.571-573
    • /
    • 2022
  • 최근 금융기관에서는 축적된 금융 빅데이터를 활용하여 차별화된 서비스를 강화하고 있다. 기업고객에 투자하기 위해서는 보다 정밀한 기업분석이 필요하다. 본 연구는 대만기업 6,819개의 95개 재무데이터를 가지고, 비대칭 데이터 문제해결, 데이터 표준화 등 데이터 전처리 작업을 하였다. 해당 데이터는 로지스틱 회기, SVM, K-NN, 나이브 베이즈, 의사결정나무, 랜덤포레스트 등 9가지 분류모델에 5겹 교차검증을 적용하여 학습한 후 모델 성능을 비교하였다. 이 중에서 성능이 가장 우수한 분류모델을 선택하여 예측 결정 이유를 판단하고자 설명 가능한 인공지능(XAI)을 적용하여 예측 결과에 대한 설명을 부여하여 이를 분석하였다. 본 연구를 통해 데이터 전처리에서부터 모델 예측 결과 설명에 이르는 분류예측모델의 전주기를 자동화하는 시스템을 제시하고자 한다.

Forecasting Open Government Data Demand Using Keyword Network Analysis (키워드 네트워크 분석을 이용한 공공데이터 수요 예측)

  • Lee, Jae-won
    • Informatization Policy
    • /
    • v.27 no.4
    • /
    • pp.24-46
    • /
    • 2020
  • This study proposes a way to timely forecast open government data (OGD) demand(i.e., OGD requests, search queries, etc.) by using keyword network analysis. According to the analysis results, most of the OGD belonging to the high-demand topics are provided by the domestic OGD portal(data.go.kr), while the OGD related to users' actual needs predicted through topic association analysis are rarely provided. This is because, when providing(or selecting) OGD, relevance to OGD topics takes precedence over relevance to users' OGD requests. The proposed keyword network analysis framework is expected to contribute to the establishment of OGD policies for public institutions in the future as it can quickly and easily forecast users' demand based on actual OGD requests.