• 제목/요약/키워드: Web Estimation

검색결과 202건 처리시간 0.025초

협업필터링에서 고객의 평가치를 이용한 선호도 예측의 사전평가에 관한 연구 (Pre-Evaluation for Prediction Accuracy by Using the Customer's Ratings in Collaborative Filtering)

  • 이석준;김선옥
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.187-206
    • /
    • 2007
  • The development of computer and information technology has been combined with the information superhighway internet infrastructure, so information widely spreads not only in special fields but also in the daily lives of people. Information ubiquity influences the traditional way of transaction, and leads a new E-commerce which distinguishes from the existing E-commerce. Not only goods as physical but also service as non-physical come into E-commerce. As the scale of E-Commerce is being enlarged as well. It keeps people from finding information they want. Recommender systems are now becoming the main tools for E-Commerce to mitigate the information overload. Recommender systems can be defined as systems for suggesting some Items(goods or service) considering customers' interests or tastes. They are being used by E-commerce web sites to suggest products to their customers who want to find something for them and to provide them with information to help them decide which to purchase. There are several approaches of recommending goods to customer in recommender system but in this study, the main subject is focused on collaborative filtering technique. This study presents a possibility of pre-evaluation for the prediction performance of customer's preference in collaborative filtering before the process of customer's preference prediction. Pre-evaluation for the prediction performance of each customer having low performance is classified by using the statistical features of ratings rated by each customer is conducted before the prediction process. In this study, MovieLens 100K dataset is used to analyze the accuracy of classification. The classification criteria are set by using the training sets divided 80% from the 100K dataset. In the process of classification, the customers are divided into two groups, classified group and non classified group. To compare the prediction performance of classified group and non classified group, the prediction process runs the 20% test set through the Neighborhood Based Collaborative Filtering Algorithm and Correspondence Mean Algorithm. The prediction errors from those prediction algorithm are allocated to each customer and compared with each user's error. Research hypothesis : Two research hypotheses are formulated in this study to test the accuracy of the classification criterion as follows. Hypothesis 1: The estimation accuracy of groups classified according to the standard deviation of each user's ratings has significant difference. To test the Hypothesis 1, the standard deviation is calculated for each user in training set which is divided 80% from MovieLens 100K dataset. Four groups are classified according to the quartile of the each user's standard deviations. It is compared to test the estimation errors of each group which results from test set are significantly different. Hypothesis 2: The estimation accuracy of groups that are classified according to the distribution of each user's ratings have significant differences. To test the Hypothesis 2, the distributions of each user's ratings are compared with the distribution of ratings of all customers in training set which is divided 80% from MovieLens 100K dataset. It assumes that the customers whose ratings' distribution are different from that of all customers would have low performance, so six types of different distributions are set to be compared. The test groups are classified into fit group or non-fit group according to the each type of different distribution assumed. The degrees in accordance with each type of distribution and each customer's distributions are tested by the test of ${\chi}^2$ goodness-of-fit and classified two groups for testing the difference of the mean of errors. Also, the degree of goodness-of-fit with the distribution of each user's ratings and the average distribution of the ratings in the training set are closely related to the prediction errors from those prediction algorithms. Through this study, the customers who have lower performance of prediction than the rest in the system are classified by those two criteria, which are set by statistical features of customers ratings in the training set, before the prediction process.

국민건강영양조사 자료를 이용한 가공식품 데이터베이스 구축 (Development of processed food database using Korea National Health and Nutrition Examination Survey data)

  • 윤미옥;이현숙;김기랑;심재은;황지윤
    • Journal of Nutrition and Health
    • /
    • 제50권5호
    • /
    • pp.504-518
    • /
    • 2017
  • 본 연구는 가공식품의 섭취량이 증가하는 현실에서 국민건강영양조사 자료를 통한 정확한 영양소 섭취량 산출을 위해 국민건강영양조사의 원자료 중 최근 5년간 (2010~2014) 등장한 가공식품 4,858건에 대한 영양성분 DB를 구축하고, 이를 제6기 1차 년도 국민건강영양조사 (2013년) 자료에 적용하여 영양소 14종의 섭취량을 산출하여 구축한 DB에 대한 유용성을 검토하였다. 가공식품의 영양성분 DB 구축을 위해 국내 국가기관에 신고된 가공식품 목록 8,785건, 반조리 식품 자료배합비, 국내 국립기관에서 발간된 식품성분표 1종, 제조사 및 인터넷 등을 통해 수집된 자료를 모아 가공식품에 대한 수준별 DB를 구축하였다. 매칭 식품과 유사 식품 DB를 모두 적용 후 가공식품 섭취량은 505.8 g (30.8%)로 추정되었으며 총섭취량에 대한 기여율은 각각 에너지 29.5%, 탄수화물 27.0%, 단백질 36.7%, 지방 26.5%, 식이섬유 16.1%로 나타났다. 또한 DB 적용 후 대부분의 영양소 섭취량이 유의한 차이를 보여 구축된 DB의 유용성을 보여준다고 사료된다. 나트륨의 경우 가공식품으로 부터의 섭취량이 DB 적용 전 후 2,527.6 mg에서 3,006.2 mg으로 증가하였다. 국민건강영양조사자료의 영양소 섭취량 추정에 필요한 에너지 및 영양소 14종에 대한 국내 분석값 자료가 거의 없는 현실에서 본 연구는 DB 구축을 위한 계산값이나 대체값의 원칙을 세우고 문서화하여 가공식품 DB 구축을 위한 틀을 만들어 향후 DB 구축, 유지, 확대 등 식품영양 DB의 체계적 관리의 기초를 제공하였으며 국민건강영양조사자료를 이용하여 가공식품을 통한 영양소 섭취량 추정을 했다는 측면에서 의미가 있다고 사료된다. 향후 지속적이고 체계적인 가공식품 DB 구축과 관리가 필요하다.

MODIS NDVI와 기상자료를 이용한 우리나라 벼 수량 추정 (Estimating Rice Yield Using MODIS NDVI and Meteorological Data in Korea)

  • 홍석영;허지나;안중배;이지민;민병걸;이충근;김이현;이경도;김선화;김건엽;심교문
    • 대한원격탐사학회지
    • /
    • 제28권5호
    • /
    • pp.509-520
    • /
    • 2012
  • 본 연구에서는 농경지의 면적 산정과 다양한 작물의 생산량 추정을 위해 많이 활용되고 있는 MODIS 영상과 기상자료를 이용하여 우리나라의 벼 수량을 추정해보고자 하였다. Terra와 Aqua 위성으로부터 얻어진 시계열 MODIS NDVI 자료를 구축하고 수량과의 상관성이 높은 시기를 선택하여 기상자료와 함께 다중회귀 모형 기반으로 우리나라 벼 수량을 추정하였다. 2002년부터 2010년까지 MODIS 위성 식생지수 NDVI와 기상자료(일조시간 및 일사량)를 이용하여 우리나라 벼 수량 추정을 위한 다중 회귀모형을 작성하였다. MODIS NDVI와 관측소 기상자료 1을 이용한 모형으로 2011년 쌀 수량 추정한 결과 $494.6kg\;10a^{-1}$로 통계청이 발표한 최종 수량과는 $1.1kg\;10a^{-1}$ 차이가 나는 것으로 나타났다. MODIS NDVI와 관측소 기상자료 2를 이용한 모형으로 2011년 쌀 수량 추정한 결과 $509.7kg\;10a^{-1}$로 통계청이 발표한 최종 수량과 $14.1kg\;10a^{-1}$ 차이가 나는 것으로 나타났다. 2002년부터 2011년까지의 우리나라 쌀 수량 분포도를 작성하였다.

METHYLMERCURY EXPOSURE IN CURRENT JAPANESE: ESTIMATION FROM HAIR ANALYSIS

  • Yasutake, Akira;Hachiya, Noriyuki
    • 한국환경보건학회:학술대회논문집
    • /
    • 한국환경보건학회 2005년도 Proceedings of KSEH.Minamata Forum
    • /
    • pp.4-15
    • /
    • 2005
  • Methylmercury (MeHg) is an environmental pollutant with neurotoxic effects on the central nervous system. The major exposure route of MeHg to humans is via consumption of fish and shellfish which accumulate the chemical through the food web in an aquatic environment. Hair mercury level is an excellent marker for MeHg exposure. We have been conducting a survey on hair mercury contents among general populations from 14 districts to estimate the current Japanese MeHg exposure level. Total mercury levels of all hair samples collected (12923 in total) were analyzed by the oxygen combustion-gold amalgamation method using an atomic absorption mercury detector. Multiple regression analysis revealed that mercury levels were significantly correlated with several covariates, such as sex, age, the amount of daily intake of total fish/shellfish, a preference for certain fish such as tuna or bonito, and artificial waving. The geometric means for the population without artificial waving were 2.47 and 1.65 ${\mu}g/g$ for males (n = 5623) and females (n = 3470), respectively. Hair mercury levels varied with age, and the variations were more significant in males. Since the difference between sexes was not evident at younger ages, some hormonal control might also be involved in the mercury uptake by human hair. The average mercury levels in our hair samples varied among the sampling districts. Tuna is a major carnivorous fish with high mercury accumulations that is often consumed in Japan. The amount of fish consumption and the preference rate far tuna would appear to be responsible far the regional variation in hair mercury levels in Japan. Recently, a provisional tolerable weekly intake (PTWI) of MeHg was revised by 61st JECFA to 1.6 ${\mu}g/kg/week$, which was about half that of the Japanese standard, and corresponded to a hair level of 2.2 ppm. The distribution of hair mercury levels in Japanese populations in the present study indicated that 25% of the Japanese females of child-bearing age were estimated to be exposed to MeHg over the PTWI level. This would reflect the high Japanese consumption of marine products. However, not only mercury contamination, but also the nutritional benefit may have to be considered when discussing the risk involved in the current level of fish and shellfish consumption in Japan.

  • PDF

Association Between the Pre-mir-218 Polymorphism and Cancer Risk in the Chinese Population: a Meta-Analysis

  • Gao, Yue;Liu, Yan;Liu, Ge-Li;Ran, Long-Ke;Zeng, Fan;Wu, Jia-Yan;Song, Fang-Zhou
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권6호
    • /
    • pp.2517-2522
    • /
    • 2014
  • Background: Several recent studies have explored associations between pre-mir-218 polymorphism (rs11134527) and cancer risk. However, published data are still inconclusive. To obtain a more precise estimation of the relationship in the Chinese population, we carried out a meta-analysis for the first time. Materials and Methods: Through retrieval from the PubMed, Medline, Embase, Web of Science databases, China National Knowledge Infrastructure and the Chinese BioMedical Literature Database, a total of four studies were analyzed with 3,561 cases and 3,628 controls for SNP pre-mir-218 rs11134527. We calculated odds ratios (ORs) and 95% confidence intervals (95%CIs) to explore the strength of associations. Results: The results showed that the rs11134527 polymorphism was associated with decreased cancer risk in GG versus AA and GG versus AA+AG models tested ( GG vs AA: OR=0.82, 95%CI: 0.71-0.94; GG vs AA+AG: OR=0.84, 95%CI: 0.74-0.96), and significantly decreased cervical cancer risk was observed in GG versus AA and GG versus AA+AG models (GG vs AA: OR=0.79, 95%CI: 0.66-0.94; GG vs AA+AG: OR=0.80, 95%CI: 0.68-0.94). However, no significant association between the rs11134527polymorphism and hepatocellular carcinoma risk was observed in all comparison models tested (AG vs AA: OR=0.94, 95%CI: 0.79-1.11; GG vs AA: OR=0.88, 95%CI: 0.70-1.10; GG+AG vs AA: OR=0.92, 95%CI: 0.79-1.08; GG vs AA+AG: OR=0.91, 95%CI: 0.75-1.11). Conclusion: The findings suggest that pre-miR-218 rs11134527 polymorphism may have some relation to cancer development in Chinese. However, well-designed studies with larger sample size and more detailed data are needed to confirm these conclusions.

Genetic Association between the XPG Asp1104His Polymorphism and Head and Neck Cancer Susceptibility: Evidence Based on a Meta-Analysis

  • Jiang, Hua-Yong;Zeng, Yong;Xu, Wei-Dong;Liu, Chuan;Wang, Ya-Jie;Wang, Ya-Di
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권9호
    • /
    • pp.3645-3651
    • /
    • 2015
  • Background: Previous studies evaluating the association between the xeroderma pigmentosum group G (XPG) Asp1104His polymorphism and head and neck cancer susceptibility have proven controversial. This meta-analysis of the literature was performed to obtain a more precise estimation of the relationship. Materials and Methods: We systematically searched PubMed, Embase and Web of Science with a time limit of Dec 18, 2014. Odds ratios (ORs) with 95% confidence intervals (CIs) were used to assess the strength of any association. Results: We performed a meta-analysis of eight published case-control studies, including 3,621 cases and 5,475 controls. Overall, no significant association was found between the XPG Asp1104His polymorphism and head and neck cancer susceptibility under all genetic models. In the subgroup analysis by ethnicity, the XPG Asp1104His polymorphism had statistically significant association with elevated head and neck cancer risk under CC vs GG (OR=1.24, 95% CI=1.00~1.54) and the recessive model (OR=1.22, 95%CI=1.01~1.46) in Asian populations. A similar result was found under CC vs GG (OR =1.22, 95%CI=1.01~1.47) in the population based subgroup by source of control. When performed by tumor site, the XPG Asp1104His polymorphism had statistically significant association with elevated laryngeal cancer under all genetic models (CC vs GG: OR=1.59, 95% CI=1.16~2.19; GC vs GG: OR=1.38, 95%CI=1.10~1.72; dominant model: OR=1.42, 95% CI=1.15~1.74; recessive model: OR=1.36, 95% CI=1.02~1.81). Conclusions: This meta-analysis suggested that the XPG Asp1104His polymorphism is a risk factor for head and neck cancer susceptibility, especially for laryngeal cancer and in Asian populations.

웹사이트 조회이력자료를 활용한 카셰어링 수요 추정 및 분석 (Demand Estimation of Car-sharing Service Using Web-site Reservation Requesting Log Data)

  • 권오현;최윤영;변완희;이청원
    • 한국ITS학회 논문지
    • /
    • 제14권4호
    • /
    • pp.10-17
    • /
    • 2015
  • 최근 카셰어링 서비스 운영전략 고도화에 대한 연구의 필요성이 점차 높아지고 있으며 이를 위해서는 카셰어링 수요에 대한 상세 정보가 필요하다. 그러나 기존 연구에서는 실적자료 또는 임의가정 수요만을 이용함으로서 이용가능 차량이 부족하여 서비스를 이용하지 못한 상실수요(Spilled Demand)가 누락된 경우가 많았다. 이에 본 연구에서는 카셰어링 서비스 운영업체의 웹사이트 이용기록을 토대로 상실수요(Spilled Demand)를 포함한 값을 추정할 수 있는 방안을 제시하고자 하였다. 분석 결과 LH 행복카 서비스의 경우 이용실적과 조회이력을 통한 추정수요 간에 전반적으로 약 2배 정도의 큰 차이가 발생하는 것으로 나타났다. 특히 운행률이 일정 수준에 도달하면 더 이상의 수요를 수용하지 못하므로 수요가 크게 아무리 증가하더라도 운행률이 더 이상 높아지기 어려운 것으로 나타났다. 즉 단순히 이용실적만을 바탕으로 개별 Station의 수요를 추정할 경우 특히 용량 상태에 근접한 Station에서 상당한 수요의 과소추정 우려가 있음과 함께 본 연구의 추정 방법론을 적용하는 연구를 고려할 필요성이 있음을 확인하였다.

운전자 시선 및 선택적 주의 집중 모델 통합 해석을 통한 운전자 보조 시스템 (Driver Assistance System for Integration Interpretation of Driver's Gaze and Selective Attention Model)

  • 김지훈;조현래;장길진;이민호
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.115-122
    • /
    • 2016
  • 본 논문은 차량의 내부 및 외부 정보를 통합하여 운전자의 인지 상태를 측정하고, 안전운전을 보조하여 주는시스템을 제안한다. 구현된 시스템은 운전자의 시선 정보와 외부 영상을 분석하여 얻은 주변정보를 mutual information기반으로 통합하여 구현되며, 차량의 앞부분과 내부 운전자를 검출하는 2개의 카메라를 이용한다. 외부 카메라에서 정보를 얻기 위해 선택적 집중모델을 기반으로 하는 게슈탈트법칙을 제안하고, 이를 기반으로 구현된 saliency map (SM) 모델은 신호등과 같은 중요한 외부 자극을 두드러지게 표현한다. 내부 카메라에서는 얼굴의 특징정보를 이용하여 운전자의 주의가 집중되는 외부 응시 정보를 파악하고 이를 통해 운전자가 응시하고 있는 영역을 검출한다. 이를 위해서 우리는 실시간으로 운전자의 얼굴특징을 검출하는 알고리즘을 사용한다. 운전자의 얼굴을 검출하기 위하여 modified census transform (MCT) 기반의 Adaboost 알고리즘을 사용하였으며, POSIT (POS with ITerations)알고리즘을 통해 3차원 공간에서 머리의 방향과 운전자 응시 정보를 측정하였다. 실험결과를 통하여 제안한 시스템이 실시간으로 운전자의 응시하고 있는 영역과, 신호등과 같은 운전에 도움이 되는 정보를 파악하는데 도움이 되었음을 확인할 수 있으며, 이러한 시스템이 운전보조 시스템에 효과적으로 적용될 것으로 판단된다.

Risk of Breast Cancer and Total Malignancies in Rheumatoid Arthritis Patients Undergoing TNF-α Antagonist Therapy: a Meta-analysis of Randomized Control Trials

  • Liu, Yang;Fan, Wei;Chen, Hao;Yu, Ming-Xia
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권8호
    • /
    • pp.3403-3410
    • /
    • 2014
  • Context: Interest exits in whether TNF-alpha antagonists increase the risk of breast cancer and total malignancies in patients with rheumatoid arthritis (RA). Objectives: To analyze the risk of malignancies, especially breast cancer, in patients with RA enrolled in randomized control trials (RCTs). Methods: A systematic literature search for RCTs from 1 January 1998 to 1 July 2013 from online databases, such as PubMed, WILEY, EMBASE, ISI web of knowledge and Cochrane Library was conducted. Studies included RCTs that compared the safety of at least one dose of the five TNF-${\alpha}$ antagonists with placebo or methotrexate (MTX) (or TNF-${\alpha}$ antagonists plus MTX vs placebo plus MTX) in RA patients for more than 24 weeks and imported all the references into document management software EndNote${\times}6$. Two independent reviewers selected studies and extracted the data about study design, patients' characteristics and the type, number of all malignancies. Results: 28 RCTs from 34 records with 11,741 patients were analyzed. Of the total, 97 developed at least one malignancy during the double-blind trials, and breast cancer was observed in 17 patients (17.5% of total malignancies). However, there was no statistically significant increased risk observed in either the per protocol (PP) model (OR 0.65, 95%CI [0.22, 1.93]) or the modified intention to treat (mITT) model (OR 0.75, 95%CI [0.25, 2.21]). There were also no significant trend for increased risk of total malignancies on anti-TNF-${\alpha}$ therapy administered at approved doses in either model (OR, 1.06, 95%CI [0.64, 1.75], and OR, 1.30, 95%CI [0.80, 2.14], respectively). As to the two models, modified intention to treat model analysis led to higher estimation than per protocol model analysis. Conclusions: This study did not find a significantly increased risk of breast cancer and total malignancies in adults RA patients treated with TNF-${\alpha}$ antagonists at approved doses. However, it cannot be ignored that more patients developed malignancies with TNF-${\alpha}$ antagonists therapy compared with patients with placebo or MTX, in spite of the lack of statistical significance, so that more strict clinical trials and long-term follow-up are needed, and both mITT and PP analyses should be used in such safety analyses.

텍스타일 기반의 협력적 필터링 기술과 디자인 요소에 따른 감성 분석을 이용한 패션 디자인 추천 에이전트 시스템 (A Fashion Design Recommender Agent System using Collaborative Filtering and Sensibilities related to Textile Design Factors)

  • 정경용;나영주;이정현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권2호
    • /
    • pp.174-188
    • /
    • 2004
  • 제품의 품질 및 가격뿐만 아니라 물질적 풍요로움과 더불어 다변화 되어가는 생활 환경 속에서 소비자의 감성과 선호도를 파악하는 것은 제품 판매 전략의 중요한 성공요소가 되고 있다. 이를 위하여 제품의 기능적 측면뿐만 아니라 개개인의 정서적 감정과 선호도가 반영된 제품의 설계나 디자인 또한 요구되고 있다. 본 연구에서는 사용자의 감성과 선호도를 중심으로 소재를 개발하는 방법의 하나로 협력적 필터링 개인화 기법을 응용하여 패션 디자인 추천 에이전트 시스템(FDRAS-pro)을 제안한다. 텍스타일 기반의 협력적 필터링 기술에서, 예측에 사용될 이웃의 수를 결정하기 위해서 Representative Attribute-Neighborhood 방법을 사용한다. 사용자들간의 유사도 가중치를 계산하기 위해서 피어슨 상관계수(Pearson Correlation Coefficient)를 사용한다. 소재에 대한 사용자의 감성이나 선호도에 대한 텍스타일의 대표 감성 어휘를 추출함으로써 소재 개발을 위한 감성 어휘 데이타베이스를 구축한다. FDRAS-pro는 구축된 감성 어휘 데이타베이스를 기반으로 성향이 비슷한 사용자에게 텍스타일 디자인을 추천한다. 디자인 요소에 따른 감성 분석을 하기 위해서, 텍스타일 디자인을 9가지 디자인 요소(디자인 소재, 모티브대 배경비율, 모티브의 변화도, 해석법, 모티브의 배열, 모티브의 명료성, 명도차, 색상차, 채도차)에 따라 분석하였다. 패션 디자인 추천 시스템으로 개발하여 시스템의 논리적 타당성과 유효성을 검증하기 위해 실험적인 적용을 시도하고자 한다.