Journal of the Korea Institute of Information and Communication Engineering
/
v.24
no.5
/
pp.576-583
/
2020
This paper proposes a technique to determine the spam comments on YouTube, which have recently seen tremendous growth. On YouTube, the spammers appeared to promote their channels or videos in popular videos or leave comments unrelated to the video, as it is possible to monetize through advertising. YouTube is running and operating its own spam blocking system, but still has failed to block them properly and efficiently. Therefore, we examined related studies on YouTube spam comment screening and conducted classification experiments with six different machine learning techniques (Decision tree, Logistic regression, Bernoulli Naive Bayes, Random Forest, Support vector machine with linear kernel, Support vector machine with Gaussian kernel) and ensemble model combining these techniques in the comment data from popular music videos - Psy, Katy Perry, LMFAO, Eminem and Shakira.
The properties of soil are naturally highly variable and thus, to ensure proper safety and reliability, we need to test a large number of samples across the length and depth. In pile foundations, conducting field tests are highly expensive and the traditional empirical relations too have been proven to be poor in performance. The study proposes a state-of-art Particle Swarm Optimization (PSO) hybridized Artificial Neural Network (ANN), Extreme Learning Machine (ELM) and Adaptive Neuro Fuzzy Inference System (ANFIS); and comparative analysis of metaheuristic models (ANN-PSO, ELM-PSO, ANFIS-PSO) for prediction of bearing capacity of pile foundation trained and tested on dataset of nearly 300 dynamic pile tests from the literature. A novel ensemble model of three hybrid models is constructed to combine and enhance the predictions of the individual models effectively. The authenticity of the dataset is confirmed using descriptive statistics, correlation matrix and sensitivity analysis. Ram weight and diameter of pile are found to be most influential input parameter. The comparative analysis reveals that ANFIS-PSO is the best performing model in testing phase (R2 = 0.85, RMSE = 0.01) while ELM-PSO performs best in training phase (R2 = 0.88, RMSE = 0.08); while the ensemble provided overall best performance based on the rank score. The performance of ANN-PSO is least satisfactory compared to the other two models. The findings were confirmed using Taylor diagram, error matrix and uncertainty analysis. Based on the results ELM-PSO and ANFIS-PSO is proposed to be used for the prediction of bearing capacity of piles and ensemble learning method of joining the outputs of individual models should be encouraged. The study possesses the potential to assist geotechnical engineers in the design phase of civil engineering projects.
Future changes in seasonal mean temperature and precipitation over East Asia under anthropogenic global warming are investigated by comparing the historical run for 1979~2005 and the Representative Concentration Pathway (RCP) 4.5 run for 2006~2100 with 20 coupled models which participated in the phase five of Coupled Model Inter-comparison Project (CMIP5). Although an increase in future temperature over the East Asian monsoon region has been commonly accepted, the prediction of future precipitation under global warming still has considerable uncertainties with a large inter-model spread. Thus, we select best five models, based on the evaluation of models' performance in present climate for boreal summer and winter seasons, to reduce uncertainties in future projection. Overall, the CMIP5 models better simulate climatological temperature and precipitation over East Asia than the phase 3 of CMIP and the five best models' multi-model ensemble (B5MME) has better performance than all 20 models' multi-model ensemble (MME). Under anthropogenic global warming, significant increases are expected in both temperature and land-ocean thermal contrast over the entire East Asia region during both seasons for near and long term future. The contrast of future precipitation in winter between land and ocean will decrease over East Asia whereas that in summer particularly over the Korean Peninsula, associated with the Changma, will increase. Taking into account model validation and uncertainty estimation, this study has made an effort on providing a more reliable range of future change for temperature and precipitation particularly over the Korean Peninsula than previous studies.
Seo, Eunkyo;Lee, Myong-In;Jeong, Jee-Hoon;Kang, Hyun-Suk;Won, Duk-Jin
Atmosphere
/
v.26
no.1
/
pp.35-45
/
2016
Initialization of the global seasonal forecast system is as much important as the quality of the embedded climate model for the climate prediction in sub-seasonal time scale. Recent studies have emphasized the important role of soil moisture initialization, suggesting a significant increase in the prediction skill particularly in the mid-latitude land area where the influence of sea surface temperature in the tropics is less crucial and the potential predictability is supplemented by land-atmosphere interaction. This study developed a new soil moisture initialization method applicable to the KMA operational seasonal forecasting system. The method includes first the long-term integration of the offline land surface model driven by observed atmospheric forcing and precipitation. This soil moisture reanalysis is given for the initial state in the ensemble seasonal forecasts through a simple anomaly initialization technique to avoid the simulation drift caused by the systematic model bias. To evaluate the impact of the soil moisture initialization, two sets of long-term, 10-member ensemble experiment runs have been conducted for 1996~2009. As a result, the soil moisture initialization improves the prediction skill of surface air temperature significantly at the zero to one month forecast lead (up to ~60 days forecast lead), although the skill increase in precipitation is less significant. This study suggests that improvements of the prediction in the sub-seasonal timescale require the improvement in the quality of initial data as well as the adequate treatment of the model systematic bias.
Ji, Hee-Sook;Hwang, Seung-On;Lee, Johan;Hyun, Yu-Kyung;Ryu, Young;Boo, Kyung-On
Atmosphere
/
v.32
no.4
/
pp.395-409
/
2022
A new soil moisture initialization scheme is applied to the Korea Meteorological Administration (KMA) Global Seasonal forecasting system version 6 (GloSea6). It is designed to ingest the microwave soil moisture retrievals from Soil Moisture Active Passive (SMAP) radiometer using the Local Ensemble Transform Kalman Filter (LETKF). In this technical note, we describe the procedure of the newly-adopted initialization scheme, the change of soil moisture states by assimilation, and the forecast skill differences for the surface temperature and precipitation by GloSea6 simulation from two preliminary experiments. Based on a 4-year analysis experiment, the soil moisture from the land-surface model of current operational GloSea6 is found to be drier generally comparing to SMAP observation. LETKF data assimilation shows a tendency toward being wet globally, especially in arid area such as deserts and Tibetan Plateau. Also, it increases soil moisture analysis increments in most soil levels of wetness in land than current operation. The other experiment of GloSea6 forecast with application of the new initialization system for the heat wave case in 2020 summer shows that the memory of soil moisture anomalies obtained by the new initialization system is persistent throughout the entire forecast period of three months. However, averaged forecast improvements are not substantial and mixed over Eurasia during the period of forecast: forecast skill for the precipitation improved slightly but for the surface air temperature rather degraded. Our preliminary results suggest that additional elaborate developments in the soil moisture initialization are still required to improve overall forecast skills.
Recent explosive increase of electronic commerce provides many advantageous purchase opportunities to customers. In this situation, customers who do not have enough knowledge about their purchases, may accept product recommendations. Product recommender systems automatically reflect user's preference and provide recommendation list to the users. Thus, product recommender system in online shopping store has been known as one of the most popular tools for one-to-one marketing. However, recommender systems which do not properly reflect user's preference cause user's disappointment and waste of time. In this study, we propose a novel recommender system which uses data mining and multi-model ensemble techniques to enhance the recommendation performance through reflecting the precise user's preference. The research data is collected from the real-world online shopping store, which deals products from famous art galleries and museums in Korea. The data initially contain 5759 transaction data, but finally remain 3167 transaction data after deletion of null data. In this study, we transform the categorical variables into dummy variables and exclude outlier data. The proposed model consists of two steps. The first step predicts customers who have high likelihood to purchase products in the online shopping store. In this step, we first use logistic regression, decision trees, and artificial neural networks to predict customers who have high likelihood to purchase products in each product group. We perform above data mining techniques using SAS E-Miner software. In this study, we partition datasets into two sets as modeling and validation sets for the logistic regression and decision trees. We also partition datasets into three sets as training, test, and validation sets for the artificial neural network model. The validation dataset is equal for the all experiments. Then we composite the results of each predictor using the multi-model ensemble techniques such as bagging and bumping. Bagging is the abbreviation of "Bootstrap Aggregation" and it composite outputs from several machine learning techniques for raising the performance and stability of prediction or classification. This technique is special form of the averaging method. Bumping is the abbreviation of "Bootstrap Umbrella of Model Parameter," and it only considers the model which has the lowest error value. The results show that bumping outperforms bagging and the other predictors except for "Poster" product group. For the "Poster" product group, artificial neural network model performs better than the other models. In the second step, we use the market basket analysis to extract association rules for co-purchased products. We can extract thirty one association rules according to values of Lift, Support, and Confidence measure. We set the minimum transaction frequency to support associations as 5%, maximum number of items in an association as 4, and minimum confidence for rule generation as 10%. This study also excludes the extracted association rules below 1 of lift value. We finally get fifteen association rules by excluding duplicate rules. Among the fifteen association rules, eleven rules contain association between products in "Office Supplies" product group, one rules include the association between "Office Supplies" and "Fashion" product groups, and other three rules contain association between "Office Supplies" and "Home Decoration" product groups. Finally, the proposed product recommender systems provides list of recommendations to the proper customers. We test the usability of the proposed system by using prototype and real-world transaction and profile data. For this end, we construct the prototype system by using the ASP, Java Script and Microsoft Access. In addition, we survey about user satisfaction for the recommended product list from the proposed system and the randomly selected product lists. The participants for the survey are 173 persons who use MSN Messenger, Daum Caf$\acute{e}$, and P2P services. We evaluate the user satisfaction using five-scale Likert measure. This study also performs "Paired Sample T-test" for the results of the survey. The results show that the proposed model outperforms the random selection model with 1% statistical significance level. It means that the users satisfied the recommended product list significantly. The results also show that the proposed system may be useful in real-world online shopping store.
Journal of the korean Society of Automotive Engineers
/
v.14
no.6
/
pp.39-47
/
1992
The engine combustion is one of the most important process affecting performance and emissions. One effective way to improve the engine combustion is to control motion of the charge inside a cylinder by means of optimum induction system design, because the flame speed is mainly determined by the turbulence in a gasoline engine. This paper describes the measurement and characterization of mean velocity and turbulence intensity inside the cylinder of a 4-valve gasoline engine using laser Doppler velocimeter(LDV) under motoring(non-firing) conditions. Since the measured LDV data in each cycle show small cycle variation during compression stroke in the tested engine, the mean velocity and turbulence intensity are calculated by ensemble averaging method neglecting cycle variation effects. In the ensemble averaging method, the effects of the calculation window, in which velocities are assumed as the same crank angle, on mean velocity and turbulence intensity are fully investigated. In addition, the effects of measuring point on the flow characteristics are studied. With large calculation window, the mean velocity is shown to be less sensitive with respect to crank angle and turbulence intensity decrease in its absolute amplitude. When the piston approch to the top dead center of compression, the turbulence intensity is found to be homogeneous in the cylinder.
Sugii, Y;Nishio, S;Okamoto, K;Nakano, A;Minamiyama, M;Niimi, H
International Journal of Vascular Biomedical Engineering
/
v.1
no.1
/
pp.24-31
/
2003
As endothelial cells are subject to flow shear stress, it is important to determine the detailed velocity distribution in microvessels in the study of mechanical interactions between blood and endothelium. This paper describes a velocity field of the arteriole in the rat mesentery using an intravital microscope and high-speed digital video system obtained by a highly accurate PIV technique. Red blood cells (RBCs) velocity distributions with spatial resolutions of $0.8{\times}0.8{\mu}m$ were obtained even near the wall in the center plane of the arteriole. By making ensemble-averaged time-series of velocity distributions, velocity profiles over different cross-sections were calculated for comparison. The shear rate at the vascular wall also evaluated on the basis of the ensemble-averaged profiles. It was shown that the velocity profiles were blunt in the center region of the vessel cross-section while they were steep in the near wall region. The wall shear rates were significantly small, compared with those estimated from the Poiseuille profiles.
Proceedings of the Korea Water Resources Association Conference
/
2008.05a
/
pp.264-268
/
2008
미래 발생 가능한 수문 및 기상현상의 예측과정은 지식의 부족과 자연현상의 다양성으로 인해 불확실성을 포함하게 된다. 하지만 많은 예측들은 아직까지 확정적으로 제공되고 있으며, 결과적으로 예측결과의 불확실성 정도를 제공하지 못하고 있다. 앙상블 유량예측(ESP, Ensemble Streamflow Prediction)은 이러한 불확실성을 고려하여 수자원시스템의 의사결정에 있어 중요한 요소 중 하나인 유량예측을 수행할 수 있는 방법이다. 하지만 ESP의 결과는 기상자료, 유역 초기조건, 수문모형의 매개변수, 단순화된 수문모형에 의해 비교적 큰 불확실성을 포함하게 되며, 따라서 실제적인 현업에서의 사용을 위해서는 불확실성 정도를 줄이기 위한 사전 및 사후처리 과정이 요구된다. 본 연구에서는 국내에서 활용 가능한 기후 예보자료를 사용하여 앙상블 유량예측에 적용할 수 있는 사전처리 방안들을 검토하고, 국내에서 사후처리를 위해 적용되었던 최적선형 보정기법에 더해 다양한 기법들을 강우유출모형인 TANK모형의 모의결과 보정에 적용하였다. 사전 및 사후처리를 적용한 결과 기상자료와 유량예측과정에 존재하는 불확실성을 저감시키는 것이 가능하였다. 특히 사전 및 사후 처리가 동시에 적용되었을 경우 그 향상 정도가 단순히 각각의 방법에 의한 향상 정도를 합한 것보다 높게 나타날 수 있음이 확인되었다. 사전 및 사후처리를 동시에 적용한 경우 이수기에는 RPS(Ranked Probability Score) 평가방법 내에서 54%를, 홍수기에는 8%를 향상시키는 것이 가능하였다.
International Journal of Fluid Machinery and Systems
/
v.9
no.3
/
pp.265-276
/
2016
Energy systems working coherently in different conditions may not have a specific design which can provide optimal performance. A system working for a longer period at lower efficiency implies higher energy consumption. In this effort, a methodology demonstrated by a jet pump design and optimization via numerical modeling for fluid dynamics and implementation of an evolutionary algorithm for the optimization shows a reduction in computational costs. The jet pump inherently has a low efficiency because of improper mixing of primary and secondary fluids, and multiple momentum and energy transfer phenomena associated with it. The high fidelity solutions were obtained through a validated numerical model to construct an approximate function through surrogate analysis. Pareto-optimal solutions for two objective functions, i.e., secondary fluid pressure head and primary fluid pressure-drop, were generated through a multi-objective genetic algorithm. For the jet pump geometry, a design space of several design variables was discretized using the Latin hypercube sampling method for the optimization. The performance analysis of the surrogate models shows that the combined surrogates perform better than a single surrogate and the optimized jet pump shows a higher performance. The approach can be implemented in other energy systems to find a better design.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.