Huge amounts of various web items such as keywords, images, and web pages are being made widely available on the Web. The popularities of such web items continuously change over time, and mining temporal patterns in popularities of web items is an important problem that is useful for several web applications. For example, the temporal patterns in popularities of search keywords help web search enterprises predict future popular keywords, enabling them to make price decisions when marketing search keywords to advertisers. However, presence of millions of web items makes it difficult to scale up previous techniques for this problem. This paper proposes an efficient method for mining temporal patterns in popularities of web items. We treat the popularities of web items as time-series, and propose gapmeasure to quantify the similarity between the popularities of two web items. To reduce the computation overhead for this measure, an efficient method using the Fast Fourier Transform (FFT) is presented. We assume that the popularities of web items are not necessarily following any probabilistic distribution or periodic. For finding clusters of web items with similar popularity trends, we propose to use a density-based clustering algorithm based on the gap measure. Our experiments using the popularity trends of search keywords obtained from the Google Trends web site illustrate the scalability and usefulness of the proposed approach in real-world applications.
Kim, Hyo-Gyeong;Lee, Dong-In;Yu, Cheol-Hwan;Gwon, Won-Tae
Journal of Korea Water Resources Association
/
v.35
no.1
/
pp.25-36
/
2002
Window Probability Matching Method(WPMM) is achieved by matching identical probability density of rain intensities and radar reflectivities taken only from small window centered about the gage. The equation of $Z_{e}-R$ relationship is obtained and compared with data between a DWSR-88C radar and high density rain gage networks within 150km from radar site in summer season, 1998. The probability density of radar effective reflectivity is distributed with high frequency near 15dBZ. The frequency distribution of rain intensities shows that rain intensity is lower than 10mm/hr in most part of radar coverage area. As the result of $Z_{e}-R$ relationship using WPMM, curved line has shown to the log scale spatially and it can be explained more flexible than any straight-line power laws at the transformation to the rainfall amount from $Z_e$ value. During 3 months, total radar cumulative rainfall amount estimated by $Z=200R^{1.6}$ and WPMM relationships are 44 and 80 percentages of total raingage amount, respectively. Therefore, $Z_{e}-R$ relationships by WPMM may be widely needed a statistical method for the computation of accumulated precipitation.
Journal of the Korean association of regional geographers
/
v.4
no.1
/
pp.121-134
/
1998
In this study, the satellite images and the GIS technique are used to select the basin characteristics parameters as the basis of water resources management of river basin. The study area is Geum-ho river basin and the hydrologic characteristics data are computed through the database of the basin characteristics parameters classified by subjects with 35 maps correspond to the study basin of 1:25,000 scale as the basic map. As the result, the drawing up of land use map through satellite image processing that provides the quantitative informations for the land is very efficient to analysis the extensive land use information of the basin, and exact analysis of mass surface data is possible and the feasibility of statistic computation between spatial subjects as it superpose on other subject map is ascertained. It is thought also that the analysis of the basin characteristics data can be utilized very effectively for the basin management and the analysis of basin surface area, once it is expressed numerically for database, since the superposition analysis with different subject map and the correlative analysis with the property data are possible although the tracing process of each subject in the basic map is not efficient. Especially, modification and renewal of the data for the change of land surface become easy, therefore more rapid and exact selection of the basin characteristics data and the construction of more efficient basin management plan are possible.
This study performs a daily long-term runoff analysis for 30 years to forecast medium- and long-term probabilistic reservoir inflows on the Soyang River basin. Snowmelt is computed by Anderson's temperature index snowmelt model and potenetial evaporation is estimated by Penman-combination method to produce input data for a rainfall-runoff model. A semi-distributed TOPMODEL which is composed of hydrologic rainfall-runoff process on the headwater-catchment scale based on the original TOPMODEL and a hydraulic flow routing model to route the catchment outflows using by kinematic wave scheme is used in this study It can be observed that the time variations of the computed snowmelt and potential evaporation are well agreed with indirect observed data such as maximum snow depth and small pan evaporation. Model parameters are calibrated with low-flow(1979), medium-flow(1999), and high-flow(1990) rainfall-runoff events. In the model evaluation, relative volumetric error and correlation coefficient between observed and computed flows are computed to 5.64% and 0.91, respectively. Also, the relative volumetric errors decrease to 17% and 4% during March and April with or without the snowmelt model. It is concluded that the semi-distributed TOPMODEL has well performance and the snowmelt effects for the long-term runoff computation are important on the study area.
The flood forecasting model currently used in Korea calculates the runoff of basin using the lumped rainfall-runoff model and estimates the river level using the river and reservoir routing models. The lumped model assumes homogeneous drainage zones in the basin. Therefore, it can not consider various spatial characteristics in the basin. In addition, the rainfall data used in lumped model also has the same limitation because of using the point scale rainfall data. To overcome the limitations as mentioned above, many researchers have studied to apply the distributed rainfall-runoff model to flood forecasting system. In this study, to apply the Grid-based Rainfall-Runoff Model (GRM) to the Korean flood forecasting system, the optimal resolution is determined by analyzing the difference of the results of the runoff according to the various resolutions. If the grid size is to small, the computation time becomes excessive and it is not suitable for applying to the flood forecasting model. Even if the grid size is too large, it does not fit the purpose of analyzing the spatial distribution by applying the distributed model. As a result of this study, the optimal resolution which satisfies the accuracy of the bsin runoff prediction and the calculation speed suitable for the flood forecasting was proposed. The accuracy of the runoff prediction was analyzed by comparing the Nash-Sutcliffe model efficiency coefficient (NSE). The optimal resolution estimated from this study will be used as basic data for applying the distributed rainfall-runoff model to the flood forecasting system.
KSCE Journal of Civil and Environmental Engineering Research
/
v.39
no.2
/
pp.307-316
/
2019
Development of vegetation in stream channel increases resistance to flow, resulting in increase in river stage upon flood and affecting change in stage-discharge relationship. Vegetation revealed in stream by water level reaching a peak and then declined upon flood is mostly found as prone. Taking an account of flow distribution with the number of vegetation, prone vegetation layer might be at height where discharge rate is zero (0) (Stephan and Guthnecht, 2002). However, there is a tendency that flow rate is overestimated when applying the height of river bed to flow area with no consideration of the height of vegetation layer in flow rate by float measurement. In this study, reliable flow measurement in stream with vegetation was calculated by measuring the height of vegetation layer after flood and excluding the vegetation layer-projected area from the flow area. The result showed the minimum 4.34 % to maximum 10.82 % of flow deviation depending on the scale of discharge. Accordingly, reliable velocity-area methods would be determined if vegetation layer-projected area in stream is considered in flow rate estimation using the flow area during the flood.
Long time-series gridded data is crucial for the analyses of Earth environmental changes. Climate reanalysis and satellite images are now used as global-scale periodical and quantitative information for the atmosphere and land surface. This paper examines the feasibility of DCT-PLS (penalized least square regression based on discrete cosine transform) for the spatial gap filling of gridded data through the experiments for multiple variables. Because gap-free data is required for an objective comparison of original with gap-filled data, we used LDAPS (Local Data Assimilation and Prediction System) daily data and MODIS (Moderate Resolution Imaging Spectroradiometer) monthly products. In the experiments for relative humidity, wind speed, LST (land surface temperature), and NDVI (normalized difference vegetation index), we made sure that randomly generated gaps were retrieved very similar to the original data. The correlation coefficients were over 0.95 for the four variables. Because the DCT-PLS method does not require ancillary data and can refer to both spatial and temporal information with a fast computation, it can be applied to operative systems for satellite data processing.
To investigate the characteristics of detailed flows in a building-congested district, we coupled a computation fluid dynamics (CFD) model to the local data assimilation and prediction system (LDAPS), a current operational numerical weather prediction model of the Korea Meteorological Administration. For realistic numerical simulations, we used the meteorological variables such as wind speeds and directions and potential temperatures predicted by LDAPS as the initial and boundary conditions of the CFD model. We trilinearly interpolated the horizontal wind components of LDAPS to provide the initial and boudnary wind velocities to the CFD model. The trilinearly interpolated potential temperatures of LDAPS is converted to temperatures at each grid point of the CFD model. We linearly interpolated the horizontal wind components of LDAPS to provide the initial and boundary wind velocities to the CFD model. The linearly interpolated potential temperatures of LDAPS are converted to temperatures at each grid point of the CFD model. We validated the simulated wind speeds and directions against those measured at the PKNU-SONIC station. The LDAPS-CFD model reproduced similar wind directions and wind speeds measured at the PKNU-SONIC station. At 07 LST on 22 June 2020, the inflow was east-north-easterly. Flow distortion by buildings resulted in the east-south-easterly at the PKNU-SONIC station, which was the similar wind direction to the measured one. At 19 LST when the inflow was southeasterly, the LDAPS-CFD model simulated southeasterly (similar to the measured wind direction) at the PKNU-SONIC station.
KSCE Journal of Civil and Environmental Engineering Research
/
v.29
no.1A
/
pp.45-52
/
2009
In conventional structural design, deterministic optimization which satisfies codified constraints is performed to ensure safety and maximize economical efficiency. However, uncertainties are inevitable due to the stochastic nature of structural materials and applied loads. Thus, deterministic optimization without considering these uncertainties could lead to unreliable design. Recently, there has been much research in reliability-based design optimization (RBDO) taking into consideration both the reliability and optimization. RBDO involves the evaluation of probabilistic constraint that can be estimated using the RIA (Reliability Index Approach) and the PMA(Performance Measure Approach). It is generally known that PMA is more stable and efficient than RIA. Despite the significant advancement in PMA, RBDO still requires large computation time for large-scale applications. In this paper, A new reliability-based design optimization (RBDO) method is presented to achieve the more stable and efficient algorithm. The idea of the new method is to integrate a response surface method (RSM) with PMA. For the approximation of a limit state equation, the moving least squares (MLS) method is used. Through a mathematical example and ten-bar truss problem, the proposed method shows better convergence and efficiency than other approaches.
Hallucination is a significant barrier to the utilization of large-scale language models or multimodal models. In this study, we collected 654 computer science papers with "hallucination" in the abstract from arXiv from December 2022 to January 2024 following the advent of Chat GPT and conducted frequency analysis, knowledge network analysis, and literature review to explore the latest trends in hallucination research. The results showed that research in the fields of "Computation and Language," "Artificial Intelligence," "Computer Vision and Pattern Recognition," and "Machine Learning" were active. We then analyzed the research trends in the four major fields by focusing on the main authors and dividing them into data, hallucination detection, and hallucination mitigation. The main research trends included hallucination mitigation through supervised fine-tuning (SFT) and reinforcement learning with human feedback (RLHF), inference enhancement via "chain of thought" (CoT), and growing interest in hallucination mitigation within the domain of multimodal AI. This study provides insights into the latest developments in hallucination research through a technology-oriented literature review. This study is expected to help subsequent research in both engineering and humanities and social sciences fields by understanding the latest trends in hallucination research.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.