• 제목/요약/키워드: Average nearest neighbor analysis

검색결과 33건 처리시간 0.023초

VIIRS와 MODIS 자료를 활용한 중분류 토지이용별 알베도 분석 (Analysis of Albedo by Level-2 Land Use Using VIIRS and MODIS Data)

  • 이용관;정지훈;장원진;김진욱;김성준
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1385-1394
    • /
    • 2022
  • 본 연구에서는 MODerate resolution Imaging Spectroradiometer (MODIS) 자료를 활용하여 20년(2002-2021)의 중분류 토지피복별 알베도 변화를 분석하고, Visible Infrared Imaging Radiometer Suite (VIIRS)의 10년(2012-2021) 자료를 활용해 MODIS 자료와의 차이를 분석하였다. MODIS와 VIIRS의 알베도 자료는 Bidirectional Reflectance Distribution Function (BRDF) 모델을 활용해 생산된 Sinusoidal Tile Grid 기반 500 m 공간해상도의 일단위 알베도 자료 MCD43A3와 VNP43IA3를 우리나라 범위에 대하여 구축하였다. Python 3.9 기반으로 작성된 코드를 활용하여 Reprojection을 하였으며, Resampling method는 Nearest neighbor를 적용하였다. 알베도 분석에는 단파 영역(Shortwave)의 White sky albedo와 Black sky albedo를 활용하였다. MODIS 자료를 활용한 20년의 알베도 분석 결과, 모든 토지이용에서 알베도가 상승하는 경향이 나타났다. 2000년대(2002-2011)에 비해 2010년대(2012-2021)의 평균 알베도가 산림 지역에서 0.0027의 가장 큰 상승값을 보였고, 그 다음으로 초지가 0.0024의 상승값을 보였다. VIIRS와 MODIS의 알베도를 비교한 결과, VIIRS의 알베도가 0.001에서 0.1 만큼 더 큰 것으로 나타났으며, 이는 영상의 촬영시기에 따른 지표면 반사도와 센서의 특성 차이에 의한 것으로 판단된다.

한국관박쥐 망막에서 파브알부민 면역반응성 망막신경절세포의 분포 양상 (Distribution of Parvalbumin-Immunoreactive Retinal Ganglion Cells in the Greater Horseshoe Bat, Rhinolophus ferrumequinum)

  • 전영기;김태진;이은실;주영락;전창진
    • 생명과학회지
    • /
    • 제17권8호통권88호
    • /
    • pp.1068-1074
    • /
    • 2007
  • 파브알부민(pa π albumin)은 망막의 다양한 세포타입에서 분포하고 있다. 본 연구팀은 이전연구에서 박쥐 망막의 내핵층에서의 파브알부민의 분포를 보고하였다. 현재 연구에서 본 연구팀은 한국관박쥐 (Rhinolophus ferrumequinum) 망막의 신경절세포층에 존재하는 파브알부민을 함유하는 신경세포를 규명하였고, 이들 세포의 분포양상을 조사하였다. 실험 결과,파브알부민의 면역반응성은 신경절세포층의 다수 세포에서 발견되었으며, 이들 세포는 주로 중간형 이상 크기의 세포체를 가지고 있었다. 조사된 세포체의 직경은 12.35 - 19.12 ${\mu}m$ 의 범위를 가지며 (n=166), 신경섬유층의 섬유 역시 염색되는 것으로 보아, 파브알부민을 함유하는 신경절세포는 대부분이 중간형이상 크기의 신경절세포임을 뒷받침하고 있다. NND (nearest neighbor distance) 분석을 통해서 본, 평균 NND는 59.57 에서 62.45 ${\mu}m$ 로 나타났으며, 평균 RI (regularity index) 는 2.95 ${\pm}$ 0.3 (mean${\pm}$s.d., n=4) 으로 계산되었다. 이를 종합해보면, 파브알부민은 한국관박쥐 망막의 신경절세포층에서 중간형이상 크기의 신경절세포에서 주로 발현하고 있으며, 이들은 규칙적인 배열을 가진 채 잘 조직화된 분포양상을 보여주고 있음을 알 수 있었다. 이러한 결과들은, 아직까지 명확하게 규명되어 있지 못한 박쥐의 시각에 대한 이해에 중요하게 적용될 수 있을 것이라고 사료된다.

Fast k-NN based Malware Analysis in a Massive Malware Environment

  • Hwang, Jun-ho;Kwak, Jin;Lee, Tae-jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권12호
    • /
    • pp.6145-6158
    • /
    • 2019
  • It is a challenge for the current security industry to respond to a large number of malicious codes distributed indiscriminately as well as intelligent APT attacks. As a result, studies using machine learning algorithms are being conducted as proactive prevention rather than post processing. The k-NN algorithm is widely used because it is intuitive and suitable for handling malicious code as unstructured data. In addition, in the malicious code analysis domain, the k-NN algorithm is easy to classify malicious codes based on previously analyzed malicious codes. For example, it is possible to classify malicious code families or analyze malicious code variants through similarity analysis with existing malicious codes. However, the main disadvantage of the k-NN algorithm is that the search time increases as the learning data increases. We propose a fast k-NN algorithm which improves the computation speed problem while taking the value of the k-NN algorithm. In the test environment, the k-NN algorithm was able to perform with only the comparison of the average of similarity of 19.71 times for 6.25 million malicious codes. Considering the way the algorithm works, Fast k-NN algorithm can also be used to search all data that can be vectorized as well as malware and SSDEEP. In the future, it is expected that if the k-NN approach is needed, and the central node can be effectively selected for clustering of large amount of data in various environments, it will be possible to design a sophisticated machine learning based system.

3차원 알고리듬을 이용한 랜덤(or s-랜덤) 인터리버를 적용한 터보코드의 성능분석 (Performance Analysis of Turbo-Code with Random (and s-random) Interleaver based on 3-Dimension Algorithm)

  • 공형윤;최지웅
    • 정보처리학회논문지A
    • /
    • 제9A권3호
    • /
    • pp.295-300
    • /
    • 2002
  • 본 논문에서는 3차원 입출력 알고리즘을 랜덤 인터리버와 s-랜덤 인터리버에 적용하였으며, 이를 터보코드 인터리버에 적용하여 성능을 분석하였다. 인터리버의 성능은 인접 데이터간 최소 거리에 의해 결정되어지므로, 인접 데이터간의 최소거리를 증가시키는 방법으로 인터리버의 성능을 향상 시켰다. 3차원 알고리즘을 적용한 인터리버는 3차원 저장공간을 이용해 입력 데이터를 저장하고 랜덤하게 추출하는 방식이다. 이러한 방식은 기존의 랜덤 인터리버와 s-랜덤 인터리버에 비해 인접 데이터간 최소거리와 평균거리를 증가시킨다. 컴퓨터 시뮬레이션을 이용하여 3차원 알고리듬을 적용한 터보코드의 성능을 분석하였으며, 전송 환경을 가우시안 채널로 설정하였다.

Indoor 3D Dynamic Reconstruction Fingerprint Matching Algorithm in 5G Ultra-Dense Network

  • Zhang, Yuexia;Jin, Jiacheng;Liu, Chong;Jia, Pengfei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권1호
    • /
    • pp.343-364
    • /
    • 2021
  • In the 5G era, the communication networks tend to be ultra-densified, which will improve the accuracy of indoor positioning and further improve the quality of positioning service. In this study, we propose an indoor three-dimensional (3D) dynamic reconstruction fingerprint matching algorithm (DSR-FP) in a 5G ultra-dense network. The first step of the algorithm is to construct a local fingerprint matrix having low-rank characteristics using partial fingerprint data, and then reconstruct the local matrix as a complete fingerprint library using the FPCA reconstruction algorithm. In the second step of the algorithm, a dynamic base station matching strategy is used to screen out the best quality service base stations and multiple sub-optimal service base stations. Then, the fingerprints of the other base station numbers are eliminated from the fingerprint database to simplify the fingerprint database. Finally, the 3D estimated coordinates of the point to be located are obtained through the K-nearest neighbor matching algorithm. The analysis of the simulation results demonstrates that the average relative error between the reconstructed fingerprint database by the DSR-FP algorithm and the original fingerprint database is 1.21%, indicating that the accuracy of the reconstruction fingerprint database is high, and the influence of the location error can be ignored. The positioning error of the DSR-FP algorithm is less than 0.31 m. Furthermore, at the same signal-to-noise ratio, the positioning error of the DSR-FP algorithm is lesser than that of the traditional fingerprint matching algorithm, while its positioning accuracy is higher.

한국 금정산에 븐포하고 있는 얼레지의 공간적 분포 양상과 집단 구조 (Spatial Distribution Pattern of Patches of Erythronium japonicum at Mt. Geumjeong in Korea)

  • 허만규
    • 생명과학회지
    • /
    • 제33권3호
    • /
    • pp.227-233
    • /
    • 2023
  • 본 연구의 목적은 한국의 금정산 얼레지(Erythronium japonicum) 집단의 지리적 분포에 따른 공간적 분석을 기술한 것이다. 얼레지의 공간적 양상은 Neatest Neighbor Rule, 분산 척도에 의한 다양한 플롯 크기에 따른 집단 응집, 그리고 공간적 상관관계로 분석하였다. 교란된 프롯은 5 m × 5 m 내에서 응집되었다. 얼레지의 대부분 자연 플롯은 산림 군락에서 일정하게 분포되어 있었다. 얼레지의 이웃 패치는 평균 약 7.5 m 에서 10 m 사이에서 이격되어 있었다. 얼레지 자연집단이 인간의 활동으로 교란되었다면 7.5 m~10 m 거리보다 짧은 크기에서 발생한다. 패치 지표(patchiness index, PAI)에 근거한 모리시타 지표(Morisita index, IM)는 금정산 서쪽 사면은 2.5 m × 5 m 플롯이었고 남쪽사면은 5 m × 5 m 이내에 나타났다. 금정산의 서쪽에서 패치 크기가 2.5 m × 5 m 방형구일 때 클러스터는 식물이 가진 종의 특성과 환경적 요인에 의해 결정되었다. 금정산 얼레지 집단은 Moran's I 값의 비교에서 로지스트 회귀로 분석었고, 거리에 의한 격리가 각 개체의 분산에 높은 유의성을 가지고 설명되었다.

수출인프라강화사업이 식품유통기업 수출에 미치는 정책효과 분석 (An Analysis of Policy Effects of Export Infrastructure Strengthening Program on Export of Food Distribution Companies)

  • 황성혁;지성태
    • 유통과학연구
    • /
    • 제16권1호
    • /
    • pp.87-99
    • /
    • 2018
  • Purpose - The Export Infrastructure Strengthening Program(EISP) is a project to expand exports of agri-food products through providing customized export information to food distribution companies and supporting overseas information activities. A total of 39.6 billion won was provided by 2016. So, the purpose of this study is to analyze whether EISP is effective for expanding exports of agri-food products. Research design, data, and methodology - A simple average difference between the export performance of the policy beneficiaries and the non-policy beneficiaries can be biased if the export capacity or inherent characteristics of the enterprise are not taken into consideration. In order to solve the problem of such a bias, the propensity score matching(PSM) method has been employed in this study. PSM is a method of converting the characteristics of an export company into an index through logit analysis and then reducing the matching to one dimension to improve the accuracy of the performance measurement. Results - The balancing test was conducted to determine how the characteristics of the policy beneficiary group and the matched policy non-beneficiary group corresponded to each other. As a result of the test, we could not reject the null hypothesis that there was no difference between the two groups, so that after the matching, the two groups were similar and the explanatory variables were well controlled. Using the nearest neighbor matching with propensity score estimating through logit analysis, we estimated average treatment effect on the treated(ATT). The food companies participating the EISP had the effect of increasing the exports of $ 5.88 million. As a result, the number of export contracts increased by 11.77, the number of exporting countries by 7.52, the number of export items by 47.51, and the number of buyers' consultation by 3.50. And overseas marketing expenses increased by 35.92 million won. Except for the number of export contracts, other export performance results showed statistically significant results. Conclusions - As the EISP has a positive effect on the expansion of agro-food exports, efforts should be made to find out the limitations or problems of the policy in the future and to make a greater contribution to the increase of exports.

독립성분분석을 이용한 다변량 시계열 모의 (Multivariate Time Series Simulation With Component Analysis)

  • 이태삼;호세살라스;주하카바넨;노재경
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.694-698
    • /
    • 2008
  • In hydrology, it is a difficult task to deal with multivariate time series such as modeling streamflows of an entire complex river system. Normal distribution based model such as MARMA (Multivariate Autorgressive Moving average) has been a major approach for modeling the multivariate time series. There are some limitations for the normal based models. One of them might be the unfavorable data-transformation forcing that the data follow the normal distribution. Furthermore, the high dimension multivariate model requires the very large parameter matrix. As an alternative, one might be decomposing the multivariate data into independent components and modeling it individually. In 1985, Lins used Principal Component Analysis (PCA). The five scores, the decomposed data from the original data, were taken and were formulated individually. The one of the five scores were modeled with AR-2 while the others are modeled with AR-1 model. From the time series analysis using the scores of the five components, he noted "principal component time series might provide a relatively simple and meaningful alternative to conventional large MARMA models". This study is inspired from the researcher's quote to develop a multivariate simulation model. The multivariate simulation model is suggested here using Principal Component Analysis (PCA) and Independent Component Analysis (ICA). Three modeling step is applied for simulation. (1) PCA is used to decompose the correlated multivariate data into the uncorrelated data while ICA decomposes the data into independent components. Here, the autocorrelation structure of the decomposed data is still dominant, which is inherited from the data of the original domain. (2) Each component is resampled by block bootstrapping or K-nearest neighbor. (3) The resampled components bring back to original domain. From using the suggested approach one might expect that a) the simulated data are different with the historical data, b) no data transformation is required (in case of ICA), c) a complex system can be decomposed into independent component and modeled individually. The model with PCA and ICA are compared with the various statistics such as the basic statistics (mean, standard deviation, skewness, autocorrelation), and reservoir-related statistics, kernel density estimate.

  • PDF

국내 건강정보관련 연구에 대한 계량서지학적 분석 (Bibliometric Analysis on Health Information-Related Research in Korea)

  • 김진원;이한슬
    • 정보관리학회지
    • /
    • 제41권1호
    • /
    • pp.411-438
    • /
    • 2024
  • 본 연구는 계량서지학적 분석 방법을 통해 여러 영역으로 나누어진 국내 건강정보 관련 연구를 통합적인 시각으로 보고자 하였다. 이를 위해 한국학술지인용색인 데이터베이스를 통해 2002년부터 2023년까지의 국내 '건강정보' 관련 논문 1,193편을 수집하여 시기별 동향, 학문분야, 지적구조, 키워드 변화 시기를 분석하였다. 분석결과, 건강정보 관련 논문 수는 지속적으로 증가하였으며, 2021년 이후 감소하고 있다. 건강정보 관련 연구의 주요 학문분야는 '의공학', '예방의학/직업환경의학', '법학', '간호학', '문헌정보학', '학제간연구'로 볼 수 있다. 건강정보 관련 연구의 지적구조를 파악하기 위해 단어동시출현분석을 시행하였다. 이후 도출된 네트워크의 구조와 군집파악을 위해 병렬최근접이웃클러스터링 알고리즘을 적용한 결과 '건강정보에 대한 의료공학적 관점'과 '건강정보에 대한 사회과학적 관점'이라는 2개의 대군집을 중심으로 그에 속한 4개의 중군집, 17개의 소군집을 파악할 수 있었다. 학문분야와 키워드의 변화 시기를 추적하기 위해 변곡점 분석을 시도하였으며 공통적으로 2010년과 2011년 사이에 변화가 있는 것으로 나타났다. 마지막으로 평균 출판년도와 단어출현빈도를 통해 전략 다이어그램을 도출하였으며 고빈도 키워드를 '유망', '성장', '성숙' 영역으로 구분하여 제시하였다. 본 연구는 주로 내용분석 중심의 선행연구들과 다르게 여러 가지 계량서지학적 방법을 통해 건강정보 관련 연구영역을 통합적인 시각으로 바라보았다는 데 의의가 있다.

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.