• 제목/요약/키워드: Statistics Matching

검색결과 188건 처리시간 0.022초

수학적 모델링 관점에 따른 한국과 싱가포르의 통계영역 과제 분석: 중학교 1학년 교과서를 중심으로 (Analyzing Tasks in the Statistics Area of Korean and Singaporean Textbooks from the Perspective of Mathematical Modeling: Focusing on 7th Grade)

  • 김소민
    • 한국학교수학회논문집
    • /
    • 제24권3호
    • /
    • pp.283-308
    • /
    • 2021
  • 본 연구는 한국과 싱가포르의 중학교 1학년 교과서의 통계영역에 제시된 과제를 수학적 모델링 관점에서 비교·분석함으로써 두 나라의 학생들이 각각 접할 학습 내용과 학습 경험의 기회를 확인하고자 하였다. 또한 이를 바탕으로 통계영역의 교과서 개발 및 보완 측면에서 시사점을 찾아보고자 하였다. 교과서 과제는 수학적 모델링 과정 반영, 데이터 제공 유형, 표현 형식, 문제 상황 맥락, 수학적 활동의 5가지 측면으로 분석하였다. 분석 결과, 한국과 싱가포르 교과서 모두 수학적 결론을 구하는 과제와 과제 해결에 필요한 데이터만 제공되는 과제, 표나 그림으로 표현되는 과제의 비중이 가장 높았다. 한국과 싱가포르 교과서에 반영된 실세계 맥락과 수학적 활동의 경우는 서로 비중에 차이가 있었다. 이를 바탕으로 향후 수학적 모델링 활동을 지원하기 위한 교과서 과제 개발에 대한 다음과 같은 시사점을 도출하였다. 수학적 모델링 과정의 균형 있는 경험 제공과 다양한 표현 형식의 과제를 제시함으로써 학생들의 인지적 수준을 높이며, 의미 있는 수학화 과정을 경험할 수 있는 기회의 확대가 필요하다. 또한, 수학적 모델링 활동에 대한 학생들의 흥미 또는 학습동기를 위해 맥락적 현실성이 높은 과제를 제시할 필요가 있다.

빅데이터 분석을 활용한 초기 정보 기반 화재현장 위험도 예측 모델 개발 연구 (A Study on the Development of a Fire Site Risk Prediction Model based on Initial Information using Big Data Analysis)

  • 김도형;조병완
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.245-253
    • /
    • 2021
  • 연구목적: 본 연구는 화재발생 건축물 정보, 신고자 취득 정보 등 초기 정보를 활용하여 화재현장의 위험도를 예측하여, 재난 발생 초기에 효과적인 소방자원 동원 및 적절한 대응을 위한 피해최소화 전략 수립을 지원하는 위험도 예측 모델을 개발하고자 한다. 연구방법: 화재 통계 데이터 상에서 화재의 피해규모와 관련된 변수 규명을 위해 머신러닝 알고리즘을 이용한 변수간 상관성 분석을 실시하여 예측 가능성을 검토하고, 데이터 표준화 및 이산화 등의 전처리를 통해 학습 데이터 셋을 구축하였다. 이를 활용하여 예측 정확도가 높은 것으로 평가 받고 있는 복수의 머신러닝 알고리즘을 테스트하여 가장 정확도가 높은 알고리즘을 적용한 위험도 예측 모델을 개발하였다. 연구결과: 머신러닝 알고리즘 성능 테스트 결과 랜덤포레스트 알고리즘의 정확도가 가장 높게 나왔으며, 위험도 등급에 대해서는 중간치에 대한 정확성이 상대적으로 높은 것으로 확인되었다. 결론: 화재 통계 상 피해규모 데이터의 편향성에 의해 예측모델 정확도가 제한적으로 나타났으며, 예측 모델 성능 개선을 위해 데이터 정합성 및 결손치 보완 등을 통한 데이터 정제가 필요하다.

하드웨어 소프트웨어 통합 설계에 의한 H.263 동영상 코덱 구현 (An Efficient Hardware-Software Co-Implementation of an H.263 Video Codec)

  • 장성규;김성득;이재헌;정의철;최건영;김종대;나종범
    • 한국통신학회논문지
    • /
    • 제25권4B호
    • /
    • pp.771-782
    • /
    • 2000
  • 이 논문에서는 하드웨어와 소프트웨어의 통합 설계에 의한 H.263 동영상 코덱을 구현한다. 동영상의 부호화와 복호화를 실시간으로 수행하기 위해 동작 속도 및 응용성을 동시에 고려하여 H.263 코덱의 각 부분 중 어느 부분이 하드웨어 또는 소프트웨어로 구현된는 것이 바람직한지 결정하였다. 하드웨어로 구현하는 부분은 움직임 추정부 및 보상부와 메모리 제어부이고, 나머지 부분은 RISC (reduced instruction set computer) 프로세서를 사용하여 소프트웨어로 처리한다. 이 논문에서는 하드웨어 및 소프트웨어 모듈의 효과적인 구현 방법을 소개한다. 특히 하드웨어로 구현되는 움직임 추정부를 위해서 주변 움직임 변위의 상관성 및 계층적 탐색을 이용한 다수의 움직임 후보를 가지고 알고리즘을 사용하였으며, 이 알고리즘에 기반한 소면적 구조를 제안한다. 소프트웨어로 처리되는 DCT (discrete cosine transform) 부분의 최적화를 위해서 움직임 추정부에서 얻어진 SAD (sum of absolute difference) 값에 근거하여 DCT 이후 양자화된 계수들의 통계적 특성을 분류하는 기법을 사용한다. 제안된 방법을 실제 RISC 프로세서와 gate array를 이용하여 구\ulcorner하고, 그 성능이 우수함을 확인하였다.

  • PDF

치과용 백색광 스캐너를 이용한 impression scanning의 반복 측정에 대한 안정성 평가 (Evaluation on the repeatability of dental white light scanner-based digital impression)

  • 전진훈;이경탁;김혜영;김지환;김웅철
    • 대한치과기공학회지
    • /
    • 제35권1호
    • /
    • pp.37-42
    • /
    • 2013
  • Purpose: The purpose of this study was to evaluate the repeatability of dental white light scanner. Methods: The impression(Zerosil, Dreve, Germany) were digitized in white light scanner(Identica, Medit, Korea) to create 3-dimensional surface-models. The distribution of the discrepancies between the number of points in the corresponding CRM models and the point clouds in the others were measured by a matching-software(PowerInspect 2012, Delcam Plc, UK). The discriptive statistics were used for statistical analysis(SPSS 20.0). Results: The measurement of repeatablity showed very good reliability. The mean(SD) discrepancy value on the white light scanner digital models was 8.7(0.67) ${\mu}m$, based on SD and absolute mean values. Conclusion: These in vitro studies showed that repeatability of dental white light scanner is high reliability. These results can be confirmed in further clinical studies.

Direct Divergence Approximation between Probability Distributions and Its Applications in Machine Learning

  • Sugiyama, Masashi;Liu, Song;du Plessis, Marthinus Christoffel;Yamanaka, Masao;Yamada, Makoto;Suzuki, Taiji;Kanamori, Takafumi
    • Journal of Computing Science and Engineering
    • /
    • 제7권2호
    • /
    • pp.99-111
    • /
    • 2013
  • Approximating a divergence between two probability distributions from their samples is a fundamental challenge in statistics, information theory, and machine learning. A divergence approximator can be used for various purposes, such as two-sample homogeneity testing, change-point detection, and class-balance estimation. Furthermore, an approximator of a divergence between the joint distribution and the product of marginals can be used for independence testing, which has a wide range of applications, including feature selection and extraction, clustering, object matching, independent component analysis, and causal direction estimation. In this paper, we review recent advances in divergence approximation. Our emphasis is that directly approximating the divergence without estimating probability distributions is more sensible than a naive two-step approach of first estimating probability distributions and then approximating the divergence. Furthermore, despite the overwhelming popularity of the Kullback-Leibler divergence as a divergence measure, we argue that alternatives such as the Pearson divergence, the relative Pearson divergence, and the $L^2$-distance are more useful in practice because of their computationally efficient approximability, high numerical stability, and superior robustness against outliers.

초점집단토론을 통한 국제의료행위분류의 한의의료행위 적용 방안 연구 (Exploring the Ways to Apply Korean Traditional Medical Practices to the International Classification of Health Interventions through Focus Group Discussion)

  • 김미경;김은진;조윤정;한창호
    • 대한한의학회지
    • /
    • 제41권3호
    • /
    • pp.125-137
    • /
    • 2020
  • Objectives: This study was aimed to present the experts' opinions for the successful application of Korean traditional medical practices (KTMPs) to the International Classification of Health Intervention (ICHI). Methods: Two doctors of Korean Medicine and two health information managers who had tried coding 131 KTMPs using ICHI participated in the focus group discussion. The remarks from the discussion were summarized according to the thematic analysis method. Results: The participants expected ICHI to be mainly used for statistics when applied to TKMPs. It can be used for payment systems as well, but it was expected that additional work would be required. They thought the current version of the ICHI did not sufficiently reflect the KMTPs of the real world, and even the interventions already included in the ICHI were not explained enough in the system. They thought it would not be easy to explain more KTMPs within the current structure of the ICHI, but they also said it seemed possible. In the process, rather than adding entirely new stem codes, it would be better to generate new combinations of the existing codes, to suppose subdivided codes, and to utilize the include terms or extension codes. Conclusions: For the successful introduction of ICHI, clarifying the definition of each intervention of KTMPs is a top priority. In addition, it is necessary to continue the matching work of ICHI - KMPTs and also required to make this effort together with the field of traditional medicine and complementary medicine worldwide.

음의 일치 빈도를 고려한 유사성 측도의 대소 관계 규명에 관한 연구 (A study on the ordering of similarity measures with negative matches)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.89-99
    • /
    • 2015
  • 세계 경제 포럼과 대한민국 지식경제부에서 10대 핵심정보기술 가운데 하나로 빅 데이터를 선정한 바 있다. 빅 데이터에 대한 분석은 결국 데이터들이 가지고 있는 속성을 얼마나 효과적으로 분석하느냐가 관건이다. 이를 위한 기법들 중에서 군집 분석 방법은 거리 또는 유사성 측도를 이용하여 각 개체의 유사성을 측정하여 유사도가 높은 대상 집단을 분류하고 군집에 속한 개체들의 유사성과 서로 다른 군집에 속한 개체간의 상이성을 밝혀내는 통계분석 기법이다. 군집분석에서 이용되고 있는 유사성 측도는 데이터의 속성에 따라 여러 가지의 형태로 분류할 수 있으며, 범주형 데이터에 적용 가능한 측도들은 음의 일치 빈도를 고려한 측도, 음의 일치 빈도를 고려하지 않는 측도, 그리고 주변 확률 분포의 포함 여부에 의한 측도 등으로 구분할 수 있다. 음의 일치 빈도는 동시발생빈도와 더불어 두 항목간의 관련성에 대한 순방향성을 의미하므로 이를 고려하지 않는 유사성 측도들보다 이를 고려한 유사성 측도들이 좀 더 현실적인 측도라고 할 수 있다. 따라서 본 논문에서는 이분형 데이터에 대해 일반적으로 많이 활용되고 있는 음의 일치 빈도를 고려한 측도들에 대해 대소 관계를 규명함으로써 이들의 상한 및 하한을 설정하는 문제를 고려하였다.

Chirp 신호를 이용한 해저퇴적층의 음향학적 특성 역산 (Inversion of Acoustical Properties of Sedimentary Layers from Chirp Sonar Signals)

  • 박철수;성우제
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.32-41
    • /
    • 1999
  • 본 논문은 chirp신호와 두 개의 근거리 청음기를 이용한 해저퇴적층의 음향학적 특성치 역산기법을 제시한다. 역산문제를 확률론적 모델로 정식화하고, 역산의 해를 역산인자의 a priori분포와 유사도함수의 곱으로 표현되는a posteriori 확률분포로 정의하였다. 퇴적층의 음속과 층두께의 a priori정보를 파형 매칭 기법으로 추정한 후 다수의 퇴적층이 존재하는 환경모델을 부분퇴적층모델로 치환하고, 계측신호와 모의신호의 L₂노음을 이용하여 정의된 목적함수에 대해 반복적인 유전자알고리즘 탐색을 수행하여 탐색공간의 축소로 인한 탐색효율과 결과의 향상을 얻었다. A posteriori 확률분포의 다중적분의 형태로 정의되는 인자의 주변확률분포와 평균의 추정은 유전자알고리즘의 탐색과정에서 선택된 탐색점들을 이용하여 수행되었다. 제시된 역산기법의 검증을 위해 두 가지 퇴적층 환경모델을 설정하고 잡음을 첨가한 합성신호에 대해 역산기법을 적용하여 역산해를 추정하였고 역산결과로부터 본 역산기법의 유용성을 확인하였다.

  • PDF

효율적인 실내 측위를 위한 최적화된 KNN/IFCM 알고리즘 (Optimized KNN/IFCM Algorithm for Efficient Indoor Location)

  • 이장재;송익호;김종화;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.125-133
    • /
    • 2011
  • WLAN 환경하에서 알고리즘 기반의 패턴 매칭을 위해 training 단계에서는 여러 개의 AP에서 신호 잡음비의 특성값을 데이터베이스에 만들어 활용하고 estimation 단계에서는 단말기(MU)의 2차원 좌표값을 단말기로부터 새롭게 얻은 SNR과 데이터베이스에 저장된 fingerprint을 비교함으로써 추정한다. Fingerprinting 방식에서 KNN은 WLAN 기반 실내 측위에 가장 많이 적용되고 있지만 KNN의 성능은 k 개의 이웃 수와 RP의 수에 따라 민감하다. 논문에서는 KNN 성능을 향상시키기 위해 PFCM 군집화를 적용한 KNN과 PFCM을 혼합한 알고리즘을 제안하였다. 제안한 알고리즘은 신호잡음비 데이터를 KNN 방법에 적용하여 k개의 RP을 선택한 후 선택된 RP의 신호잡음비를 PFCM에 적용하여 k개의 RP를 군집하여 분류한다. 실험 결과에서는 위치 오차가 2m 이내에서 KNN/IFCM 알고리즘이 KNN, KNN/FCM, KNN/PFCM 알고리즘보다 성능이 우수하다.

실내 위치기반서비스를 위한 KNN/ANN Hybrid 측위 결정 알고리즘 (KNN/ANN Hybrid Location Determination Algorithm for Indoor Location Base Service)

  • 이장재;정민아;이성로;송익호
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.109-115
    • /
    • 2011
  • Fingerprinting 방식에서 KNN은 WLAN 기반 실내 측위에 가장 많이 적용되고 있지만 KNN의 성능은 k 개의 이웃 수와 RP의 수에 따라 민감하다. 논문에서는 KNN 성능을 향상시키기 위해 ANN 군집화를 적용한 KNN과 ANN을 혼합한 알고리즘을 제안하였다. WLAN 환경하에서 알고리즘 기반의 패턴 매칭을 위해 training 단계에서는 여러 개의 AP에서 신호 잡음비의 특성값을 데이터베이스에 만들어 활용하고 estimation 단계에서는 단말기(MU)의 2차원 좌표값을 단말기로부터 새롭게 얻은 SNR과 데이터베이스에 저장된 fingerprint을 비교함으로써 추정한다. 제안한 알고리즘은 신호잡음비 데이터를 KNN 방법에 적용하여 k개의 RP을 선택한 후 선택된 RP의 신호잡음비를 ANN에 적용하여 k개의 RP를 군집하여 분류한다. 실험 결과에서는 위치 오차가 2m 이내에서 KNN/ANN 알고리즘이 KNN 알고리즘보다 성능이 우수하다.