• 제목/요약/키워드: Statistics Korea

검색결과 8,521건 처리시간 0.043초

사재기 의혹 음원 특징 분석과 순위 예측 (Feature analysis and ranking prediction of music suspected of being abused)

  • 정해린;김도영;정현정;김성경;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.388-391
    • /
    • 2022
  • 온라인 음원 스트리밍 서비스가 확대되면서 음원 사재기가 빈번해지고 있다. 본 논문에서는 사재기로 의심할 수 있는 음원의 특징을 분석하고, 사재기가 이루어지지 않았을 경우의 음원 순위를 예측한다. 그 결과, 랜덤 포레스트를 통해 앨범 평점이 낮은 음원, 장르가 인디나 발라드인 음원, 특정 발매사의 음원일 때 사재기로 의심할 수 있었다. 또한, 딥러닝을 통한 순위 예측 실험 결과, 사재기의 영향으로 실제 순위와 예측 순위에 큰 차이가 있는 것으로 나타났다.

리뷰 데이터 기반 개인 맞춤형 음식점 추천 시스템 (Personalized restaurant recommendation system based on customer's review data)

  • 정승혜;임예빈;최가연;장혜원;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.407-408
    • /
    • 2023
  • 사람들은 각자 원하는 조건에 부합한 식당과 카페를 찾곤 한다. 그러나 개인별로 원하는 조건들이 다양하고 그 조건들이 모두 부합하는 음식점을 찾기에는 적지 않은 시간과 노력이 필요한 일이다. 이 불편함을 해소하고자, 사용자가 원하는 조건을 입력하면 그 조건에 부합하는 몇 개의 음식점들을 추천해 주고, 지도상으로 위치를 표시해 주는 개인 맞춤형 음식점 추천 시스템을 개발하였다. 본 연구에서 제안하는 추천 시스템은 사용자가 입력한 우선순위에 따라 차별화된 음식점 추천을 받을 수 있으므로, 시간과 노력을 투자하지 않고도 자신이 원하는 음식점을 쉽게 찾을 수 있을 것으로 예상된다.

부동산 전세사기 예방을 위한 요인 분석 및 회귀 분석 기반 전세보증사고 금액 예측 모델 (A Factor Analysis and Regression-Based Prediction Model of Security Deposit Scam Amount for Preventing Rental Scam)

  • 하서정;오세현;반소정;이지윤;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.554-555
    • /
    • 2024
  • 전세 사기로 인한 피해가 해마다 증가하고 있다. 본 연구에서는 부동산 가격과 대출 데이터를 통해 전세 사기의 원인을 분석하고, 이에 대한 대처방안을 제시하였다. 데이터 분석 결과, 주택 가격의 상승과 부동산 정책의 변화가 전세사기에 주요한 영향을 미친다는 것과, 전세사기 사건 수와 부동산 가격 상승 사이에 높은 상관관계가 나타남을 확인했다. 또한, 회귀분석을 사용하여 연도에 따른 전세보증사고 금액 예측 모델을 구축하였다. 이를 토대로 부동산 시장 안정화와 함께 개인 및 정부 차원의 협력이 강화된다면 전세사기 피해를 줄일 수 있을 것이라 기대된다.

통계품질 향상을 위한 평가지표의 개발 (A Development of the Evaluation Indices for Improving the Quality of Statistics)

  • 류제복;유정빈;김선웅
    • 한국조사연구학회지:조사연구
    • /
    • 제5권2호
    • /
    • pp.71-90
    • /
    • 2004
  • 제품과 마찬가지로 통계의 품질은 국가의 경쟁력을 높이고 국가발전에 필수적이다. 통계청은 지난 2002년 처음으로 48개의 통계품질평가지표를 사용해서 통계청에서 생산한 12개의 통계에 대한 품질평가를 실시하였다. 그러나 주요 국제기구나 선진국들에 비해 통계품질향상을 위한 조직과 인력이 부족하고 통계품질지표도 충분치 않아서 정확한 평가와 올바른 통계품질을 향상시키는 정책을 수립하는데 어려움이 있다. 이에 본 연구에서는 현재 통계청에서 사용하고 있는 통계품질평가지표를 검토하고 주요 국제기구와 통계 선진국들의 다양한 통계품질평가지표들을 비교${\cdot}$분석하여 81개의 평가지표를 마련하였고 이들은 7개 차원으로 분류하였다. 또한 이들 지표의 필요성과 각 지표에서 평가할 내용들을 정리하였다. 이 지표는 차원별, 절차별로 분류할 수 있고 통계별로 필요에 따라 사용될 수 있다.

  • PDF

소프트웨어(SW)산업구조 이해를 위한 유관 통계 간 비교분석 연구 (A Comparative Analysis Study of Relevant Statistics for Understanding the Structure of the Software(SW) Industry)

  • 최무이
    • 한국IT서비스학회지
    • /
    • 제23권3호
    • /
    • pp.55-63
    • /
    • 2024
  • To grasp the structure of an industry and monitor its changes, it is essential to utilize relevant statistics. Various statistics are being compiled regarding the software (SW) industry, presenting diverse numerical values. However, without a precise understanding of the scope and measurement methods inherent to each statistic, gaining a rigorous understanding of the industry's structure and evolving trends becomes challenging. Moreover, significant discrepancies between similar statistics often lead to confusion among users. In the software (SW) industry, key statistics commonly used include SW production value and SW market size. As of 2022, the annual domestic SW production value is reported as 77.4 trillion KRW (based on ICT Survey), while the SW market size for the same year is stated as 38.5 trillion KRW (according to IDC data). Although production value and market size may seem conceptually similar, there is approximately a twofold difference between the figures provided. Without understanding the meanings of each statistic and the differences between them, there are limitations in utilizing these statistics effectively. While statistics are utilized for various purposes such as policy development or causal analysis of policy using statistical raw data, research that presents and analyzes the precise meanings and limitations of each SW-related statistic is virtually non-existent. Thus, this study aims to compare and analyze the methodologies and differences among key statistics used to represent the SW industry: SW production value, SW market size, and SW GDP statistics. Through this analysis, the goal is to contribute to a better understanding of the SW industry's structure and enable more accurate and rigorous utilization of relevant statistics.

언어모델 전이학습 기반 해외 직접 구매 상품군 분류 (A Method of Classification of Overseas Direct Purchase Product Groups Based on Transfer Learning)

  • 오교중;최호진;차원석;김일구;우찬균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.571-575
    • /
    • 2022
  • 본 논문에서는 통계청에서 매월 작성되는 온라인쇼핑동향조사를 위해, 언어모델 전이학습 기반 분류모델 학습 방법론을 이용하여, 관세청 제공 전자상거래 수입 목록통관 자료를 처리하기 위해서 해외 직접 구매 상품군 분류 모델을 구축한다. 최근에 텍스트 분류 태스크에서 많이 이용되는 BERT 기반의 언어모델을 이용하며 기존의 색인어 정보 분석 과정이나 사례사전 구축 등의 중간 단계 없이 해외 직접 판매 및 구매 상품군을 94%라는 높은 예측 정확도로 분류가 가능해짐을 알 수 있다.

  • PDF

A comparative study of the revised 2022 Korea mathematics curriculum and the international baccalaureate diploma program mathematics: Applications and interpretation standard level - focusing on high school statistics area

  • Soo Bin Lee;Ah Ra Cho;Oh Nam Kwon
    • 한국수학교육학회지시리즈D:수학교육연구
    • /
    • 제27권1호
    • /
    • pp.49-73
    • /
    • 2024
  • This study aims to explore the direction of high school statistics education in Korea through a comparative analysis between the revised 2022 Korea mathematics curriculum and the IBDP Mathematics: Application & Interpretation Standard Level (IBDP AI SL) Curriculum and textbooks. The study seeks to investigate the Statistics unit of the two curricula, compare chapter structures and content elements of textbooks, and explore exercises on modeling and utilization of technology tools. The results are as follows: First, the IBDP AI SL statistics covered a broader range of topics. Second, exercises in Korean high school textbooks typically inquire about one or two questions in each topic, whereas the IBDP AI SL textbook's exercises present a real-life scenario on all relevant topics through sub-questions. Third, the Korean textbook guides the utilization of technology tools only in exercises presented after completing the entire chapter or where the calculation is complex. Also, there were only a handful of modeling exercises in the Korean textbook in contrast to most of the lessons and exercises were modeling exercises in the IBDP AI SL textbook. If these findings can be integrated into teaching practices in Korea, it will provide a direction for statistics education in Korean high schools.

Nonparametric Estimation of Bivariate Mean Residual Life Function under Univariate Censoring

  • Dong-Myung Jeong;Jae-Kee Song;Joong Kweon Sohn
    • Journal of the Korean Statistical Society
    • /
    • 제25권1호
    • /
    • pp.133-144
    • /
    • 1996
  • We, in this paper, propose a nonparametric estimator of bivariate mean residual life function based on Lin and Ying's (1993) bivariate survival function estimator of paired failure times under univariate censoring and prove the uniform consistency and the weak convergence result of this estimator. Through Monte Carlo simulation, the performances of the proposed estimator are tabulated and are illustrated with the skin grafts data.

  • PDF

On Confidence Intervals of High Breakdown Regression Estimators

  • Lee Dong-Hee;Park YouSung;Kim Kang-yong
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.205-210
    • /
    • 2004
  • A weighted self-tuning robust regression estimator (WSTE) has the high breakdown point for estimating regression parameters such as other well known high breakdown estimators. In this paper, we propose to obtain standard quantities like confidence intervals, and it is found to be superior to the other high breakdown regression estimators when a sample is contaminated

  • PDF

Maximum Entropy Principle for Queueing Theory

  • SungJin Ahn;DongHoon Lim;SooTaek Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제4권2호
    • /
    • pp.497-505
    • /
    • 1997
  • We attempt to get a probabilistic model of a queueing system in the maximum entropy condition. Applying the maximum entropy principle to the queueing system, we obtain the most uncertain probability model compatible with the available information expressed by moments.

  • PDF