• Title/Summary/Keyword: 통계 분류

Search Result 2,155, Processing Time 0.027 seconds

한글 문자의 서체 분류

  • Kim, Sam-Su;Kim, Su-Hyeong
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.113-118
    • /
    • 2002
  • 본 논문에서는 한글 문자의 세리프(serif) 계열과 산세리프(sans-serif) 계열의 분류를 위한 특징을 제안한다. 한글의 서체는 세로획의 시작 부분에 장식 세리프(돌기)가 있는 세리프 계열과 그렇지 않은 산세리프 계열로 나눌 수 있다. 제안하는 한글 문자의 서체 분류 방법은 세리프 형태에서 추출한 특징을 이용하여 세리프 또는 산세리프 클래스로 분류하고, 각 클래스별로 적합한 특징 및 분류기를 학습하여 보다 다양한 서체를 인식하도록 계층적으로 설계한다. 제안한 특징의 유용성을 입증하기 위한 실험은 명조, 바탕, 궁서, 고딕, 돋움, 굴림 서체의 3,000개 낱자 영상에 적용하였다.

  • PDF

Assessing spatial uncertainty distributions in remote sensing data classification using geostatistical simulation (지구통계학적 시뮬레이션을 이용한 원격탐사 화상 분류 결과의 공간적 불확실성 분포의 추정)

  • 박노욱;지광훈;권병두
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.463-468
    • /
    • 2004
  • 이 연구에서는 원격탐사 자료를 이용하여 얻어진 분류 결과로부터 분류 정확도의 공간적 불확실성을 추정하고자 하였다. 기존 분류결과로부터 얻어지는 토지 피복별 확률값을 지구통계학적 시뮬레이션 기법을 이용하여 참조자료의 공간적 분포와 통합하였다. 다중센서 화상 통합에 적용한 결과, 각 토지피복 항목별로 공간적인 정확도 분포를 얻을 수 있을 수 있었으며 이러한 자료는 분류결과를 해석하는데 유용하게 사용될 수 있을 것으로 기대된다.

  • PDF

Optimal threshold using the correlation coefficient for the confusion matrix (혼동행렬의 상관계수를 이용한 최적분류점)

  • Hong, Chong Sun;Oh, Se Hyeon;Choi, Ye Won
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.1
    • /
    • pp.77-91
    • /
    • 2022
  • The optimal threshold estimation is considered in order to discriminate the mixture distribution in the fields of Biostatistics and credit evaluation. There exists well-known various accuracy measures that examine the discriminant power. Recently, Matthews correlation coefficient and the F1 statistic were studied to estimate optimal thresholds. In this study, we explore whether these accuracy measures are appropriate for the optimal threshold to discriminate the mixture distribution. It is found that some accuracy measures that depend on the sample size are not appropriate when two sample sizes are much different. Moreover, an alternative method for finding the optimal threshold is proposed using the correlation coefficient that defines the ratio of the confusion matrix, and the usefulness and utility of this method are also discusses.

A Web-Based Information System for the Integrated Search for Protein Structure Classifications (단백질 구조 분류의 통합 검색을 위한 웹 정보시스템)

  • 신원준;황의윤;김진홍;안건태;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.274-276
    • /
    • 2004
  • 단백질은 대부분 공간상의 특징을 고려할 때 유사한 부분을 기준으로 분류되는 경우가 많다 단백질 구조 분류 데이터베이스는 단백질이 가지는 다양한 구조 정보를 바탕으로 단백질 구조 분류 정보를 제공하고 있다. 대표적인 단백질 구조 분류 데이터베이스에는 CATH와 SCOP 데이터베이스가 있다. 이들 데이터베이스는 서로 다른 구조 분류 기준으로 단백질 구조를 분류하고 있으며, 단백질 구조 분류 정보를 검색하는 웹 서비스를 개별적으로 제공하고 있다. 따라서 여러 종류의 단백질 구조 분류 정보를 하나의 웹 사이트에서 검색할 수 있으면 유용할 것이다. 본 논문에서는 CATH와 SCOP에서 정의한 단백질 구조 분류 정보의 통합적인 검색 기능 일 통계 정보를 체계적으로 제공하는 웹 정보시스템에 관하여 기술한다. 제안된 시스템은 CATH와 SCOP에서 제공하는 각각의 데이터를 가공하여 효과적인 구조 분류 검색을 지원하는 구조화된 데이터베이스를 구축하였다. 개발된 시스템은 PDB 식별자, CAT터 식별자. 그리고 SCOP 식별자 또는 단백질 분류 이름으로 한번의 검색으로 두 데이터베이스에서 제공하는 계층적 구조 분류 정보를 제공한다. 또한, 단백질 구조에 대한 유용한 통계 정보를 제공한다.

  • PDF

A Study of A Cultural Classification and A Culture Contents Industrial Classification (문화분류와 문화콘텐츠산업분류에 관한 연구)

  • Ahn, In-Ja
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.17 no.2
    • /
    • pp.5-22
    • /
    • 2006
  • A cultural classification and a culture contents industrial classification are the basic tools for cultural policies, cultural supporting, cultural statistics, and evaluations and there is a cyclic processes among them. This study finds out the varieties and short time changes of cultural categorization in laws, statistics, indexes, evaluations, research reports. As a result, colon style new cultural classification is suggested which used networks, media, genre, and cultural comparts as principles.

Statistic Signature based Application Traffic Classification (통계 시그니쳐 기반의 응용 트래픽 분류)

  • Park, Jin-Wan;Yoon, Sung-Ho;Park, Jun-Sang;Lee, Sang-Woo;Kim, Myung-Sup
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.34 no.11B
    • /
    • pp.1234-1244
    • /
    • 2009
  • Nowadays, the traffic type and behavior are extremely diverse due to the appearance of various services and applications on Internet, which makes the need of application-level traffic classification important for the efficient management and control of network resources. Although lots of methods for traffic classification have been introduced in literature, they have some limitations to achieve an acceptable level of performance in terms of accuracy and completeness. In this paper we propose an application traffic classification method using statistic signatures, defined as a directional sequence of packet size in a flow, which is unique for each application. The statistic signatures of each application are collected by our automatic grouping and extracting mechanism which is mainly described in this paper. By matching to the statistic signatures we can easily and quickly identify the application name of traffic flows with high accuracy, which is also shown by comprehensive excrement with our campus traffic data.

Classification of Statistical Error Types Through Analysis of Wind and Flood Damage History Data (풍수해 피해이력 자료 분석을 통한 통계적 오류유형 분류)

  • Kim, Ku-Yoon;Lee, Mi-Ran;Lee, Jun-Woo
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2022.10a
    • /
    • pp.135-136
    • /
    • 2022
  • 최근 기후변화의 영향으로 태풍 및 국지성 집중호우 등 자연재해 발생빈도가 증가함에 따라 풍수해로 인한 인명피해와 재산피해가 증가하고 있다. 국내에서는 재해연보를 통해 자연재난 피해이력 통계정보를 제공하고 있으며, 당해연도 자연재해상황을 기간별, 시도별, 수계별, 월별, 원인별 총괄통계와 인명피해, 시설피해와 관련된 피해면적, 피해액, 복구액 등 세부내용으로 구성하여 정보를 제공하고 있다. 행정안전부는 국가재난정보시스템을 통해 취합된 지자체 피해이력 통계자료를 입력하고 있는데 입력하는 과정에서 누락, 오기 등의 오류가 발생할 가능성이 있다. 경제적 손실이 증가하고 있는 풍수해 재난이 발생하게 될 경우 피해비용 집계, 피해액 산정 등 정확한 자료로서 구축되지 않으면 연구 및 분석을 수행하기 위한 통계자료로서 활용될 수 없다. 이러한 문제점을 개선하기 위해서 본 연구에서는 1985년부터 2018년까지 재해연보에 대해서 기간별-시군구별 자료분석을 통해 피해이력 데이터 오류 유형에 대해 분류하였다.

  • PDF

A Case Study for Rock Mass Classification and Statistical Analysis in Roadway Tunnel (도로터널에서의 암반분류 및 통계분석 사례)

  • 김영근;유동욱
    • Proceedings of the Korean Geotechical Society Conference
    • /
    • 2003.06b
    • /
    • pp.197-226
    • /
    • 2003
  • 터널에서의 암반분류/평가는 지보패턴결정 뿐만 아니라 터널주변암반에 대한 설계정 수 산정 및 물성평가에 있어 매우 중요한 요소라 할 수 있다. 암반분류는 각 국 또는 주요기관 별로 분류안이 만들어져 있으며, 현재 RMR분류와 Q-system이 가장 활발히 적용되고 있다. 본고에서는 터널설계단계에서 암반분류방법과 지보패턴결정과정을 고찰하였으며, 도로설계를 중심으로 적용현황을 분석하였다 또한 실제 터널시공시 암반분류 및 판정에 의한 지보공 변경사례를 살펴봄으로서 시공 중 암반분류/평가의 의미를 고찰하였다. 그리고 암반분류요소들에 대한 통계분석을 실시하여 암반분류요소들간의 상관관계를 분석하였다.

  • PDF

A Multiclass Sound Classification Model based on Deep Learning for Subtitles Production of Sound Effect (효과음 자막 생성을 위한 딥러닝 기반의 다중 사운드 분류)

  • Jung, Hyeonyoung;Kim, Gyumi;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.397-400
    • /
    • 2020
  • 본 논문은 영화에 나오는 효과음을 자막으로 생성해주는 자동자막생성을 제안하며, 그의 첫 단계로써 다중 사운드 분류 모델을 제안하였다. 고양이, 강아지, 사람의 음성을 분류하기 위해 사운드 데이터의 특정벡터를 추출한 뒤, 4가지의 기계학습에 적용한 결과 최적모델로 딥러닝이 선정되었다. 전처리 과정 중 주성분 분석의 유무에 따라 정확도는 81.3%와 33.3%로 확연한 차이가 있었으며, 이는 복잡한 특징을 가지는 사운드를 분류하는데 있어 주성분 분석과 넓고 깊은 형태의 신경망이 보다 개선된 분류성과를 가져온 것으로 생각된다.