• Title/Summary/Keyword: 동시발생빈도

Search Result 291, Processing Time 0.034 seconds

A Pattern Recognition Based on Co-occurrence among Median Local Binary Patterns (중간값 국소이진패턴 사이의 동시발생 빈도 기반 패턴인식)

  • Cho, Yong-Hyun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.26 no.4
    • /
    • pp.316-320
    • /
    • 2016
  • In this paper, we presents a pattern recognition by considering the spatial co-occurrence among micro-patterns of texture images. The micro-patterns of texture image have been extracted by local binary pattern based on median(MLBP) of block image, and the recognition process is based on co-occurrence among MLBPs. The MLBP is applied not only to consider the local character but also analyze the pattern in order to be robust noise, and spatial co-occurrence is also applied to improve the recognition performance by considering the global space of image. The proposed method has been applied to recognized 17 RGB images of 120*120 pixels from Mayang texture image based on Euclidean distance. The experimental results show that the proposed method has a texture recognition performance.

Association rule thresholds of similarity measures considering negative co-occurrence frequencies (동시 비 발생 빈도를 고려한 유사성 측도의 연관성 규칙 평가 기준 활용 방안)

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.6
    • /
    • pp.1113-1121
    • /
    • 2011
  • Recently, a variety of data mining techniques has been applied in various fields like healthcare, insurance, and internet shopping mall. Association rule mining is a popular and well researched method for discovering interesting relations among large set of data items. Association rule mining is the method to quantify the relationship between each set of items in very huge database based on the association thresholds. There are three primary quality measures for association rules; support and confidence and lift. In this paper we consider some similarity measures with negative co-occurrence frequencies which is widely used in cluster analysis or multi-dimensional analysis as association thresholds. The comparative studies with support, confidence and some similarity measures are shown by numerical example.

Bayesian Approach to Estimation of Copula Parameters and Assessment of Uncertainty for Bivariate Frequency Analysis (Bayesian Copula기반 이변량 비정상성 빈도해석 및 불확실성 평가 모형 개발)

  • Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.35-35
    • /
    • 2016
  • 수문학적 빈도해석은 일반적으로 단변량 형태에 해석이 주를 이루고 있으나, 최근 다변량 해석에 대한 이해와 더불어, 해석 기술 발달에 따라 빈도해석에서도 다변량 해석적 접근이 이루어지고 있다. 기존 다변량 해석 방법으로는 Copula방법 적용이 활발하게 이루어지고 있으며, 특히 가뭄해석에 있어 지속시간과 심도를 동시에 평가하는 2변량 가뭄빈도해석에 대한 연구가 다수 이루어지고 있다. 그러나 기존 해석 방법은 정상성 해석 모형으로서 기상변동성과 같은 시변동성을 고려하는데 한계가 있다. 이러한 점에서 본 연구에서는 Bayesian 기반 Copula 함수의 매개변수를 추정함과 동시에 매개변수의 불확실성을 평가할 수 있는 2변량 비정상성 빈도해석 모형을 개발하였다. 본 연구에서는 최근 우리나라와 미국에서 발생한 2013-15년 가뭄빈도에 대한 평가와 동시에 이에 따른 불확실성을 정량적으로 평가하는 연구를 진행하였다.

  • PDF

Multi-Topic Meeting Summarization using Lexical Co-occurrence Frequency and Distribution (어휘의 동시 발생 빈도와 분포를 이용한 다중 주제 회의록 요약)

  • Lee, Byung-Soo;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.07a
    • /
    • pp.13-16
    • /
    • 2015
  • 본 논문에서는 어휘의 동시 발생 (co-occurrence) 빈도와 분포를 이용한 회의록 요약방법을 제안한다. 회의록은 일반 문서와 달리 문서에 여러 세부적인 주제들이 나타나며, 잘못된 형식의 문장, 불필요한 잡담들을 포함하고 있기 때문에 이러한 특징들이 문서요약 과정에서 고려되어야 한다. 기존의 일반적인 문서요약 방법은 하나의 주제를 기반으로 문서 전체에서 가장 중요한 문장으로 요약하기 때문에 다중 주제 회의록 요약에는 적합하지 않다. 제안한 방법은 먼저 어휘의 동시 발생 (co-occurrence) 빈도를 이용하여 회의록 분할 (segmentation) 과정을 수행한다. 다음으로 주제의 구분에 따라 분할된 각 영역 (block)의 중요 단어 집합 생성, 중요 문장 추출 과정을 통해 회의록의 중요 문장들을 선별한다. 마지막으로 추출된 중요 문장들의 위치, 종속 관계를 고려하여 최종적으로 회의록을 요약한다. AMI meeting corpus를 대상으로 실험한 결과, 제안한 방법이 baseline 요약 방법들보다 요약 비율에 따른 평가 및 요약문의 세부 주제별 평가에서 우수한 요약 성능을 보임을 확인하였다.

  • PDF

A study on the ordering of similarity measures with negative matches (음의 일치 빈도를 고려한 유사성 측도의 대소 관계 규명에 관한 연구)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.1
    • /
    • pp.89-99
    • /
    • 2015
  • The World Economic Forum and the Korean Ministry of Knowledge Economy have selected big data as one of the top 10 in core information technology. The key of big data is to analyze effectively the properties that do have data. Clustering analysis method of big data techniques is a method of assigning a set of objects into the clusters so that the objects in the same cluster are more similar to each other clusters. Similarity measures being used in the cluster analysis may be classified into various types depending on the nature of the data. In this paper, we studied upper and lower bounds for binary similarity measures with negative matches such as Russel and Rao measure, simple matching measure by Sokal and Michener, Rogers and Tanimoto measure, Sokal and Sneath measure, Hamann measure, and Baroni-Urbani and Buser mesures I, II. And the comparative studies with these measures were shown by real data and simulated experiment.

Estimation of Rainfall Quantile of Typhoon Using Bivariate Frequency Analysis (이변량 빈도해석을 이용한 태풍의 확률강우량 산정)

  • Um, Myoung-Jin;Joo, Kyung-Won;Kim, Su-Young;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.375-375
    • /
    • 2012
  • 우리나라는 연강우량의 여름철 집중현상이 뚜렷하며 많은 부분이 태풍에 기인한다. 기후변화로 인하여 최근 들어서 태풍이 수반하는 폭우나 국지성 호우로 인한 강우사상이 증가하고 있어 짧은 시간에 많은 강우량이 발생하여 단기강우의 강도가 증가하고 있다. 이로 인하여 단기간에 예측하기 힘든 큰 강우량이 발생하는 경우가 빈번하여 이와 같은 강우에 의한 홍수를 대비할 필요성이 대두되고 있다. 따라서 본 연구에서는 태풍으로 인한 강우에 대하여 빈도해석을 수행하여 태풍으로 인하여 발생하는 확률강우량을 산정하였다. 태풍은 여러 인자를 포함하고 있는데 강우(1시간, 24시간, 총합), 풍속(최대, 순간최대), 중심최저기압, 중심최대풍속 등이 그것들이며, 강우와 동시에 그 이외의 인자들을 고려하기 위하여 이변량 빈도해석 모형인 copula 모형을 이용하여 빈도해석을 수행하였다. 이와 같이 copula 모형이 구성되면, 조건부 copula의 개념을 이용하여 강우 이외의 인자가 주어졌을 경우의 확률강우량을 산정할 수 있다.

  • PDF

A development of trivariate drought frequency analysis approach using copula function (Trivariate Copula 함수를 활용한 가뭄빈도해석 기법 개발)

  • Kim, Jin-Young;Lee, Jeong-Ju;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.351-351
    • /
    • 2017
  • 2014-2015년 우리나라 강수량이 평년에 비해 절반수준에 미치지 못해 극심한 가뭄을 일으켰으며, 이는 댐 용량 부족, 지하수 고갈 등 다양한 피해를 발생시켰다. 특히 소양강댐의 경우 1978년 이루 두 번째로 낮은 수위를 기록한바 있다. 우리나라의 경우 가뭄은 약 2-3냔 주기로 발생하고 있으며, 특히 2015년에 겪었던 가뭄은 물 용수공금 측면에서 막대한 영향을 미친 것으로 평가되어 신뢰성 있는 가뭄 분석이 중요한 요소로 대두되고 있다. 또한 지구온난화로 인해 기후변화의 영향으로 강수량의 증가가 일반적으로 전망되지만, 상대적으로 증가된 강우변동성으로 인해 가뭄 발생 빈도 및 강도도 동시에 증가할 것으로 전망되고 있다. 이러한 이유로 본 연구에서는 현재 가뭄을 신뢰성있게 평가하기 위해 Trivariate Copula 함수를 활용하여 가뭄분석을 수행하였다. 기존연구에서는 가뭄 지속시간(drought duration), 가뭄 심도(drought severity)를 활용한 이변량 가뭄 빈도 해석을 수행하였지만, 이는 다소 과소 추정 될 개연성이 있다. 이러한 이유로 본 연구에서는 가뭄강도(drought intensity) 변량을 추가로 분석하여 Trivariate frequency analysis 기법을 개발하였으며, 서울 관측소를 대상으로 분석하였다. 분석 결과 현재 가뭄은 역대 발생했던 가뭄 중 가장 큰 빈도를 기록하여 이에 대한 효과적인 가뭄 관리체계를 마련하기 위한 기초자료를 제공할 수 있을 것으로 기대된다. 또한 기존 Bivariate 빈도해석의 경우 Trivariate 빈도해석 보다 가뭄위험도를 다소 과소추정하는 것으로 나타나 Trivariate 해석이 다소 현실적인 접근 방법이라 사료된다.

  • PDF

Prediction of Frequency Based Precipitation in Korean Peninsular Using Climate Model (기후모형을 이용한 한반도 확률강수량 예측)

  • Kyoung, Min-Soo;Kim, Hung-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.278-282
    • /
    • 2010
  • 기후변화는 홍수나 가뭄과 같은 극한사상의 발생가능성을 증가시키게 됨과 동시에 하천유량, 홍수, 수질, 생태, 지하수, 농업, 융설, 수력발전 등 수자원 전반에 걸쳐 영향을 미치고 있다. 이 중 홍수는 국민의 생명과 재산에 직접적으로 영향을 미치기 때문에 상당수의 국가들이 홍수로부터 자국민을 보호하기 위한 다양한 정책을 제시하고 있다. 이러한 정책을 수립하는데 있어서 무엇보다 중요한 것이 미래의 강수량이 기후변화로 인하여 얼마나 변하게 되는지를 정량적으로 평가하는 것이다. 이에 본 연구에서는 기후변화의 영향을 평가하기 위해서 프랑스 국립기상연구소에서 개발한 A1b시나리오 기반의 CNCM3모형을 대상으로 KNN기법과 일강수발생모형을 적용하여 기상청 산하 58개 관측소의 일 강수량으로 축소하였다. 제시된 일 강수량을 이용하여 2020s, 2050s, 2080s에 해당하는 80년, 100년, 150년, 200년 빈도의 확률강수량을 각각 산정하였다. 검토결과 확률강수량은 전국 58개 지점 중 49~52개 지점정도가 증가하는 것으로 나타나 현재에 비해서 전반적으로 증가하는 것으로 예측되었으며, 지점별 증가량의 경우, 빈도별로 차이를 보이기는 하나 현재에 비해서 전반적으로 3%~7%정도 증가하는 것을 알 수 있었다.

  • PDF

A Method for Detection and Correction of Pseudo-Semantic Errors Due to Typographical Errors (철자오류에 기인한 가의미 오류의 검출 및 교정 방법)

  • Kim, Dong-Joo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.18 no.10
    • /
    • pp.173-182
    • /
    • 2013
  • Typographical mistakes made in the writing process of drafts of electronic documents are more common than any other type of errors. The majority of these errors caused by mistyping are regarded as consequently still typo-errors, but a considerable number of them are developed into the grammatical errors and the semantic errors. Pseudo semantic errors among these errors due to typographical errors have more noticeable peculiarities than pure semantic errors between senses of surrounding context words within a sentence. These semantic errors can be detected and corrected by simple algorithm based on the co-occurrence frequency because of their prominent contextual discrepancy. I propose a method for detection and correction based on the co-occurrence frequency in order to detect semantic errors due to typo-errors. The co-occurrence frequency in proposed method is counted for only words with immediate dependency relation, and the cosine similarity measure is used in order to detect pseudo semantic errors. From the presented experimental results, the proposed method is expected to help improve the detecting rate of overall proofreading system by about 2~3%.

Concurrency Control and Recovery Method of B+-Tree using Bulk Loading and Extended Lazy Deletion (일괄구성과 확장된 지연삭제를 이용한 B+-Tree의 동시성 제어 및 회복)

  • 김대일;김성희;조숙경;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.128-130
    • /
    • 2000
  • B+-Tree는 데이트베이스 관리 시스템에서 대용량의 데이터를 관리하기 위해 가장 널리 사용되는 인덱스이다. 그런 기존의 B+-Tree는 데이터베이스의 초기 구성 및 재구성시 많은 비용이 들고, 또한 삭제 연산의 빈번한 발생시 색인 구조 변경연산의 발생빈도가 높아져 동시성이 떨어진다는 단점이 있다. 이러한 문제점을 해결하기 위해서 기존 대부분의 데이터베이스 관리시스템에서는 일괄구성과 지연삭제를 이용하고 있으나, 동시성 및 회복에 대한 처리가 미흡하여 실제 시스템에 적용하기에는 문제가 있다. 따라서 본 논문에서는 일괄구성과 지연삭제 방법을 적용한 B+-Tree에서의 동시성 및 회복기법을 제안한다. 제안된 기법은 일괄구성 시에 잠금의 부하와 연속적인 철회(Cascade Rollback)가 없고, 또한 지연 삭제기법을 확장함으로써 빈 페이지 리스트 관리에 대한 부하가 없으며, 삭제 연산에 대한 회복 시 논리적 복귀(Logical Undo)가 빨라지고 구현이 간단해진다는 장점이 있다.

  • PDF