• 제목/요약/키워드: 동시발생빈도

검색결과 291건 처리시간 0.035초

중간값 국소이진패턴 사이의 동시발생 빈도 기반 패턴인식 (A Pattern Recognition Based on Co-occurrence among Median Local Binary Patterns)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제26권4호
    • /
    • pp.316-320
    • /
    • 2016
  • 본 논문에서는 질감영상의 마이크로패턴 간 공간적인 동시발생 빈도를 고려한 패턴인식을 제안한다. 여기서 마이크로패턴은 블록영상의 중간값에 기반한 국소이진패턴(local binary pattern : LBP)으로 추출되고, 추출된 국소이진패턴들 사이의 동시발생빈도를 고려하여 패턴인식을 수행한다. 중간값 이진패턴은 영상의 국소속성을 고려할 뿐만 아니라 잡음에 강건한 패턴분석을 위함이고, 동시발생빈도는 영상의 전역속성을 고려하여 인식성능을 좀 더 향상시키기 위함이다. 제안된 기법을 120*120 픽셀의 17개 RGB 질감 패턴영상을 대상으로 유클리디언(Euclidean) 거리에 기반한 실험결과, 우수한 인식성능이 있음을 확인하였다.

동시 비 발생 빈도를 고려한 유사성 측도의 연관성 규칙 평가 기준 활용 방안 (Association rule thresholds of similarity measures considering negative co-occurrence frequencies)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1113-1121
    • /
    • 2011
  • 최근 여러 분야에서 다양한 데이터 마이닝 방법들을 현업에 적용하고 있는 추세이다. 가장 많이 활용되고 있는 데이터 마이닝 기법 중의 하나인 연관성 규칙은 대용량 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화하여 그들 간의 연관 정도를 나타내는 기법이다. 의미 있는 연관성 규칙을 생성하기 위해 지지도, 신뢰도, 향상도 등의 측도가 가장 기본적으로 활용되고 있다. 본 논문에서는 군집 분석이나 다차원 분석법에서 많이 활용되고 있는 유사성 측도들 중에서 동시 비 발생 빈도를 고려한 유사성 측도를 연관성 평가 기준으로 제안한 후, 예제를 통하여 기존의 신뢰도 및 지지도와 비교함으로써 그 유용성을 알아보았다. 모의실험 결과를 종합해볼 때, 동시 발생 빈도 또는 동시 비 발생 빈도가 증가하면 본 논문에서 고려한 모든 유사성 측도들은 지지도 및 신뢰도와 마찬가지로 증가하며, 불일치 계수의 값이 증가하면 이 측도들은 감소하게 된다는 사실을 알 수 있었다. 또한 이들 유사성 측도들은 지지도 및 신뢰도와 매우 유의한 상관관계가 있는 것으로 나타났으며, 전항과 후항이 바뀌더라도 값의 변화가 없기 때문에 신뢰도 보다 더 바람직한 연관성 규칙 평가 기준이라고 할 수 있다.

Bayesian Copula기반 이변량 비정상성 빈도해석 및 불확실성 평가 모형 개발 (Bayesian Approach to Estimation of Copula Parameters and Assessment of Uncertainty for Bivariate Frequency Analysis)

  • 권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.35-35
    • /
    • 2016
  • 수문학적 빈도해석은 일반적으로 단변량 형태에 해석이 주를 이루고 있으나, 최근 다변량 해석에 대한 이해와 더불어, 해석 기술 발달에 따라 빈도해석에서도 다변량 해석적 접근이 이루어지고 있다. 기존 다변량 해석 방법으로는 Copula방법 적용이 활발하게 이루어지고 있으며, 특히 가뭄해석에 있어 지속시간과 심도를 동시에 평가하는 2변량 가뭄빈도해석에 대한 연구가 다수 이루어지고 있다. 그러나 기존 해석 방법은 정상성 해석 모형으로서 기상변동성과 같은 시변동성을 고려하는데 한계가 있다. 이러한 점에서 본 연구에서는 Bayesian 기반 Copula 함수의 매개변수를 추정함과 동시에 매개변수의 불확실성을 평가할 수 있는 2변량 비정상성 빈도해석 모형을 개발하였다. 본 연구에서는 최근 우리나라와 미국에서 발생한 2013-15년 가뭄빈도에 대한 평가와 동시에 이에 따른 불확실성을 정량적으로 평가하는 연구를 진행하였다.

  • PDF

어휘의 동시 발생 빈도와 분포를 이용한 다중 주제 회의록 요약 (Multi-Topic Meeting Summarization using Lexical Co-occurrence Frequency and Distribution)

  • 이병수;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제52차 하계학술대회논문집 23권2호
    • /
    • pp.13-16
    • /
    • 2015
  • 본 논문에서는 어휘의 동시 발생 (co-occurrence) 빈도와 분포를 이용한 회의록 요약방법을 제안한다. 회의록은 일반 문서와 달리 문서에 여러 세부적인 주제들이 나타나며, 잘못된 형식의 문장, 불필요한 잡담들을 포함하고 있기 때문에 이러한 특징들이 문서요약 과정에서 고려되어야 한다. 기존의 일반적인 문서요약 방법은 하나의 주제를 기반으로 문서 전체에서 가장 중요한 문장으로 요약하기 때문에 다중 주제 회의록 요약에는 적합하지 않다. 제안한 방법은 먼저 어휘의 동시 발생 (co-occurrence) 빈도를 이용하여 회의록 분할 (segmentation) 과정을 수행한다. 다음으로 주제의 구분에 따라 분할된 각 영역 (block)의 중요 단어 집합 생성, 중요 문장 추출 과정을 통해 회의록의 중요 문장들을 선별한다. 마지막으로 추출된 중요 문장들의 위치, 종속 관계를 고려하여 최종적으로 회의록을 요약한다. AMI meeting corpus를 대상으로 실험한 결과, 제안한 방법이 baseline 요약 방법들보다 요약 비율에 따른 평가 및 요약문의 세부 주제별 평가에서 우수한 요약 성능을 보임을 확인하였다.

  • PDF

음의 일치 빈도를 고려한 유사성 측도의 대소 관계 규명에 관한 연구 (A study on the ordering of similarity measures with negative matches)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.89-99
    • /
    • 2015
  • 세계 경제 포럼과 대한민국 지식경제부에서 10대 핵심정보기술 가운데 하나로 빅 데이터를 선정한 바 있다. 빅 데이터에 대한 분석은 결국 데이터들이 가지고 있는 속성을 얼마나 효과적으로 분석하느냐가 관건이다. 이를 위한 기법들 중에서 군집 분석 방법은 거리 또는 유사성 측도를 이용하여 각 개체의 유사성을 측정하여 유사도가 높은 대상 집단을 분류하고 군집에 속한 개체들의 유사성과 서로 다른 군집에 속한 개체간의 상이성을 밝혀내는 통계분석 기법이다. 군집분석에서 이용되고 있는 유사성 측도는 데이터의 속성에 따라 여러 가지의 형태로 분류할 수 있으며, 범주형 데이터에 적용 가능한 측도들은 음의 일치 빈도를 고려한 측도, 음의 일치 빈도를 고려하지 않는 측도, 그리고 주변 확률 분포의 포함 여부에 의한 측도 등으로 구분할 수 있다. 음의 일치 빈도는 동시발생빈도와 더불어 두 항목간의 관련성에 대한 순방향성을 의미하므로 이를 고려하지 않는 유사성 측도들보다 이를 고려한 유사성 측도들이 좀 더 현실적인 측도라고 할 수 있다. 따라서 본 논문에서는 이분형 데이터에 대해 일반적으로 많이 활용되고 있는 음의 일치 빈도를 고려한 측도들에 대해 대소 관계를 규명함으로써 이들의 상한 및 하한을 설정하는 문제를 고려하였다.

이변량 빈도해석을 이용한 태풍의 확률강우량 산정 (Estimation of Rainfall Quantile of Typhoon Using Bivariate Frequency Analysis)

  • 엄명진;주경원;김수영;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.375-375
    • /
    • 2012
  • 우리나라는 연강우량의 여름철 집중현상이 뚜렷하며 많은 부분이 태풍에 기인한다. 기후변화로 인하여 최근 들어서 태풍이 수반하는 폭우나 국지성 호우로 인한 강우사상이 증가하고 있어 짧은 시간에 많은 강우량이 발생하여 단기강우의 강도가 증가하고 있다. 이로 인하여 단기간에 예측하기 힘든 큰 강우량이 발생하는 경우가 빈번하여 이와 같은 강우에 의한 홍수를 대비할 필요성이 대두되고 있다. 따라서 본 연구에서는 태풍으로 인한 강우에 대하여 빈도해석을 수행하여 태풍으로 인하여 발생하는 확률강우량을 산정하였다. 태풍은 여러 인자를 포함하고 있는데 강우(1시간, 24시간, 총합), 풍속(최대, 순간최대), 중심최저기압, 중심최대풍속 등이 그것들이며, 강우와 동시에 그 이외의 인자들을 고려하기 위하여 이변량 빈도해석 모형인 copula 모형을 이용하여 빈도해석을 수행하였다. 이와 같이 copula 모형이 구성되면, 조건부 copula의 개념을 이용하여 강우 이외의 인자가 주어졌을 경우의 확률강우량을 산정할 수 있다.

  • PDF

Trivariate Copula 함수를 활용한 가뭄빈도해석 기법 개발 (A development of trivariate drought frequency analysis approach using copula function)

  • 김진영;이정주;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.351-351
    • /
    • 2017
  • 2014-2015년 우리나라 강수량이 평년에 비해 절반수준에 미치지 못해 극심한 가뭄을 일으켰으며, 이는 댐 용량 부족, 지하수 고갈 등 다양한 피해를 발생시켰다. 특히 소양강댐의 경우 1978년 이루 두 번째로 낮은 수위를 기록한바 있다. 우리나라의 경우 가뭄은 약 2-3냔 주기로 발생하고 있으며, 특히 2015년에 겪었던 가뭄은 물 용수공금 측면에서 막대한 영향을 미친 것으로 평가되어 신뢰성 있는 가뭄 분석이 중요한 요소로 대두되고 있다. 또한 지구온난화로 인해 기후변화의 영향으로 강수량의 증가가 일반적으로 전망되지만, 상대적으로 증가된 강우변동성으로 인해 가뭄 발생 빈도 및 강도도 동시에 증가할 것으로 전망되고 있다. 이러한 이유로 본 연구에서는 현재 가뭄을 신뢰성있게 평가하기 위해 Trivariate Copula 함수를 활용하여 가뭄분석을 수행하였다. 기존연구에서는 가뭄 지속시간(drought duration), 가뭄 심도(drought severity)를 활용한 이변량 가뭄 빈도 해석을 수행하였지만, 이는 다소 과소 추정 될 개연성이 있다. 이러한 이유로 본 연구에서는 가뭄강도(drought intensity) 변량을 추가로 분석하여 Trivariate frequency analysis 기법을 개발하였으며, 서울 관측소를 대상으로 분석하였다. 분석 결과 현재 가뭄은 역대 발생했던 가뭄 중 가장 큰 빈도를 기록하여 이에 대한 효과적인 가뭄 관리체계를 마련하기 위한 기초자료를 제공할 수 있을 것으로 기대된다. 또한 기존 Bivariate 빈도해석의 경우 Trivariate 빈도해석 보다 가뭄위험도를 다소 과소추정하는 것으로 나타나 Trivariate 해석이 다소 현실적인 접근 방법이라 사료된다.

  • PDF

기후모형을 이용한 한반도 확률강수량 예측 (Prediction of Frequency Based Precipitation in Korean Peninsular Using Climate Model)

  • 경민수;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.278-282
    • /
    • 2010
  • 기후변화는 홍수나 가뭄과 같은 극한사상의 발생가능성을 증가시키게 됨과 동시에 하천유량, 홍수, 수질, 생태, 지하수, 농업, 융설, 수력발전 등 수자원 전반에 걸쳐 영향을 미치고 있다. 이 중 홍수는 국민의 생명과 재산에 직접적으로 영향을 미치기 때문에 상당수의 국가들이 홍수로부터 자국민을 보호하기 위한 다양한 정책을 제시하고 있다. 이러한 정책을 수립하는데 있어서 무엇보다 중요한 것이 미래의 강수량이 기후변화로 인하여 얼마나 변하게 되는지를 정량적으로 평가하는 것이다. 이에 본 연구에서는 기후변화의 영향을 평가하기 위해서 프랑스 국립기상연구소에서 개발한 A1b시나리오 기반의 CNCM3모형을 대상으로 KNN기법과 일강수발생모형을 적용하여 기상청 산하 58개 관측소의 일 강수량으로 축소하였다. 제시된 일 강수량을 이용하여 2020s, 2050s, 2080s에 해당하는 80년, 100년, 150년, 200년 빈도의 확률강수량을 각각 산정하였다. 검토결과 확률강수량은 전국 58개 지점 중 49~52개 지점정도가 증가하는 것으로 나타나 현재에 비해서 전반적으로 증가하는 것으로 예측되었으며, 지점별 증가량의 경우, 빈도별로 차이를 보이기는 하나 현재에 비해서 전반적으로 3%~7%정도 증가하는 것을 알 수 있었다.

  • PDF

철자오류에 기인한 가의미 오류의 검출 및 교정 방법 (A Method for Detection and Correction of Pseudo-Semantic Errors Due to Typographical Errors)

  • 김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.173-182
    • /
    • 2013
  • 전자 문서의 초안 작성과정에서 추가되는 철자오류는 다른 유형의 오류보다 압도적으로 높은 비율을 차지한다. 입력 실수로 인한 이들 오류는 결과적으로 여전히 철자오류일 수도 있지만 상당수는 구문오류나 의미오류로 발전한다. 이러한 오류들 중 철자오류에서 발전된 가의미 오류는 순수 의미오류에 비해 문장 내에서 주변 단어의 의미에 대해 두드러진 상이성을 갖게된다. 따라서 이러한 의미 오류는 그것이 가지는 두드러진 문맥 상이성으로 인해 간단한 동시발생 빈도에 기초한 알고리즘으로 검출 및 교정이 가능하다. 본 논문에서는 이러한 오류들을 검출하고 교정하기 위한 동시발생 빈도에 기초한 알고리즘을 제안한다. 제안하는 방법에서 동시발생 빈도는 의존 구조상에서 직접 의존관계에 놓인 단어만을 대상으로 계산하며, 가의미 오류 여부를 판단하기 위해서 코사인 유사도 측정 방법을 사용한다. 제시하는 실험으로부터 제안한 방법은 전체 맞춤법 검사기 검출율을 약 2~3% 수준까지 향상 시킬 수 있을 것으로 예측하였다.

일괄구성과 확장된 지연삭제를 이용한 B+-Tree의 동시성 제어 및 회복 (Concurrency Control and Recovery Method of B+-Tree using Bulk Loading and Extended Lazy Deletion)

  • 김대일;김성희;조숙경;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.128-130
    • /
    • 2000
  • B+-Tree는 데이트베이스 관리 시스템에서 대용량의 데이터를 관리하기 위해 가장 널리 사용되는 인덱스이다. 그런 기존의 B+-Tree는 데이터베이스의 초기 구성 및 재구성시 많은 비용이 들고, 또한 삭제 연산의 빈번한 발생시 색인 구조 변경연산의 발생빈도가 높아져 동시성이 떨어진다는 단점이 있다. 이러한 문제점을 해결하기 위해서 기존 대부분의 데이터베이스 관리시스템에서는 일괄구성과 지연삭제를 이용하고 있으나, 동시성 및 회복에 대한 처리가 미흡하여 실제 시스템에 적용하기에는 문제가 있다. 따라서 본 논문에서는 일괄구성과 지연삭제 방법을 적용한 B+-Tree에서의 동시성 및 회복기법을 제안한다. 제안된 기법은 일괄구성 시에 잠금의 부하와 연속적인 철회(Cascade Rollback)가 없고, 또한 지연 삭제기법을 확장함으로써 빈 페이지 리스트 관리에 대한 부하가 없으며, 삭제 연산에 대한 회복 시 논리적 복귀(Logical Undo)가 빨라지고 구현이 간단해진다는 장점이 있다.

  • PDF