• 제목/요약/키워드: 패턴 분류 규칙

검색결과 142건 처리시간 0.03초

현대 한국어에서 아라비안 숫자의 읽기 규칙 연구 (A Study on the Arabic numeral reading rules in Modern Korean)

  • 정영임;김정세;김상훈;이영직;윤애선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.16-23
    • /
    • 2002
  • 본 논문에서는 아라비안 숫자를 포함한 텍스트를 음성으로 합성하기 위하여, 숫자 형태와 분류사 그리고 숫자가 나오는 문맥에 따라 숫자를 자동으로 문자화할 수 있는 전처리 규칙을 설정하는데 목적을 둔다. 먼저 선행연구를 통해 숫자를 포함한 수사 및 수사표현의 읽기 규칙의 적용 범위 및 한계점을 살펴보고, 음성 합성을 위한 아라비안 숫자의 문자화 규칙을 설정하고자 한다. 현대 한국어에서 아라비안 숫자를 읽는 방식은 크게 고유어 방식과 한자어 방식이 있으며 단(單)단위에서는 영어가 사용되기도 한다. 또한 한자어 방식에서도 단위를 붙여 읽는 경우와 모든 수를 단 단위로 읽는 경우가 있으므로, 아라비안 숫자의 문자화를 단순한 규칙을 설정하여 자동화하기에는 중의성이 높다. 본 연구에서는 (1) 숫자 전 전치어(pre-numeral), (2) 기호를 포함한 숫자열의 표현 형식과 크기, (3) 단위 표현, (4) 숫자 후치어(post-numeral), (5) 분류사(classifier) (6) 분류사 후치어(post-classifier), (7) 수사표현 앞뒤 문맥에 따라, 아라비안 숫자표현이 문자화되는 방식을 살펴보았다. 분석 대상 말뭉치는 C 신문의 2000년 1월부터 2000년 4월까지 전체 기사 1,400건에서 숫자가 포함된 숫자표현 약 63,000개론 구성하였다. 패턴화된 구조 및 중의성이 없는 구조를 12가지로 밝히고 중의성이 있는 구조의 유형을 밝혔으며 분류사 후치어와의 결합 관계, 좌우 문맥정보를 통해 중의성 해결의 단서를 제시하고자 하였다.

  • PDF

개인별 이상신호 검출과 QRS 패턴 변화에 따른 조기심실수축 분류 (PVC Classification by Personalized Abnormal Signal Detection and QRS Pattern Variability)

  • 조익성;윤정오;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1531-1539
    • /
    • 2014
  • 조기심실수축(PVC)은 가장 보편적인 부정맥으로 심실세동, 심실빈맥 등과 같은 위험한 상황을 유발할 수 있는 가능성을 가지고 있기 때문에 이의 조기 검출은 매우 중요하다. 하지만 ECG 신호의 개인 차이가 있음에도 불구하고, 일반적인 신호의 판단 규칙에 따라 진단을 수행함으로써 성능하락이 나타날 수 밖에 없다. 이러한 문제점을 극복하기 위해서는 개인에 따른 이상 신호를 검출한 후 다양한 QRS 패턴을 고려하여 PVC를 분류할 수 있는 알고리즘이 필요하다. 본 연구에서는 개인별 이상신호 검출과 QRS 패턴 변화에 따른 PVC 분류 기법을 제안한다. 이를 위해 전 처리 과정과 차감기법을 통해 R파를 검출하였으며, 개인별 이상신호를 검출하였다. 이후 QRS 패턴에 따른 QS 간격과 R파의 진폭 변화율에 따라 PVC를 분류하였다. 제안한 알고리즘의 이상 신호 검출 및 PVC 분류 성능을 평가하기 위해서 MIT-BIH 부정맥 데이터베이스를 사용하였다. 성능평가 결과, 이상 신호 검출률은 98.33%, PVC는 각각 94.46%의 평균 분류율을 나타내었다.

전 방향 참조 경로 탐사 패턴을 이용한 웹 문서 예측 (Web document prediction using forward reference path traversal patterns)

  • 김양규;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.112-114
    • /
    • 2004
  • 오늘날 웹을 이용하는 사용자들의 웹 검색 형태를 저장한 웹 로그 데이터들은 데이터 마이닝을 위한 중요한 자료가 되고 있다. 이들 웹 로그들로부터 사용자의 현재 행동을 기반으로 사용자가 다음에 요청할 요구를 예측할 수 있는 예측 모델을 만들 수 있다. 하지만 이들 웹 로그들은 크기가 매우 크고 분석하기가 어렵다. 이런 문제를 해결하기 위해 이미 않은 방법이 제안되었다. 그 중에서 효과적으로 예측할 수 있도록 제안된 순차적 분류 기반에 연관법칙을 적용한 예측 기법이 있다. 본 논문에서는 전방향 참조 경로 탐사 패턴 알고리즘을 적용하여 연관규칙에 기반 한 웹 문서 예측 기법을 향상시키는 모델을 제안한다.

  • PDF

베이지안 신경망을 이용한 분류분석 (A Classification Analysis using Bayesian Neural Network)

  • 황진수;최성용;전홍석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제12권2호
    • /
    • pp.11-25
    • /
    • 2001
  • 자료들 사이에 존재하는 관계, 패턴, 규칙등을 찾아내서 모형화 하는 통계적인 분류기법은 여러가지가 있다. 그러나 우리가 얻게 되는 지식은 어떤 일련의 분류규칙에 의해서가 아닌 관찰과 학습을 통한 훈련으로부터 얻게 된다. 본 베이지안 학습은 모든 형태의 불확실성을 표현하는 확률로써 우리의 믿음의 정도를 표현하는 것으로 해석될 수 있으며, 확실한 결과가 알려짐에 따라 확률이론 법칙을 사용하여 이러한 확률들을 갱신한다. 또한 신경망 모형은 이미 알고 있는 속성들에 근거하여 아직 알지 못하는 집단이나 특질들을 예측하게 해준다. 본 논문에서는 이러한 두 가지 방법을 결합한 베이지안 신경망과 기존의 CHAID, CART, QUBST 분류 알고리즘에 있어서 각각 오분류율을 비교연구하였다.

  • PDF

동적 그룹 바인딩 기반의 모바일 에이전트를 이용한 인텔리전트 분산 플랫폼 (Intelligent Distributed Platform using Mobile Agent based on Dynamic Group Binding)

  • 마테오 로미오;이재완
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.131-143
    • /
    • 2007
  • 오늘날 정보 기술 및 지능형 시스템에서는 분산 데이터베이스로부터 패턴들을 찾고 규칙들을 추출하기 위해 데이터 마이닝 기술을 사용한다. 분산환경에서 데이터 마이닝 기술을 이용해 추출된 규칙들은 동적인 중복, 적응형 부하 균형 및 기타 기술들에서 활용될 수 있다. 그러나 대량의 데이터 전송은 에러를 야기하며 신뢰할 수 없는 결과를 초래할 수 있다. 이 논문은 이동 에이전트를 사용하여 동적 그룹 바인딩을 기반으로 한 인텔리전트 분산 플랫폼을 제안한다. 그룹서비스를 통해 효율적인 객체 검색을 위한 분류 알고리즘을 구현한다. 지능형 모델은 동적 중복을 위해 추출된 규칙을 사용한다. 데이터 마이닝 에이전트와 데이터 압축 에이전트는 각각 서비스 노드 데이터베이스로부터 규칙을 추출하여 데이터를 압축한다. 제안한 알고리즘은 데이터를 전송하기 전에 neuro-fuzzy 분류기를 사용하여 빈도가 적은 데이터 ???V을 합하는 전처리 과정을 수행한다. 객체그룹 분류, 서비스 노드 데이터베이스 마이닝, 데이터 압축 및 규칙 추출에 대한 시뮬레이션을 수행했다. 효율적인 데이터 압축 및 신뢰성 있는 규칙 추출에 대한 실험 결과 제안한 알고리즘이 다른 방법들과 비교해 이러한 관점에서 성능이 우수함을 나타내었다.

  • PDF

퍼지 결정 트리를 이용한 효율적인 퍼지 규칙 생성 (Efficient Fuzzy Rule Generation Using Fuzzy Decision Tree)

  • 민창우;김명원;김수광
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.59-68
    • /
    • 1998
  • 데이터 마이닝의 목적은 유용한 패턴을 찾음으로써 데이터를 이해하는데 있으므로, 찾아진 패턴은 정확할뿐 아니라 이해하기 쉬워야한다. 따라서 정확하고 이해하기 쉬운 패턴을 추출하는 데이터 마이닝에 대한 연구가 필요하다. 본 논문에서는 퍼지 결정 트리를 이용한 효과적인 데이터 마이닝 알고리즘을 제안한다. 제안된 알고리즘은 ID3, C4.5와 같은 결정 트리 알고리즘의 이해하기 쉬운 장점과 퍼지의 표현력을 결합하여 간결하고 이해하기 쉬운 규칙을 생성한다. 제안된 알고리즘은 히스토그램에 기반하여 퍼지 소속함수를 생성하는 단계와 생성된 소속 함수를 이용하여 퍼지 결정 트리를 구성하는 두 단계로 이루어진다. 또한 제안된 방법의 타당성을 검증하기 위하여 표준적인 패턴 분류 벤치마크 데이터인 Iris 데이터와 Wisconsin Breast Cancer 데이터에 대한 실험 결과를 보인다.

  • PDF

확률적 러프 집합에 기반한 근사 규칙의 간결화 (Reduction of Approximate Rule based on Probabilistic Rough sets)

  • 권은아;김홍기
    • 정보처리학회논문지D
    • /
    • 제8D권3호
    • /
    • pp.203-210
    • /
    • 2001
  • 본 논문에서는 저장 데이터베이스의 정보 시스템을 정제하여 새로운 객체를 근사 추론하기 위한 규칙 생성에 관한 연구이다. 이 때 많은 수의 규칙 생성은 의사결정자로 하여금 직관적인 판단을 어렵게 하며 의사 결정 시 부가되는 시간적인 단점도 있다. 그러므로 본 논문에서는 확률적 러프 이론에 기반하여 규칙을 최대한 간결화 하는 데 주안점을 두었다. 제안하는 알고리즘은 러프 이론에 기반한 최적 리덕트를 생성하는 과정에 확률적 개념을 도입하여 리덕트 생성에서부터 어느 정도의 허용치를 부여함으로써 기존의 규칙 생성 알고리즘의 근사 결정 규칙을 보다 간결하게 표현할 수 있다. 이 과정에서 제안한 확률적 최소 리덕트 생성 알고리즘은 기존의 리덕트를 더욱 작게하여 추론에 필요한 조건 속성의 수를 최소화하였고 이는 확률적 근사 결정 규칙의 생성 과정에서 시간 복잡도에 따른 시간을 줄일 수 있다. 제안된 알고리즘을 이용하여 패턴 분류 문제에 표준적으로 사용되는 IRIS 데이터와 Wisconsin Breast Cancer 데이터에 대해 실험하였으며 허용된 분류율 하에서 규칙의 수와 간결함의 정도를 기존 알고리즘과 비교하였다.

  • PDF

가중치를 갖는 FMM신경망과 패턴분류를 위한 특징분석 기법 (A Weighted FMM Neural Network and Feature Analysis Technique for Pattern Classification)

  • 김호준;양현승
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권1호
    • /
    • pp.1-9
    • /
    • 2005
  • 본 논문에서는 패턴 분류를 위한 수정된 퍼지 최대최소 신경망 모델을 제안하고 그의 유용성을 고찰한다. 이를 위하여 하이퍼박스 내에서 각 특징들에 대하여 가중치 요소론 갖는 새로운 하이퍼큐브 소속함수를 정의한다. 이 가중치 요소는 분류과정에서 임의의 클래스에 대한 각 특징의 상대적인 기여도를 반영한다. 본 연구에서는 이를 위하여 새롭게 정의된 하이퍼박스 생성, 확장 및 축소의 3단계로 이루어지는 학습 방법론을 소개한다. 또한 제안된 모델을 기반으로 하여 학습된 분류기로부터 하이퍼박스 소속함수와 연결가중치를 사용하여 주어진 클래스에 대한 특징의 연관도를 산출하는 형태의 이른바 특징 분석 기법을 제안한다. 이를 위하여 세부적으로 각 특징에 대하여 연관도 척도와 퍼지 소속함수간의 유사도 척도를 정의한다. 또한 실제 패턴 분류문제에 적용한 실험결과를 통하여 제안된 이론의 타당성을 평가한다.

주성분 분석과 서포트 벡터 머신을 이용한 침입 탐지 시스템 (An Intrusion Detection System Using Principle Component Analysis and Support Vector Machines)

  • 정성윤;강병두;김상균
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.314-317
    • /
    • 2003
  • 기존의 침입탐지 시스템에서는 오용탐지모델이 널리 사용되고 있다. 이 모델은 낮은 오판율(False Alarm rates)을 가지고 있으나, 새로운 공격에 대해 전문가시스템(Expert Systems)에 의한 규칙추가를 필요로 한다. 그리고 그 규칙과 완전히 일치되는 시그너처만 공격으로 탐지하므로 변형된 공격을 탐지하지 못한다는 문제점을 가지고 있다 본 논문에서는 이러한 문제점을 보완하기 위해 주성분분석(Principle Component Analysis; 이하 PCA)과 서포트 벡터 머신(Support Vector Machines; 이하 SVM)을 이용한 침입탐지 시스템을 제안한다. 네트워크 상의 패킷은 PCA를 이용하여 결정된 주성분 공간에서 해석되고, 정상적인 흐름과 비정상적인 흐름에 대한 패킷이미지패턴으로 정규화 된다. 이러한 두 가지 클래스에 대한 SVM 분류기를 구현한다. 개발하는 침입탐지 시스템은 알려진 다양한 침입유형뿐만 아니라, 새로운 변종에 대해서도 분류기의 유연한 반응을 통하여 효과적으로 탐지할 수 있다.

  • PDF

셀룰라신경회로망의 연상메모리를 이용한 영상 패턴의 분류 및 인식 방법 (Image Pattern Classification and Recognition by using Associative Memories with Cellular Neural Networks)

  • 신윤철;박용훈;강훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.231-234
    • /
    • 2002
  • 셀룰라 신경회로망의 연상 메모리를 이용하여 시각적인 입력 데이터의 연산을 통하여 영상 패턴의 분류와 인식을 수행한다. 셀룰라 신경회로망은 일반적인 신경회로망과 같이 비선형 데이터의 실시간 처리가 가능하고, 세 포자동자와 같이 격자구조의 셀로 이루어져 인접한 셀과 직접 정보를 주고받는다. 응용 분야로는 최적화, 선형/비선형화, 연상 메모리, 패턴인식, 컴퓨터 비젼 등에 적용할 수 있다. 영상의 이미지 픽셀을 셀룰라 신경회로망의 셀에 대응하여 전체 이미지 영상을 모든 셀룰라 신경회로망의 셀에서 동시에 병렬로 처리할 수 있어 2-D 이미지 처리에 적합하다 본 논문은 셀룰라 신경회로망에 의한 연상 메모리 구조를 설계하고, 학습된 하중값 메모리에서 가장 적당한 하중값을 선택하여 학습된 영상과 정확히 일치하는 출력을 얻는 방법을 제시한다. 학습을 통한 연상 메모리 구현에는 각각의 뉴런에서 일정하지 않은 다른 템플릿을 사용한다. 각각의 템플릿은 뉴런들 간의 연결 하중값을 나타내고 학습011 따라 갱신된다. 학습방법으로는 템플릿 하중값 학습에 뉴런들 간의 연결 하중값을 조정하는 가장 단순한 규칙인 Hebb의 학습방법이 사용되었고 분류값 학습에 LMS 알고리즘이 사용되었다

  • PDF