• 제목/요약/키워드: 패턴 분류 규칙

검색결과 142건 처리시간 0.037초

KNN 규칙과 새로운 특징 가중치 알고리즘을 결합한 패턴 인식 시스템 (Pattern Recognition System Combining KNN rules and New Feature Weighting algorithm)

  • 이희성;김은태;김동연
    • 전자공학회논문지CI
    • /
    • 제42권4호
    • /
    • pp.43-50
    • /
    • 2005
  • 본 논문에서는 유전자 알고리즘을 이용한 새로운 적응적 특징 가중치 방식과 클래스별로 적용된 KNN(Nearest -Neighbor) 규칙을 이용한 새로운 패턴 인식 시스템을 제안한다. 패턴 인식 시스템의 성능을 향상시키기 위하여, 새로운 연산자를 갖는 유전자 알고리즘으로 가중치의 중간값을 결정함으로써 과잉 맞춤(overfitting)을 피하면서, 데이터의 분포에 따라 적절한 특징의 가중치를 찾는 새로운 특징 가중치 알고리즘을 제안한다. 또한, 제안하는 방법은 각각의 클래스를 가장 잘 표현하는 특징 공간들을 개별적으로 찾는다. KNN분류기는 클래스별로 찾은 특징 공간들을 이용하여 클래스에 따라 특징 공간을 변화시켜 미지 패턴의 클래스를 예측한다. 제안된 알고리즘은 Concordia대학의 handwritten numeral database에 적용시켜 그 성능을 확인하였다.

산업분야에서의 지식 정보 추출에 대한 비교연구 (Comparative Study of Knowledge Extraction on the Industrial Application)

  • 우영광;김성신;배현;우광방
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.251-254
    • /
    • 2003
  • 데이터는 어떤 특성을 나타내는 언어적 또는 수치적 값들의 표현이다. 이러한 데이터들을 목적에 따라 구성한 것이 정보이며, 문제 해결이나 패턴 분류, 또는 의사 결정을 위해 정보들간의 관계를 규칙으로 체계화하는 것이 지식이다. 현재 대부분의 산업 분야에서 시스템에 대한 이해를 높이고 시스템의 성능을 향상시키기 위해 지식을 추출하고, 적용시키는 작업들이 활발히 이루어지고 있다. 지식 정보의 추출은 지식의 획득, 표현, 구현의 단계로 구성되며 이렇게 추출된 지식 정보는 규칙으로 도출된다. 본 논문에서는 여러 산업 분야에 걸쳐 다양하게 적용되는 지식 정보 추출 방법들에 대해 그 영역별로 알아보고 여러 시험 데이터들과 실제 시스템에 클러스터링(CL), 입력공간 분할(ISP), 뉴로-퍼지(NF), 신경망(NN), 확장 행렬(EM) 등의 방법들을 적용시킨 결과들을 비교 분석하고자 한다.

  • PDF

DTD의 의미 구조 분석을 이용한 XML 문서의 변환 (A Transformation of XML Documents With Semantic Constraints)

  • 곽동규;최종명;조용윤;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.589.2-861
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서를 다른 XML 어플리케이션에서 재 사용하여 사용자에게 동일한 정보를 제공하는데 있다 XML 문서는 어플리케이션 특성에 따라 한 문서에서 전달할 수 있는 정보의 량이 다르다. 따라서 문서를 변환하기 전에 어플리케이션의 특성에 따라 문서를 분할하거나 병합하여야 한다[1]. 또한, XML 문서의 정보는 속성에 따라 문법적인 특성을 가진다. 본 논문은 문벌적인 특성을 의미 속성이라 하고 의미 속성을 파악하기 위해 XML 문서의 의미 구조와 의미 구조 관계를 정의한다. 그리고 정의된 의미 구조와 의에 구조 관계를 이용하여 문서 정보의 속성을 분류하는 방법을 제안한다. 변환 규칙은 의ロP 구조 관계가 유사한 엘리먼트간의 대응으로 정의하고, 변환 규칙을 이용하여 문서 변환을 실행하여 변환 XML과 의미 관계 구조가 유사한 피 변환 XML 문서를 생성한다. 의미구조 분석을 이용한 변환은 기존의 사용 패턴을 분석한 변환에서 벗어나 DTD의 분석을 통한 자동화된 문서 변환 방법을 제공한다.

  • PDF

데이터 마이닝 도구 XM-Tool/Miner 개발에 관한 연구 (A Study on the Development of Data Mining Tool named XM-Tool/Miner)

  • 이남근;이창호;김주용;이병엽;이승희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.23-26
    • /
    • 2000
  • 정보기술이 발달하면서 자료의 흔적들이 체계화된 데이터베이스에 저장이 되고, 더불어 데이터베이스의 규모는 점점 커지고 있다. 데이터 마이닝은 이런 방대한 자료의 분석을 통해, 그 속에 숨어있는 의미를 찾는 과정이라고 볼 수 있다. 본 논문에서는 대용량 데이터베이스에 존재하는 여러 유용한 지식을 추출하는 방법으로서 데이터 마이닝을 분류화, 클러스터링, 요약규칙, 시간에 따른 분석 및 예측등으로 분류하여 요약, 제시하였고, 이렇게 추출된 패턴, 정보, 지식들의 유용성을 측정하는 지표를 정리하였다. 개발된 XM-Tool/Miner은 문제 중심적 마이닝 도구를 목표로 하였으며, 대표적인 마이닝 알고리즘을 적용하였고, 또한 사용의 편이성에 초점을 맞추었다. 더 나아가 데이터 마이닝 기법뿐만 아니라 데이터의 샘플링과 성능향상을 통하여 방대한 데이터로부터 다양한 지식탐사가 가능해지고, 발견된 규칙 또는 지식의 유용성 측정을 통하여 업무 분야의 특성에 따라 효과적으로 반영되며 의사결정 및 CRM 마케팅, 동향분석 및 예측 등에 유용한 정보를 추출하는 도구로 사용할 수 있을 것이다.

  • PDF

효율적인 클러스터링을 이용한 관심 정보 추출을 위한 웹 마이닝 (Web Mining for Discovering Interesting Information using Effective Clustering)

  • 김성학;안병태
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.251-260
    • /
    • 2008
  • 인터넷의 전자상거래에서 대규모 정보 저장소에 있는 원하는 정보를 신속하게 검색하기란 어렵다. 대부분의 전자상거래 사이트에 있어서 정보를 제공하는 방법으로는 통계적 분석이나 분류별 지향의 간단한 과정을 통해 생성된다. 그러나 이러한 것은 생성 정보들 사이의 다양한 상호관계를 표현할 수 없고 사용자의 정확한 구매 패턴을 반영하기 어렵다. 본 논문에서는 전자상거래에서 효과적인 클러스터링을 이용한 다양한 관심정보 추출을 위한 효율적인 웹 마이닝을 제안한다. 이러한 방법은 분류별 항목에서 순차 패턴과 상관 규칙을 이용하여 생성 정보들 사이의 보다 적합한 상관관계를 구성하고 제안된 방법을 통해 효율적인 실험 결과를 나타낸다. 그리고 효과적인 클러스터링을 이용하여 신속한 검색을 제안한다.

  • PDF

셀룰라 신경회로망의 연상메모리를 이용한 영상 패턴의 분류 및 인식방법 (Image Pattern Classification and Recognition by Using the Associative Memory with Cellular Neural Networks)

  • 신윤철;박용훈;강훈
    • 한국지능시스템학회논문지
    • /
    • 제13권2호
    • /
    • pp.154-162
    • /
    • 2003
  • 셀룰라 신경회로망의 연상 메모리를 이용하여 시각적인 입력 데이터의 연산을 통하여 영상 패턴의 분류와 인식을 수행한다. 셀룰라 신경회로망은 일반적인 신경회로망과 같이 비선형 데이터의 실시간 처리가 가능하고, 세포자동자와 같이 이 격자구조의 셀로 이루어져 인접한 셀과 직접 정보를 주고받는다. 응용 분야로는 최적화, 선형/비선형화, 연상 메모리, 패턴인식, 컴퓨터 비전 등에 적용할 수 있다. 영상의 이미지 픽셀을 셀룰라 신경회로망의 셀에 대응하여 전체 이미지 영상을 모든 셀룰라 신경회로망의 셀에서 동시에 병렬로 처리할 수 있어 2-D 이미지 처리에 적합하다. 본 논문은 셀룰라 신경회로망에 의한 연상 메모리 구조를 설계하고, 학습된 하중값 메모리에서 가장 적당한 하중값을 선택하여 학습된 영상과 정확히 일치하는 출력을 얻는 방법을 제시한다. 학습을 통한 연상 메모리 구현에는 각각의 뉴런에서 일정하지 않은 다른 템플릿을 사용한다. 각각의 템플릿은 뉴런들 간의 연결 하중값을 나타내고 학습에 따라 갱신된다. 학습방법으로는 템플릿 하중값 학습에 뉴런들 간의 연결 하중값을 조정하는 가장 단순한 규칙인 Hebb의 학습방법이 사용되었고 분류값 학습에 LMS 알고리즘이 사용되었다.

의사결정트리를 통한 자동차산업의 구매패턴분류 (Buying Customer Classification in Automotive Corporation with Decision Tree)

  • 이병엽;박용훈;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제10권2호
    • /
    • pp.372-380
    • /
    • 2010
  • 일반적으로 데이터 마이닝은 다양한 예측기법이나 차이점의 분석을 통하여 유용한 정보 도출을 통해 매출의 증대나, 비용 절감 등의 효과를 가져 올수 있다. 데이터 마이닝 분석은 정보의 분류 또는 다양한 각도나 영역의 관점을 통하여 새로운 뷰를 분석할 수 있다. 기술적으로 데이터 마이닝의 연관규칙이나, 패턴의 분석은 대량의 데이터베이스에서 분석된다. 따라서 데이터 마이닝은 가장 빠르게 성장한 산업중의 하나이다. 그 이유는 정보기술이 발달하면서 수많은 자료들이 체계화된 데이터베이스에 저장이 되고, 기업의 데이터베이스의 규모는 폭발적으로 증가되고 있다. 본 논문에서는 자동차 마케팅에서 이용 가능한 데이터를 데이터 마이닝 분석 기법중의 하나인 Quinlan의 C4.5에 따라 분석 하였다. 본 논문에서는 기존 고객에 대한 고객 속성파악, 고객 분류 및 분석에 따른 고객의 구매패턴을 분석하여 해당 기업의 전략적 마케팅 수립을 통해 경영 과학적으로 접근할 수 있는 데이터 마이닝 분석에 관한 사례 연구이다.

규칙 구성자와 연결 구성자를 이용한 혼합형 행동 진화 모델 (Hybrid Behavior Evolution Model Using Rule and Link Descriptors)

  • 박사준
    • 지능정보연구
    • /
    • 제12권3호
    • /
    • pp.67-82
    • /
    • 2006
  • 가상 로봇의 행동 진화를 위해서 규칙 구성자와 연결 구성자를 구성하여 분류 규칙과 진화 신경망을 형성하는 혼합형 행동 진화 모델(Hybrid Behavior Evolution Model)을 제안한다. 본 모델에서는 행동 지식을 두 수준에서 표현하였다. 상위 수준에서는 규칙 구성자와 연결 구성자를 구성하여 표현력을 향상시켰다. 하위 수준에서는 행동 지식을 비트 스트링 형태의 염색체로 표현하여, 이들 염색체를 대상으로 유전자 연산을 적용하여 학습을 수행시켰다. 적합도가 최적인 염색체를 추출하여 가상 로봇을 구성하였다. 구성된 가상 로봇은 주변 상황을 인식하여 입력 정보와 규칙 정보를 이용하여 패턴을 분류하였고, 그 결과를 신경망에서 처리하여 행동하였다. 제안된 모델을 평가하기 위해서 HBES(Hybrid Behavior Evolution System)를 개발하여 가상 로봇의 먹이 수집 문제에 적용하였다. 제안한 시스템을 실험한 결과, 동일한 조건의 진화 신경망보다 학습 시간이 적게 소요되었다. 그리고, 규칙이 적합도 향상에 주는 영향을 평가하기 위해서, 학습이 완료된 염색체들에 대해서 규칙을 적용한 것과, 그렇지 않은 것을 각각 수행하여 적합도를 측정하였다. 그 결과, 규칙을 적용하지 않으면 적합도가 저하되는 것을 확인하였다. 제안된 모델은 가상 로봇의 행동 진화에 있어서 기존의 진화 신경망 방식 보다 학습 성능이 우수하고 규칙적인 행동을 수행하는 것을 확인하였다.

  • PDF

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

데이터 마이닝을 위한 퍼지 결정트리 (A Fuzzy Decision Tree for Data Mining)

  • 이중근;민창우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.63-65
    • /
    • 1998
  • 사회 전 분야에서 데이터가 폭발적으로 증가함에 따라 데이터를 이해하고 분석하는 새로운 자동적이고 지능적인 데이터 분석 도구와 기술이 필요하게 되었다. KDD(Knowledge Discovery in Databases)는 이러한 필요로부터 데이터에서 유용하고 이해 가능한 지식을 추출하는 연구이다. 데이터 마이닝(Data Mining)은 KDD에서 가장 중요한 단계로 데이터로부터 지식을 추출하는 단계이다. 데이터 마이닝에서 생성된 지식은 좋은 분류율을 가져야하고 이해하기 쉬워야한다. 본 논문에서는 퍼지 결정트리(FDT : Fuzzy Decision Tree)에 기반한 효율적인 데이터 마이닝 알고리즘을 제안한다. FDT의 각 링크는 속성(attribute) 값을 갖는 퍼지 집합이며, EDT의 각 경로는 퍼지 규칙을 생성한다. 제안된 알고리즘은 ID3의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법으로 히스토그램에 이루어진다. 마지막으로 제안된 방법의 타당성을 검증하기 위해 표준적인 패턴 분류 벤치마크 데이터에 대한 실험 결과를 보인다.

  • PDF