• 제목/요약/키워드: 분류시스템

검색결과 6,451건 처리시간 0.034초

나이브 베이지안 분류자와 메세지 규칙을 이용한 스팸메일 필터링 시스템 (Spam-mail Filtering System Using Naive Bayesian Classifier and Message Rule)

  • 조한철;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.223-225
    • /
    • 2002
  • 인터넷의 급속한 성장과 함께 E-Mail은 대표적인 통신수단의 하나가 되어버렸다. 편리하다는 점을 이용해서 엄청난 양의 스팸메일이 매일같이 쏟아져 오고 , 그 문제점의 심각성에 정보통신부에서 정보통신망 이용촉진 및 정보보호 등에 관한 법률이라는 새로운 법률까지 생겨났다. 본 논문에서는 이 법률에서 요구하는 '광고'라는 문구를 걸러내는 등의 메시지 규칙을 갖는 시스템과 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(Naive Baesian Classifier)를 결합한 스팸 메일 필터링 시스템(Spam-mail Fitering System)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 작성할 필요없이 학습한 데이터를 갖고 자동으로 스팸메일을 분류할 수가 있다. 들어온 메일은 메시지 규칙 기반 필터가 먼저 적용되고, 메세지 규칙 기반 필터에서 분류되지 않으면 나이브 베이지안 필터에서 분류된다. 실험에서는 제안된 시스템의 성능을 평가하기 위해서 메시지 규칙을 사용한 시스템 및 나이브 베이지만 분류자 시스템과 비교 평가하였다. 또한 임계치를 변경함으로써 제안된 시스템의 성능을 높일 수있도록 하였다.

  • PDF

하이브리드 다중 분류기시스템 (Hybrid Multiple Classifier Systems)

  • 김인철
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.133-145
    • /
    • 2004
  • 단일 분류기보다 우수한 성능을 얻기 위해 다수의 분류기들을 결합하는 방법은 폭 넓게 이용되어 오고 있는 기술이다. 하나의 다중 분류기 시스템(MCS)를 구축하는 일은 두 가지 해결해야 할 문제들을 가지고 있다. 하나는 다양한 기반-레벨의 분류기들을 어떤 방법으로 생성하느냐 하는 것이고, 다른 하나는 이들의 예측을 어떤 방법으로 결합하느냐 하는 것이다. 본 논문에서는 기존의 다중 분류기 시스템들인 bagging, boosting, 그리고 staking의 특징들을 살펴본 다음, 새로운 다중 분류기 시스템들인 stacked boosting, boosting, bagged stacking, 그리고 boosted stacking들을 제안한다. 이들은 기존의 다중 분류기 시스템들의 장점들을 결합한 일종의 하이브리드 다중 분류기 시스템들이다. 새로 제안한 다중 분류기 시스템들의 성능을 평가하기 위해, 본 논문에서는 UCI KDD 데이터 아카이브에서 제공되는 서로 다른 9가지의 실세계 데이터 집합들을 이용하여 실험들을 전개하였다. 실험 결과, 본 논문에서 제안한 하이브리드 다중 분류기 시스템들, 특히 bagged stacking과 boosted stacking이 기존의 다중 분류기 시스템들에 비해 우수한 성능을 보여 주었다.

  • PDF

분류시스템 개발과정에서의 협력에 대한 연구 (A Study on Collaboration in Classification System Development Practice)

  • 박옥남
    • 한국문헌정보학회지
    • /
    • 제42권4호
    • /
    • pp.181-199
    • /
    • 2008
  • 본 연구는 실제 분류 시스템 개발자들의 행태를 이해하는 데 그 목적이 있다. 이를 위하여, 협력행태를 중심으로 협력의 유형, 협력에 영향을 미치는 요인, 협력이 분류 시스템 개발에 미치는 영향 등을 조사하였다. 또한 협력에 대한 이해가 분류 교육자, 연구자, 개발자에게 제공하는 의의를 논의하였다. 자료는 문헌조사, 현장인터뷰, 관찰법, 이메일의 방법을 통하여 수집되었다. 본 연구는 이미지 분류 시스템 개발팀을 대상으로 조사하였으며 사회과정모델을 연구의 프레임워크로 채택하였다.

다중 신경망을 이용한 한메일넷 질의 자동분류 시스템 (An Automatic Classification System for Hanmail Net Questions Using Multiple Neural Networks)

  • 이지행;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.232-234
    • /
    • 2000
  • 최근들어 정보의 양이 날로 방대해 짐에 따라 이를 자동으로 분류해 줄 수 있는 무서 자동분류의 중요성이 널리 인식되고 있다. 문서 자동분류는 새로운 문서를 미리 정의된 부류로 대응시키는 일련의 작업을 말하며, 각종 패턴인식 기법들을 이용하여 시도되고 있다. 본 논문에서는 수많은 사용자들의 질의들을 분류하여 자동으로 응답하는 시스템에 적용할 수 있는 자동 질의 분류시스템을 제안한다. 실험은 500만명 이상이 사용하고 있는 한메일넷의 실제 사용자 질의를 수집하여 수행하였으며, 자동분류 방법으로는 다중 신경망을 이용하였다. 또한 효율적인 특징추출 기법과 결과 결합방법을 적용하여 분류의 정확율을 높이고자 하였다. 2204개의 실제 질의메일에 대한 실험결과, 91.1%까지의 정확율을 얻어 제안한 시스템이 실제 한메일넷의 자동응답 시스템에 효과적으로 적용될 수 있음을 알 수 있었다.

  • PDF

정보화율과 복잡도에 기반한 대학 정보시스템 분류 및 도입 방안 (Information Rate and Complexity based Classification of Campus Information & ASP Construction Plan)

  • 전병호;임재현;송재신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.1363-1366
    • /
    • 2005
  • 대학 정보시스템 분류를 기존의 통합성과 커스터마이징으로 분류하는 것을 현 실정에 맞게 현재의 정보화율을 고려한 어플리케이션 분류를 시도하였다. 전국 대학을 대상으로 실시한 설문조사를 통해 각 시스템의 통합성과 커스터마이징을 조사하여 ‘복잡도’라는 하나의 변수로 설정하였다. 대학에서 정보화가 가능한 모든 시스템에 대해 현재의 정보화율과 복잡도를 고려하여 대학 정보시스템을 분류하였다. 이 분류를 기준으로 ASP 방식을 도입하는 방안(로드맵)을 제시하였다. 분류 모델에 정보화율을 도입함으로써 현재의 상황을 고려한 어플리케이션 분류 모델을 제시하였다. 이 분류 모델은 각 분야에 있어 정보화율에 따른 단계적 ASP 도입 방안 마련에 기초적 기준이 될 것이다.

  • PDF

개인화 검색시스템 평가에 관한 연구 (A Study of Personalized Retrieval System Evaluation)

  • 김광영;최호섭;진두석;김진숙
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.39-42
    • /
    • 2010
  • 본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색 시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글 테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.

  • PDF

최적 퍼지 룰 베이스 시스템의 설계를 위한 유전 알고리즘 (Genetic Algorithm for Designing the Optimal Fuzzy Rule-base Systems)

  • 김동훈;김종율
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.772-775
    • /
    • 2008
  • 본 논문은 퍼지 분류 시스템을 위한 퍼지 규칙베이스에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화를 하는 유전 알고리즘을 제안한다. 제안하는 유전 알고리즘은 분류 성능을 보다 더 향상시키기 위해서 인식에 사용된 규칙에 대한 확실성 정도를 개선하는 방법을 포함한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

패턴분류를 위한 지능형 에이전트 시스템 (Intelligent Agent System for Pattern Classification)

  • 박지훈;김대수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.291-294
    • /
    • 2001
  • 최근 들어 개인용 컴퓨터의 광범위한 보급과 인터넷의 확산으로 인하여 이러한 시스템을 사용하는 사용자들은 보다 편리하고 사용자의 요구에 적절하게 대응할 수 있는 지능화 된 시스템을 필요로 하게 되었다. 이러한 배경을 바탕으로 하여 지능형 에이전트 이론을 활용한 연구와 개발은 다방면에 걸쳐 활성화되고 있다. 본 연구에서는 패턴분류에 있어서의 몇 가지 알고리즘을 통하여 공통된 데이터에 대한 패턴 클러스터링을 통한 패턴의 분류 방법을 고찰하고, 또한 지능형 에이전트 개념을 적용하여 패턴분류를 위한 지능형 에이전트 시스템을 모델링하고 구현하였다. 그 결과 4개의 알고리즘에 대한 300개의 3차원 데이터의 패턴분류가 정확하게 되는 것을 확인하였으며, 본 연구의 핵심 분야인 지능형 에이전트 시스템의 다양한 에이전트들을 적용하여 기존의 시스템과는 차별화 된 인터페이스가 이루어질 수 있음을 보인다.

  • PDF

유전알고리즘을 이용한 최적퍼지 규칙베이스 시스템의 설계 (Design of Optimal Fuzzy Rule-base Systems with Genetic Algorithm)

  • 김종율
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.439-442
    • /
    • 2007
  • 본 논문은 퍼지 분류를 위한 퍼지 규칙베이스 시스템에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화률 하는 유전 알고리즘을 제안한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

문화예술교육 패싯 분류체계 설계에 대한 연구 (A Study of Facet Classification System Development for Arts and Cultural Education)

  • 박옥남;오삼균;김세영
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.197-219
    • /
    • 2009
  • 본 연구에서는 문화예술교육 분야 분류체계의 필요성을 인식하고 패싯 기반의 분류 시스템을 설계하게 되었다. 본 연구는 체계적인 방법론을 적용하여 분류시스템을 구축하였고, 국내외 도메인 전문가와 분류전문가가 협력을 통해 분류시스템을 향상시켜 그 결과 13개의 메인 패싯과 다양한 하위 용어를 추출하였다. 본 연구에서 설계된 분류시스템의 목적은 문화예술교육의 다양한 자원을 보다 체계적이고 효율적으로 관리 이용할 수 있는 기반을 마련하는데 있으며 이는 나아가 문화예술교육 분야의 개념에 대한 문화적 격차를 해소시키는데 사용되기를 바란다.