• Title/Summary/Keyword: 기술 분류

Search Result 6,587, Processing Time 0.037 seconds

Neural Network Pair with Negatively Correlated Genes for Cancer Classification (암의 분류를 위한 음의 상관관계 유전자의 신경망 쌍)

  • 원홍희;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.359-361
    • /
    • 2003
  • 정확한 암의 분류는 암의 진단 및 치료에 있어 매우 중요하지만, 암을 진단하기 위한 기존의 여러 방법들은 종종 불완전한 결과를 도출한다. 최근의 마이크로어레이 기술에 기반한 분자 수준의 진단은 정확하고 객관적이며 체계적인 암의 분류를 위한 방법론을 제시해준다. 유전자 발현 데이터는 일반적으로 수천개 이상의 유전자를 포함하는데, 유전자 발현 데이터의 모든 유전자가 암과 관련이 있는 것이 아니므로 정확한 암을 분류하기 위하여 중요한 유전자만을 추출하는 것이 바람직하다. 본 논문에서 음의 상관관계를 갖는 두 개의 이상적인 유전자 벡터를 정의한 후 이와 유사한 정도를 기준으로 중요한 유전자 집단을 추출하고, 각각을 신경망으로 학습하여 결합하는 신경망 쌍을 제안한다. 실험 결과는 음의 상관관계를 갖는 두 개의 유전자 집단이 암의 클래스를 잘 구분할 수 있음을 보여주었다. 이 유전자 집단을 특징으로 하여 각각 학습한 신경망을 베이시안 방법으로 결합한 결과, 벤치마크 데이터에 대하여 신경망 쌍이 개별 분류기에 비해 우수한 성능을 보임을 확인하였다.

  • PDF

An Integrated Data Mining Model for Customer Relationship Management (고객관계관리를 위한 데이터마이닝 통합모형에 관한 연구)

  • Song, Im-Young;Oh, R.D.;Yi, T.S.;Shin, K.J.;Kim, K.C.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.154-159
    • /
    • 2006
  • 본 논문은 웹 서버에 의해 자동으로 수집되는 로그 파일로부터 고객 가치 판단 기준을 고객의 행동 기반에 두고 군집화 기법을 이용하여 고객을 세분화하고 세분화 결과에 의사결정나무를 적용함으로써 고객을 분류하는 통합 모형을 제안하였다. 또한, 분류된 고객들의 주 서비스 활용 패턴을 분석하기 위하여 연관규칙기법을 적용하여 고객의 과학기술정보 활용의 연관성을 분석함으로써, 과학정보포털 서비스를 제공하는 사이트 이용자의 분류군에 해당하는 정보와 인터페이스를 제공하는 새로운 방법에 대하여 연구하였다. 고객 관리 측면에서 본 논문은 정보 서비스를 제공하는 웹 사이트의 기존고객을 분류하여 패턴을 분석함으로써 고객 위주의 사이트 운영정책과 동적 인터페이스를 제공하기 위한 웹사이트 활용 방안을 제시하였다. 또한, 고객의 지속적인 관리라 각 고객 분류군별에 안는 서비스를 제공하고 고객의 관리에도 기여할 수 있을 것이다.

  • PDF

Comparing Korean Spam Document Classification Using Document Classification Algorithms (문서 분류 알고리즘을 이용한 한국어 스팸 문서 분류 성능 비교)

  • Song, Chull-Hwan;Yoo, Seong-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.222-225
    • /
    • 2006
  • 한국은 다른 나라에 비해 많은 인터넷 사용자를 가지고 있다. 이에 비례해서 한국의 인터넷 유저들은 Spam Mail에 대해 많은 불편함을 호소하고 있다. 이러한 문제를 해결하기 위해 본 논문은 다양한 Feature Weighting, Feature Selection 그리고 문서 분류 알고리즘들을 이용한 한국어 스팸 문서 Filtering연구에 대해 기술한다. 그리고 한국어 문서(Spam/Non-Spam 문서)로부터 영사를 추출하고 이를 각 분류 알고리즘의 Input Feature로써 이용한다. 그리고 우리는 Feature weighting 에 대해 기존의 전통적인 방법이 아니라 각 Feature에 대해 Variance 값을 구하고 Global Feature를 선택하기 위해 Max Value Selection 방법에 적용 후에 전통적인 Feature Selection 방법인 MI, IG, CHI 들을 적용하여 Feature들을 추출한다. 이렇게 추출된 Feature들을 Naive Bayes, Support Vector Machine과 같은 분류 알고리즘에 적용한다. Vector Space Model의 경우에는 전통적인 방법 그대로 사용한다. 그 결과 우리는 Support Vector Machine Classifier, TF-IDF Variance Weighting(Combined Max Value Selection), CHI Feature Selection 방법을 사용할 경우 Recall(99.4%), Precision(97.4%), F-Measure(98.39%)의 성능을 보였다.

  • PDF

A Junkmail Checking System Using Fuzzy Relational Products (퍼지 관계 곱을 이용한 정크메일 분류 시스템)

  • 박정선;김창민;김용기
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.341-344
    • /
    • 2001
  • 20세기 후반 인터넷의 발전을 기반으로 전자메일은 현재의 대표적인 개인간 정보전달 수단으로 자리 잡게 되었다. 그러나 전자메일 사용자들은 인터넷상에 개인 전자메일 주소가 노출되므로 해서 많은 정크메일(junkmail)을 수신하게 되었는데, 정크메일이란 기업의 광고 선전물과 같이 수신을 원하지 않는 전자메일을 의미한다. 이러한 정크메일의 증가에 따라 정크메일을 분류하는 수단이 필요하게 되었는데, 현재까지는 사용자가 입력한 송신자의 전자메일 주소 또는 도메인 주소를 등록하여 차단하거나 제목에 특정 단어를 포함한 메일을 완전히 삭제하여 버리는 기술수준에 머무르고 있다. 본 논문에서는 퍼지 관계 곱을 기반으로 메일의 내용에 의미적으로 접근하여 정크메일을 분류하는 시스템을 제안한다. 이는 퍼지 관계곱 연산을 이용하여 미리 정의한 정크용어들과 사용자에게 수신되는 전자메일 내의 용어들간 의미적 포함관계를 분석하고 그를 통해 전자메일의 정크도(degree of junk)를 추출한다. 각 전자메일별로 추출된 정크도는 사용자가 부여하는 정크 기준치(SVJ, Standard Value of Junk)를 기분으로 정크메일과 비 정크메일로 분류한다. 제안된 기법은 사용자가 특정 개수의 동일한 전자메일에 대해 느끼는 정크도를 기준으로 분류한 정크메일 수를 비교하여 그 효용성을 증명하였다.

  • PDF

A Study on a Class Classification of Game Classes for the Extention of Spatio-Temporal Concepts (게임 클래스의 시공간 개념 확장을 위한 클래스 분류 방법에 관한 연구)

  • 김달중;하수철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.168-173
    • /
    • 1998
  • 최근의 급속한 정보 통신 기술의 발달로 인하여 음향 효과, 정교한 그래픽 처리 등을 이용하는 실제와 유사한 게임 소프트웨어들이 제작되고 있으며, 게임 개발자들에게 개발 기간 단축과 개발의 편이성을 위한 멀티미디어 게임 제작 도구가 필요하게 되었다. 이러한 멀티미디어 게임 저작 도구의 핵심 구성 요소가 되는 클래스 라이브러리 개발을 위해 멀티미디어 게임 객체와 객체들의 행위들을 정교하게 분류할 수 있는 게임 클래스 분류법이 필요하다. 본 논문에서는 게임 클래스 시공간 개념에 대한 정교한 방법을 제안한다. 이를 위해 시공간 개념 중심으로 Enumerative 분류 방법을 이용하여 게임 클래스들을 분류하는 방법을 제시하였으며 게임 클래스의 유사도에 의한 클래스 클러스터링을 통하여 C++ 언어의 특징인 클래스들 사이의 계층 구조를 표시할 수 있으며 소프트웨어의 클래스 구조를 쉽게 확장하여 클래스 구조를 변경할 수 있도록 제시하였다.

  • PDF

EO-1 Hyperion / Landsat-7 ETM+ 영상을 활용한 영상분류 정확도 분석

  • Jang Se-Jin;Chae Ok-Sam
    • Proceedings of the KSRS Conference
    • /
    • 2006.03a
    • /
    • pp.223-227
    • /
    • 2006
  • 최근 위성기술의 발전은 크게 두 가지 방향으로 진행되고 있다. 하나는 고해상도(High Resolution)라는 말로 대표되는 공간해상도(Spatial Resolution)의 향상이고, 다른 하나는 초분광(Hyperspectral)으로 대표되는 분광해상도(Spectral Resolution)의 향상이다. 특히 초분광영상(Hyperspectral Image)은 지상피복 및 대상물에 대해 실험실에서 얻을 수 있을 정도의 연속적이고 좁은 파장 간격의 분광정보를 제공하고 있어, 기존에 사용하던 다중분광영상(Multispectral Image) 보다 많은 양의 정보를 사용자에게 제공한다. 본 논문에서는 다중분광영상과 초분광영상의 분광 정보를 활용한 영상분류능력을 비교분석하고 그 결과를 평가하였다. 분석결과는 다중분광영상에서 식별이 어려웠던 초지, 농지, 나지에 대한 분석 능력이 초분광영상에서 상당히 향상됨으로써 감독분류에서 약 20% 정도의 정확도 향상을 가져왔으며, 무감독분류의 경우에는 미소한 차이로 그 정확도가 향상된다는 것이다. 이런 결과는 향후 초분광영상의 토지 피복분류 및 대상물 탐사에 긍정적인 활용 방안을 제시할 수 있음을 알려주고 있다.

  • PDF

Sentiment Classification for Korean Tweets via Semi-Supervised Learning (준지도 학습을 이용한 트윗 감정 분류)

  • Seo, Hyeong-Won;Noh, Kyung-Mok;Cheon, Min-A;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.123-125
    • /
    • 2012
  • 본 논문은 기계 학습을 이용한 감정 분류에 필요한 학습 말뭉치를 효율적으로 확장하는 방법에 대하여 기술한다. 학습 말뭉치는 일반적으로 그에 알맞은 레이블을 정해야 하는데, 그 양이 어마어마하기 때문에 이 과정을 일일이 사람이 할 수는 없다. 그에 대한 해결책으로써 이미 많은 준지도학습 방법이 연구되었고, 그것을 트윗이라는 짧은 문서를 감정 분류하는 것에 적용해도 감정 문서 분류기의 성능이 좋다는 결과를 확인하였다.

  • PDF

An Establishment of Taxonomy for Next-generation Convergent Contents (차세대 융합형 콘텐츠 분류체계 정립)

  • Rim, Myung-hwan;Heo, Pil-sun;Park, Yong-jae
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2010.05a
    • /
    • pp.121-125
    • /
    • 2010
  • 최근 온라인게임, e-Book, 모바일콘텐츠, 포털 등 IT 기반의 새로운 서비스 산업으로서 디지털콘텐츠 산업이 급성장하고 있다. 또한, 과거 엔터테인먼트 위주의 콘텐츠산업이 미래에는 제조, 서비스를 포함한 전 산업영역에 체화융합되어 확산되고, CT 및 IT 기반의 새로운 콘텐츠 산업이 급성장할 것으로 전망되는 등 융합형 콘텐츠에 대한 관심이 증대되고 있다. 정부에서도 신성장동력으로서의 융합형 콘텐츠 산업에 주목하여, 관련 산업을 발굴육성하는데 정책적 관심을 기울이고 있다. 기존의 콘텐츠 분류체계는 영화, 음악, 방송 등 장르 중심적이어서 관련 기술의 발전 및 융합현상을 제대로 반영하지 못하는 한계점을 가지고 있다. 따라서 미래 정책추진의 기반(base)로서 효과적으로 활용되고, 콘텐츠 분야의 외연확장을 포괄하는 새로운 분류체계(taxonomy)의 정립이 요구되는 상황이다. 이에 본 고에서는 미래 정책추진 및 산업활성화에 초점을 맞추어 기존 분류체계의 한계점을 극복하는 차세대 융합형 콘텐츠 산업에 대한 새로운 분류체계를 제시하고자 한다.

  • PDF

On the Classification of Voice Sound and the Recognition of Vowels for Korean Continuous Speech (한국어 연속음인식에 관한 연구(유성음 분류 및 단모음 인식 ))

  • 하판봉;이철희;방승찬;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • v.5 no.3
    • /
    • pp.28-35
    • /
    • 1986
  • 우리나라 음성의 유성음을 모음, 비음 및 유성화 자음으로 분류하는 알고리즘을 기술하였다. 먼 저 기존의 PITCH 검출 알고리즘에 의하여 음성을 유성음과 무성음으로 나눈 뒤, 단지 정규화된 1차 상 관계수, 영교차율, LOG 에너지 및 LPG 에너지의 골짜기 검출만을 이용하여, 유성음은 모음, 비음 및 유 성화자음으로 분류하고 무성음은 실제의 무성음과 묵음으로 분류하였다. 그리고 이렇게 분류된 모음에 대하여 단모음 인식을 행하였다. 단지 한 FRAME으로 모음을 대표하였기 때문에 메모리 크기와 인식 시간을 줄였다. 여기서 UP & DOWN 및 수정된 영교차율을 새로이 정의하여 적용한 결과 만족한 결과 를 얻을 수 있었다. LPC 매개변수 및 전력 스펙트럼도 단모음 인식의 FEATURE로 사용하였다. 그리고 각 FEATURE 의 성능을 비교하였다. 이들 FEATURE을 잘 조합하여 2단계 인식을 행한 결과 92%의 높은 인식율을 얻을 수 있었다.

  • PDF

A Window-Based Classification of Stream Data (스트림 데이터의 윈도우 기반 분류)

  • Kim, Sung-Hyun;Lee, Yong-Mi;Jin, Long;Seo, Sung-Bo;Ryu, Keun-Ho
    • Annual Conference of KIPS
    • /
    • 2005.11a
    • /
    • pp.47-50
    • /
    • 2005
  • 센서와 모바일 기술의 발달로 인해 다양한 센서에서 수집된 스트림 데이터를 처리하는 연구들이 많이 수행되고 있다. 다차원 속성의 스트림 데이터는 센서에서 주기적으로 수집되어 버퍼링 후 처리되기 때문에 기존의 투플 기반의 데이터 분류 기법에 적합하지 않다. 따라서 이 논문에서는 윈도우 기반의 스트림 데이터 분류를 위해 각 속성의 평균과 표준편차 값을 이용하여 투플 기반으로 변환하는 기법을 제안한다. 제안된 기법의 타당성은 투플 기반 데이터 분류 기법(의사결정트리, 단순 베이지안 분류기, 베이지안 신뢰 네트워크)에 의한 정확도 측정에 기반 한다. 로봇에서 수집된 센서 데이터를 이용한 실험 결과, 높은 정확도로 제안된 기법이 타당함을 증명하였으며 베이지안 신뢰 네트워크 기법이 다른 기법에 비해 우수함을 발견하였다.

  • PDF