• 제목/요약/키워드: 비교 분류

검색결과 7,532건 처리시간 0.035초

감성 분류를 위한 워드 임베딩 성능 비교 (Performance Comparison of Word Embeddings for Sentiment Classification)

  • 윤혜진;구자환;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.760-763
    • /
    • 2021
  • 텍스트를 자연어 처리를 위한 모델에 적용할 수 있게 언어적인 특성을 반영해서 단어를 수치화하는 방법 중 단어를 벡터로 표현하여 나타내는 워드 임베딩은 컴퓨터가 인간의 언어를 이해하고 분석 가능한 언어 모델의 필수 요소가 되었다. Word2vec 등 다양한 워드 임베딩 기법이 제안되었고 자연어를 처리할 때에 감성 분류는 중요한 요소이지만 다양한 임베딩 기법에 따른 감성 분류 모델에 대한 성능 비교 연구는 여전히 부족한 실정이다. 본 논문에서는 Emotion-stimulus 데이터를 활용하여 7가지의 감성과 2가지의 감성을 5가지의 임베딩 기법과 3종류의 분류 모델로 감성 분류 학습을 진행하였다. 감성 분류를 위해 Logistic Regression, Decision Tree, Random Forest 모델 등과 같은 보편적으로 많이 사용하는 머신러닝 분류 모델을 사용하였으며, 각각의 결과를 훈련 정확도와 테스트 정확도로 비교하였다. 실험 결과, 7가지 감성 분류 및 2가지 감성 분류 모두 사전훈련된 Word2vec가 대체적으로 우수한 정확도 성능을 보였다.

IKONOS 영상의 토지피복분류 방법에 관한 실증 연구 (An Empirical Study on the Land Cover Classification Method using IKONOS Image)

  • 사공호상;임정호
    • 한국지리정보학회지
    • /
    • 제6권3호
    • /
    • pp.107-116
    • /
    • 2003
  • 이 연구는 기존의 분광특성에 의한 영상분류방법들이 고해상도 위성영상에 어느 정도 적절한지 알아보는데 목적이 있다. 이를 위하여 매개변수법과 비매개변수법을 혼합한 감독분류, 퍼지이론을 적용한 감독분류 그리고 무감독분류방법을 각각 적용하여 토지피복분류를 실시하고 각 방법들의 적용결과를 서로 비교하였다. 또한 육안판독과 분광특성을 이용한 영상분류 결과를 서로 비교하여 각 방법 간 토지피복분류의 결과를 비교 분석하였다. 실증연구 결과, 고해상도 위성영상은 반사값의 복잡성, 그림자의 영향 등으로 인하여 노이즈 현상이 심하게 발생하였다. 이러한 고해상도 위성영상은 무감독분류보다는 감독분류가 더 적절한 분석방법이며, 특히 퍼지이론을 적용한 감독분류방법이 가장 우수한 것으로 나타났다. 그러나 토지피복분류결과의 전체 정확도가 76% 정도에 불과해 토지피복분류결과의 신뢰성이 낮았다. 또한 육안판독과 영상분류 결과를 서로 비교한 바 뚜렷한 경계와 넓은 면적을 갖는 농경지 등의 항목은 일치도가 높은 반면 산발적으로 분포해 있는 초지 등의 항목은 일치도가 낮게 나타났다. 영상분류와 육안판독 간의 일치도는 79%로 나타났다.

  • PDF

Interval Type-2 FCM based RBFNN의 도움으로 실현된 사례 및 에코 분류기 설계 : LSE와 WLSE의 비교연구 (Design of Event and Echo Classifier Realized with the Aid of Interval Type-2 FCM based RBFNN : Comparative Studies of LSE and WLSE)

  • 송찬석;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1347-1348
    • /
    • 2015
  • 본 논문에서는 기상레이더 데이터에서 섞여있는 강수에코 및 비강수에코를 분류하기 위하여 Interval Type-2 FCM based RBFNN의 도움으로 사례 및 에코 분류기의 설계를 제안한다. 학습과 테스트 데이터는 현재 기상청에서 사용하는 UF radar data를 사용하였으며, 사례 분류기와 에코패턴 분류기의 데이터를 각각 생성한다. 전처리 과정인 사례 분류를 통하여 강수사례 혹은 비강수사례를 분류하여 강수사례일 경우 에코패턴분류를 진행하며, 비강수사례일 경우 데이터에 관측된 모든 반사도 값을 제거한다. 사례 및 에코 분류기는 Interval Type-2 FCM based RBFNN을 통하여 패턴분류를 진행하며, 패턴분류 성능을 확인한다. 또한 후반부 파라미터의 동정 시, 각 규칙에 파라미터를 전역적으로 구하는 LSE와 각 규칙에 대한 파라미터를 독립적으로 구하는 WSLE의 비교연구를 수행한다. 분류기의 성능을 확인하기 위하여 사례 분류 후 에코패턴분류의 결과는 현재 기상청에서 사용하고는 품질검사(QC) 데이터와 비교하여 평가하였다.

  • PDF

한국십진분류법과 듀이십진분류법에 나타난 주기의 다양성에 관한 비교 연구 (A Comparative Study of Notes in KDC and DDC)

  • 정연경
    • 한국비블리아학회지
    • /
    • 제19권2호
    • /
    • pp.129-146
    • /
    • 2008
  • 문헌분류표에서 주기는 분류기호의 생성과 합성에 있어서 필수적인 도구이다. 본 연구는 문헌분류표에서 사용되고 있는 다양한 주기의 유형을 살펴보고 한국십진분류법의 주기와 비교함으로써 보다 나은 주기를 개발하고 좀 더 적합한 분류 기호를 부여할 수 있도록 하였다. 이를 위해 듀이십진분류법에서 사용되고 있는 주기의 유형을 살펴보고 한국십진분류법에서 사용되고 있는 주기를 듀이십진분류법의 주기와 비교 분석하였다. 이를 바탕으로 한국십진분류법에 추가적으로 필요한 주기와 다양한 형식을 제시하였다.

전자 듀이십진분류표의 비교 연구 (Dewey for Windows vs. Electronic Dewey Decimal Classification)

  • 정연경
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.91-94
    • /
    • 1997
  • Dewey for Windows는 1997년 여론에 나온 듀이십진분류표 제 21판의 전자본이다. 1994년에 Electronic Dewey Decimal Classification이 최초의 전자 분류표로 등장한 후, 보다 나아진 이용자 인터훼이스와 다양한 접근방법을 사용할 수 있는 전자 듀이십진분류표로 개발되었다. 본고에서는 새로 나온 전자분류표의 기능을 살펴보고 최초의 전자분류표와 비교한 후, 개선점을 제시하였으며 한국의 전자십진분류표 개발을 제안하였다.

  • PDF

한국어 비교 문장 유형 분류를 위한 변환 기반 학습 기법 (Transformation-based Learning for Korean Comparative Sentence Classification)

  • 양선;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.155-160
    • /
    • 2010
  • 본 논문은 비교마이닝(comparison mining)의 일환인 비교 문장 유형 자동 분류에 관하여 연구한다. 비교마이닝은 텍스트 마이닝의 한 분야로서 대용량의 텍스트를 대상으로 비교 관계를 분석하며, 크게 세 단계의 과정을 거치게 되는데 첫 번째 단계는 대용량의 문서에서 비교 문장만을 식별 후 추출해 내는 과정이고, 두 번째 단계는 추출된 비교 문장들을 비교 유형별로 분류하는 과정이며, 앞의 두 선행 과정이 끝나면 유형별로 비교 속성을 추출 및 비교 관계를 분석하는 세 번째 단계를 수행하게 된다. 본 연구에서는 변환 기반 학습(transformation-based learning) 기법을 이용하여 비교 문장들을 일곱 가지의 유형으로 자동 분류하는 두 번째 과제를 수행한다. 자연어 처리 분야 여러 부문에서 사용되고 있는 변환기반 학습은 오류를 감소시키는 최적의 규칙을 자동으로 생성하여 정답을 찾아가는 규칙 기반 학습 방법이다. 웹상의 다양한 도메인에서 추출된 비교 문장들을 대상으로 유형 분류를 수행한 결과 정확도 80.01%의 성능으로 일곱 가지 유형을 분류할 수 있었다.

지형패턴(Geomorphons)을 이용한 새로운 지형분류방법 (Landform Classification using Geomorphons)

  • 김동은;성영배;손학기;최광희
    • 한국지형학회지
    • /
    • 제19권4호
    • /
    • pp.139-155
    • /
    • 2012
  • 기존에 사용되고 있는 대부분의 DEM을 이용한 지형분류는 중심 셀과 주변 셀과의 수치를 비교하기 때문에 그 결과 값이 분석반경에 민감하다. 이러한 문제점들을 극복하기 위해 지형패턴(Geomorphons)을 이용한 새로운 방식의 지형분류 방법이 등장하였는데 이는 중심 셀과 주변 셀의 높이를 비교하여 그 패턴을 저장하고 이를 바탕으로 지형을 분류하는 방법이다. 본 연구에서는 지형패턴 분류법을 이용하여 평창강 유역을 대상으로 지형을 분류하였다. 분석 결과를 검증하기 위해 최근에 많이 사용하고 있는 지형분류방법 중의 하나인 Topographic Position Index(TPI)와 분석결과를 비교하였다. 또한 이미 기 구축된 하계망도, 유역도와 비교해본 결과 다음과 같은 특징을 발견하였다. 첫 번째로 지형패턴 분류법은 구축시간과 구축비용을 줄일 수 있기 때문에 사용자 중심의 지형분류 방법이라고 할 수 있다. 두 번째로 개방성을 이용한 패턴을 기반으로 지형을 분류하였기 때문에 스케일종속성(scaledependency) 문제를 상당부분 극복하였다. 이는 지형패턴에 기반한 지형분류방법이 기존의 지형분류방법들이 가지고 있는 특징을 계승하면서 기존의 방법들과는 다른 독특한 강점이라고 볼 수 있다. 마지막으로 지형패턴을 이용한 지형분류방법이 보다 다양한 분야에 걸쳐 광범위하게 이용되기 위해서는 현장답사를 통해 실제 지형과 분류된 지형이 일치하는지에 대한 체계적인 검증이 필요하다.

IPAA의 효과를 고찰하기 위한 분류분석방법들의 비교연구

  • 이승연;이은주;최호식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.291-298
    • /
    • 2005
  • 지속성 외래 복막투석은 말기 신부전 환자들에게 널리 시행하는 신 대체 요법으로, 복막투석 환자에게서 주된 합병증으로 일어나는 단백질-열량 영양실조를 치료하기 위하여 아미노산을 복강 내로 주입하는 치료방법이다. 이현석 등(2004)의 연구에서는 아미노산 복막 투석액(IPAA)이 영양실조 환자들에게 실제로 영양상태에 미치는 영향을 평가하기 위하여 지속성 외래 복막투석 환자 43명을 12개월 동안 3개월 주기로 관측하여 얻어낸 반복측정자료를 바탕으로 IPAA의 효과 여부에 따라 반응군과 비반응군을 분류하였다. 본 논문에서는 이러한 두 그룹을 효과적으로 분류할 수 있는 분류기준변수들을 찾아내고 이 분류기준변수의 값을 바탕으로 새로운 환자에게 IPAA의 투여 여부를 진단할 수 있는 여러 분류방법들을 고찰하여 비교 연구하였다. 모수적인 방법으로 선형판별분석, 이차판별분석 및 로지스틱 판별분석을 소개하고 비모수적인 방법으로 support vector machine(SVM)을 소개하여 분류분석의 결과를 비교하여 두 그룹을 최소한의 오류로 분류하는 방법을 제안하였다.

  • PDF

보안관리를 위한 위협, 자산, 취약성의 분류체계 -BDSS 사례-

  • 김기윤;나관식;김종석
    • 정보보호학회지
    • /
    • 제5권2호
    • /
    • pp.49-63
    • /
    • 1995
  • 본 논문은 정보시스템 보안관리에 대한 개념적 모형을 INFORSEC 및 한국전산원이 제시한 모형을 중심으로 기술했으며 보안관리의 표준적인 분류체계를 근거로 BDSS의 위협. 자산, 취약성의 분류체계를 비교함으로써 위협, 자산, 취약성의 관련성을 탐색 하고자 했다. 특히 위협의 원천과 가해자 측면에서 BDSS와 CRAMM의 경우를 비교함으로써 분류체계의 장단점을 파악하고자 했다.

  • PDF

지지벡터기계를 이용한 다중 분류 문제의 학습과 성능 비교 (Learning and Performance Comparison of Multi-class Classification Problems based on Support Vector Machine)

  • 황두성
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.1035-1042
    • /
    • 2008
  • 이진 분류기로서 지지벡터기계는 다양한 응용을 통해 이진 분류 문제에서 기존의 패턴 분류기들보다 우수한 성능을 보였다. 지지벡터기계의 바탕이 되는 최대 마진 분류 이론을 다중 분류 문제에 확장은 어려움이 있다. 이 논문에서는 다중 분류 문제를 위한 지지벡터기계의 학습 전략을 논의하였으며 성능 비교를 수행하였다. 학습 데이터의 분배 전략에 따라 지지벡터기계는 고유의 이진 분류 특징을 수정하지 않고 다중분류 문제에 쉴게 적용될 수 있다. 다양한 벤치마킹 데이터에 대해 선택된 학습 전략, 커널함수, 학습 소요시간 등에 따라 성능비교가 수행되었고 오류역전파 학습의 신경망의 테스트 결과와 비교되었다. 신경망 모델과 비교 실험에서 지지벡터기계는 일반적인 다중 분류 문제에 응용성과 효과가 있음을 보였다.

  • PDF