• 제목/요약/키워드: 결정트리분류기

검색결과 52건 처리시간 0.024초

열 영상에서 핫 스팟 영역을 이용한 휴먼 보행자 검출 기법 (Pedestrian detection in thermal image using hot-spot region)

  • 김덕연;고병철;남재열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.348-350
    • /
    • 2012
  • 본 논문에서는 열 영상카메라를 통해 입력 받은 영상을 CS-LBP(Center-symmetric LBP)와 랜덤 포레스트(Random forest)를 이용하여 보행자 휴먼 객체를 검출하는 방법을 제안한다. 우선 불필요한 후보영역을 줄이기 위해 열 영상의 표준편차, 밝기 평균, 밝기 최대값을 이용하여 이진화하고, 신체부위 중 가장 발열이 강한 얼굴부위를 핫스팟 영역으로 설정한다. 그 후, 핫스팟 영역에서 CS-LBP특징을 추출하여 결정 트리의 앙상블인 랜덤 포레스트 분류기를 이용하여 최종적인 보행자 휴먼 객체를 검증한다. CS-LBP와 랜덤 포레스트 분류기를 통해 실시간 보행자 객체의 검출이 가능하고, 높은 검출 성능을 나타내었다.

문법관계 정보를 이용한 단계적 한국어 구문 분석 (Cascaded Parsing Korean Sentences Using Grammatical Relations)

  • 이성욱
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.69-72
    • /
    • 2008
  • 본 연구는 한국어 의존 구조를 결정하는 단계적 의존 구조 분석기를 제안한다. 각 단계에서는 주어진 문법관계의 후보열에서 올바른 문법관계를 결정하는데, 대상문법관계의 종류에 따라 독립적으로 수행된다. 문법관계의 후보열은 미리 학습된 지지벡터기계를 이용하여 주어, 목적어, 보어, 부사어 등 7가지의 문법관계로 추정한다. 각 단계에서는 지지벡터기계 분류기와 어절 간의 거리, 교차 구조 금지, 격 제한의 원칙 등의 한국어 언어 특성을 이용하여 대상문법관계를 결정하며, 모든 단계를 거쳐 최종적으로 전체 의존 구조와 문법관계가 결정된다. 트리 및 문법관계 부착 말뭉치를 이용하여 제안된 시스템을 구현 및 실험하였으며 약 85.7%의 정확률을 얻었다.

의사결정트리 프로그램 개발 및 갑상선유두암에서 질량분석법을 이용한 단백질 패턴 분석 (Development of Decision Tree Software and Protein Profiling using Surface Enhanced laser Desorption/lonization - Time of Flight - Mass Spectrometry (SELDI-TOF-MS) in Papillary Thyroid Cancer)

  • 윤준기;이준;안영실;박복남;윤석남
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제41권4호
    • /
    • pp.299-308
    • /
    • 2007
  • 본 연구의 목적은 의사결정트리를 생성하는 생물정보학 프로그램을 개발하고, 이를 갑상선유두암 혈청의 질량분석자료로 시험해 보는 것이다. 대상 및 방법: C4.5를 커스터마이징하여 의사결정트리 분석을 수행할 수 있는 'Protein analysis'라는 프로그램을 개발하였다 61개의 혈청시료(갑상선유두암 27, 자가면역성 갑상선염 17, 대조군 17)를 일정 기간 동안 순차적으로 냉동한 후 실온에서 일시에 해동하여 분석에 사용하였다. 모든 시료는 탈지질화 과정을 거쳐 준비한 후, 2종류의 단백질칩(CM10, IMAC3)에 각각 60개, 50개 시료를 적용하였다. 갑상선유두암의 특징적인 단백질 패턴을 찾기 위해 질량분석기를 이용하여 단백질칩을 분석했다. 'Protein analysis' 프로그램을 이용하여 단백질분포 자료로부터 의사결정트리를 작성하고, 생체표지자 후보물질을 검출하였다. CM10칩에서 발견된 생체표지자 후보물질을 무작위 표본추출 방법을 이용하여 검증하였다. 결과: 단백질분포 자료의 훈련과 검증이 가능한 의사결정트리 프로그램이 개발되었으며, 이 프로그램은 트리 구조와 노드 정보, 트리 구성 과정을 표시하는 3개의 창으로 구성되었다. CM10칩을 이용한 분석에서 총 113개의 단백질 피크 중 23개가 3그룹 간에 유의한 차이가 있었으며, IMAC3는 41개의 단백질 피크 중 8개가 3그룹 간에 유의한 차이가 있었다. 3그룹 분석에서 의사결정트리는 CM10칩과 IMAE3의 단백질분포 자료로부터 각각 60개와 50개의 시료를 높은 정확도로 분류하였으며(오차율 = 각각 3.3%, 2.0%), 각각 4개와 7개의 생체표지자 후보물질을 검출하였다. 암시료와 비암시료를 구분하는 2그룹 분석 에서, 의사결정트리는 모든 암시료를 정확히 구분하였으며(모두 오차율 = 0%), CM10칩을 이용한 분석에서는 단일 노드를 사용하고, IMAC3칩을 이용한 분석에서는 여러 개의 노드를 사용하였다. CM10칩의 단백질 분포자료를 5번의 무작위 추출에 의해 시행한 검증에서 암시료와 비암시료를 구분하는데 높은 정확도를 보였으나(정확도 = 98%, 54/55), 3그룹을 구분할 때는 중등도의 정확도를 보였다(정확도 = 65%, 36/55). 결론: 우리가 개발한 프로그램은 질량분석 자료로부터 성공적으로 의사결정트리를 생성하고, 생체표지자 후보물질을 검출할 수 있었다. 따라서 이 프로그램은 혈청 시료를 이용한 생체표지자 발굴 및 갑상선유두암의 추적관찰에 유용하게 사용될 수 있을 것이다.

투영면 컨벌루션과 결정트리를 이용한 상태 적응적 차량번호판 인식 시스템 (Adaptive Vehicle License Plate Recognition System Using Projected Plane Convolution and Decision Tree Classifier)

  • 이응주;이수현;김성진
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1496-1509
    • /
    • 2005
  • 본 논문에서는 투영면 컨벌루션과 결정트리 분류기법을 사용하여 주변 환경이 복잡한 차량영상으로부터 실시간으로 번호판을 추출하고 인식하는 적응적 차량번호판 인식 시스템을 제안하였다. 일반적으로 고속도로 톨게이트와 주차장 출입구에서의 차량영상은 설치 카메라와 도로 환경에 따라 차량번호판의 크기, 각도변화, 주변잡음 등으로 매우 다양하므로 번호판 추출과 분할이 어렵다. 따라서 본 논문에서는 차량 영상을 획득한 후 번호판 후보영역을 검출하고 진입 위치 변화에 따라 번호판의 기울기와 크기를 자동으로 보정하여 인식하는 알고리즘을 제안하였다. 제안한 인식 방법은 차량의 에지누적 분포와 번호판의 일정한 명암값 변화 빈도수를 누적한 투영면 컨벌루션과 체인코드를 사용하여 크기와 기울기가 일정하지 않은 번호판으로부터 번호판영역을 정확히 추출하고, 적응적 이진화 기법을 이용하여 문자를 분할하였다. 본 논문에서 제안한 방법으로써 실험한 결과 복잡한 영상에서 전방 및 후방 차량영상으로부터 번호판 인식이 가능하였으며 각각 $98.8\%$$95.5\%$의 추출률과 분할된 문자영역에서 $97.3\%$$96\%$의 인식률 개선 결과를 나타내었다.

  • PDF

SNP와 양적 표현형의 연관성 분석을 위한 분류기 (A Classifier for the association study between SNPs and quantitative traits)

  • 엄상용;이광모
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권11호
    • /
    • pp.141-148
    • /
    • 2012
  • 인간 유전체 정보와 관련된 기술이 발전함으로 인하여 이를 이용한 질환 또는 질병에 대한 연관성을 분석하여 그 위험도나 치료 예후 등에 대한 예측하기 위한 연구가 활발히 진행되고 있다. 이러한 연구의 대부분은 대표적인 질적 표현형을 대상으로 하는 환자-대조군 연구(case-control study) 방법을 이용하고 있으며 양적 표현형에 대해서는 개별 단일 염기 변이의 연관성을 회기 분석 방법을 이용하여 규명하는 연구가 주로 수행되고 있다. 특히 복합 질병(complex disease)에 대한 위험도를 예측하기 위한 연구의 경우 흔한 변이 흔한 질환(common variants common disease)의 가정아래 주로 각각의 단일 염기 변이가 보이는 연관성 정보를 기반으로 진행되고 있으며 여러 변이의 상호 작용에 의한 영향을 분석한 결과는 상대적으로 미비하다. 이 논문에서는 양적 표현형에 대한 SNP의 연관성을 분석하고 그 결과로 발견된 SNP을 이용하여 대상 표현형의 값을 예측하기 위한 분류기를 구성하고 그 성능을 평가하였으며 분류기의 단일 염기 변이의 선택에 있어서 각각의 단일 염기 변이의 연관성을 고려할 때와 단일 염기 변이의 쌍이 보이는 연관성을 고려할 때의 분류 성능을 비교하였다.

부스팅 인공신경망학습의 기업부실예측 성과비교 (An Empirical Analysis of Boosing of Neural Networks for Bankruptcy Prediction)

  • 김명종;강대기
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.63-69
    • /
    • 2010
  • 최근 기계학습 분야에서 분류자의 정확도 개선을 위하여 제안된 다양한 방법들 중 가장 큰 주목을 받고 있는 학습방법 중 하나는 앙상블 학습이다. 그러나 앙상블 학습은 의사결정트리와 같이 불안정한 학습 알고리즘의 성과 개선 효과는 탁월한 반면, 인공신경망과 같이 안정적인 학습알고리즘의 성과 개선 효과는 응용 분야와 구현 방법에 따라 서로 상반된 결론들을 보여주고 있다. 본 연구에서는 국내 기업의 부실화 예측문제를 활용하여 인공신경 망 분류자 및 대표적 앙상블 학습기법인 부스팅 분류자를 적용한 결과 앙상블 학습은 기업부실 예측문제에 있어 전통적 인공신경망의 성과를 개선할 수 있음을 검증하였다.

그래프 분류 기반 특징 선택을 활용한 작물 수확량 예측 (Crop Yield Estimation Utilizing Feature Selection Based on Graph Classification)

  • 옴마킨;이성근
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1269-1276
    • /
    • 2023
  • 작물 수확량 예측은 토양, 비, 기후, 대기 및 이들의 관계와 같은 다양한 측면으로 인해 다국적 식사와 강력한 수요에 필수적이며, 기후 변화는 농업 생산량에 영향을 미친다. 본 연구에서는 온도, 강수량, 습도 등의 데이터 세트를 운영한다. 현재 연구는 농부와 농업인을 지원하기 위해 다양한 분류기를 사용한 기능 선택에 중점을 두고 있다. 특징 선택 접근법을 활용한 작물 수확량 추정은 96% 정확도를 나타내었다. 특징 선택은 기계학습 모델의 성능에 영향을 미친다. 현재 그래프 분류기의 성능은 81.5%를 나타내며, 특징 선택이 없는 Random Forest 회귀 분석은 78%의 정확도를 나타냈다. 또한, 특징 선택이 없는 의사결정 트리 회귀 분석은 67%의 정확도를 유지하였다. 본 논문은 제시된 10가지 알고리즘을 대상으로 특징 선택 중요성에 대한 실험결과를 나타내었다. 이러한 결과는 작물 분류 연구에 적합한 모델을 선택하는 데 도움이 될 것으로 기대된다.

TMA 분석을 위한 지능적 의학 전문가 시스템의 설계 및 구현 (Design and Implementation of an Intelligent Medical Expert System for TMA(Tissue Mineral Analysis))

  • 조영임;한근식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.137-152
    • /
    • 2004
  • 모발분석(TMA: Tissue Mineral Analysis)은 머리카락 속에 있는 30여 가지의 미네랄과 8가지의 중금속의 양과 중요 미네랄 비율을 분석하여 체내에 과잉, 결핍 및 불균형 상태를 평가하고, 그 결과가 현재 인체에 미치는 영향을 예측하여, 건강을 유지하는 방향을 제시하는 임상 영양학 및 독성학 모발조직 검사방법을 말한다. 그러나 국내 TMA 분석방법은 몇 가지 문제점이 있다. 첫째, TMA 분석기기는 있으나 분석결과를 해석할 수 있는 한국형 의학 정보 데이타베이스가 없다. 둘째, 미국에서 보내오는 TMA 검사결과 자료가 영문이며 철저한 보안에 바탕을 둔 그래픽 파일 형태이므로 활용성이 적다. 셋째, TMA 관련 데이터베이스가 있어도 의료기관에서 사용하기 어려운 매우 낮은 수준이므로 TMA 분석 및 의료서비스를 위해 매번 미국에 의뢰해야 하므로 심각한 외화낭비를 초래한다. 넷째, TMA 결과가 서구식 생활패턴에서 비롯된 데이터 베이스로부터 구축된 것이므로 검사결과의 신뢰성 문제가 발생한다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 국내 전문 기관으로부터 자료를 제공받아 TMA 관련 국내 최초 지능적 의학 전문가 시스템(IMES: Intelligent Medical Expert System)을 개발하였다. IMES는 TMA 자료를 다단계 통계분석 방법에 의한 결정 트리 분류기를 이용하여 분류하고 다중 퍼지 규칙베이스를 구축하여, 지능적 퍼지추론 방법에 의해 한글화된 데이터베이스로부터 복잡한 자료를 추론하도록 구축하였다. 본 IMES 시스템을 실제 적용한 결과 업무능률과 만족도가 각각 86%, 92% 증가함을 알 수 있었다.

선별 시스템 기반 표지 유전자를 포함한 난소암 마이크로어레이 데이터 분류 (Classification of Ovarian Cancer Microarray Data based on Intelligent Systems with Marker gene)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.747-752
    • /
    • 2011
  • 마이크로어레이 분류는 전형적으로 분류기 디자인과 에러 추정이 현저하게 작은 샘플에 기반한다는 것과 교차 검증 에러 추정이 대다수의 논문에 사용된다는 주목할 만한 두 가지 특징을 소유한다. 마이크로어레이 난소 암 데이터는 수 만개의 유전자 발현으로 구성되어 있고, 이러한 정보를 동시에 분석하기 위한 어떤 체계적인 절차도 없다. 본 논문에서는, 통계에 따라 유전자의 우선순위를 정함으로써 표지유전자를 선택하였고, 널리 보급되어 있는 분류 규칙인 선형 분류 분석, 3-nearest-neighbor와 결정 트리 알고리즘은 표지 유전자를 선택한 데이터와 선택하지 않는 데이터의 분류 정확도 비교를 위해 사용되어졌다. ANOVA를 이용하여 선택된 표지 유전자를 포함하는 마이크로어레이 데이터 셋에 선영 분류분석 규칙을 적용한 결과 97.78%의 가장 높은 분류 정확도와 가장 낮은 예측 에러 추정치를 나타내었다.

모델 기반 지각적 그룹핑을 이용한 3차원 다면체의 인식 및 형상 복원 (Recognition and Reconstruction of 3-D Polyhedral Object using Model-based Perceptual Grouping)

  • 박인규;이경무;이상욱
    • 한국통신학회논문지
    • /
    • 제26권7B호
    • /
    • pp.957-967
    • /
    • 2001
  • 본 논문에서는 모델 기반 지각적 그룹핑을 이용한 3차원 다면체의 인식 및 형상 복원에 관한 새로운 기법을 제안한다. 2차원 입력 영상과 여기에서 추출된 특징들의 3차원 특징을 거리 측정기를 이용하여 추출하여 인식 및 복원의 기본 특징으로 이용한다. 이 때, 모델의 3차원 기하학적 정보는 결정 트리 분류기에 의하여 학습되며 지각적 그룹핑은 이와 같은 모델 기반으로 이루어진다. 또한, 1차 그룹핑의 결과로 얻어진 3차원 직선 특징간의 관계는 Gestalt 그래프로 표현되며 이것의 부그래프 분할을 통하여 인식을 위한 후보 그룹이 생성된다. 마지막으로 각각의 후보 그룹은 3차원 모델과 정렬되어 가장 잘 부합되는 그룹을 인식 결과로 생성하게 된다. 그리고 정렬의 결과로서 2차원 텍스춰를 추출하여 3차원 모델에 매핑함으로써 실제적인 3차원 형상을 복원할 수 있다. 제안하는 알고리듬의 성능을 평가하기 위하여 불록 영상과 지형 모델 보드 영상에 대하여 실험을 수행하였다. 실험 결과, 모델 기반의 그룹핑 기법은 결과 그룹의 수를 상당히 감소시켰으며 또한 잡음과 가리워짐에 강건한 인식과 복원 결과가 얻어졌다.

  • PDF