• 제목/요약/키워드: 분류시스템

검색결과 6,451건 처리시간 0.034초

오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구 (A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries)

  • 안애림;이서진;최동현;김응균;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

DDC 20판의 주기 분석에 근거한 보조표 분류지원 전문가시스템 설계에 관한 연구 (A Study on Classification Support Expert System Design based on Note Analysis for DDC 20 Tables)

  • 김상미;남태우
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.129-132
    • /
    • 1994
  • DOC 20판에서는 보조표 활용을 위하여 다양한 형태의 주기(Note)가 여러 곳에 마련되어 있다. 이 주기는 새로운 학문들이 이전판의 분류체재와의 중복성을 극복하고, 정확한 문헌분류를 위한 중요한 문법규칙들을 포함하고 있다. 그러나. 기술된 주기의 다양성이 제대로 정리되어 있지 않아서 이 주기의 활용은 미흡한 실정이다. 따라서, 본 연구는 DDC 20판의 보조표 T1(표준세분표: Standard Subdivisions) 및 T2(지리, 시대, 인물 구분표: Geographic Areas, Historical Periods, Persons)에 대안 이용주기를 통계적 빈도수를 고려하여 분석하고, 분석된 주기를 유형별로 분류하여 각 유형별 분류기호 생성 문법을 마련하였으며, 분류기호 생성 문법을 유도트리(Derivation tree)를 활용하여 정확한 분류과정을 예시하고, 이를 자동분류시스템으로 활용할 수 있는 분류진원 전문가시스템 모형을 설계하였다.

  • PDF

eCRM에서 최적화 모형을 이용한 고객 분류 시스템 (Customer Classification System using Optimized Form in eCRM)

  • 이재훈;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.149-152
    • /
    • 2004
  • 기업들의 고객중심 마케팅 기법중 하나인 고객관계관리(CRM : Customer Relationship Management)가 인터넷의 발전으로 온라인화 되고 있으며 다양하게 발전되어 왔다. 가장 대두되고 있는 문제는 고객 분류를 객관적인 방법으로 어떻게 자동화할 수 있는가 이다. 본 논문은 최적화 모형을 이용하여 고객 분류를 더욱 세밀하게 할 수 있음을 제안하였고 고객 집단 편성 최적화를 반영함으로써 고객을 최적으로 분류할 수 있는 시스템을 설계 및 구축하였다.

  • PDF

Neural Network을 이용한 이미지 장르 분류 시스템 (Neural Network Based Image Genre Classification)

  • 안재훈;이한구;주현호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.330-335
    • /
    • 2006
  • 본 논문에서는 neural network을 이용한 이미지 장르(유형) 분류 시스템을 소개한다. 이 논문에서 제안된 시스템은 이미지를 예술(art), 사진(photo), 만화(cartoon) 이미지라는 세 가지 장르(유형) 중 하나로 분류한다. 이미지의 특성은 표준 MPEG-7 visual descriptor를 사용하여 추출된 후, neural networks를 이용하여 학습된다. 시뮬레이션 결과는 제안된 시스템이 80% 이상의 이미지들을 정확한 장르(유형)로 분류하는 것을 보여준다.

  • PDF

범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템 (Automatic Document Classification by Term-Weighting Method)

  • 이경찬;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.475-477
    • /
    • 2002
  • 자동 문서 분류는 범주 특성 벡터와 입력 문서 벡터의 유사도 비교에 의해 가장 유사한 범주를 선택하는 방법이다. 문서 분류 시스템을 구현하기 위하여 각 범주의 특성 벡터를 정보 검색 시스템의 역파일 형태로 구축하였으며, 용어 가중치를 계산하는 방법을 달리하여 문서 분류 시스템의 정확도를 실험하였다. 실험 문서는 일간지의 신문기사들을 무작위로 추출한 문서 집합을 대상으로 하였으며, 정보 검색 모델에서 보편적으로 사용되는 TF-lDF 방식이 변형된 방식에 비해 더 나은 성능을 보였다.

  • PDF

온라인 평가 시스템을 위한 평가문항 분류 기준에 관한 연구

  • 이재원;최은만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.992-995
    • /
    • 2009
  • 온라인 평가 시스템의 발전으로 오프라인을 통한 전통적인 시험에서 수준에 맞는 다양한 평가가 가능한 온라인 평가가 폭넓게 수행되고 있다. 하지만 평가문항에 대한 체계적인 유형 분류가 미흡하여 평가문항을 온라인 평가 시스템을 통해 표현하고 이기종 시스템간의 평가문항을 원활하게 공유하지 못하고 있다. 이 논문은 국내외 평가문항 유형 분류를 분석하고 온라인 상에서 평가문항을 효과적으로 표현하기 위한 명확한 문항 분류 기준을 제시한다.

분류자 시스템과 인공 면역 네트워크에 기반한 자율 분산 로봇 시스템 개발 (Distributed Autonomous Robotics System based on Classifier System and Artificial Immune Network)

  • 황철민;박창현;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.85-88
    • /
    • 2004
  • 본 논문에서는 인공 면역 네트워크와 분류자 시스템을 이용한 자율 분산 로봇 시스템을 제안한다. 시스템에서 각 로봇의 행동은 전역행동과 지역행동으로 구성된다. 전역행동은 작업을 찾고 수행하기 위해 필요한 환경을 조성하는데 필요한 전반적인 행동들을 결정하고, 지역 행동은 작업을 수행할 때 각 로봇들이 어떤 방식으로 동작하는가를 결정한다. 이때 전역 행동은 인공 면역 네트워크를 이용하여 결정되며 작업을 빠른 속도로 탐색하며 탐색한 작업 주위로 적절한 수의 로봇이 집합하도록 한다. 또한 지역 행동은 분류자 시스템을 이용하여 결정되며 작업을 수행하는데 적절한 로봇의 역할을 결정한다.

  • PDF

분류자 시스템을 이용한 축구 로봇의 행동 전략 (Behavior strategies of Soccer Robot using Classifier System)

  • 김지윤;이동욱;심재윤;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.19-22
    • /
    • 2002
  • 분류자 시스템은 유전자 알고리즘(Genetic Algorithm : GA)을 이용하여 새로운 규칙 집합을 발견하는 시스템이다 또 로봇 축구 시뮬레이션 게임(SimuroSot)은 시간에 따라 상태가 변화하는 동적인 시스템이다 본 논문에서는 GBML(Genetic Based Machine Learning)의 한 갈래이자 미시간 접근 방법을 기반으로 하는 Zeroth Level Classifier System(ZCS)을 SimuroSot에 적용하여 게임 전략을 구성하는 새로운 규칙의 발견과 학습에 의한 축구 로봇의 행동전략 알고리즘을 제안하고, 시뮬레이션을 통하여 본 전략의 유용성을 확인한다

  • PDF

임베디드 시스템의 분류 (A Taxonomy of Embedded Systems)

  • 소선섭;손경아;은성배
    • 한국정보통신학회논문지
    • /
    • 제24권6호
    • /
    • pp.818-825
    • /
    • 2020
  • 임베디드 시스템은 컴퓨터가 내장된 특수목적 시스템으로 정의하며 가전제품, 사무기기, 무기 체계 등 매우 다양한 분야에서 사용된다. 특정 분야에서 잘 정의된 분류 기법은 교수 및 학습에 강점을 갖는데 임베디드 시스템을 위한 분류체계는 찾아보기 힘들다. 본 논문에서 우리는 임베디드 시스템의 분류체계를 제시한다. 먼저, 임베디드 시스템의 표준화된 구조를 제시한다. 이 구조에서 임베디드 시스템 응용들을 "firmware-based"와 "embedded OS-based"로 나눈다. 또한, 임베디드 시스템 응용의 특성을 기반으로 "고신뢰 응용"과 "일반 응용"으로 나누는데 그 결과 총 4 개의 영역으로 임베디드 시스템 응용을 나눈다. 우리는 각 영역의 특징을 제시하고 임베디드 응용들의 사례를 제시하여 우리의 분류체계가 적절함을 보였다. 우리의 분류체계는 임베디드 시스템의 교수/학습법에 잘 활용될 수 있을 것이다.

Modified ECCD 및 문서별 범주 가중치를 이용한 문서 분류 시스템 (A Document Classification System Using Modified ECCD and Category Weight for each Document)

  • 한정석;박상용;이수원
    • 정보처리학회논문지B
    • /
    • 제19B권4호
    • /
    • pp.237-242
    • /
    • 2012
  • 웹 문서 정보 서비스는 관리자의 효율적 문서관리와 사용자의 문서검색 편의성을 위해 문서 분류 시스템을 필요로 한다. 기존의 문서 분류 시스템은 분류하고자 하는 문서 내 선택된 자질어의 개수가 적거나, 특정 범주의 문서 비율이 높아 그 범주에서 대부분의 자질어가 선택되어 모델이 생성된 경우 분류 정확도가 저하되는 문제점을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 'Modified ECCD' 기법 및 '문서별 범주 가중치' 특징 변수를 사용한 문서 분류 시스템을 제안한다. 실험 결과, 제안 방법인 'Modified ECCD' 기법이 ${\chi}^2$ 및 ECCD 기법에 비해 높은 분류 성능을 보였으며, '문서별 범주 가중치' 특징 변수를 'Modified ECCD' 기법으로 선택된 자질어 변수에 추가하여 학습하였을 경우에 더 높은 분류 성능을 보였다.