• 제목/요약/키워드: 예제

검색결과 2,134건 처리시간 0.029초

능동적 학습을 위한 복수 문의예제 선정 (Selecting Multiple Query Examples for Active Learning)

  • 강재호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.541-543
    • /
    • 2004
  • 능동적 학습(active learning)은 제한된 시간과 인력으로 가능한 정확도가 높은 분류기(classifier)를 생성하기 위하여, 훈련집합에 추가할 예제 즉 문의예제(query example)의 선정과 확장된 훈련집합으로 다시 학습하는 과정을 반복하여 수행한다. 능동적 학습의 핵심은 사용자에게 카테고리(category) 부여를 요청할 문의예제를 선정하는 과정에 있다. 효과적인 문의예제를 선정하기 위하여 다양한 방안들이 제안되었으나, 이들은 매 문의단계마다 하나의 문의예제를 선정하는 경우에 가장 적합하도록 고안되었다. 능동적 학습이 복수의 예제를 사용자에게 문의할 수 있다면, 사용자는 문의예제들을 서로 비교해 가면서 작업할 수 있으므로 카테고리 부여작업을 보다 빠르고 정확하게 수행할 수 있을 것이다. 또한 충분한 인력을 보유한 상황에서는, 카테고리 부여작업을 병렬로 처리할 수 있어 전반적인 학습시간의 단축에 큰 도움이 될 것이다. 하지만, 각 예제의 문의예제로써의 적합 정도를 추정하면 유사한 예제들은 서로 비슷한 수준으로 평가되므로, 기존의 방안들을 복수의 문의예제 선정작업에 그대로 적용할 경우, 유사한 예제들이 문의예제로 동시에 선정되어 능동적 학습의 효율이 저하되는 현상이 나타날 수 있다. 본 논문에서는 특정 예제를 문의예제로 선정하면 이와 일정 수준이상 유사한 예제들은 해당 예제와 함께 문의예제로 선정하지 않음으로써, 이러한 문제점을 극복할 수 있는 방안을 제안한다. 제안한 방안을 문서분류 문제에 적용해 본 결과 기존 문의예제 선정방안으로 복수 문의예제를 선정할 때 발생할 수 있는 문제점을 상당히 완화시킬 있을 뿐 아니라, 복수의 문의예제를 선정하더라도 각 문의 단계마다 하나의 예제를 선정하는 경우에 비해 큰 성능의 저하가 없음을 실험적으로 확인하였다./$m\ell$로 나타났다.TEX>${HCO_3}^-$ 이온의 탈착은 서서히 진행되었다. R&D investment increases are directly not liked to R&D productivities because of delays and side effects during transition periods between different stages of technology development. Thus, It is necessary to develope strategies in order to enhance efficiency of technological development process by perceiving the switching pattern. 기여할 수 있을 것으로 기대된다. 것이다.'ity, and warm water discharges from a power plant, etc.h to the way to dispose heavy water adsorbent. Through this we could reduce solid waste products and the expense of permanent disposal of radioactive waste products and also we could contribute nuclear power plant run safely. According to the result we could keep the best condition of radiation safety super vision and we could help people believe in safety with Radioactivity wastes control for harmony with Environ

  • PDF

군집화 기법을 이용한 능동적 학습의 최초학습예제 선정 (Selecting Initial Training Set for Active Learning by Clustering)

  • 강재호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.16-18
    • /
    • 2003
  • 기계학습의 분류(classification) 기술을 실제 문제에 적용하기 위해서는 카테고리(category)를 부여한 학습예제를 상당수 준비하여야 한다. 예제에 카테고리를 부여(labeling)하는 작업에는 무시할 수 없는 시간과 인력을 필요로 한다. 능동적 학습(active learning)은 동일한 수의 학습예제로 최대한의 성능을 달성하기 위하여 카테고리를 부여할 학습예제를 선별하는 전략이다. 능동적 학습은 현재까지 파악된 정보에 기반하여 분류기(classifier)를 생성하고, 생성된 분류기를 활용하여 카테고리를 부여받았을 때 가장 이득이 큰 예제들을 선정하여 사용자에게 문의하는 과정을 반복하여 수행한다. 만일 능동적 학습의 첫 학습단계에서 학습에 보다 유용한 예제들을 최초학습예제집합으로 선정한다면 같은 수의 학습예제로 더 나은 성능을 달성할 수 있을 것이다. 본 논문에서는 유사한 예제들은 동일한 카테고리에 속할 가능성이 높다는 일반적인 가정에 기반하여 예제들을 군집화(clustering)한 후, 생성된 각 군집을 대표할 수 있는 예제로 최초학습예제집합으로 구성하는 방안을 제안한다. 제안한 방안을 문서분류 문제를 대상으로 실험해 본 결과 최초학습예제들을 임의로 선정하는 방식보다 정확도가 높은 분류기를 생성할 수 있음을 확인하였다.

  • PDF

능동적 학습을 위한 군집화 기반 복수 문의 예제 선정

  • 강재호;류광렬;권혁철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.240-249
    • /
    • 2005
  • 사용자 맞춤 서비스를 위하여 온라인상에서 사용자의 관심 분야를 파악하고자 하는 경우에는 적은 수의 훈련 예제로 효율적인 학습이 가능한 능동적 학습이 적절하다. 능동적 학습을 효과적으로 적용하기 위하여 사용자에게 문의할 가치가 높은 예제를 선정하는 것도 중요하지만, 사용자 편의를 위해서는 문의 횟수를 가능한 최소화하여야 한다. 문의 횟수를 줄이면서도 많은 수의 훈련 예제를 획득하기 위해서는 복수의 문의 예제들을 사용자에게 한꺼번에 제시하고 그 관심 여부를 표한하게 하는 것이 효과적이다. 본 논문에서는 능동적 학습 적용 시 사용자에게 문의할 가치가 높은 복수 문의 예제들을 효과적으로 선정하기 위하여 가중치 반영 군집화를 적용하는 방안을 제안한다. 본 제안 방안은 먼저 각 예제의 문의 예제로서의 가치를 파악하고 이를 가중치로 삼아 군집화를 수행하여 상대적으로 유사한 예제들의 집합을 구성한다. 이어서 생성된 각각의 군집에서 가장 보편적인 예제를 문의 예제로 선정하면 선정된 각각의 문의 예지는 문의할 가치가 높으면서 함께 문의하게 될 예제들은 서로 충분히 달라 학습에 보다 유용하게 사용할 수 있는 훈련 예제들을 얻을 수 있다. 문서 분류 문제를 대상으로 본 제안 방안을 실험한 결과, 단순히 문의 가치가 높은 복수의 예제들을 함께 문의할 예제들로 선정하는 방안에 비해 학습 성능이 뛰어났으며, 한 번에 문의하는 예제 수를 증가시키더라도 분류기의 성능 저하가 적음을 확인하였다.

  • PDF

군집화 기법을 이용한 준감독 군집화의 훈련예제 선정 (Selecting Examples to Be Labeled for Semi-Supervised Clustering Using Cluster-Based Sampling)

  • 김종성;강재호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.646-648
    • /
    • 2004
  • 기계학습의 군집화(clustering) 기법은 예제들 간의 유사성에 근거하여 주어진 예제들을 무리 짓는 방법이다. 준감독(semi-supervised) 군집화는 카테고리가 부여된(labeled) 소수의 예제들을 적극적으로 활용하여 군집형태가 보다 자연스럽게 형성되도록 유도하는 군집화 방법이다. 준감독 군집화 문제에서 예제에 카테고리를 부여하는 작업은 현실적으로 극히 제한적이거나 카테고리를 부여하는데 소요되는 비용이 상당하므로, 제한된 자원 내에서 군집화에 효용성이 높을 예제들을 선정하여 카테고리를 부여하는 것이 필요하다. 본 논문에서는 기존 연구에서 능동적 학습의 초기 훈련예제 선정을 위해 제안된 군집기반 훈련예제 선정 방법을 준감독 군집화에 적용하여 군집 결과의 질을 향상시키고자 한다. 군집화를 이용한 예제 선정 방법은 유사한 예제들은 동일한 카테고리에 속할 가능성이 높다는 가정하에 전체 예제를 활용하여 선정하고자 하는 예제 수만큼 군집을 생성 한 후. 각 군집의 중심점에 가장 가까운 예제들을 대표 예제로 선정하여 훈련 집합을 구성하는 방법이다 본 논문에서는 문서를 대상으로 하는 준감독 군집화 실험을 통해, 카테고리를 부여할 예제를 임의로 선정한 경우에 비해 군집화를 이용한 훈련 예제들로 준감독 군집화를 수행한 경우가 보다 좋은 군집을 형성함을 확인하였다.

  • PDF

가상예제를 이용한 $Na{\ddot{i}}ve$ Bayes 분류기 성능 향상 (Improving Performance for $Na{\ddot{i}}ve$ Bayes Classifier Using Virtual Examples)

  • 이유정;강병호;강재호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.655-657
    • /
    • 2005
  • 기계학습에서 분류는 훈련 예제들로 학습하여 생성한 분류기를 활용하여 새로운 예제에 어느 한 범주를 부여하는 것을 말한다. 일반적으로 분류의 성능 즉 정확도의 향상은 학습 알고리즘을 개선하거나 훈련예제 집합을 변형시킴으로써 가능하다. 본 논문에서 소개하는 가상예제를 이용한 분류기 성능 향상 방안은 후자에 속한다. 실세계 분류문제에서 많은 수의 훈련예제들을 수집하는 일은 대상문제에 따라 비용이 많이 드는 경우가 있다. 또한 적은 수의 훈련예제를 학습해 생성한 분류기는 분류성능이 좋지 않을 수 있다. 본 논문에서는 이런 문제를 해결하기 위해서 가상예제를 생성해 훈련예제 집합에 추가하는 방안을 제안하고자 한다. 가상예제를 이용한 분류성능 향상방안이 $Na{\ddot{i}}ve$ Bayes 학습 알고리즘 성능 개선에 효과가 있음을 실험을 통해 확인하였다.

  • PDF

병합된 예제를 이용한 자동차 번호판 문자 인식 (Character Recognition in License Plate Using Merged Examples)

  • 김종성;박태진;강재호;백남철;강원의;이상협;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.238-240
    • /
    • 2004
  • 경제 성장과 생활 수준의 향상으로 인한 자동차 수의 증가는 않은 문제를 발생시키고 있다 제한된 인력과 비용으로 효율적인 자동차 관리를 위한 연구 분야 중에서 자동차 번호판 인식 (Vehicle Plate Recognition) 기술은 법규위반의 식별, 통행료 징수, 납세, 도난.도주 차량 확인 및 주차 관리 등의 않은 분야에 응용되고 있다. 자동차 번호판 문자 인식 문제와 같이 훈련 예제 수집 비용이 많이 드는 경우에 제한된 수의 훈련 예제를 최대한 활용하여 분류 성능을 향상시키기 위한 방안 중 하나로, 수집된 훈련 예제들로부터 가상의 예제를 생성하고, 생성된 가상 예제를 훈련 예제로 추가하여 학습하는 절러 연구가 수행된 바 있다. 본 논문에서는 자동차 번호판 문자 인식의 성능 향상을 위친 수집된 예제들을 적절히 병합하여 가상의 예제를 생성하는 방안에 관해 기술하고, 문자 인식 분야에서 일반적으로 많이 사용되는 여러 알고리즘에 대하여 다양한 가상 예제 생성 방안 및 다양한 생성 비율 따른 실험을 통해 그 효용성을 확인하였다

  • PDF

예제가 프로그래밍 언어의 학습과정에 미치는 영향 (The Impacts of Examples On the Learning Process of Programming Languages)

  • 김진수;김진우
    • 인지과학
    • /
    • 제11권2호
    • /
    • pp.19-35
    • /
    • 2000
  • 예제에 의한 학습은 프로그래밍 언어를 포함한 다양한 주제들을 숙지하는데 효과적인 방법으로 밝혀져 왔다. 그러나 어떤 예제를 어떻게 제공하는 것이 바람직한가에 대한 보다 심층적인 연구는 많지 않다. 본 연구는 예제가 제시되는 방식과 제시되는 예제의 형태가 예제에 의한 프로그래밍 언어의 학습 성과에 영향을 미치는 두 가지 중요한 차원이라는 가설을 세웠다. 이 가설들을 자바 프로그래밍 언어의 학습 과정을 통하여 검증하기 위하여 컴퓨터 상에서 실험을 실시하였다. 예제의 제시 방식에서는 두 종류의 예제들을 부가적 설명 없이 제공하는 것이 부가적 설명과 함께 하나의 예제를 제공하는 것보다 더 효과적이라는 결과를 얻었다. 예제의 형태에서는 두 종류의 예제를 제공받았더라고 두 예제가 주어진 과제와 기능적으로 유사한 경우가 기능적으로 상이한 경우보다 더 나은 수행 결과를 나타냈다. 이와 같은 수행 결과의 차이에 대한 이유를 밝히기 위해 개별 피험자들의 프로그래밍 행동의 유형을 시간과 빈도의 관점에서 분석하였으며 또한 피험자들의 행위에 대한 보다 체계적인 설명을 위하여 GOMS 모델을 제시하였다. 결론적으로, 본 연구의 결과들은 프로그래밍 언어를 효과적으로 지도할 수 있는 교육 시스템 개발에 기여할 수 있을 것으로 기대된다.

  • PDF

훈련예제 병합을 이용한 자동차 차량번호판 문자인식 성능 향상 방안 (Vehicle License Plate Recognition Using the Training Data's Annexation)

  • 백남철;이상협;류광렬
    • 대한토목학회논문집
    • /
    • 제26권3D호
    • /
    • pp.349-352
    • /
    • 2006
  • 자동차 수의 급증으로 야기되는 교통혼잡, 교통사고, 주차난 등의 많은 문제에 효율적으로 대응하기 위해서는 제한된 인력과 비용을 사용하는 자동차 관리가 필수적인데 이를 위한 많은 연구들이 국내외적으로 현재 진행되고 있다. 현재 진행되고 있는 여러 연구 분야 중에서 특히 자동차의 차량번호판인식 기술은 법규위반 차량 식별, 통행료 징수, 자동차세 징수, 도난 도주 차량 확인 및 주차 관리 등의 많은 분야에 응용되고 있다. 자동차의 차량번호판 문자 인식 문제와 같이 훈련예제 수집 비용이 많이 드는 경우에 제한된 수의 훈련예제를 최대한 활용하여 분류성능을 향상시키기 위한 방안의 하나로, 수집된 훈련예제들로부터 가상의 예제를 생성하고, 생성된 가상예제를 훈련예제로 추가하여 학습하는 여러 연구가 수행된 바 있다. 본 논문에서는 차량번호판 문자 인식의 성능 향상을 위해 수집된 예제들을 적절히 병합하여 가상의 예제를 생성하는 방안에 관해 기술하고, 문자인식 분야에서 일반적으로 많이 사용되는 여러 알고리즘에 대하여 다양한 가상예제 생성방안 및 다양한 생성비율에 따른 실험을 통해 그 효용성을 확인한다.

가상예제를 이용한 수치 및 범주 속성 데이터의 분류 성능 향상 (Improving Classification Accuracy for Numerical and Nominal Data using Virtual Examples)

  • 이유정;강재호;강병호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.183-188
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크를 기반으로 생성하고 평가한 가상예제를 활용하여 범주속성 및 수치속성 데이터에 대한 분류 성능을 향상시키는 방안을 제안한다. 가상예제를 활용하는 종래의 연구들은 주로 수치 속성 데이터를 대상으로 한 반면 본 연구에서는 범주속성 데이터에 대해서도 가상예제를 적용하여 효과를 확인하였다. 그리고 대상 도메인에 특화된 지식을 활용하여 특정 학습 알고리즘의 성능을 향상시키는 것을 목표로 한 기존 연구들과는 달리 본 연구에서는 도메인에 특화된 지식을 활용하는 대신 주어진 훈련 집합을 기반으로 만든 베이지안 네트워크로부터 가상예제를 생성하고, 그 예제가 네트워크의 조건부 우도를 증가시키는데 기여할 경우 유용한 것으로 선별한다. 이러한 생성 및 선별과정을 반복하여 적절한 크기의 가상예제 집합을 수집하여 사용한다. 범주 속성 데이터와 수치 속성을 포함한 데이터를 대상으로 한 실험 결과, 여러 가지 학습 모델의 성능이 향상됨을 확인하였다.

  • PDF

적대적 예제에 강건한 한국어 패러프레이즈 문장 인식 모델 (Korean Paraphrase Sentence Recognition Model Robust Against Adversarial Examples)

  • 김민호;허정;김현;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.453-454
    • /
    • 2020
  • 본 연구는 적대적 예제에 강건한 한국어 패러프레이즈 문장 인식 기술을 다룬다. 구글에서 적대적 예제를 포함하는 PAWS-X 다국어 말뭉치를 공개하였다. 이로써, 한국어에서도 적대적 예제를 다룰 수 있는 실마리가 제공되었다. PAWS-X는 개체 교환형을 대표로 하는 적대적 예제를 포함하고 있다. 이 말뭉치만으로도 개체 교환형 이외의 적대적 예제 타입을 위한 인식 모델을 구축할 수 있을지, 다앙한 타입의 실(real) 패러프레이즈 문장 인식에서도 적용할 수 있는지, 학습에 추가적인 타입의 패러프레이즈 데이터가 필요한지 등에 대해 다양한 실험을 통해 알아보고자 한다.

  • PDF