• 제목/요약/키워드: 자가 생성 지도 학습 알고리즘

검색결과 54건 처리시간 0.027초

데이터 분할 평가 진화알고리즘을 이용한 효율적인 퍼지 분류규칙의 생성 (Generation of Efficient Fuzzy Classification Rules Using Evolutionary Algorithm with Data Partition Evaluation)

  • 류정우;김성은;김명원
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.32-40
    • /
    • 2008
  • 데이터 속성 값이 연속적이고 애매할 때 퍼지 규칙으로 분류규칙을 표현하는 것은 매우 유용하면서도 효과적이다. 그러나 효과적인 퍼지 분류규칙을 생성하기 위한 소속함수를 결정하기는 어렵다. 본 논문에서는 진화알고리즘을 이용하여 효과적인 퍼지 분류규칙을 자동으로 생성하는 방법을 제안한다. 제안한 방법은 지도 군집화로 클래스 분포에 따라 초기 소속함수를 생성하고, 정확하고 간결한 규칙을 생성할 수 있도록 초기 소속함수를 진화시키는 방법이다. 또한 진화알고리즘의 시간에 대한 효율성을 높이기 위한 방법으로 데이터 분할 평가 진화 방법을 제안한다. 데이터 분할 평가 진화 방법은 전체 학습 데이터를 여러 개의 부분 학습 데이터들로 나누고 개체는 전체 학습 데이터 대신 부분 학습 데이터를 임의로 선택하여 평가하는 방법이다. UCI 벤치마크 데이터로 기존 방법과 비교 실험을 통해 평균적으로 제안한 방법이 효과적임을 보였다. 또한 KDD'99 Cup의 침입탐지 데이터에서 KDD'99 Cup 우승자에 비해 1.54% 향상된 인식률과 20.8% 절감된 탐지비용을 보였고 데이터 분할 평가 진화 방법으로 개체평가 시간을 약 70% 감소시켰다.

통계 언어모델 기반 객관식 빈칸 채우기 문제 생성 (Automatic Generation of Multiple-Choice Questions Based on Statistical Language Model)

  • 박영기
    • 정보교육학회논문지
    • /
    • 제20권2호
    • /
    • pp.197-206
    • /
    • 2016
  • 빈칸 채우기 문제는 학생들이 학습 내용을 제대로 이해했는지 확인하기 위해 널리 사용되어 왔다. 이런 유형의 문제를 컴퓨터 알고리즘에 의해 자동으로 생성하는 많은 방법들이 제안되어 왔지만, 대부분 어떤 부분을 빈칸으로 만들면 좋을지에 대해 집중했기 때문에 적절한 보기를 자동으로 생성하는 연구는 미흡했다. 본 논문에서는 빈칸이 주어졌다고 가정하고, 이에 어울리는 보기를 자동 생성하는 알고리즘을 제안한다. 본 알고리즘은 통계 언어 모델에 기반하여 보기를 생성하기 때문에, 사람이 생성하는 경우보다 출제자에 편향되지 않은 보기를 제공할 수 있다. 또, 확률값에 기반하여 난이도를 자동으로 조절하는 것이 가능하기 때문에, 직접 사람이 문제를 만드는 것에 비해 상당한 비용 절감 효과가 있다. TEPS 문법, 어휘 시험에 대해 적용하여 실험한 결과, 사람과 유사한 결과를 생성함을 확인하였다. 향후 스마트 교육 분야에서 높은 활용도를 보일 것으로 기대한다.

속성분할이 없는 향상된 협력학습 방법 (An Improved Co-training Method without Feature Split)

  • 이창환;이소민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1259-1265
    • /
    • 2004
  • 분류학습에서 높은 정확도를 유지하기 위해서는 충분한 분류 데이타가 필요하게 되는데 분류 데이타는 미 분류 데이타보다 생성하기가 어려운 경우가 많다. 따라서 미 분류 데이타를 활용하여 분류의 정확도를 향상시키는 것은 큰 효용성을 가지며 이러한 미 분류 데이타를 활용하는 대표적인 학습방법 중의 하나는 협력학습(co-training) 알고리즘이다. 이는 데이타를 두 개의 독립적인 속성그룹으로 나누어 두개의 분류자로 학습한 후 미 분류 데이타를 분류하고 그중 가장 신뢰성이 높은 데이타를 분류 데이터에 포함하고 이를 반복하는 학습모델이다. 하지만 이 방법은 전체 데이타의 속성을 독립적인 두개의 집합으로 분할하여야하는 제약이 있다. 따라서 본 연구에서는 이와 같은 문제점을 개선하여 보통의 데이터베이스에 적용시킬 수 있는 새로운 협력학습방법을 제시 하고자한다. 즉. 두 개의 독립적인 속성 그룹으로 나누는 가정을 따르지 않고 전체 속성을 사용할 수 있으며 두 개 이상의 분류자를 사용하는 새로운 협력학습방법을 제안하였다.

퍼지 분류자 시스템을 이용한 자율이동로봇의 충돌 회피학습 (Learning Rules for AMR of Collision Avoidance using Fuzzy Classifier System)

  • 반창봉;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제10권5호
    • /
    • pp.506-512
    • /
    • 2000
  • 본 논문에서는 연속적인 입력을 연속적인 출력으로 매핑하는 것을 가능하게 하는 퍼지 분류자 시스템을 제안한다. 퍼지 분류자 시스템은 기계학습의 방법중 하나인 분류자 시스템을 퍼지 제어기의 개념에 적용한 것이다. 즉 분류자의 조건부는 퍼지 규칙의 전건부와 행동부는 후건부와 같은 행태가 된다. 퍼지 분류자 시스템은 입력 값을 퍼지화된 메시지로 변환하고 메시지 리스트에 저장한다. 저장된 메시지와 퍼지 분류자 리스트의 분류자들과 정합과정을 통해 룰-베이스를 구성하고, 퍼지 분류자들의 유용성을 검증하기 우해 버킷 릴레이 알고리즘을 적용한다. 또한 새로운 규칙을 생성하거나 규칙을 수정하여 시스템의 성능을 향상시키기 위해 알고리즘을 사용한다. 이러한 과정을 통해 유용한 규칙집합을 찾아내고, 시스템은 그 규칙들에 의해 출력 값을 내보낸다. 제안된 퍼지 분류자 시스템을 자율이동로봇의 충돌 회피 학습에 적용하여 그 유용성을 확인하였다.

  • PDF

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

연합학습을 위한 패턴 및 그룹 기반 효율적인 분산 합의 최적화 (Efficient distributed consensus optimization based on patterns and groups for federated learning)

  • 강승주;천지영;노건태;정익래
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.73-85
    • /
    • 2022
  • 인공지능으로 자동화와 연결성이 극대화되는 4차 산업혁명 시대를 맞이하여 모델의 업데이트를 위한 데이터 수집과 활용의 중요성이 점차 높아지고 있다. 인공지능 기술을 사용하여 모델을 생성하기 위해서는 일반적으로 데이터를 한곳에 모아야 업데이트할 수 있으나, 이런 경우 사용자의 개인정보를 침해할 수 있다. 본 논문에서는 분산 저장된 데이터를 직접 공유하지 않으면서 서로 협력하여 모델을 업데이트할 수 있는 분산형 기계학습 방법인 연합학습을 소개하며, 기존의 서버 없이 참여자들 간의 분산 합의 최적화를 이루는 연구를 소개한다. 또한, Kirkman Triple System을 기반으로 한 패턴 및 그룹을 생성하는 알고리즘을 이용하며, 병렬적인 업데이트 및 통신을 하는 패턴 및 그룹 기반 분산 합의 최적화 알고리즘을 제안한다. 이러한 알고리즘은 기존의 분산 합의 최적화 알고리즘 이상의 프라이버시를 보장하며, 모델이 수렴할 때까지의 통신시간을 감소시킨다.

웨이브릿 이론을 이용한 퍼지-신경망 구조의 최적화 (The FNN Optimization Using The Wavelet Theory)

  • 김용택;서재용;연정흠;김종수;전홍태
    • 한국지능시스템학회논문지
    • /
    • 제10권6호
    • /
    • pp.591-596
    • /
    • 2000
  • 본 논문에서는, 퍼지 신경망 시스템에 대한 최적의 규칙 베이스의 생성과 초기화를 이루기 위하여 웨이브릿 이론을 기반으로 한 퍼지 신경망 구조를 제안한다. 제안한 웨이브릿 기반의 퍼지 신경망 구조(WFNN)에서는 퍼지-신경망에 대하여 웨이브렛 함수의 성질과 다운스트레칭 메카니즘에 의하여 초기의 최적 퍼지 규칙 베이스를 구성하고 은닉층의 노드 개수를 최적화시키며, 에러 역전파 알고리즘에 의하여 각 파라미터의 조절과 학습이 진행된다. 역진자 시스템에 대한 모의 실험을 통하여 제안한 웨이브릿 기반의 퍼지 신경망 제어 시스템의 우수성을 검증하였다.

  • PDF

U-learning 환경의 대용량 학습문서 판리를 위한 효율적인 점진적 문서 (An Effective Increment리 Content Clustering Method for the Large Documents in U-learning Environment)

  • 주길홍;최진탁
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.859-872
    • /
    • 2004
  • 컴퓨터와 통신 기술이 발전함에 따라 최근의 교육 환경은 학습자 스스로 학습 내용, 학습 시간 및 학습 순서를 선택하고 조직하는 유비쿼터스 학습 방향으로 나아가고 있다. 방대한 양의 학습정보들은 대부분 문서 형태로 관리되고 있기 때문에 문서 단위로 표현된 많은 정도들을 효과적으로 관리하고 검색하기 위한 방법의 연구가 필요하게 되었다. 문서 클러스터링은 문서간의 유사도를 바탕으로 서로 연관된 문서들을 군집화하여 문서틀을 주제별로 통합하는 방법으로 대용량의 문서들을 자통으로 분류하고, 검색하는 데 있어서 검색의 정확성을 증대시킬 수 있다. 따라서 본 논문에서는 새로운 학습 문서의 추가나 기존문서의 삭제로 인하여 군집화 대상이 되는 학습 문서 집합이 점진적으로 변화하는 환경을 위한 점진적 문서 클러스터링 알고리즘을 제안한다. 점진적 문서 클러스터링 알고리즘은 새로운 문서가 추가되었을 경우 문서 전체를 다시 클러스터링하지 않고. 이미 생성된 클러스터들의 구조를 적응적으로 변화시킴으로써 높은 효율성을 제공할 수 있다. 또한, 문서 글러스터링의 정확도극 높이기 위하여 통계적인 기법으로 불용어를 판별하여 제거하는 알고리즘을 제안한다.

  • PDF

동종 병렬기계에서 납기지연 최소화를 위한 혼합형 유전 알고리즘의 개발 (A Hybrid Genetic Algorithm for the Identical Parallel Machine Total Tardiness Problem)

  • 최홍진;이종영;박문원
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.624-627
    • /
    • 2004
  • 본 연구는 동일한 병렬기계에서의 총 납기지연의 합을 최소화하는 일정계획 문제에 대해 다룬다. 이 문제는 Lenstra et al. (1977)에 의해 NP-hard로 알려져 있으며, 작업의 수와 기계의 수가 큰 현실적 문제에 대해 적절한 시간 내에 최적해를 찾는다는 것은 사실상 불가능하다. 따라서 본 연구에서는 이 문제를 해결하기 위하여 혼합형 유전 알고리즘(hybrid genetic algorithm)을 제안한다. 혼합형 유전 알고리즘에서는 임의로 발생시킨 모집단에 대해 먼저 유전 알고리즘(genetic algorithm)이 세대를 진행하며 해를 개선한다. 유전 알고리즘이 일정기간동안 더 이상 해를 개선하지 못하면, 부분탐색 알고리즘(local-search algorithm))이 유전 알고리즘의 모집단의 개체들에 대해 해의 개선을 시도한다. 즉, 부분 탐색 알고리즘은 모집단 속의 각각의 개체를 초기해로 하여 모집단 내의 개체 수만큼의 부분 최적해(local optimum)들을 구한다. 이렇게 구한 부분 최적해들로 새로운 모집단을 구성하면 다시 유전 알고리즘이 진행된다. 이 과정을 종료조건에 이를 때까지 번갈아가며 반복 수행한다. 본 연구에서 제안한 유전 알고리즘에서는 Bean(1994)이 제안한 Random key 방법으로 개체를 표현하였으며 Park(2000)이 제안한 3가지 교차 연산자들을 채용하였다. 부분탐색 알고리즘을 위해서는 쌍대교환(pair-wise interchange) 방법을 통해 이웃해를 생성하였다. 선행실험을 통하여 제안한 혼합형 유전알고리즘에서 사용하는 다양한 모수(parameter)값들을 최적화하였으며 알고리즘의 성능을 비교하기 위하여 기존의 알고리즘과도 비교실험을 수행하였다.복적인 지표가 채택되는 경우를 포함하고 있다. 셋째는 추상적이며 측정이 어려운 지표를 채택하고 있는 경우이다. 여기에는 지표에 대한 정확한 정의가 이루어져 있지 않아 피 평가자가 불필요하거나 과다한 평가 자료를 준비해야 하거나 평가자로 하여금 평가 시 혼돈을 유발할 가능성이 있거나, 또는 상위개념의 평가항목과 하위개념의 평가항목이 혼재되어 구분이 모호한 경우를 포함하고 있다. 바탕으로 '생태적 합리성'이라는 체계적인 지식교육을 거쳐서, '환경정의' 의식의 제고로 이어가고, 굵직한 '환경갈등'의 상황에서 뚜렷한 정치적 태도와 실천을 할 수 있는 '생태적 인간상'의 육성으로 나아갈 수 있어야 한다는 것이 필자의 생각이다. 이를 위해서는 어찌되었건 체험학습 영역에서는 환경현안에 대한 사회적 실천을 '교육 소재'로 삼을 수 있어야 하며, 교과학습 영역에서는 한국사회의 환경현안에 대한 정치경제적 접근을 외면하지 말고 교과서 저작의 소재로 삼을 수 있어야 하며, 이는 '환경관리주의'와 '녹색소비'에 머물러 있는 '환경 지식교육'과 실천을 한단계 진전시키는 작업으로 이어질 것이다. 이후 10년의 환경교육은 바로 '생태적 합리성'과 '환경정의'라는 두 '화두'에 터하여 세워져야 한다.배액에서 약해를 보였으나, 25% 야자지방산의 경우 50 ${\sim}$ 100배액 어디에서도 액해를 보이지 않았다. 별도로 적용한 시험에서, 토마토의 경우에도 25% 야자지방산 비누 50 ${\sim}$ 100배액 모두 약해를 발생하지 않았으나, 오이에서는 25% 야자지방산 비누 100배액에도 약해를 나타내었다. 12. 이상의 결과, 천연지방산을 이용하여 유기농업에 허용되는 각종의 살충비누를 제조할 수 있었으

  • PDF

KHistory: 한국사 객관식 문제 자동 생성 시스템 (KHistory: A System for Automatic Generation of Multiple Choice Questions on the History of Korea)

  • 김성원;정해성;진재환;이명준
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권1호
    • /
    • pp.253-263
    • /
    • 2017
  • 최근 한국사에 필요성이 증대하고 사람들의 관심이 높아지면서, 한국사 학습을 위한 다양한 어플리케이션들이 등장하고 있다. 이러한 기존의 한국사 학습 어플리케이션은 문제은행 방식으로 사용자들에게 객관식 문제를 제공한다. 하지만 문제은행 방식은 미리 저장된 문제를 가져와 사용함으로써 계속 사용할 경우 중복되는 문제로 인하여 필연적으로 학습효율이 떨어지게 된다. 본 논문에서는 한국사 데이터베이스를 기반으로 한국사 학습문제를 자동적으로 생성하는 시스템인 K-History의 개발과 이를 활용한 한국사 학습 어플리케이션인 한국사 무한도전의 개발에 대하여 기술한다. K-History의 개발을 위하여 한국사 학습 교재를 바탕으로 다양한 한국사 학습 문제를 분석하여 학습문제의 대표 유형을 분류하고, 발견된 유형에 따라 문제를 생성하는 알고리즘을 제안한다. 개발된 한국사 학습문제 생성 기법은 다양한 학습 시스템에 적용되어 문제 생성을 위한 비용을 줄일 수 있으며, 다양하게 생성된 학습문제를 통하여 학습자의 학습효율을 높일 수 있을 것으로 기대된다.