• 제목/요약/키워드: 미니맥스 알고리즘

검색결과 5건 처리시간 0.019초

고누게임에서 최선의 수를 구하기 위한 가중치의 평가 (Evaluation of weights to get the best move in the Gonu game)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제18권5호
    • /
    • pp.59-66
    • /
    • 2018
  • 이 논문에서는 전통게임중 하나인 고누게임에 대한 구현과 실험이 수행된다. 고누게임을 구현하기 위한 기법으로 미니맥스알고리즘이 적용되었다. 미니맥스 알고리즘에 게임을 구현하기 위해 평가함수를 제안하였다. 고누게임의 구현 이후 성능향상을 위해 알파베타 가지치기에 대한 알고리즘의 효율성을 분석한다. 게임의 승패에 영향을 미치는 최적의 분석을 위해 가중치 분석이 수행되었다. 가중치 분석을 위하여, 사람과 컴퓨터의 대국, 컴퓨터와 컴퓨터의 대국으로 실험하였다. 그 결과 최적의 공격과 방어를 할 수 있는 가중치를 제시하였다.

미니맥스 알고리즘을 이용한 학습속도 개선을 위한 Q러닝 (Q-learning to improve learning speed using Minimax algorithm)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제18권4호
    • /
    • pp.99-106
    • /
    • 2018
  • 보드게임에서는 많은 경우의 수의 말들과 많은 상태공간들을 가지고 있다. 그러므로 게임은 학습을 오래 하여야 한다. 본 논문에서는 Q러닝 알고리즘을 이용했다. 그러나 강화학습은 학습초기에 학습속도가 느려지는 단점이 있다. 그러므로 학습을 하는 동안에 같은 최선의 값이 있을 때, 게임트리를 고려한 문제영역의 지식을 활용한 휴리스틱을 사용하여 학습의 속도향상을 시도하였다. 기존 구현된 말과 개선하여 구현된 말을 비교하기 위하여 보드게임을 제작했다. 그래서 일방적으로 공격하는 말과 승부를 겨루게 하였다. 개선된 말은 게임트리를 고려하여 상대방 말을 공격하였다. 실험결과 개선하여 구현된 말이 학습속도적인 면에서 향상됨 것을 알 수 있었다.

강화학습에서 점진적인 심화를 이용한 고누게임의 개선 (Improvement of the Gonu game using progressive deepening in reinforcement learning)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제20권6호
    • /
    • pp.23-30
    • /
    • 2020
  • 게임에서는 많은 경우의 수들을 가지고 있다. 그래서 학습을 많이 하여야 한다. 본 논문은 학습속도를 개선하기 위하여 강화학습을 이용했다. 그러나 강화학습은 많은 경우의 수들을 가지므로 학습 초기에 속도가 느려진다. 그래서 미니맥스 알고리즘을 이용하여 학습의 속도를 향상하였다. 개선된 성능을 비교하기 위해 고누게임을 제작하여 실험하였다. 실험결과는 승률은 높았지만, 동점의 결과가 발생하게 되었다. 점진적인 심화를 이용하여 게임트리를 더 탐색하여 동점인 경우를 줄이고 승률이 약 75% 향상되었다.

제약을 갖는 POMDP를 위한 점-기반 가치 반복 알고리즘 (Point-Based Value Iteration for Constrained POMDPs)

  • 김동호;이재송;김기응
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.286-289
    • /
    • 2011
  • 제약을 갖는 부분 관찰 의사결정 과정(Constrained Partially Observable Markov Decision Process; CPOMDP)는 정책이 제약(constraint)를 만족하면서 가치 함수를 최적화하도록 일반적인 부분 관찰 의사결정과정(POMDP)을 확장한 모델이다. CPOMDP는 제한된 자원을 가지거나 여러 개의 목적 함수를 가지는 문제를 자연스럽게 모델링할 수 있기 때문에 일반적인 POMDP에 비해 더 실용적인 장점을 가진다. 본 논문에서는 CPOMDP의 확률적 최적 정책 및 근사 최적 정책을 계산할 수 있는 최적 및 근사 동적 프로그래밍 알고리즘을 제안한다. 최적 알고리즘은 동적 프로그래밍의 각 단계마다 미니맥스 이차 제약 계획 문제를 계산해야 하는 반면에 근사 알고리즘은 선형 계획 문제만을 필요로 하는 점-기반(point-based) 가치 업데이트를 이용한다. 실험 결과, 확률적 정책이 결정적(deterministic) 정책보다 더 나은 성능을 보이며, 근사 알고리즘을 통해 계산 시간을 줄일 수 있음을 보였다.

이진트리 비 균일 필터뱅크를 이용한 잡음감소기법 및 구현 (A Noise De-Noising Technique using Binary-Tree Non-Uniform Filter Banks and Its Realization)

  • 손상욱;최훈;배현덕
    • 대한전자공학회논문지SP
    • /
    • 제44권5호
    • /
    • pp.94-102
    • /
    • 2007
  • 잠음감소에 있어서 웨이브렛 임계처리 알고리즘은 미니맥스 관점에서 거의 최적의 성능을 보이는 것으로 알려져 있다. 그러나 웨이브렛 임계처리 알고리즘은 웨이브렛 함수의 복잡성으로 인해 FPGA와 같은 하드웨어 상에 구현이 어렵다. 본 논문에서는 이진트리 구조 필터뱅크에서 전체 신호전력에 대한 각 부밴드 신호 전력비에 기반한 새로운 잡음감소 기법을 제안한다. 그리고 이 기법을 FPGA 상에 구현한다. 간단한 구현을 위해 필터뱅크는 하다마드 변환 계수로 설계된다. 시뮬레이션과 하드웨어 실험결과 제안방법이 간단하지만 웨이브렛에 기반한 소프트 임계처리 잡음감소 알고리즘과 성능이 유사함을 보인다.