• 제목/요약/키워드: 로봇 행동선택

검색결과 48건 처리시간 0.024초

에이전트의 최적 행동 생성을 위한 행동선택 네트워크의 계획 기능 (Planning Capability of Action Selection Network for Generating Optimal Behaviors of Agent)

  • 민현정;김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.473-475
    • /
    • 2003
  • 최근 빠른 시간에 행동을 표현할 수 있는 장점을 가진 반응형 시스템과 최적화된 시퀀스를 생성할 수 있는 계획에 기반만 시스템을 통합하기 위한 하이브리드 시스템의 연구가 활발히 진행되고 있다. 행동 네트워크 구조는 센서와 목적에 대한 외부연결과 행동들 사이의 내부연결을 통해 수동적으로 설계되지만. 자동적으로 행동을 생성할 수 있고 복잡한 문제에 적용할 수 있는 장점이 있다. 본 논문에서는 이동 에이전트의 행동을 생성하기 위한 최적화된 방법을 찾는 문제에 대해 이 행동 네트워크에 계획 기능을 부가함으로 행동 시퀀스를 최적화하는 방법을 제안한다. 행동 네트워크는 입력된 정보와 목적 정보를 가지고 다음에 수행할 행동을 선택하여 각 상황에 가장 높은 우선순위를 가지는 행동만을 선택한다. 이 행동 네트워크에서 선택된 모든 행동들을 몇 단계 앞서 수행시켜 가장 좋은 결과를 가져올 행동으로 다음의 행동을 선택하는 방법을 통하여 복잡하고 불확실한 환경에서 주어진 목표를 달성하기 위한 전체적인 최적 행동 시퀀스를 생성할 수 있다. Khepera 이동 로봇을 이용한 실험을 통해 제안한 행동 네트워크에 계획을 이용한 방법이 행동 네트워크 구조에서보다 더 적은 행동 시퀀스로 목적을 달성함을 알 수 있었다.

  • PDF

모듈형 행동선택네트워크를 이용한 거울뉴런과 마음이론 기반의 의도대응 모델 (An Intention-Response Model based on Mirror Neuron and Theory of Mind using Modular Behavior Selection Networks)

  • 채유정;조성배
    • 정보과학회 논문지
    • /
    • 제42권3호
    • /
    • pp.320-327
    • /
    • 2015
  • 최근 다양한 분야에 서비스 로봇이 상용화되고 있지만 대부분의 로봇 에이전트는 사용자의 구체적인 명령에 의존적이고, 불안정한 센서정보를 기반으로 환경변화에 빠르게 대응하여 목적을 달성하기는 어려운 문제가 있다. 이러한 문제를 해결하기 위해, 본 논문은 사람이 타인의 의도를 이해하고 대응하는 과정을 설명하는 거울뉴런(mirror neuron)과 마음이론(theory of mind) 시스템을 모델링하고 로봇에이전트에 적용하여 유용성을 입증한다. 제안하는 의도-대응 모델은 거울뉴런의 빠르고 직관적인 대응행동과 중간목적 지향적인 특성을 구현하기 위해, 환경과 목적을 고려하는 행동선택 네트워크(behavior selection network)를 사용한다. 또한, 장기적인 행동계획을 기반으로 대응행동을 수행하는 마음이론 시스템을 수행하기 위해, 계층적 계획생성 기법을 이용하여 중간목적 단위로 행동을 계획하고 이를 기반으로 행동선택네트워크 모듈을 제어한다. 다양한 시나리오에 대해 실험한 결과 외부자극에 적절한 대응행동이 생성됨을 확인하였다.

인공 면역 시스템과 분산 유전자 알고리즘에 기반한 자율 분산 로봇 시스템 (Distributed Autonomous Robotic System based on Artificial Immune system and Distributed Genetic Algorithm)

  • 심귀보;황철민
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.164-170
    • /
    • 2004
  • 본 논문에서는 인공 면역 시스템과 분산 유전자 알고리즘에 기반하여 동작하는 자율분산로봇 시스템을 제안한다. 시스템에서 로봇들의 행동은 전역행동과 지역행동으로 분류된다. 전역행동은 환경에서 작업을 탐색하는데 이를 빠르게 수행하기 위하여 집합과 분산의 두 가지 행동으로 이루어져 있다. 이때 인공 면역 시스템은 로봇이 어떤 행동을 선택하여 행동할 것인가를 결정한다. 지역행동은 탐색된 작업을 수행하는 부분으로서 어떤 로봇들이 협조행동을 할지를 학습하고, 학습한 결과에 따라 작업을 수행하는 행동을 한다. 이를 위해 분산 유전자 알고리즘을 이용하여 각 로봇들은 주어진 작업에 대하여 학습을 한다. 제안된 시스템에서 학습 알고리즘은 주어지는 작업의 변화로봇들은 주어진 작업을 수행하기 위해 학습을 하고, 주어진 작업이 변할 경우 스스로 대처한다는 면에서 기존의 자율 분산 시스템보다 적응성에서 향상된 시스템이다.

행동기반 AI를 이용한 슈팅게임 캐릭터의 적응형 행동생성 (Creating Adaptive Behaviors for Shooting Game Characters Behavior-based Artificial Intelligence)

  • 구자민;홍진혁;조성배
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.89-92
    • /
    • 2004
  • 로보코드는 사용자가 직접 제작할 수 있는 슈팅게임 환경으로서, 이를 이용한 경진대회가 개최되고 있다. 매우 다양한 작전을 구사하는 로봇들이 인터넷을 통해 공개되지만, 대부분의 전략은 사람이 직접 설계하여 행동이 단순하고, 변화하는 환경에 따라 행동을 구사하는데에 어려움을 가지고 있다. 이로 인해 아무리 훌륭한 전략을 가지고 있더라도 환경적 요소에 따라 예상치 못한 이벤트가 발생했을 경우 적절한 행동을 선택하여 행하기가 어렵다. 본 논문에서는 동적인 환경에서 적절한 행동을 선택하는 행동선택 네트워크를 이용하여 상대 전략에 따라 적절한 행동을 선택하는 방법을 제안하고 로보코드에 적용하여 실험하였다. 실험결과, 상대 탱크의 전략에 따라 다양한 행동들을 자동으로 선택하였으며, 경기 결과로 그 전략의 우수성이 입증되었다.

  • PDF

분류자 시스템과 인공면역네트워크를 이용한 자율 분산 로봇시스템 개발 (Development of Distributed Autonomous Robotic Systerrt Based on Classifier System and Artificial Immune Network)

  • 심귀보;황철민
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.699-704
    • /
    • 2004
  • 본 논문에서는 인공 면역 시스템과 분류자 시스템에 기반하여 동작하는 자율분산로봇 시스템을 제안한다. 시스템에서 로봇들의 행동은 전역행동과 지역행동으로 분류된다. 전역행동은 환경에서 작업을 탐색하는데 이를 빠르게 수행하기 위하여 집합과 분산의 두 가지 행동으로 이루어져 있다 이때 인공 면역 시스템은 로봇이 어떤 행동을 선택하여 행동할 것인가를 결정한다. 지역행동은 탐색된 작업을 수행하는 부분으로서 어떤 로봇들이 협조행동을 할지를 학습하고, 학습한 결과에 따라 작업을 수행하는 행동을 한다. 이를 위해 분류자 시스템을 이용하여 각 로봇들은 주어진 작업에 대하여 학습을 한다. 제안된 시스템에서 학습 알고리즘은 주어지는 작업의 변화로봇들은 주어진 작업을 수행하기 위해 학습을 하고, 주어진 작업이 변할 경우 스스로 대처한다는 면에서 기존의 자율 분산 시스템보다 적응성에서 향상된 시스템이다.

다중 에이전트 강화 학습을 위한 상태 공간 타일링과 확률적 행동 선택 (State Space Tiling and Probabilistic Action Selection for Multi-Agent Reinforcement Learning)

  • 권기덕;김인철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.106-108
    • /
    • 2006
  • 강화 학습은 누적 보상 값을 최대화할 수 있는 행동 선택 전략을 학습하는 온라인 학습의 한 형태이다. 효과적인 강화학습을 위해 학습 에이전트가 매 순간 고민해야 하는 문제가 탐험(exploitation)과 탐색(exploration)의 문제이다. 경험과 학습이 충분치 않은 상태의 에이전트는 어느 정도의 보상 값을 보장하는 과거에 경험한 행동을 선택하느냐 아니면 보상 값을 예측할 수 없는 새로운 행동을 시도해봄으로써 학습의 폭을 넓힐 것이냐를 고민하게 된다. 특히 단일 에이전트에 비해 상태공간과 행동공간이 더욱 커지는 다중 에이전트 시스템의 경우, 효과적인 강화학습을 위해서는 상태 공간 축소방법과 더불어 탐색의 기회가 많은 행동 선택 전략이 마련되어야 한다. 본 논문에서는 로봇축구 Keepaway를 위한 효율적인 다중 에이전트 강화학습 방법을 설명한다. 이 방법의 특징은 상태 공간 축소를 위해 함수근사방법의 하나인 타일 코딩을 적용하였고, 다양한 행동 선택을 위해 룰렛 휠 선택 전략을 적용한 것이다. 본 논문에서는 이 방법의 효과를 입증하기 위한 실험결과를 소개한다.

  • PDF

목적과 사양이 다른 다양한 인간 친화 로봇에 적용하기 위한 감성 행동 생성 방법 및 범용성 실험 (Emotional Behavior Decision Method and Its Experiments of Generality for Applying to Various Social Robot Systems)

  • 안호석;최진영;이동욱
    • 전자공학회논문지SC
    • /
    • 제48권4호
    • /
    • pp.54-62
    • /
    • 2011
  • 감성 행동을 표현하는 것은 인간 친화 로봇의 필수 요소 중 하나이다. 하지만 감성 행동은 로봇의 목적이나 사양에 따라서 달라지기 때문에 감성 행동을 생성하고 표현하는 방법은 로봇마다 다르다. 따라서 본 논문에서는 로봇의 목적이나 사양에 상관없이 다양한 인간 친화 로봇에 적용될 수 있는 감성 행동 생성 방법을 제안한다. 먼저 감성 행동 생성 방법의 입력 값으로 다중 감정값을 이용한다. 다중 감정 공간을 이용하여 각 감정이 독립적으로 존재할 수 있기 때문에 로봇의 목적에 따라 사용하고자 하는 감정을 취사선택할 수 있다. 로봇의 사양에 따라서 표현할 수 있는 방법이 다르므로, 로봇의 표현 부위를 나누고, 각 표현 부위별로 표현할 수 있는 행동을 데이터화한다. 이렇게 나누어진 행동들을 단위 행동이라고 정의하며, 각 단위 행동이 표현할 수 있는 감정에 대한 반영도를 결정한다. 그리고 이를 이용하여 주어진 다중 감정값에 최적화된 단위 행동 조합을 결정한다. 이 과정을 사양과 목적이 다른 사이버 로봇 시뮬레이터, 3D 캐릭터 헤드 로봇, 기계적인 설계 기반의 헤드 로봇 등에 적용함으로써 제안한 방법의 범용성을 실험한다.

신경망을 이용한 감정추론 모델 (The Emotion Inference Model Bassed using Neural Network)

  • 김상헌;정재영;이원호;이형우;노태정
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.309-312
    • /
    • 2004
  • 본 논문에서는 인간과 로봇의 상호작용을 위해 감정에 기반한 감정 처리 모델을 설계하였다. 감정 재현 기술은 사용자에게 친근감을 주기 위해 로봇 시스템이 제스처, 표정을 통하여 사람이나 동물의 감성과 동작을 표현하는 분야이다. 로봇이 감정을 표현하는 문제에는 많은 심리학적, 해부학적, 공학적 문제가 관련된다. 여러가지 애매모호한 상황임에 불구하고 심리학자인 Ekman과 Friesen에 의해 사람의 여섯 가지 기본 표정이 놀람, 공포, 혐오, 행복감, 두려움, 슬픔은 문화에 영향을 받지 않고 공통적으로 인식되는 보편성을 가지고 있는 것으로 연구됐다. 사람의 행동에 대한 로봇의 반응이 학습되어 감정모델이 결정되고, 그 결과가 행동결정에 영향을 주어 로봇의 행동에 반영되도록 하였다. 본 논문에서는 인간과 로봇과의 상호작용을 통해 정보를 축적하고 인간의 반응에 적응해나 갈 수 있는 감정 처리 모델을 제안한다.

  • PDF

추론 이론과 퍼지 이론 결합에 의한 자율 이동 로봇의 지도 구축 및 안전한 네비게이션에 관한 연구 (A Study on The Automatic Map Building and Reliable Navigation of Combining Fuzzy Logic and Inference Theory)

  • 김영철;조성배;오상록;유범재
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 D
    • /
    • pp.2744-2746
    • /
    • 2001
  • 이 논문에서는 이동 로봇을 위하여 퍼지이론과 Dempster-Shafer 이론을 이용한 불확실한 환경에서의 센서기반 네비게이션 방법을 제안한다. 제안된 제어기는 장애물 회피 동작과 목적지 찾기 동작을 위한 2개의 행동 모듈로 구성되어 있다. 2개의 행동 모듈은 각각 퍼지 이론으로 학습되었고, 적절한 행동 선택 방법으로 선택되게끔 하였다. 견고한 퍼지 제어기를 가진 로봇이 실험 환경내에서 안전하게 움직이기 위하여 자동으로 지도를 구축(Map Building) 하도록 하였다. 이 실험에서 구성된 맵은 평면상의 격자를 중심으로 작성되었고 로봇의 센서에서 읽어들인 센서 값은 D-S 추론 이론을 이용하여 기존의 맵과 혼합되어진다. 즉, 로봇이 움직일때 마다 실험 환경내에서 새로운 정보를 읽어 들이고, 그 정보로 인하여 기존의 지도가 새로운 지도로 갱신되는 것이다. 이러한 작업을 거치면서 로봇은 장애물과 충돌없이 배회하는 것 뿐 아니라 설정된 목적지까지도 쉽게 찾아갈 수가 있다. 실험에 대한 안정성과 확신을 검증 받기 위하여 실제 로봇에 적용하기보다는 먼저 이동 로봇의 시뮬레이션으로 실험 해 보고자 한다.

  • PDF

고차원 행동구현을 위한 행동 네트워크와 규칙기반 결합방식의 비교 (A Comparison of Behavior Network and Rule-based Integration Method for Higher-level Behavior Implementation)

  • 김경중;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.551-554
    • /
    • 2001
  • 분산 인공지능 분야에서는 여러 개의 기본 객체들이 상호작용을 통해 원하는 작업을 수행하는데, 그 한 예로 행동기반 이동로봇 제어 시스템을 들 수 있다. 이것은 여러 개의 기본 행동 모듈을 개발한 후, 적절한 조정방법을 사용하여 어려운 문제를 해결하며, 행동 네트워크는 행동 모듈들간의 협력과 억제를 모델링 하여 주어진 작업을 달성하도록 행동들의 실행순서를 조정하는 방법중의 하나이다. 정적으로 행동을 선택하는 규칙기반 결합 방법과는 달리 목표에 기반 하여 행동 네트워크는 다양한 행동들의 실행순서를 동적으로 선택한다는 장점이 있다. 본 논문에서는 진화 방식으로 설계된 기본 행동 모듈을 행동 네트워크와 규칙기반 방법으로 선택하는 실험을 수행하며, 그 결과 행동 네트워크가 변화하는 환경에서도 좋은 성능을 보인다는 사실을 확인할 수 있었다.

  • PDF