• 제목/요약/키워드: 로봇 행동선택

검색결과 48건 처리시간 0.02초

비디오 에스노그래피를 이용한 서비스 로봇의 대기상태 행동패턴 연구 (The Behavioral Patterns of Neutral Affective State for Service Robot Using Video Ethnography)

  • 송현수;김민중;정상훈;석현정;권동수;김명석
    • 감성과학
    • /
    • 제11권4호
    • /
    • pp.629-636
    • /
    • 2008
  • 현재 진행되고 있는 대부분의 로봇 연구는 특정한 목적을 수행함에 있어서 기능적으로 안정적이고 원활한 움직임을 보이는 것과 더불어 사용자가 원하는 정보를 적절하게 전달하는 것에 초점을 맞춰 진행하고 있다. 본 논문에서는 로봇의 작업수행 상태가 아닌 외부로부터 입력 값이 없는 대기상태의 행동패턴을 제시하여 보다 자연스러운 인간-로봇 상호작용을 제시하고자 하였다. 로봇의 대기상태 행동패턴을 디자인함에 있어서 비디오 판독 방법을 선택하였고, 실제 서비스업에 종사하는 10명의 사람들을 비디오로 녹화하여 사람들과 상호작용이 없는 대기상태의 반복적인 행동패턴을 관찰하였다. 각각의 비디오 데이터로부터 총 21개의 반복적 행동을 기록하였고, 비슷한 항목들을 통합하여 최종적으로 11개의 행동패턴을 추출하였다. 추출된 패턴들 가운데 6개의 대표적인 행동들을 EEEX라는 로봇에 적합하도록 인코딩 작업을 하였고, 이것들이 사람들에게 올바르게 인식되는지를 확인하기 위하여 검증실험을 수행하였다. 사람들은 대부분의 로봇 행동패턴을 실험에서 의도한 바와 같이 인식하였으나 로봇의 하드웨어 특성상 몸과 팔의 움직임에서 약간의 혼동 요소가 있었다. 추후 실험을 통해 EEEX를 대형 마트의 입구에 실제로 배치하여 대기 중에 중립행동을 보일 때와 보이지 않을 때의 손님의 관심도 차이를 조사해보고자 한다.

  • PDF

다 개체 로봇의 협업기법에 관한 연구 (A Collaboration Method to Confine a Robot with Multiple Robots)

  • 최준용;김동환;이귀형
    • 대한기계학회논문집A
    • /
    • 제34권8호
    • /
    • pp.953-964
    • /
    • 2010
  • 이 연구에서는 다 개체 로봇에 의해 하나의 로봇을 자율적으로 포획하는 협업제어에 관한 연구를 제안한다. 제안된 방안은 각 로봇에 대한 작업역할을 지정하는 역할 분류기, 단일 로봇의 행동 선택기 그리고 복잡한 상황을 대처하는 협업관리기로 구성되어 있다. 이 연구에서는 주변의 다개체 로봇의 다양한 행동을 통하여 단위 로봇을 특정지역으로 몰아가는 결과를 시뮬레이션을 통하여 그 적절성을 검증하였다.

복잡한 행동을 위한 셀룰라 오토마타 기반 신경망 모듈의 동적선택 (Dynamic Selection of Neural Network Modules based on Cellular Automata for Complex Behaviors)

  • 김경중;조성배
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권4호
    • /
    • pp.160-166
    • /
    • 2002
  • Since conventional mobile robot control with one module has limitation to solve complex problems, there have been a variety of works on combining multiple modules for solving them. Recently, many researchers attempt to develop mobile robot controllers using artificial life techniques. In this paper, we develop a mobile robot controller using cellular automata based neural networks, where complex tasks are divided to simple sub-tasks and optimal neural structure of each sub-task is explored by genetic algorithm. Neural network modules are combined dynamically using the action selection mechanism, where basic behavior modules compete each other by inhibition and cooperation. Khepera mobile robot simulator is used to verify the proposed model. Experimental results show that complex behaviors emerge from the combination of low-level behavior modules.

퍼지 추론 기반의 멀티에이전트 강화학습 모델 (Multi-Agent Reinforcement Learning Model based on Fuzzy Inference)

  • 이봉근;정재두;류근호
    • 한국콘텐츠학회논문지
    • /
    • 제9권10호
    • /
    • pp.51-58
    • /
    • 2009
  • 강화학습은 최적의 행동정책을 구하는 최적화 문제로 주어진 환경과의 상호작용을 통해 받는 보상 값을 최대화하는 것이 목표이다. 특히 단일 에이전트에 비해 상태공간과 행동공간이 매우 커지는 다중 에이전트 시스템인 경우 효과적인 강화학습을 위해서는 적절한 행동 선택 전략이 마련되어야 한다. 본 논문에서는 멀티에이전트의 효과적인 행동 선택과 학습의 수렴속도를 개선하기 위하여 퍼지 추론 기반의 멀티에이전트 강화학습 모델을 제안하였다. 멀티 에이전트 강화학습의 대표적인 환경인 로보컵 Keepaway를 테스트 베드로 삼아 다양한 비교 실험을 전개하여 에이전트의 효율적인 행동 선택 전략을 확인하였다. 제안된 퍼지 추론 기반의 멀티에이전트 강화학습모델은 다양한 지능형 멀티 에이전트의 학습에서 행동 선택의 효율성 평가와 로봇축구 시스템의 전략 및 전술에 적용이 가능하다.

군집 로봇의 협조 행동을 위한 강화 학습 기반의 진화 및 학습 알고리즘 (Reinforcement Learning Based Evolution and Learning Algorithm for Cooperative Behavior of Swarm Robot System)

  • 서상욱;김호덕;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제17권5호
    • /
    • pp.591-597
    • /
    • 2007
  • 군집 로봇시스템에서 개개의 로봇은 스스로 주위의 환경과 자신의 상태를 스스로 판단하여 행동하고, 필요에 따라서는 다른 로봇과 협조를 통하여 어떤 주어진 일을 수행할 수 있어야 한다. 따라서 개개의 로봇은 동적으로 변화하는 환경에 잘 적응할 수 있는 학습과 진화능력을 갖는 것이 필수적이다 이를 위하여 본 논문에서는 새로운 Polygon 기반의 Q-learning 알고리즘과 분산유전알고리즘을 이용한 새로운 자율이동로봇의 행동학습 및 진화방법을 제안한다. 또한 개개의 로봇이 통신을 통하여 염색체를 교환하는 분산유전알고리즘은 각기 다른 환경에서 학습한 우수한 염색체로부터 자신의 능력을 향상시킨다. 특히 본 논문에서는 진화의 성능을 향상시키기 위하여 강화학습의 특성을 이용한 선택 교배방법을 채택하였다. 제안된 방법은 협조탐색 문제에 적용하여 컴퓨터 모의실험을 통하여 그 유효성을 검증한다.

심층 강화학습을 이용한 모바일 로봇의 맵 기반 장애물 회피 알고리즘 (Map-Based Obstacle Avoidance Algorithm for Mobile Robot Using Deep Reinforcement Learning)

  • 선우영민;이원창
    • 전기전자학회논문지
    • /
    • 제25권2호
    • /
    • pp.337-343
    • /
    • 2021
  • 심층 강화학습은 학습자가 가공되지 않은 고차원의 입력 데이터를 기반으로 최적의 행동을 선택할 수 있게 하는 인공지능 알고리즘이며, 이를 이용하여 장애물들이 존재하는 환경에서 모바일 로봇의 최적 이동 경로를 생성하는 연구가 많이 진행되었다. 본 논문에서는 복잡한 주변 환경의 이미지로부터 모바일 로봇의 이동 경로를 생성하기 위하여 우선 순위 경험 재사용(Prioritized Experience Replay)을 사용하는 Dueling Double DQN(D3QN) 알고리즘을 선택하였다. 가상의 환경은 로봇 시뮬레이터인 Webots를 사용하여 구현하였고, 시뮬레이션을 통해 모바일 로봇이 실시간으로 장애물의 위치를 파악하고 회피하여 목표 지점에 도달하는 것을 확인하였다.

지능형 에이전트의 환경 적응성 및 확장성 (A study on environmental adaptation and expansion of intelligent agent)

  • 백혜정;박영택
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.795-802
    • /
    • 2003
  • 로봇이나 가상 캐릭터와 같은 지능형 에이전트가 자율적으로 살아가기 위해서는 주어진 환경을 인식하고, 그에 맞는 최적의 행동을 선택하는 능력을 가지고 있어야 한다. 본 논문은 이러한 지능형 에이전트를 구현하기 위하여, 외부 환경에 적응하면서 최적의 행동을 배우고 선택하는 방법을 연구하였다. 본 논문에서 제안한 방식은 강화 학습을 이용한 행동기반 학습 방법과 기호 학습을 이용한 인지 학습 방법을 통합한 방식으로 다음과 같은 특징을 가진다. 첫째, 강화 학습을 이용하여 환경에 대한 적응성을 학습함으로 지능형 에이전트가 변화하는 환경에 대한 유연성을 가지도록 하였다. 둘째, 귀납적 기계학습과 연관 규칙을 이용하여 규칙을 추출하여 에이전트의 목적에 맞는 환경 요인을 학습함으로 주어진 환경에서 보다 빠르게, 확장된 환경에서 보다 효율적으로 행동을 선택을 하도록 하였다. 셋째, 본 논문은 지능형 에이전트를 구현하는데 있어서 처음부터 모든 상태를 고려하기 보다 상태 탐지기를 이용하여 새로운 상태가 입력될 때마다 상태를 확장시키는 방식을 이용하였다. 이러한 방식은 필요한 상태에 대하여서만 고려함으로 메모리를 획기적으로 축소 할 수 있으며, 새로운 상태를 동적으로 처리 할 수 있어, 환경에 대한 변화에 능동적으로 대처 할 수 있다.

효율적인 점증적 진화학습을 위한 씨앗개체의 자동생성 (Automatic Generation of Seed Individuals for Efficient Incremental Evolutionary Learning)

  • 송금범;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.6-8
    • /
    • 1999
  • 시뮬레이션 환경이나 실제 환경에서 이동 로봇 제어기를 진화 알고리즘으로 만들어내는 연구가 최근 활발하다. 이전의 연구에서는 기존의 단순한 진화 알고리즘이 환경에 제한된 제어기를 만들어 내는 문제점을 해결하기 위한 방법으로 셀룰라 오토마타 기반 신경망의 점증적 진화방법을 제시하였다. 점증적 진화 방법은 초기에 간단한 행동으로 해결할 수 있는 환경에 맞도록 제어기를 진화시킨 다음, 점차 복잡한 행동이 요구되는 환경에서 제어기를 점증적으로 진화시킨다. 실험결과, 점증적 진화의 방법이 좀 더 효율적으로 로봇을 진화시키고 환경의 변화에 보다 강한 것을 알 수 있었다. 그러나 이전연구에서의 점증적 진화 방법은 한 단계에서 진화가 끝난 후 다음 단계로 넘어갈 개체를 사람이 선택해야 하는 문제가 있었다. 본 논문에서는 이러한 문제점을 해결하기 위한 다양한 방법을 제시하고 실험을 통해 그 유용성을 보이고자 한다.

  • PDF

초등학교 정서장애 학생의 행동 개선을 위한 휴머노이드 활용 연구 (A Study on Utilization of Humanoid for Students with Emotional Disorder in the Elementary School)

  • 신용수;김동호
    • 정보교육학회논문지
    • /
    • 제18권1호
    • /
    • pp.45-56
    • /
    • 2014
  • 초등학교 교육현장에서 최근 대두되고 있는 문제 가운데 과잉행동장애나 주의력 결핍 등 학생들의 심리 정서적 장애에서 비롯된 다양한 문제들이 발생하고 있다. 본 논문에서는 특수학교나 특수학급이 아닌 초등학교 일반학급에 속해 있는 아동들 가운데 심리 정서적인 장애나 그에 준하는 문제 해동을 보이는 아동들을 대상으로 휴머노이드 로봇 프로그램을 개발하여 아동들이 갖고 있는 장애와 문제 상황을 로봇과의 상호작용을 통해 돌아보게 함으로써 자신의 문제를 스스로 극복할 수 있는 방안을 연구하였다. 본 연구의 결과, 연구 대상들의 변화된 모습으로는 주의력결핍성, 과잉 충동성 및 폭력적 성향, 반항적 행동의 감소와 교사의 지시에 불복하거나 수업에 참여하지 않는 등의 품행 장애적 행동에 대한 감소를 보였다. 또한 로봇과의 상호작용을 통해 선택적 함묵증 아동의 사회성 향상에 도움이 된 것으로 검증되었다.

물체 조작 정책의 효율적 습득을 위한 모방 학습과 강화 학습의 결합 (Combining Imitation Learning with Reinforcement Learning for Efficient Manipulation Policy Acquisition)

  • 정은진;이상준;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.759-762
    • /
    • 2018
  • 최근 들어 점차 지능형 서비스 로봇들이 인간의 실생활 속으로 들어옴에 따라, 로봇 스스로 다양한 물체들을 효과적으로 조작할 수 있는 지식을 습득하는 기계 학습 기술들이 매우 주목을 받고 있다. 전통적으로 로봇 행위 학습 분야에는 강화 학습 혹은 심층 강화 학습 기술들이 주로 많이 적용되어 왔으나, 이들은 대부분 물체 조작 작업과 같이 다차원 연속 상태 공간과 행동 공간에서 최적의 행동 정책을 학습하는데 여러가지 한계점을 가지고 있다. 따라서 본 논문에서는 전문가의 데모 데이터를 활용해 보다 효율적으로 물체 조작 행위들을 학습할 수 있는 모방 학습과 강화 학습의 통합 프레임워크를 제안한다. 이 통합 프레임워크는 학습의 효율성을 향상시키기 위해, 기존의 GAIL 학습 체계를 토대로 PPO 기반 강화 학습 단계의 도입, 보상 함수의 확장, 상태 유사도 기반 데모 선택 전략의 채용 등을 새롭게 시도한 것이다. 다양한 성능 비교 실험들을 통해, 본 논문에서 제안한 통합 학습 프레임워크인 PGAIL의 우수성을 확인할 수 있었다.