一种基于&pi;-MaxQ学习的多机器人协作方法

柯文德; 洪炳镕; 崔刚; 蔡则苏

登录

免费注册

赞分享引用

科研之友

微信

新浪微博

Facebook

分享链接

一种基于π-MaxQ学习的多机器人协作方法

作者：柯文德; 洪炳镕; 崔刚; 蔡则苏

来源：智能计算机与应用, 2013, (03): 14-17.

摘要

针对多机器人协作中存在的并发性较少、协商通信的实时性与高效性较差以及问题学习空间维数灾难等问题,提出一种基于π-MaxQ学习的多机器人主体协作方法。定义了机器人的公共知识、信念、目标、意图、承诺、信任、知识更新等心智状态,扩充了基于心智状态的KQML(Knowledge Query and Manipulation Language)通信原语,并基于MaxQ方法构建了联合奖励函数。实验证明了方法的有效性。

单位
哈尔滨工业大学; 茂名学院

分享分享被引浏览

更新时间：2018-09-14 14:59

Similar
Related
Reference

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号