一种迷宫机器人的人工脑系统
阮晓钢,许晓明,李欣源
北京工业大学人工智能与机器人研究所,北京
摘 要:提出一种迷宫机器人的人工脑系统,包括迷宫路标感知单元与行为决策单元。其中,感知单元基于ART1神经网络,用于识别迷宫导向路标;决策单元基于行为概率实现矩阵,并以强化学习更新行动策略。机器人所在迷宫的特征为每个路口设有导向路标,路标为含噪声的符号图像。在仿真实验中,令机器人在迷宫中随机行走,通过调节人工脑系统的试验参数,经过一段时间的自主探索学习过程机器人能较终穿越迷宫。仿真实验结果表明,该人工脑系统能够自组织地理解迷宫中导向路标的含义,并引导机器人成功穿越迷宫。同时,该人工脑系统对于基于路标导航的城市巡逻机器人、高危复杂环境下的抢险机器人的研究发展有一定
的推动作用。
关 键 词:ART1神经网络;强化学习;自组织;非监督学习;人工脑
引 言
移动机器人[1]如同生物体一样,是一种“刺激”“反应”的智能体,也是一种“感知”“行动”机构(PerceptionActionAgent,PPA)。生物的“刺激”“反应”行为和“感知”“行动”机制常常是在与生物
环境交互作用的过程中自治地或自组织地建立起来的。迷宫机器人是移动机器人的一种特定应用,其主要研究类迷宫环境特征的认知、测绘、学习及导航等。生物对于环境特征的理解和认知是要通过不断地学习和积累的,不会因为新知识的学习而影响旧知识的记忆,并能够将其与旧的习得知识相关联,是一种自组织的谐振稳定状态,迷宫机器人也应该有类似的能力。以往人们主要研究基于监督学习的移动机器人控制策略,如结合BP网络和Hopfield网络的强化学习方法,通过机器人在迷宫中完成行走任务后的样本数据进行学习,以实现机器人避障、路径规划、环境特征学习,不具备在线学习的能力,不能对新的习得模式进行学习,即这些网络的学习是分步骤或分批次地进行的,学习完毕后,一旦有新的输入样本需要学习聚类时,必须把这些输入样本与原输入样本一同重新输入到网络中才能进行学习,本文提出一种基于自适应谐振网络ART1[23]和强化学习[46]组成的人工脑系统成功地解决了这一问题。
相关阅读:
- ...· Efinix® 全力驱动AI边缘计算,成功推出Trion™ T20 FPGA样品, 同时将产品扩展到二十万逻辑单元的T200 FPGA
- ...· 英飞凌亮相进博会,引领智慧新生活
- ...· 三电产品开发及测试研讨会北汽新能源专场成功举行
- ...· Manz亚智科技跨入半导体领域 为面板级扇出型封装提供化学湿制程、涂布及激光应用等生产设备解决方案
- ...· 中电瑞华BITRODE动力电池测试系统顺利交付北汽新能源
- ...· 中电瑞华FTF系列电池测试系统中标北京新能源汽车股份有限公司
- ...· 中电瑞华大功率高压能源反馈式负载系统成功交付中电熊猫
- ...· 中电瑞华国际在电动汽车及关键部件测评研讨会上演绎先进测评技术