Combining STDP and binary networks for reinforcement learning from images and sparse rewards

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!

技术分享图片

Neural Networks 2021

Abstract

  脉冲神经网络(SNN)旨在复制生物大脑的能源效率、学习速度和时间处理。然而,此类网络的准确性和学习速度仍落后于基于传统神经模型的强化学习(RL)模型。这项工作将预训练的二值卷积神经网络与通过奖励调节的STDP在线训练的SNN相结合,以利用两种模型的优势。脉冲网络是其先前版本的扩展,在架构和动态方面进行了改进,以应对更具挑战性的任务。我们专注于对所提出的模型进行广泛的实验评估,这些模型具有优化的最先进基准,即近端策略优化(PPO)和深度Q网络(DQN)。这些模型在具有高维观察的网格世界环境中进行比较,该环境由高达256×256像素的RGB图像组成。实验结果表明,所提出的架构可以成为评估环境中深度强化学习(DRL)的竞争替代品,并为脉冲网络的更复杂的未来应用奠定基础。

Keywords: spiking neural networks, binary neural networks, STDP, reinforcement learning.

1. Introduction

Combining STDP and binary networks for reinforcement learning from images and sparse rewards

原文:https://www.cnblogs.com/lucifer1997/p/15309976.html

以上是Combining STDP and binary networks for reinforcement learning from images and sparse rewards的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>