Combining STDP and binary networks for reinforcement learning from images and sparse rewards

时间：2021-09-21 09:53:32 阅读：43 评论：0 收藏：0 [点我收藏+]

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！

技术分享图片

Neural Networks 2021

Abstract

　　脉冲神经网络(SNN)旨在复制生物大脑的能源效率、学习速度和时间处理。然而，此类网络的准确性和学习速度仍落后于基于传统神经模型的强化学习(RL)模型。这项工作将预训练的二值卷积神经网络与通过奖励调节的STDP在线训练的SNN相结合，以利用两种模型的优势。脉冲网络是其先前版本的扩展，在架构和动态方面进行了改进，以应对更具挑战性的任务。我们专注于对所提出的模型进行广泛的实验评估，这些模型具有优化的最先进基准，即近端策略优化(PPO)和深度Q网络(DQN)。这些模型在具有高维观察的网格世界环境中进行比较，该环境由高达256×256像素的RGB图像组成。实验结果表明，所提出的架构可以成为评估环境中深度强化学习(DRL)的竞争替代品，并为脉冲网络的更复杂的未来应用奠定基础。

Keywords: spiking neural networks, binary neural networks, STDP, reinforcement learning.

1. Introduction

Combining STDP and binary networks for reinforcement learning from images and sparse rewards

原文：https://www.cnblogs.com/lucifer1997/p/15309976.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)