搜索资源 - 深度强化学习 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

数值算法/人工智能

搜索资源 - 深度强化学习

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

压缩解压

STL

数据结构常用算法

数学计算/工程计算

人工智能/神经网络/遗传算法

matlab例程

生物技术

密码/编码算法

mathematica

Maple

数据挖掘

大数据

comsol

物理计算

化学计算

仿真建模

搜索资源列表

FlappyLearning-gh-pages

0下载：
搭建强化学习网络学习flappybird，代码为js文件。神经网络可改写重用。(Build reinforcement learning network learning flappybird, code for js file. Neural network can be rewritten and reused.)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2017-12-21
- 文件大小：25600
- 提供者：Silvert

1709.04326

0下载：
多智能体设置在机器学习中的重要性日益突出。超过了最近的大量关于深度的工作多agent强化学习，层次强化学习，生成对抗网络和分散优化都可以看作是这种设置的实例。然而，多学习代理人的存在这些设置使得培训问题的非平稳常常导致不稳定的训练或不想要的最终结果。我们提出学习与对手的学习意识（萝拉），一种方法，原因的预期。其他代理的学习。罗拉学习规则包括一个额外的术语，解释了在预期的参数更新的代理政策其他药物。我们发现，利用似然比策略梯度更新的方法，可以有效地计算萝拉更新规则，使该方法适合于无模型强化学习。这
所属分类：人工智能/神经网络/深度学习
- 发布日期：2017-12-30
- 文件大小：1130496
- 提供者：我去六六六

万门大学强化学习算法代码RW模型+TD模型

1下载：
万门大学，强化学习，rw模型算法代码实现， V(CS) = V(CS) + A * ( V(US) * us - V(CS) * cs ) td模型， V(s{t}) = V(s{t}) + a[R(t+1) + rV{S(t+1)} - V{S(t)}](In the intensive learning of the University of Wan men, the RW algorithm, the python implementation, the algorithm f
所属分类：人工智能/神经网络/深度学习
- 发布日期：2018-05-01
- 文件大小：1024
- 提供者：lilin123

万门大学强化学习GridEvalu模型GridPolicy模型

1下载：
万门大学，强化学习，Grid_world_evaluation模型算法代码实现， V(S) = V(S) + A * ( R(S) + r*V(new_S) - V(S) ) Grid_world_Policy模型， P(S) = P(S) + A * ( R(S) + r*P(new_S) - P(S) )(In the intensive learning of the University of Wan men, the Grid_world_evaluation algo
所属分类：人工智能/神经网络/深度学习
- 发布日期：2018-05-01
- 文件大小：3072
- 提供者：lilin123

qlearning4k-master

0下载：
qlearning4k是强化学习Python深度学习lib库Keras插件。它简单，是快速成型的理想选择。(Qlearning4k is a reinforcement learning add-on for the python deep learning library Keras. Its simple, and is ideal for rapid prototyping.)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2018-05-02
- 文件大小：72704
- 提供者：YH.HO

DeepMind-Atari-Deep-Q-Learner-master

2下载：
基于python环境的简明深度强化学习深度Q学习实现代码(Concise deep intensive learning based on Python environment and deep Q learning implementation code)
所属分类：数值算法/人工智能
- 发布日期：2020-04-13
- 文件大小：32510976
- 提供者：caiyunffx

code

6下载：
Q-learning 算法实现AGV的最优路径规划，实测效果非常好，对于研究深度学习和强化学习的同学很有帮助！(The Q-learning algorithm realizes the optimal path planning of AGV, and the measured results are very good. It is very helpful for students who are studying deep learning and reinforcement learn
所属分类：人工智能/神经网络/深度学习
- 发布日期：2018-06-18
- 文件大小：262144
- 提供者：sfy123456

深度学习入门：基于Python的理论与实现.pdf+代码

8下载：
本书是深度学习真正意义上的入门书，深入浅出地剖析了深度学习的原理和相关技术。书中使用Python3，尽量不依赖外部库或工具，从基本的数学知识出发，带领读者从零创建一个经典的深度学习网络，使读者在此过程中逐步理解深度学习。书中不仅介绍了深度学习和神经网络的概念、特征等基础知识，对误差反向传播法、卷积神经网络等也有深入讲解，此外还介绍了深度学习相关的实用技巧，自动驾驶、图像生成、强化学习等方面的应用，以及为什么加深层可以提高识别精度等“为什么”的问题。(This book is a true sen
所属分类：人工智能/神经网络/深度学习
- 发布日期：2019-05-09
- 文件大小：14304256
- 提供者：wangjindian00

单一任务导航

1下载：
测试深度马尔可夫决策来导航,给出了python的实现代码(MDP based navigation)
所属分类：matlab例程
- 发布日期：2020-01-05
- 文件大小：53248
- 提供者：星尚

tpprl

1下载：
结合深度强化学习和时间点过程算法的实现，主要用python(In combination with deep reinforcement learning and implementation of time point process algorithm, Python is mainly used.)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2019-10-28
- 文件大小：545792
- 提供者：哈哈哈szh

基于深度强化学习的复杂环境下机器人自主移动算法

1下载：
本算法是通过深度强化学习方法，模拟人类行走策略，建立避免碰撞的模型，训练机器人底盘以人类习惯在复杂变化的环境中主动生成速度和角度信息，从而自动行走。
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2019-05-05
- 文件大小：13139849
- 提供者：tthdtest

Proximal_Policy_Optimization

2下载：
强化学习可以按照方法学习策略来划分成基于值和基于策略两种。而在深度强化学习领域将深度学习与基于值的Q-Learning算法相结合产生了DQN算法，通过经验回放池与目标网络成功的将深度学习算法引入了强化学习算法。(Reinforcement learning can be divided into value-based learning and strategy based learning according to method learning strategies. In the fiel
所属分类：人工智能/神经网络/深度学习
- 发布日期：2020-06-24
- 文件大小：8192
- 提供者：小人物0104

FCMADDPG

4下载：
基于深度强化学习的编队控制使用MADDPG算法(Formation control based on deep reinforcement learning)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2020-10-30
- 文件大小：11264
- 提供者：alikessss

9.14DQN-QL

2下载：
深度强化学习一个简单的事例，用于深度强化学习而用(Deep reinforcement learning is a simple example for deep reinforcement learning)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2020-09-18
- 文件大小：1024
- 提供者：jinggggg

无人机强化学习控制代码python

0下载：
一个基于深度强化学习的无人机控制代码，python语言写的。
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2021-11-25
- 文件大小：116791843
- 提供者：gystruggle01_@

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.