CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 数值算法/人工智能 搜索资源 - 深度强化学习

搜索资源列表

  1. FlappyLearning-gh-pages

    0下载:
  2. 搭建强化学习网络学习flappybird,代码为js文件。神经网络可改写重用。(Build reinforcement learning network learning flappybird, code for js file. Neural network can be rewritten and reused.)
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2017-12-21
    • 文件大小:25600
    • 提供者:Silvert
  1. 1709.04326

    0下载:
  2. 多智能体设置在机器学习中的重要性日益突出。超过了最近的大量关于深度的工作多agent强化学习,层次强化学习,生成对抗网络和分散优化都可以看作是这种设置的实例。然而,多学习代理人的存在这些设置使得培训问题的非平稳常常导致不稳定的训练或不想要的最终结果。我们提出学习与对手的学习意识(萝拉),一种方法,原因的预期。其他代理的学习。罗拉学习规则包括一个额外的术语,解释了在预期的参数更新的代理政策其他药物。我们发现,利用似然比策略梯度更新的方法,可以有效地计算萝拉更新规则,使该方法适合于无模型强化学习。这
  3. 所属分类:人工智能/神经网络/深度学习

  1. 万门大学强化学习算法代码RW模型+TD模型

    1下载:
  2. 万门大学,强化学习,rw模型算法代码实现, V(CS) = V(CS) + A * ( V(US) * us - V(CS) * cs ) td模型, V(s{t}) = V(s{t}) + a[R(t+1) + rV{S(t+1)} - V{S(t)}](In the intensive learning of the University of Wan men, the RW algorithm, the python implementation, the algorithm f
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2018-05-01
    • 文件大小:1024
    • 提供者:lilin123
  1. 万门大学强化学习GridEvalu模型GridPolicy模型

    1下载:
  2. 万门大学,强化学习,Grid_world_evaluation模型算法代码实现, V(S) = V(S) + A * ( R(S) + r*V(new_S) - V(S) ) Grid_world_Policy模型, P(S) = P(S) + A * ( R(S) + r*P(new_S) - P(S) )(In the intensive learning of the University of Wan men, the Grid_world_evaluation algo
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2018-05-01
    • 文件大小:3072
    • 提供者:lilin123
  1. qlearning4k-master

    0下载:
  2. qlearning4k是强化学习Python深度学习lib库Keras插件。它简单,是快速成型的理想选择。(Qlearning4k is a reinforcement learning add-on for the python deep learning library Keras. Its simple, and is ideal for rapid prototyping.)
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2018-05-02
    • 文件大小:72704
    • 提供者:YH.HO
  1. DeepMind-Atari-Deep-Q-Learner-master

    2下载:
  2. 基于python环境的简明深度强化学习深度Q学习实现代码(Concise deep intensive learning based on Python environment and deep Q learning implementation code)
  3. 所属分类:数值算法/人工智能

    • 发布日期:2020-04-13
    • 文件大小:32510976
    • 提供者:caiyunffx
  1. code

    6下载:
  2. Q-learning 算法实现AGV的最优路径规划,实测效果非常好,对于研究深度学习和强化学习的同学很有帮助!(The Q-learning algorithm realizes the optimal path planning of AGV, and the measured results are very good. It is very helpful for students who are studying deep learning and reinforcement learn
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2018-06-18
    • 文件大小:262144
    • 提供者:sfy123456
  1. 深度学习入门:基于Python的理论与实现.pdf+代码

    8下载:
  2. 本书是深度学习真正意义上的入门书,深入浅出地剖析了深度学习的原理和相关技术。书中使用Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度学习。书中不仅介绍了深度学习和神经网络的概念、特征等基础知识,对误差反向传播法、卷积神经网络等也有深入讲解,此外还介绍了深度学习相关的实用技巧,自动驾驶、图像生成、强化学习等方面的应用,以及为什么加深层可以提高识别精度等“为什么”的问题。(This book is a true sen
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2019-05-09
    • 文件大小:14304256
    • 提供者:wangjindian00
  1. 单一任务导航

    1下载:
  2. 测试深度马尔可夫决策来导航,给出了python的实现代码(MDP based navigation)
  3. 所属分类:matlab例程

    • 发布日期:2020-01-05
    • 文件大小:53248
    • 提供者:星尚
  1. tpprl

    1下载:
  2. 结合深度强化学习和时间点过程算法的实现,主要用python(In combination with deep reinforcement learning and implementation of time point process algorithm, Python is mainly used.)
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2019-10-28
    • 文件大小:545792
    • 提供者:哈哈哈szh
  1. 基于深度强化学习的复杂环境下机器人自主移动算法

    1下载:
  2. 本算法是通过深度强化学习方法,模拟人类行走策略,建立避免碰撞的模型,训练机器人底盘以人类习惯在复杂变化的环境中主动生成速度和角度信息,从而自动行走。
  3. 所属分类:人工智能/神经网络/遗传算法

    • 发布日期:2019-05-05
    • 文件大小:13139849
    • 提供者:tthdtest
  1. Proximal_Policy_Optimization

    2下载:
  2. 强化学习可以按照方法学习策略来划分成基于值和基于策略两种。而在深度强化学习领域将深度学习与基于值的Q-Learning算法相结合产生了DQN算法,通过经验回放池与目标网络成功的将深度学习算法引入了强化学习算法。(Reinforcement learning can be divided into value-based learning and strategy based learning according to method learning strategies. In the fiel
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2020-06-24
    • 文件大小:8192
    • 提供者:小人物0104
  1. FCMADDPG

    4下载:
  2. 基于深度强化学习的编队控制使用MADDPG算法(Formation control based on deep reinforcement learning)
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2020-10-30
    • 文件大小:11264
    • 提供者:alikessss
  1. 9.14DQN-QL

    2下载:
  2. 深度强化学习一个简单的事例,用于深度强化学习而用(Deep reinforcement learning is a simple example for deep reinforcement learning)
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2020-09-18
    • 文件大小:1024
    • 提供者:jinggggg
  1. 无人机强化学习控制代码python

    0下载:
  2. 一个基于深度强化学习的无人机控制代码,python语言写的。
  3. 所属分类:人工智能/神经网络/遗传算法

    • 发布日期:2021-11-25
    • 文件大小:116791843
    • 提供者:gystruggle01_@
搜珍网 www.dssz.com