搜索资源 - Q学习 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

通讯/手机编程

搜索资源 - Q学习

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

搜索资源列表

Q

0下载：
手机上的SLG游戏，完整的RES代码，可提学习使用
所属分类：J2ME
- 发布日期：2008-10-13
- 文件大小：83168
- 提供者：SupereGo

ReinforcementLearning

0下载：
马尔卡夫决策过程理论定义了一个数学模型，可用于随机动态系统的最优决策过程。强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。强化学习就是：追求最大回报G 追求最大回报G就是：找到最优的策略π?。策略π?告诉在状态s，应该执行什么行动a。最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical model that can be used for the
所属分类：通讯编程
- 发布日期：2018-01-01
- 文件大小：1024
- 提供者：下雪

Qlearning

2下载：
基于Q学习实现自主选频与动态频谱接入，认知无线电(Dynamic spectrum access with Q-Learing)
所属分类：通讯编程
- 发布日期：2018-01-01
- 文件大小：1024
- 提供者：baomadaidou

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.