搜索资源列表
GAPSO-share
- 我从网上下载了一个GA-PSO算法,试着利用GA和PSO组合的策略进行优化,结果算法很问题,效率和不错。我下载原始算法,有一个问题就是它是针对所有的设计变量上下限都是一样的,所以我对程序进行了修改与改进,现在可以处理上下限不一致的问题,同时fix了一些bug。-GA GA and PSO algorithm matlab program combined ion group When doing optimization, first choose the GA algorithm, bu
TD-SCDMA_Platform
- TD-SCDMA动态仿真平台 用于研究系统特性、RRM算法和网络规划策略-TD-SCDMA Platform
ReinforcementLearning
- 马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。 强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。 强化学习就是:追求最大回报G 追求最大回报G就是:找到最优的策略π?。 策略π?告诉在状态s,应该执行什么行动a。 最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical model that can be used for the