搜索到110篇“ 半MARKOV决策过程“的相关文章
Markov决策过程强化学习算法研究
强化学习作为机器学习领域中的一种主要算法,在智能决策和行为认知等领域有着重要作用,也是解决随机序贯决策问题的有效方法。虽然强化学习算法在基础理论研究和应用等方面取得了显著的成果,但大部分研究将系统所处环境都建模为Mark...
杨家源
关键词:半马尔可夫决策过程强化学习算法
基于Markov决策过程的手机节能策略研究
诸如智能手机、平板电脑等智能移动设备已成为人们日常生活中的必需品。随着智能手机上配备更多的硬件模块,开发者使用它们开发出各类软件,以最大限度提升用户使用体验。高能耗是此类软件所要考虑的重要因素。然而,当前电池密度的增长相...
张梦夕
关键词:移动终端电源管理管理程序
Markov决策过程的研究进展
2015年
本文综述Markov决策过程(SMDP)理论的发展现状,主要介绍SMDP无限阶段期望折扣报酬准则、长期平均准则、有限阶段期望报酬准则、首达目标期望报酬准则、概率准则、受约束问题和均值-方差准则的研究工作,着重阐述这些优化准则的背景、意义、主要研究进展及有待研究的问题.最后,展望SMDP未来的一些潜在研究方向和相关问题.
郭先平黄永辉
关键词:半MARKOV决策过程计算方法
基于Markov决策过程的概率布尔网络模型
2013年
借助Markov决策过程理论研究了概率布尔网络中的最优控制问题.将概率布尔网络的控制模型转化为首达目标的Markov决策过程模型,通过选取最优控制输入使得和系统相关的目标函数最小,从而解决了一个最优控制问题,并举例说明所用方法的效用.
刘秋丽杨洁
关键词:半MARKOV决策过程
基于Markov决策过程的劣化系统检测与维修优化模型被引量:11
2007年
针对系统劣化阶段持续时间、检测间隔时间和维修时间都服从一般分布的情况,提出了一类基于马氏决策过程的劣化系统检测与维修优化模型.利用位相型分布近似一般分布简化了求解过程,并提出了相应的改进值迭代算法.最后通过算例验证了模型与迭代算法的可行性.
程志君郭波
关键词:劣化系统
Markov决策过程的数值迭代优化被引量:4
2006年
针对Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机异步迭代,特别是基于样本轨道仿真的数值迭代等,并运用性能势思想对上述算法进行改进。结果表明,该算法可直接适用于连续时间Markov决策过程。最后通过一个数值例子来比较各种算法的特点。
唐昊吴玉华周雷
关键词:计算机应用半MARKOV决策过程
Markov决策过程折扣模型与平均模型之间的关系被引量:4
2006年
首先分别在折扣代价与平均代价性能准则下,讨论了一类M arkov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后讨论了两种模型之间的关系,表明了平均模型的有关结论,可以通过对折扣模型相应结论取折扣因子趋于零时的极限来得到.
殷保群李衍杰唐昊代桂平奚宏生
关键词:半MARKOV决策过程
可数Markov决策过程折扣代价性能优化被引量:2
2006年
讨论一类可数M arkov决策过程(CSM DP)在折扣代价准则下的性能优化问题.运用等价M arkov过程方法,定义了折扣Po isson方程,并由该方程定义了α-势.基于α-势,导出了由最优平稳策略所满足的最优性方程.较为详细地讨论了最优性方程解的存在性问题,并给出了其解存在的一些充分条件.
殷保群李衍杰周亚平奚宏生
基于Markov决策过程的智能电网储能调峰的最优控制
智能电网作为一种集成了先进的通信技术、传感量测技术和智能控制技术的现代电网,具有良好的经济性、可靠性和稳定性。建设坚强智能电网对于发展国民经济、提高综合国力具有重要的战略意义。  电能供需平衡作为电力系统的一个物理特征,...
计鹿飞
关键词:智能电网半MARKOV决策过程最优控制
考虑个体差异的系统退化建模与Markov过程维修决策被引量:3
2020年
为了在采样不完全、个体差异明显的条件下对缓慢退化系统的维修策略进行研究,针对具有个体差异的缓慢退化系统,选择线性混合效应模型进行退化建模,并利用自回归方法对模型残差中的时间序列相关性进行调节,提高了模型的准确性。在此基础上构造合理的状态空间和维修决策空间,求解退化过程的状态转移概率,并使用策略迭代算法求解最小化单位时间长期预计成本的最优化维修策略。以激光退化实际案例求解了基于Markov决策过程的维修策略,并与经典的基于役龄的维修策略和周期检查的维修策略进行比较,证明了所提方法能够更加精确地刻画系统的退化过程,并可帮助制定兼顾成本与可靠性的维修策略。
李琦李婧蒋增强边靖媛
关键词:半MARKOV决策过程线性混合效应模型

相关作者

唐昊
作品数:211被引量:238H指数:8
供职机构:合肥工业大学
研究主题:性能势 Q学习 柔性负荷 优化控制 调度
周雷
作品数:80被引量:57H指数:4
供职机构:合肥工业大学
研究主题:Q学习 外骨骼 性能势 优化控制 半MARKOV决策过程
吴玉华
作品数:6被引量:8H指数:2
供职机构:合肥工业大学
研究主题:半MARKOV决策过程 SMDP 性能势 计算机应用 煤矿
李衍杰
作品数:19被引量:42H指数:4
供职机构:哈尔滨工业大学深圳研究生院
研究主题:性能势 半MARKOV决策过程 MARKOV决策过程 优化算法 广义MOORE-PENROSE逆
奚宏生
作品数:254被引量:785H指数:13
供职机构:中国科学技术大学信息科学技术学院
研究主题:性能势 流媒体 鲁棒自适应控制 随机非线性系统 最优控制