搜索到5520篇“ 半马尔可夫决策过程“的相关文章
马尔可夫决策过程
侯振挺
关键词:马尔可夫过程
马尔可夫决策过程
1990年
White,CC 刘迪芬
关键词:马氏决策过程
基于马尔可夫决策过程的中国石油战略储备模型分析
2025年
石油被称为“国民经济的血液”,是国家的重要战略资源,在国家经济安全中发挥着战略支撑作用。当前国际环境变乱交织,大国间博弈逐步加剧,国际油价震荡不定,中国作为能源需求大国,石油对外依存度始终处于高位,为更好应对石油市场的不确定性及供应中断风险,制定科学合理的战略储备策略尤为重要。本文研究旨在运用马尔可夫决策过程,构建符合中国国情的石油战略储备模型,为保障国家能源安全提供决策依据。模型考虑石油价格波动、供应中断概率及持续时间等因素,通过定义时间阶段、石油价格、供应量、断供幅度等参数和变量,采用动态规划方法构建奖励函数,提出约束条件,通过情景分析研究各类不确定因素对储备策略的影响。研究结果表明,石油需求弹性、供应中断概率和储备成本系数等因素对储备规模和策略有显著影响,高中断持续时间风险会使最优储备规模显著增加,且不同中断持续时间下储备释放策略不同。模型计算结果在一定程度上反映了不同情景下中国石油战略储备的合理规模和调整策略,但实际情况更为复杂,需综合考虑多方面因素。模型结果为决策提供了重要参考依据,敏感性分析有助于深入理解各因素对储备决策的影响机制,从而在实际中制定更科学合理的石油战略储备策略。分析石油战略储备政策对矿业资本市场的潜在影响,以通过优化储备策略来提高资源的高质化利用,增强中国在全球石油市场中的能源安全和经济稳定性。本文研究不仅为石油战略储备政策提供了决策支持,也为其他战略性矿产资源的管理提供了借鉴,为政策制定者提供了重要参考。
刘婧侯孟睿刘冲昊贾祥英
关键词:石油战略储备马尔可夫决策过程动态规划
一种基于马尔可夫决策过程的能源管理方法及系统
本发明公开了一种基于马决策过程的能源管理方法及系统,本系统对智能家庭住宅进行建模,建立了一套独特的成本计算体系。同时定义了本系统中隐私保护程度的衡量标准,引入充电电池进行错峰充放电,并掩盖用户实时用电信息。利用马尔...
田源郝舒阳董睿轩汤志超颜彦陈建华
一种基于马尔可夫决策过程的剩余时差拾取方法及装置
本发明公开了一种基于马尔可夫决策过程的剩余时差拾取方法及装置,包括输入偏移成像道集,通过拉平和最优叠加,获得成像剖面;设计反射层位的拾取参数,并计算成像剖面的属性信息,采用马尔可夫决策过程追踪同相轴,生成特征成像剖面;针...
吴成梁王华忠冯波宋肖楠盛燊
基于马尔可夫决策过程的大语言模型多阶段隐私保护方法
本发明属于大模型保护数据的技术领域,更具体地,涉及基于马尔可夫决策过程的大语言模型多阶段隐私保护方法。所述方法包括系统建模,设计基于MDP的动态隐私保护模型MDP‑PPFC。所述模型包括系统状态和状态转换,在系统中引入纳...
顾树俊陈岩陈云洋黄玮彦高龙翔曲悠扬崔磊
一种基于马尔可夫决策过程的反射层位追踪方法及装置
本发明公开了一种基于马尔可夫决策过程的反射层位追踪方法及装置,包括输入偏移成像剖面,对所述成像剖面进行预处理并设计拾取的参数;计算所述成像剖面的属性信息,包括包络属性、相位属性、倾角属性、极值点属性和子波质心属性;确定种...
吴成梁王华忠冯波宋肖楠许荣伟盛燊
基于马尔可夫决策过程的附加服务定价优化
2024年
随着民航运输业竞争日益加剧以及航空旅客个性化需求逐步提高,为取得差异化竞争优势和提高旅客满意度,开展附加服务业务是目前国内外航空公司关注的焦点,如何对附加服务定价以增加收益是目前航空公司运营的一个重要问题.为此基于马尔可夫决策过程提出了一种附加服务定价模型,并使用策略迭代算法对该模型进行求解以获得最优价格.对两类旅客细分市场进行仿真实验.结果表明,相比于现行使用较多的附加服务短视化定价模型,通过该模型求解得到最优价格将每位旅客的平均预期收益从93.7元提高到102.1元,提升幅度约8.96%.
杨明霞朱星辉
关键词:航空运输收益管理马尔可夫决策过程策略迭代
基于马尔可夫决策过程的边缘云业务迁移算法
2024年
在移动互联网中,当用户位置发生改变时,业务迁移用来提升服务质量(QoS)。基于此,提出一种基于马尔可夫决策过程的边缘云业务迁移算法。与对比算法相比,所提算法考虑了不同业务类型对QoS的差异化需求,并全面考虑了业务迁移过程中的收益及开销。所提算法将业务分为实时和非实时2类,将终端的业务运行状态和与服务器的距离作为状态空间,并基于与业务体验紧密相关的用速率和时延2个QoS指标构建收益函数,同时将业务迁移过程中的系统资源消耗作为迁移开销,通过最大化全局收益来获取最优迁移策略。通过与对比算法的模拟比较,所提算法在多种场景下都有更高的全局收益。
马安华潘甦
关键词:马尔可夫决策过程服务质量
一种基于马尔可夫决策过程的社区储能调度方法
本发明属于电网调度技术领域,尤其涉及一种基于马尔可夫决策过程的社区储能调度方法。本发明方法首先建立一个基于马尔可夫决策过程的社区储能调度方法,将社区储能管理模型改写为贝尔曼方程,利用最优策略的阈值方法,求解与社区储能调度...
孙宏斌孙勇郭庆来李宝聚王彬李振元邓莉荣吕项羽潘昭光李德鑫张璇王佳蕊阳天舒张懿夫

相关作者

张一晋
作品数:133被引量:47H指数:4
供职机构:南京理工大学
研究主题:马尔可夫决策过程 车联网 吞吐 无人机 多智能体强化学习
仵博
作品数:85被引量:189H指数:7
供职机构:深圳职业技术学院
研究主题:部分可观察马尔可夫决策过程 信念 ROBOCUP 无线传感器网络 GSM
陈前斌
作品数:1,308被引量:1,781H指数:19
供职机构:重庆邮电大学
研究主题:网络 资源分配 基站 切片 卸载
赵楠
作品数:164被引量:69H指数:5
供职机构:湖北工业大学
研究主题:私有信息 协作通信 可调衰减器 马尔可夫决策过程 契约
唐伦
作品数:552被引量:766H指数:15
供职机构:重庆邮电大学通信与信息工程学院
研究主题:切片 网络 基站 资源分配 车载自组织网络