公共文化服务平台

搜索到583篇“ 博弈问题“的相关文章

混合博弈问题的求解与应用综述被引量：1: 2025年; 近年来,随着人工智能技术在序贯决策和博弈对抗等问题的应用方面取得了飞速发展,围棋、游戏、德扑和麻将等领域取得了巨大的进步,例如,AlphaGo、OpenAI Five、AlphaStar、DeepStack、Libratus、Pluribus和Suphx等系统都在这些领域中达到或超过人类专家水平.这些应用集中在双人、两队或者多人的零和博弈问题中,而对于混合博弈问题的研究缺乏实质性的进展与突破.区别于零和博弈,混合博弈需要综合考虑个体收益、集体收益和均衡收益等诸多目标,被广泛应用于公共资源分配、任务调度和自动驾驶等现实场景.因此,对于混合博弈问题的研究至关重要.通过梳理当前混合博弈领域中的重要概念和相关工作,深入分析国内外研究现状和未来发展方向.具体地,首先介绍混合博弈问题的定义与分类;其次详细阐述博弈解概念和求解目标,包含纳什均衡、相关均衡、帕累托最优等解概念,最大化个体收益、最大化集体收益以及兼顾公平等求解目标;接下来根据不同的求解目标,分别对博弈论方法、强化学习方法以及这两种方法的结合进行详细探讨和分析;最后介绍相关的应用场景和实验仿真环境,并对未来研究的方向进行总结与展望.; 董绍康李超杨光葛振兴曹宏业陈武兵杨尚东陈兴国李文斌高阳; 关键词：混合博弈博弈论

一类考虑滑动摩擦力影响的追逃博弈问题: 2025年; 本文以追逃博弈问题的经典模型之一——“homicidal chauffeur”博弈为基础,考察汽车转弯时受滑动摩擦力影响的博弈问题的捕获区域。经典“homicidal chauffeur”博弈是基于足够粗糙的地面这一理想假设对汽车转弯时的速度进行处理的。然而在现实运动中,地面粗糙程度不同会对转弯时汽车的速度造成不同的影响。本文建立模型对追逃过程中汽车速度给出全新的刻画,求解最优策略,分析与经典“homicidal chauffeur”博弈相比捕获区域的变化并阐述原因,主要结论可用于陆地追逃、空战格斗等现实场景。; 侯敏于洋戴照鹏敬鲁晶高红伟

追逃博弈问题研究综述: 2025年; 作为多智能体对抗博弈问题的重要分支,追逃博弈(Pursuit-evasion,PE)问题在控制和机器人领域得到广泛应用,受到众多研究者的密切关注.追逃博弈问题主要聚焦于追逐者和逃跑者双方为实现各自目标而展开的动态博弈:追逐者试图在最短时间内抓到逃跑者,逃跑者的目标则是避免被捕获.本文概述追逃博弈问题的相关研究进展,从空间环境、信息获取等五个方面介绍追逃博弈问题的各类设定;简述理论求解、数值求解等四种当下主流的追逃博弈问题求解方法.通过对现有研究的总结和分析,给出几点研究建议,对未来追逃博弈问题的发展具有一定指导意义.; 迟嵩禹李帅王晨谢广明; 关键词：多智能体微分对策

针对受约束轨道追逃博弈问题的循环差分进化求解框架: 2025年; 轨道追逃博弈问题得到了广泛的研究,但大多数均建立在无过程约束的假设上.本文针对受轨道高度约束的轨道追逃博弈问题,推导了鞍点存在性条件.基于方程系数矩阵的性质,将其解耦降维为两组两点边值问题.利用罚函数法处理过程约束,并将两点边值问题转化为针对最优性条件的最优化问题.继而提出了一种循环差分进化(DE)求解框架用于求解该最优化问题,以兼顾全局搜索能力和收敛效率.仿真结果表明,该求解框架相较于传统差分进化算法,大幅提高了求解效率和精度.最后,通过对比无轨道约束工况仿真结果,揭示了轨道高度约束对于防止航天器与地球碰撞的现实意义.; 张去非季明江闫斌刘才山曹璐; 关键词：罚函数两点边值问题

一种基于强化学习的渔业管理博弈问题最优策略确定方法、装置、介质及产品: 本申请公开一种基于强化学习的渔业管理博弈问题最优策略确定方法、装置、介质及产品，涉及合作博弈技术领域，所述方法包括：获取历史数据、待治理水域的当前时刻的状态向量和所有企业的相关矩阵；初始化各企业的环境治理策略参数矩阵；利...; 赵景波赵子豪张家恺孟欢李彤彤

基于分布式动态规划的微分博弈问题研究及应用: 微分博弈是一种研究动态策略互动的数学框架,其广泛应用于动态系统、多智能对象控制等领域的建模和仿真分析,其中零和博弈和非零和博弈一直是控制领域的研究重点。在实际应用中,系统往往是动态特性复杂的非线性系统,目前已有的控制方法...; 王德正; 关键词：微分博弈无模型控制

几类非光滑优化与博弈问题的神经动力学算法理论及应用: 神经动力学算法因其在并行计算和高速寻优方面的优越性能,逐渐成为目前大规模复杂工程领域一种高效的优化问题求解方法,并在图像处理、模式识别、控制工程等领域得到广泛应用。在日益复杂的工程问题和实际应用场景中,优化问题也日益呈现...; 王萌欣

一种解决同质多背包拦截博弈问题的优化方法: 本发明公开了一种解决同质多背包拦截博弈问题的优化方法。该方法通过将同质多背包单层优化问题的多项式时间近似算法中使用的调和分组机制扩展为双层版本，同时引入Ω(m)个约束条件来建立与双层线性规划近似等价的具有多项式个约束的单...; 吴晓宇张国川

基于网络环境的若干组合优化博弈问题研究: 2024年; 随着互联网技术的飞速发展和社交网络的广泛普及,大量现实问题可以模型化为基于网络环境的组合优化问题,受到学术界和工业界的广泛关注。在这一过程中,参与者通常受到个人利益的驱动,采取策略性行动以实现自身效用的最大化。这种以“自利”为核心的行为模式,不仅对其他参与者产生影响,同时所有参与者的策略选择共同决定了社会福利整体目标的实现。在此背景下,参与者之间的互动呈现出合作与竞争并存的复杂局面,构成了组合优化博弈问题。本文旨在深入分析基于网络环境的三类具有挑战性的组合优化博弈问题:网络上的公共品博弈、网络上的点覆盖博弈以及网络上的路由博弈。这三类问题不仅在组合优化和理论计算机科学领域占据着举足轻重的地位,而且在管理科学与工程、经济学等多个交叉学科领域中也展现出广泛的应用前景。因此,本文将系统性地介绍这三类组合优化博弈问题,并对其最新的研究进展进行详细的梳理和深入的凝练,以期为相关领域的研究者和实践者提供有价值的参考和启示。; 程郁琨韩鑫陈修杨张昭; 关键词：网络组合优化

狭窄框架下保险模型的Stackelberg博弈问题: 2024年; 考虑狭窄框架和均值-方差准则下的 Stackelberg 博弈再保险问题。狭窄框架意昧着,购买保险的动机除了对冲财富风险,还有可能将购买保险本身看作一项风险投资。因此,使用二次效用函数来度量保险净收益的局部得失效用,即,狭窄框架。在 Stackelberg 博弈中,再保险公司首先向保险公司提供合理的赔偿来换取适当的保费。然后,保险公司根据这个保费原则选择最优的赔偿。首先,假设再保险公司选定期望值保费原则,保险公司通过选择最优赔偿策略来最大化终端财富的均值-方差函数和保险净收益的二次函数。然后给定这个最优赔偿,再保险公司通过选择最优保费参数最大化终端财富的均值-方差函数。此外,考虑另外一个 Stackelberg 博弈的问题。对于保险公司来说,考虑与前者相同的目标函数,给定Ⅱ(I) = E(PI) 保费原则,得到了最优保险赔偿的表达式。之后,给定这个最优的保险赔偿,最大化再保险公司终端财富的期望效用准则,计算得到了保费的最优价格强度。进一步,通过 Taylor 展开,得到了这对最优解的近似表达式。; 孙少迪; 关键词：再保险

加载更多 ∨

相关作者

用户反馈

相关作者

用户登录

用户反馈