搜索到1155篇“ 分层强化学习“的相关文章
- 一种基于残差分层强化学习的臂-手机器人技能学习方法
- 本发明公开了一种基于残差分层强化学习的臂‑手机器人技能学习方法,旨在解决灵巧臂‑手机器人强化学习训练速度慢、任务成功率低的问题,涉及灵巧臂‑手机器人智能控制技术领域。该方法包括在物理仿真引擎MuJoCo中搭建用于训练灵巧...
- 黄秀财陈胜希陈开政陈杨明
- 基于分层强化学习的多无人机协同围捕方法
- 2025年
- 针对复杂障碍环境下的动态目标围捕问题,本文提出一种基于分层强化学习的多无人机协同围捕方法.该方法包含两个层级的学习过程:底层的子策略学习和高层的子策略切换.具体而言,将协同围捕任务分解为导航避障和导航避碰两个子任务,独立学习相应的底层子策略,分别赋予无人机协同围捕目标时所需的避障与避碰技能.在此基础上,设计带有切换惩罚的稀疏回报函数训练高层的子策略切换模块,避免了对人工定义规则的依赖,实现了底层技能的自动组合.数值仿真与软件在环实验结果表明,所提方法能够显著降低围捕策略的学习难度,相较于基线方法具有最高的围捕成功率.
- 孙懿豪闫超相晓嘉唐邓清周晗姜杰
- 关键词:分层强化学习避障避碰
- 一种基于自蒸馏分层强化学习的服务资源调度方法
- 本申请提供一种基于自蒸馏分层强化学习的服务资源调度方法,涉及人工智能与复杂网络交叉领域,该方法包括:基于配置的多个时间节点,获取任一时间节点处待处理的多个服务资源包对应的初始状态向量;采用自蒸馏分层强化学习网络中的编码器...
- 高庆张可昕吕金虎王薇周方
- 基于内-外循环与分层强化学习的资源分配方法
- 本发明涉及无线通信、智能交通网络及无人机协作通信技术领域,公开了一种基于内‑外循环与分层强化学习的资源分配方法。适用于包括基站BS、可重构智能表面RIS、M组V2V通信车辆对、W辆需要RIS辅助通信的车辆、无人机UAV<...
- 杨怡怀申时凯杨斌安镇宙于勇涛钱开国佘玉梅邓飞孙浏赵崇理陈震霆高扬水
- 一种基于自蒸馏分层强化学习的服务资源调度方法
- 本申请提供一种基于自蒸馏分层强化学习的服务资源调度方法,涉及人工智能与复杂网络交叉领域,该方法包括:基于配置的多个时间节点,获取任一时间节点处待处理的多个服务资源包对应的初始状态向量;采用自蒸馏分层强化学习网络中的编码器...
- 高庆张可昕吕金虎王薇周方
- 融合Bi-LSTM与多头注意力的分层强化学习推理方法
- 2025年
- 知识推理作为知识图谱补全中一项重要任务,受到了学术界的广泛关注。针对知识推理可解释性差、不能利用隐藏语义信息和奖励稀疏的问题提出了一种融合Bi-LSTM与多头注意力机制的分层强化学习方法。将知识图谱通过谱聚类分簇,使智能体分别在簇与实体间进行推理,利用Bi-LSTM与多头注意力机制融合模块对智能体的历史信息进行处理,可以更有效地发现和利用知识图谱隐藏的语义信息。Hight智能体通过分层策略网络选择目标实体所在的簇,指导Low智能体进行实体间的推理。利用强化学习智能体可以有效地解决可解释性差的问题,并通过相互奖励机制对两个智能体的动作选择以及搜索路径给予奖励,以解决智能体奖励稀疏的问题。在FB15K-237、WN18RR、NELL-995三个公开数据集上的实验结果表明,提出的方法能够捕捉序列数据中的长期依赖关系对长路径进行推理,并且在推理任务中的性能优于同类方法。
- 李卫军李卫军刘雪洋丁建平苏易礌王子怡
- 关键词:知识推理分层强化学习
- 一种基于分层强化学习的车辆无人机协同调度方法
- 本发明涉及一种基于分层强化学习的车辆无人机协同调度方法,属于交通运输和物流技术领域,解决了现有技术中“地空一体”联合运输成本高、效率低和资源配置不合理的问题,包括:步骤S1,构建城市快速物流运输的交互式仿真环境;步骤S2...
- 赵鹏蔡开泉李萌朱衍波
- 基于大语言模型的辅助分层强化学习训练方法及系统
- 本发明提出了基于大语言模型的辅助分层强化学习训练方法及系统,包括:教师智能体和学生智能体收到相同的环境观察信息;教师智能体采用大语言模型,根据接收到的环境观察信息给出指导策略,指导策略被引入训练模块;学生智能体根据环境观...
- 庞豹李千溪王江宋勇傅洪泽许庆阳袁宪锋徐小龙
- 一种个性化联邦学习中基于分层强化学习的模型交易方法
- 本发明公开了一种个性化联邦学习中基于分层强化学习的模型交易方法。该方法基于多用户拍卖模型场景下的个性化联邦学习,包括建立了一个双边拍卖交易平台,激励参与者之间的模型交易,而且优先考虑保护本地数据集中的隐私和安全。然后在这...
- 陈纬鉴李娟
- 一种基于分层强化学习的网络安全防御方法
- 本发明公开了一种基于分层强化学习的网络安全防御方法,首先通过构建目标网络训练子智能体,得到子智能体库,在此基础上,再通过构建另一目标网络训练主智能体,用于防御时,根据环境选择子智能体库中的子智能体进行防御。当子智能体和主...
- 任婧朱洪曦王雄王晟徐世中
相关作者
- 刘海波

- 作品数:94被引量:430H指数:11
- 供职机构:哈尔滨工程大学计算机科学与技术学院
- 研究主题:分层强化学习 体系结构 多智能体系统 AUV 智能机器人
- 顾国昌

- 作品数:146被引量:892H指数:16
- 供职机构:哈尔滨工程大学计算机科学与技术学院
- 研究主题:分层强化学习 智能机器人 多智能体系统 路径规划 多机器人
- 沈晶

- 作品数:73被引量:315H指数:10
- 供职机构:哈尔滨工程大学计算机科学与技术学院
- 研究主题:分层强化学习 AUV 人脸检测 OPTION 多智能体系统
- 彭志平

- 作品数:228被引量:431H指数:10
- 供职机构:广东石油化工学院
- 研究主题:裂解炉炉管 裂解炉 虚拟机 云计算 炉管
- 刘全

- 作品数:264被引量:1,379H指数:14
- 供职机构:苏州大学
- 研究主题:光栅 TABLEAU 离子束刻蚀 全息 行动者