搜索到6113篇“ 集成学习算法“的相关文章
- 一种结合树模型集成学习算法和SHAP解释器的星载GNSS-R重要特征选择及森林地上生物量和冠层高估测方法
- 本发明公开了一种结合树模型集成学习算法和SHAP解释器的星载GNSS‑R重要特征选择及森林地上生物量和冠层高估测方法,结合CatBoost、XGBoost和LightGBM三种高效的梯度提升决策树算法和SHAP解释器分别...
- 布金伟汪秋兰谢佳溪李欢籍超颖刘馨雨左小清
- 改进不平衡数据中的集成学习算法
- 2025年
- 近些年人们对机器学习方面的研究日益关注,而机器学习领域的研究重点之一就是集成学习。集成学习的基本原理就是使用了许多独立的分类器,并采用一种方法使之融合为一个强学习器,用以克服单一学习器分类的缺陷。在对Bagging算法、随机森林算法、加权KNN(K-NearestNeighbor)算法和AdaBoost算法四种算法对比的基础上,将加权KNN算法和AdaBoost算法融合在一起。所采用的数据集为网络用户购物行为数据集。在实验过程中,对不平衡数据利用SMOTE采样进行处理,再对上述四种算法和改进后的AdaBoost算法进行评价和对比。通过对比发现,改进后的AdaBoost算法的预测性能更好。再将改进后的AdaBoost算法在Spark平台并行计算,提高计算效率。
- 王璐程晓荣
- 关键词:ADABOOST算法不平衡数据
- 基于集成学习算法和Optuna调优的江西省森林碳储量遥感估测
- 2025年
- 了解森林碳储量对于完整、准确地量化碳排放及气候变化背景下的环境监测至关重要,借助遥感数据源是估算区域尺度碳储量的有效方法。以江西省为研究区,基于第七次国家森林资源连续清查样地数据与Landsat-5 TM遥感数据,通过GEE平台对影像进行处理,将递归特征消除(RFE)、Boruta两种特征选择方法与支持向量机(SVR),包括随机森林(RF)、极端梯度提升(XGBoost)和堆叠集成(Stacking)在内的三种集成学习算法相结合,分析不同模型的估测精度。此外,运用Optuna超参数优化框架来确定各模型的超参数。根据最优估测模型来反演江西省森林碳储量并绘制空间分布图,选用地理探测器对碳储量的空间分布格局进行驱动力分析。结果表明:(1)根据特征重要性排名,RFE筛选出30个变量,Boruta筛选出11个变量,合适的特征子集与回归算法相结合能显著提升估测的准确性。(2)基于Optuna对各模型的超参数进行迭代调优,发现不同特征子集与机器学习算法相结合,超参数取值和重要性在模型中差异较大。其中RFE筛选的最优特征子集与Stacking算法结合进行回归拟合时获得了最好的估测效果(R^(2)=0.527,RMSE=15.85Mg/hm^(2),MAE=12.31Mg/hm^(2)),该模型有效利用训练数据,结合多种算法的优点以减少偏差,显著改善森林碳密度高值低估和低值高估的问题。(3)最优估测模型反演得到江西省2006年的森林碳密度平均值为33.356Mg/hm^(2)(2.585—88.943Mg/hm^(2)),森林碳储量总量为321.507Tg。(4)自然环境因子中海拔和坡度是影响碳储量空间分布格局的主要驱动因子;所有因子在交互作用下呈非线性增强和双因子增强,其空间分布格局是自然因素和人为因素协同作用的结果。
- 王可月王轶夫陈馨郑峻鹏李杰孙玉军
- 关键词:集成学习算法碳密度
- 一种基于集成学习算法的台风暴雨型泥石流易发性评价方法
- 本发明提供一种基于集成学习算法的台风暴雨型泥石流易发性评价方法,针对研究区域选取影响因子,建立评价指标体系,并依据指标需求获取相关数据;接着运用ArcGIS提取因子数据并进行预处理,通过因子相关性分析方法筛选无相关性的特...
- 林川潘依琳杜哲镓林彦喆贾一帆苏燕赖晓鹤
- 一种基于CatBoost集成学习算法的核事故源项反演方法及装置
- 本申请涉及一种基于CatBoost集成学习算法的核事故源项反演方法及装置。获取核事故源项反演的目标信号和输入特征变量;对目标信号和输入特征变量进行数据预处理,得到核事故源项反演的训练集和测试集;根据训练集和测试集,确定核...
- 曹博彭丁萍缪学伟李中昊游清悦
- 一种基于集成学习算法的地质灾害报警方法
- 本发明公开了一种基于集成学习算法的地质灾害报警方法,旨在解决现有灾害报警方法在面对复杂多变的地质环境和多源监测数据时,容易出现误报或漏报情况,不能综合考虑多种影响地质灾害发生的因素的问题。包括以下步骤:S1:数据采集与预...
- 邹磊袁狄平陈文江吴国华程哲张国维张志伟赵子明
- 基于粒子群优化集成学习算法堆叠模型预测蔬菜中倍硫磷的抽检结果
- 2025年
- 目的 建立基于粒子群(particle swarm optimization,PSO)算法优化堆叠模型(stacked generalization,Stacking)的蔬菜安全风险预测模型,对上海市市售蔬菜中倍硫磷的抽检结果进行预测。方法 基于2021—2023年上海市市售蔬菜中倍硫磷的抽检数据,选取任务类型、抽样地区、抽样环节、抽样场所、抽样月份、检测机构、蔬菜品种作为特征变量,以蔬菜中倍硫磷的抽检结果是否合格为目标变量;采用十折交叉验证筛选优良机器学习模型、重采样方法,经PSO算法优化模型参数后构建PSO-Stacking预测模型。结果 3889件蔬菜中检出倍硫磷阳性样品55件,不合格率为1.4%。其中,豆类蔬菜不合格率最高(2.3%),其次为茄果类(0.2%)。筛选得到基模型,包括随机森林(random forest,RF)、类别特征梯度提升树(categorical boosting,CatBoost)、梯度提升(gradient boosting,GB)、极端梯度提升(extreme gradient boosting,XGBoost)和轻量级梯度提升机(light gradient boosting machine,LGBM),最佳重采样方法为自适应合成抽样(adaptive synthetic sampling,ADASYN)技术。PSO-Stacking模型在测试集上的精确率(0.91)、召回率(0.83)、F1值(0.87)和曲线下面积(area under the curve,AUC)值(0.91)均为最高。结论 PSO-Stacking模型在不均衡食品安全抽检数据中表现优异,能准确预测蔬菜中倍硫磷不合格样本,为蔬菜监督抽检及风险预警提供技术支撑。
- 周子文范志仪彭少杰
- 关键词:蔬菜倍硫磷粒子群算法
- 一种基于Adaboost集成学习算法的矿压预测方法
- 本发明提供了一种基于Adaboost集成学习算法的矿压预测方法,属于煤矿顶板压力分析和预测技术领域;解决了普通的机器学习方法所建立的矿压预测模型在预测精度方面存在的局限性;根据煤矿工作面液压支架采集的历史矿压时序数据进行...
- 王小龙李茂林张晋孟雷张磊刘晓峰张玲玲
- 一种面向不平衡数据流的动态加权集成学习算法
- 2025年
- 概念漂移现象的出现会极大影响在线学习模型的性能,特别是当数据的分布还不均衡时,模型的性能往往会受到更大的影响。针对上述问题,提出了一种面向不平衡数据流的动态加权集成增量学习算法(Incremental Dynamic Weighted Ensemble,IDWE),该算法可同时兼顾数据流中的分布不均衡和潜在的概念漂移问题。在每个新到达的数据块上,IDWE算法均利用多元高斯一类分类器对其中的少数类样本进行建模,算法在内存中维持固定数量的分类器,根据性能反馈实时更新分类器的决策权重,并根据权重变化对分类器进行动态更新。通过在6个合成数据流和2个真实数据流上进行实验,验证了算法的有效性和优越性,证明了该算法可以有效适应数据分布不均时存在的概念漂移现象。
- 江军于化龙
- 关键词:概念漂移动态加权
- 基于集成学习算法的尾气处理装置SO_(2)排放预测模型
- 2025年
- 目的精确预测天然气净化厂尾气处理装置烟气中二氧化硫(SO_(2))排放质量浓度。方法利用某天然气净化厂2018—2023年每小时44000条尾气处理日报数据构建数据集,进行数据处理,并利用重要性分析方法提取27个重要特征。针对烟气中SO_(2)排放质量浓度的预测任务,采用了随机森林(Random Forest)、梯度提升(Gradient Boost)和极值梯度提升(XGBoost)3种集成学习算法,以及基于径向基(RBF)内核的支持向量机(SVM)替代仿真模型进行建模。结果3种集成学习模型比SVM单模型的预测效果更为精准,而Random Forest模型展现出最佳性能,决定系数为0.89,均方误差为1250.59,相对于8800个真实测试集样本数据,其预测偏差为9.86%,相比于Random Forest模型(数据未处理),其决定系数提高了61.82%。结论Random Forest模型在准确预测尾气处理装置SO_(2)排放质量浓度方面具有实际生产应用价值,可为后续尾气处理装置的工艺参数优化提供可靠的模型支持。
- 张宝东杜支文闫昭侯磊
- 关键词:天然气净化硫磺回收尾气处理二氧化硫排放集成学习算法
相关作者
- 张泽银

- 作品数:157被引量:21H指数:2
- 供职机构:浙江大学
- 研究主题:采煤机 控制站 显示仪 丙烯聚合 寻优
- 刘兴高

- 作品数:700被引量:121H指数:7
- 供职机构:浙江大学
- 研究主题:控制站 熔融指数 显示仪 软测量仪表 数据储存
- 付忠良

- 作品数:68被引量:916H指数:15
- 供职机构:中国科学院成都计算机应用研究所
- 研究主题:ADABOOST算法 分类器组合 标签 集成学习算法 图像处理
- 徐志鹏

- 作品数:198被引量:189H指数:7
- 供职机构:中国计量大学
- 研究主题:采煤机 气体流量标准装置 故障诊断系统 PVTT 气体流量
- 殷春

- 作品数:196被引量:28H指数:3
- 供职机构:电子科技大学
- 研究主题:像素点 分数阶 红外热图像 红外热成像 系统能耗