搜索到2137篇“ 非平衡数据“的相关文章
有限标签下的平衡数据流分类方法
2025年
数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见的多类平衡、概念漂移、标签成本昂贵的问题。为此,提出了一种有限标签下的平衡数据流分类方法。该方法定义了预测概率差值与信息熵相结合的样本预测确定性度量,提出了不确定性标签请求策略;定义了基于类不平衡比率和样本预测误差的样本重要性度量;提出了基于概念漂移指数的分类器的更新与重构机制。在6个人工数据流和3个真实数据流上的对比实验表明,本文提出方法的分类性能优于已有的6种数据流分类方法的分类性能。
李艳红李志华郑建兴郑建兴白鹤翔
关键词:数据流分类极限学习机概念漂移
一种处理平衡数据的联邦安全聚类方法及系统
本发明公开了一种处理平衡数据的联邦安全聚类方法及系统,其中,所述方法包括:基于竞争学习算法对每个客户端的平衡数据集进行局部聚类,获得若干个子簇;计算每个子簇的簇心、半径、大小和标准差,并将每个子簇的簇心、半径、大小和...
张越廖新发丁徐闯白雨婷
基于平衡数据的深度再分片算法
2025年
随着区块链技术普及,交易量激增对网络性能提出挑战,传统基于账号交易的分片方法在处理不平衡数据时表现不佳,导致跨分片交易增加,影响性能。对此,提出了一种基于交易频率的深度遍历再分片算法。该算法通过初步分片减少跨分片交易,再对交易密集的分片进行深度遍历再分片,解决数据平衡问题。通过计算账号交易频率,确保负载平衡,并将频繁交易的账号尽量分配在同一分片。实验结果表明,该算法能有效平衡负载、减少跨分片交易,提升网络吞吐量和效率。
赵鹏李军卢波郭赟泽陈伟
关键词:交易频率
一种基于主动漂移检测的平衡数据流挖掘方法
针对数据流的概念漂移特性以及平衡特性,本发明提出了一种基于主动漂移检测的平衡数据流挖掘方法,包括以下三个步骤:(1)平衡数据的处理,数据流中可能存在一些类别不平衡现象,需要对不平衡数据进行有效的处理。(2)主动概念...
张平邵亨康李方陈昕叶
一种基于平衡数据的轧制过程故障诊断方法
本发明提供一种基于平衡数据的轧制过程故障诊断方法,涉及轧制过程自动控制技术领域。本发明首先采集某段时间中轧制过程的生产数据;再将数据进行连续型特征去除异常值、平滑处理和归一化、类别型特征编码处理,划分数据集,平衡训练...
孙杰汪龙军邓继飞彭文丁敬国张殿华
一种平衡数据集下图像模态转换方法
本发明公开了一种平衡数据集下图像模态转换方法,包括构建数据集,构建基于多尺度卷积核并行和稠密连接的MR成像GAN模型,将CT/MR图像同时作为条件约束,提出相应的目标函数和约束条件,并进行GAN模型训练,将CT图像输入...
朴昌浩邹伟刘明杰马艺玮陈俊生 黄健 石均仁
基于联合熵的平衡数据边界混合重采样
2024年
为了克服在数据平衡处理过程中单一重采样方法易生成冗余样本及误删重要样本信息的局限,本文提出一种基于联合熵的平衡数据边界混合重采样算法。该算法首先通过引入边界因子对边界集和边界集进行有效的区分,进一步构建一个联合熵指标体系以判断出边界集中少数类样本的重要程度,并根据其重要程度对细分后的少数类样本点设置不同的过采样方法和采样数量,最后使用NearMiss-2算法对边界集中多数类样本点进行筛选并删除,从而实现数据的相对平衡。通过对9组UCI数据集进行对比实验,实验结果表明:该算法在F1-Score、G-mean及AUC这3个指标上均有提升,验证了其有效性,有较好的平衡数据分类性能表现。
周传华任太娇罗岚周昊
关键词:不平衡数据分类联合熵混合采样
面向平衡数据的可伸缩贝叶斯网络研究
贝叶斯网络分类器(Bayesian Network Classifier,BNC)是贝叶斯网络(Bayesian Network,BN)的一种特殊形式,在分类任务中展现出巨大潜力。BNC能够清晰地表示变量之间的概率依赖性...
国露
关键词:数据挖掘非平衡数据有向无环图启发式搜索策略
信息科学技术学术著作丛书 平衡数据分类理论与方法
在实际应用中,需要处理的数据常常具有类别不平衡的特点。例如,用于信用卡欺诈检测、垃圾邮件过滤、机械故障诊断、疾病诊断、极端天气预测预报等的数据都是类别平衡数据,研究平衡数据分类问题具有重要意义和实际应用价值,引起机器...
翟俊海作
关键词:数据处理
一种基于代价敏感学习的螺杆泵平衡数据故障诊断方法
本发明公开了航空航天技术领域的一种基于代价敏感学习的螺杆泵平衡数据故障诊断方法,包括:构建包含不同螺杆泵振动的平衡数据的训练集及测试集;构建ResNet结构,基于训练集训练ResNet结构得到ResNet故障特征提取...
马剑张明辉邹新宇吕琛

相关作者

职为梅
作品数:26被引量:57H指数:5
供职机构:郑州大学
研究主题:非平衡数据集 稀有类 数据挖掘 分类器 抽样技术
范明
作品数:99被引量:354H指数:9
供职机构:郑州大学信息工程学院
研究主题:数据挖掘 分类器 组合分类器 稀有类 EP
翟云
作品数:48被引量:1,105H指数:18
供职机构:国家行政学院
研究主题:政务服务 互联网 数字政府 政府治理 政务
李凤莲
作品数:113被引量:156H指数:7
供职机构:太原理工大学
研究主题:脑卒中 大数据 脑电信号 非平衡数据 多晶硅
张雪英
作品数:124被引量:15H指数:2
供职机构:太原理工大学
研究主题:情感识别 脑卒中 网络 语音 脑电信号