搜索到1463篇“ 离群点检测“的相关文章
离群检测方法、装置、计算机设备和可读存储介质
本申请涉及一种离群检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:获取待检测数据集和待检测数据集对应的样本数据集;提取待检测数据集的属性特征,并基于属性特征在各检测算法中筛选各初始目标检测...
陈燕燕
基于离群检测的优化初始中心的三支K-Means算法
2025年
针对传统的k-means算法的聚类数目k无法确定、初始聚类中心随机给定、容易受到离群影响等问题,该算法使用LOF (Local Outlier Factor)离群检测算法计算数据集中每个数据对象的离群因子,并去除离群因子大于指定阈值的数据对象,使用手肘法来确定符合数据集的最佳k值,根据最大密度和最大距离的思想结合每个离群因子来选取初始聚类中心并进行后续聚类中心的迭代,聚类完成后结合三支决策的思想对聚类结果的每个簇内的数据对象进行进一步优化。实验结果表明ODT-kmeans算法能合理选取k值、减少离群的影响并且可以消除随机选择初始聚类中心的问题,提高了k-means聚类算法的准确率。In view of the problems of the traditional k-means algorithm, such as the number of clusters k cannot be determined, the initial cluster center is randomly given, and it is easily affected by outliers, this algorithm uses the LOF (Local Outlier Factor) outlier detection algorithm to calculate the outlier factor of each data object in the data set and remove the data objects whose outlier factor is greater than the specified threshold. The elbow method is used to determine the best k value that meets the data set. The initial cluster center is selected based on the idea of maximum density and maximum distance combined with the outlier factor of each point and the subsequent cluster center iterations are performed. After clustering is completed, the idea of three-way decision is combined to further optimize the data objects in each cluster of the clustering results. Experimental results show that the ODT-kmeans algorithm can reasonably select the k value, reduce the influence of outliers, and eliminate the problem of randomly selecting the initial cluster center, thereby improving the accuracy of the k-means clustering algorithm.
樊有明李志聪
关键词:K-MEANS算法聚类中心
基于机器视觉的造纸检测仪器误差局部离群检测方法
2025年
环境条件波动、仪器自然老化等原因的存在,导致造纸检测仪器正常误差无法避免,其对造纸检测仪器的稳定运行不会造成太大影响,而异常误差往往会诱发重大故障事件,故提出基于机器视觉的造纸检测仪器误差局部离群检测方法研究。应用高分辨率相机捕获纸张图像,通过阈值法提取纸张表面缺陷,利用造纸检测仪器对纸张(与机器视觉对象相同)缺陷进行检测,对比识别两者之间的差异,即确定造纸检测仪器误差。基于局部离群检测算法计算误差的局部密度,根据确定的离群阈值检测异常误差,从而实现了对造纸检测仪器误差局部离群检测。测试结果显示,设计方法应用后获得的纸张表面缺陷与实际缺陷高度重合,造纸检测仪器误差与实际误差趋于一致,误差局部离群检测结果(异常误差检测结果)与实际异常误差相同。
杨品张雷张雷
关键词:机器视觉
基于模糊离群检测的交通流数据异常识别方法
本发明公开了基于模糊离群检测的交通流数据异常识别方法,包括获取交通流数据集,基于交通流数据集构建δ个B+树索引,构建第一边界查找算法和第二边界查找算法,构建MBAFOM查找算法,所述MBAFOM查找算法用于设置限定参数...
王习特李善志白梅马茜
基于数据采集和知识滤波的离群检测方法及相关装置
本发明属于工业生产数据离群检测/异常检测技术领域,公开了一种基于数据采集和知识滤波的离群检测方法及相关装置;其中,所述基于数据采集和知识滤波的离群检测方法包括以下步骤:采集工业生产数据;基于采集的工业生产数据,利...
王玉栋刘振杰刘承宝白熹微谭杰
一种离群检测方法、装置、电子设备及存储介质
本发明公开了一种离群检测方法、装置、电子设备及存储介质,首先确定数据集中每个数据的局部异常因子值,然后将每个的局部异常因子值按照大小顺序进行排序。基于排序结果选取局部异常因子值较大的预设第一数量的第一局部异常因子值...
黄自力杨阳陈舟熊璐邱震尧张叶
维度映射下动态非平衡流数据DBSCAN离群检测
2025年
现有检测方法在处理高维动态非平衡流数据时,难以捕获数据非线性结构,导致检测结果不精准。为了解决该问题,提出了维度映射下动态非平衡流数据DBSCAN离群检测方法。分析高维数据维度之间相似性,将高维数据集映射在簇特征上,按照类圆簇两维度映射,计算映射与维度锚距离,确定映射位置,构建数据聚类中心。根据聚类参考间距离与参考所代表数据到聚类中心的距离关系,判断离群对象。采用动态非平衡数据流的滑动窗口,更新窗口中数据近邻数。构建类似簇矩阵,检测离群。由实验结果可知,研究方法正常均在象限一,离群分别在象限二、三、四,与数据集检测理想结果一致,能够精准检测离群
秦康平陈新仪
关键词:DBSCAN聚类离群点检测
船名标注模型的构建方法和基于船名的离群检测方法
本发明提供了一种船名标注模型的构建方法和基于船名的离群检测方法,涉及航海和地理信息系统技术领域。船名标注模型的构建方法包括:获取多个船舶名称;对多个船舶名称进行预处理,筛选出具有指定特征的船舶名称作为第一船舶名称,指定...
王楠盛尊阔韩斌
基于邻域平均距离的离群检测算法被引量:1
2024年
离群检测是数据挖掘领域的一个热问题,离群检测可以有效地识别出数据集中的离群,为数据分析提供方便。为提高数据分析精度,有效筛选离群,提出一种基于邻域平均距离的离群检测算法。首先计算误差平方和并使用肘部法确定最佳聚类个数K,然后将K代入K-Means的优化算法二分K-Means中对数据集进行聚类处理,从而得到K个数据簇,最后分别计算每个簇中质心ε邻域的邻域平均距离,将与质心距离大于阈值距离的样本作为离群集。实验结果表明,在标准数据集UCI上,该算法的检测率有较好的表现。
史金余杜晓涵孙禹明李春慧
关键词:离群点检测
基于局部相对密度的离群检测算法
2024年
数据集中离群占比很小,但大多现有的方法在检测期间需要对所有数据都进行离群度计算。针对此问题提出一种基于互近邻聚类的正常数据去除算法(EMNC),通过数据预处理最大程度消除正常。只考虑k最近邻不适用分布异常的离群,充分利用对象与其邻居的分布,同时考虑k最近邻、反近邻和共享近邻来进行密度估计。最后重新定义基于局部相对密度的离群度(ROF)对剩余可疑进行离群判断。该算法在减少离群度计算量的同时提升了检测效率,在合成与真实数据集上和其他方法的对比实验结果表明了算法的有效性。
何旭邓安生葛小龙
关键词:离群点检测

相关作者

张忠平
作品数:125被引量:426H指数:12
供职机构:燕山大学信息科学与工程学院
研究主题:网格 数据挖掘 离群点 离群点检测 离群点检测算法
孙志挥
作品数:187被引量:2,099H指数:26
供职机构:东南大学计算机科学与工程学院
研究主题:数据挖掘 关联规则 数据库 频繁模式树 数据流
杨秦敏
作品数:217被引量:85H指数:6
供职机构:浙江大学
研究主题:风电机组 输出数据 风速 风力发电机组 功率曲线
薛安荣
作品数:56被引量:396H指数:9
供职机构:江苏大学计算机科学与通信工程学院
研究主题:离群点检测 离群点挖掘 隐私保护 空间离群点 数据挖掘
俞庆英
作品数:81被引量:104H指数:5
供职机构:安徽师范大学
研究主题:隐私保护 离群点检测 路网 路段 聚类中心