搜索到34篇“ SPRINT算法“的相关文章
- 一种改进的SPRINT算法
- 2018年
- 自大数据时代以来,数据密集型计算已经引起了相当大的关注.数据密集型计算环境中的数据挖掘研究仍处于初级阶段.提出一种基于MapReduce编程框架和SPRINT算法的决策树分类算法M-BCBT. M-BCBT继承了MapReduce的优点,使算法更适合数据密集型计算应用.算法的性能根据实例进行分析评估.实验结果表明,MBCBT可以缩短操作时间,提高大数据环境的准确性.
- 白玲玲韩天鹏
- 关键词:SPRINTMAPREDUCE决策树数据挖掘
- 基于云计算的SPRINT算法研究被引量:1
- 2017年
- 决策树是数据挖掘中非常重要的一种技术,常用来做数据分析和预测。传统的决策树算法在处理海量数据挖掘时,受到CPU和内存的限制,导致算法存在消耗时间过长,容错性差,存储量小的缺点。面对海量数据的处理,云计算在这方面具有非常多的优势。针对决策树中优秀的SPRINT算法,首先对SPRINT算法进行了优化,然后为了让优化后的算法更好地应用于云计算,对算法实现了并行化。传统的SPRINT算法在生成决策树时,会发生多值偏向问题,在生成一个节点时,通过计算两层的Gini指数来降低多值偏向的影响。在算法并行化时,通过将数据分发到各个处理器执行,然后进行汇总处理,从而减少算法执行的总时间。实验结果表明:基于云计算平台的SPRINT改进算法具有更好的分类正确率,同时算法的执行速度也得到了明显的提高。
- 杨洁黄刚
- 关键词:云计算MAPREDUCESPRINT算法
- 基于Hadoop平台的SPRINT算法的分析与研究被引量:2
- 2016年
- 传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台的出现为决策树算法的并行化提供了新的思路.本文设计和实现了一种基于Hadoop平台的并行SPRINT分类算法.实验结果表明:基于Hadoop平台的SPRINT分类算法比没有进行并行化的SPRINT算法具有较好的分类正确率、较低的时间复杂度和较好的并行性能,并且能明显提高算法求最佳分裂点时的执行速度.
- 黄刚孙媛
- 关键词:HADOOPMAPREDUCE数据挖掘决策树SPRINT算法
- 改进的SPRINT算法及其在体质数据分析中的应用被引量:4
- 2014年
- 为了能够利用常规测试数据快速准确地确定人体体质状况,引入了纯区间的概念,并提出了一种趋势选择方法,在此基础上提出基于趋势选择的SPRINT算法(TESTSPRINT)。利用该算法可以根据身高、体重、握力等基本测试数据快速建立人体体质状况决策树,为快速确定人体体质健康状况提供依据。实验和理论分析结果均表明,提出的TESTSPRINT算法可以有效为分析人体体质健康状况提供决策依据,具有较高的准确性,并且时间和空间开销较原SPRINT算法小。
- 丁亚芝郑志高马嵘
- 关键词:SPRINT算法基尼系数数据挖掘
- 基于SPRINT算法的胃癌临床医疗数据挖掘研究被引量:4
- 2012年
- 为了满足数据挖掘的需要,本文提出了一个基于决策树的胃癌临床医疗信息分析应用研究模型.该模型是从业务数据库或数据仓库中抽取与胃癌术后复发因素有关的数据,形成决策树的训练数据集.运用SPRINT算法,构建胃癌术后复发的危险因素分析模型.通过对模型分析,寻找疾病的临床诊断、治疗和预后的关系,证实胃癌术后复发首要危险因素是家族遗传.
- 郑丹青
- 关键词:SPRINT算法胃癌数据挖掘
- 改进SPRINT算法及其在分布式环境下的研究被引量:7
- 2008年
- 通过引入一种动态数据结构,解决了SPRINT算法使用多个属性列表存储数据、占用过多系统资源、需创建哈希表对属性列表进行分割以及节点分割处理相对复杂的问题,并探讨了改进算法在分布式环境下的工作过程.实验结果表明,改进的算法减少了属性列表占用的存储空间以及分割节点操作所需的时间.
- 于蕾刘大有高滢田野
- 关键词:决策树SPRINT算法分布式环境
- 数据挖掘中决策树SPRINT算法探讨被引量:1
- 2007年
- 本文简明扼要的介绍了数据挖掘中决策树SPRINT算法,并对其进行了一定程度上系统的分析和改进.
- 董峰刘远军
- 关键词:数据挖掘决策树算法SPRINT算法
- SPRINT算法的并行性研究与应用被引量:1
- 2007年
- 随着数据挖掘技术的发展,分类算法的并行化问题已经成为数据挖掘领域的一个研究热点。文章详细讨论了基于SPRINT的数据挖掘分类算法,并针对该算法并行化的问题进行研究探讨。
- 陈如云符保龙
- 关键词:数据挖掘决策树SPRINT算法并行化
- SPRINT算法的改进被引量:8
- 2006年
- 引出了纯区间的概念后,提出了一种基于纯区间归约的数值型属性处理方法对SPRINT算法进行改进。该方法将属性值域用等宽直方图的方法划分为多个区间,对纯区间进行归约,对非纯区间进行精确计算,保证了分裂精度,减小了计算量。
- 刘友军汪林林
- 关键词:决策树SPRINT算法
- SPRINT算法中寻找连续属性分割点方法的改进被引量:5
- 2006年
- 文章针对SPRINT算法中的寻找连续属性最佳分割点计算量大的问题,改进了寻找连续属性最佳分割点的方法。改进后的方法可减少候选分割点的数目,从而减少计算量和计算时间。
- 彭程罗可
- 关键词:数据挖掘决策树SPRINT算法
相关作者
- 黄刚

- 作品数:82被引量:812H指数:10
- 供职机构:南京邮电大学
- 研究主题:HADOOP 测试集 泛化 用户 信任
- 彭程

- 作品数:8被引量:13H指数:3
- 供职机构:长沙理工大学
- 研究主题:SPRINT算法 决策树 数据挖掘 城市化进程 铜
- 罗可

- 作品数:115被引量:628H指数:12
- 供职机构:长沙理工大学
- 研究主题:聚类算法 粗糙集 聚类 数据挖掘 聚类分析
- 符保龙

- 作品数:47被引量:160H指数:7
- 供职机构:柳州职业技术学院
- 研究主题:数据挖掘 文本挖掘 高职 关联规则 决策树
- 龚永华

- 作品数:2被引量:1H指数:1
- 供职机构:华中科技大学计算机科学与技术学院
- 研究主题:决策树 数据挖掘 SPRINT算法 信息增益