搜索到183篇“ FP-树“的相关文章
- 基于FP序列树的法文词语提取方法研究被引量:1
- 2021年
- 法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合。实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用。
- 于娟吴晓鹏廖晓刘建国
- 关键词:文本压缩
- 一种基于FP-树的时空数据挖掘分析方法
- 本发明涉及一种基于FP‑树的时空数据挖掘分析方法,属于时空数据挖掘技术领域。先建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表;对事务表进行第一次扫描,计算并保留频繁项;然后,对事务表进行第二次扫描...
- 宋耀莲田榆杰龙华王慧东徐文林武双新
- 基于FP-树的时空关联规则挖掘算法研究被引量:4
- 2016年
- 提出一种基于FP-树的时空关联规则挖掘算法,即STFP-tree(Spatio-temporal FP-tree)算法.算法对时空数据进行时间上的划分,并用空间谓词分析空间对象间的位置关系,最终生成同时考虑时间和空间特征的FP-树,进而挖掘出强时空关联规则.实验结果证明了算法的有效性,适用于对时空数据进行分析挖掘.
- 张雪萍李围成祝玉华
- 关键词:时空数据FP-树
- 基于FP-树的时空数据挖掘算法研究
- 时空数据挖掘作为空间数据挖掘的拓展,主要是针对时空数据进行分析和处理,时空数据的结构包括位置信息、时间信息和属性信息三方面内容。对时空数据的挖掘不仅仅是要分析时空数据的属性信息,还需要分析数据对象的空间关系以及数据对象随...
- 李围成
- 关键词:时空数据挖掘空间数据挖掘FP-树
- 基于改进FP-树的关联规则增量式更新算法的研究与应用
- 数据挖掘技术是当今的研究热点,已在诸如商务、医学与工程学等众多领域拥有广泛应用。它能够探查隐藏在数据间的有用信息,帮助分析决策。 关联分析作为数据挖掘技术中极其重要的一环,研究成果相对较多。关联分析的主要功能是探查数据...
- 郑劼诚
- 关键词:数据挖掘关联规则APRIORI算法FP-树FUP算法
- 基于改进的FP-树和数组技术的频繁模式挖掘算法
- 2012年
- FP-growth算法是目前较高效的频繁模式挖掘算法之一,该算法不产生候选项集,但递归构造"条件FP-Tree"的CPU开销和存储很大。为此提出了一种频繁模式挖掘算法IFPmine。首先,为了节省内存空间,采用了约束子树的挖掘方法;其次,采用了数组技术来减少树的遍历时间,从而提高算法的效率。实验结果表明,IFP算法是一种较有效的频繁模式挖掘算法,其挖掘效率优于树算法和树算法而需要的内存却少于树和树算法。
- 孟志忠
- 关键词:数据挖掘关联规则
- 一种网格环境下的FP-树分布式构造算法被引量:2
- 2011年
- 针对分布式环境下FP-tree的构造及合并,给出了一种网格环境下FP-tree的分布式构造算法GridDBMA。该算法中,各站点根据全局项目头表,独立构造局部频繁模式树BFP-tree,然后,利用合并算法将各局部树合并为一棵全局频繁模式树,并在全局频繁模式树上提取出所求的频繁项目集,通过对传统频繁模式树的存储结构的改进,减少了树的规模及站点间的网络通信量,并使树的遍历更加方便有效,提高了合并效率,从而提高了整个频繁项目集的挖掘效率。最后,采用天体光谱数据作为形式背景,实验验证了该算法的正确性和有效性。
- 荀亚玲吴晓婷张继福
- 关键词:网格分布式数据挖掘关联规则FP-树
- 用变异FP-树改进CLOSET算法
- 2010年
- 频繁闭项集提供了频繁项集的一种完整、最小表示,对频繁闭项集的挖掘是近年来数据挖掘领域研究的热点,研究人员从不同角度对算法改进以提高算法的效率。基于频繁项集中共生项集的性质,提出无须进行子集检查的频繁闭项集挖掘方法,并设计一种变异的FP-树结构,利用FP-树结构来存储结点共生项集信息,以改进CLOSET算法,算法无须遍历结果集进行闭合性检查。实验表明,在支持度阈值减小,结果集变大时,改进算法的时间增长率比原有算法小。
- 刘迎意吴春旭沈陵峰
- 关键词:数据挖掘频繁闭项集
- 一种基于压缩FP-树的最大频繁项集挖掘算法被引量:3
- 2009年
- 针对基于FP-树挖掘最大频繁项集的算法需要大量的递归调用导致挖掘效率降低的问题,本文提出一种减枝策略并结合FP-树的结构,依据构造Patricia-树的基本原理提出一种PFP-树,将FP-树中满足一定条件的结点进行合并来保存事务数据库,对事务数据库进行进一步压缩以达到降低内存开销和递归调用次数的目的。实验表明,当最小支持度较小时,在执行效率尤其在内存开销方面都有一定的改善。
- 马达王佳强
- 关键词:最大频繁项集FP-树
- 基于改进FP-树的最大项目集挖掘算法被引量:1
- 2009年
- 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题。FP-growth算法是目前最有效的频繁模式挖掘算法之一,其在挖掘最大项目集时要递归生成大量的条件FP-树,存在时空效率不高的问题。于是结合改进的FP-树,提出了一种快速挖掘最大项目集的算法。该算法利用改进的FP-树是单向的且每个节点只保留指向父节点的指针,可以节约大量的存储空间;同时引入项目序列集和它的基本操作,使挖掘最大频繁项目集时不生成含大量候选项目的集合或条件FP-树,可以快速地挖掘出所有的最大频繁项目集。实例分析证明所提出的算法是可行的。
- 谢志强朱孟杰杨静
- 关键词:数据挖掘关联规则最大频繁项目集频繁模式树
相关作者
- 曾艳

- 作品数:5被引量:42H指数:2
- 供职机构:桂林空军学院
- 研究主题:协同过滤 评分 推荐系统 FP-树 协同过滤推荐
- 张锦

- 作品数:28被引量:127H指数:6
- 供职机构:上海海事大学经济管理学院
- 研究主题:频繁模式挖掘 可视化 INTERNET 信息检索 CORBA
- 王春凯

- 作品数:5被引量:30H指数:2
- 供职机构:中国人民大学信息学院
- 研究主题:数据流 FP-树 关联规则 频繁项集 处理系统
- 马海兵

- 作品数:11被引量:67H指数:5
- 供职机构:中国人民解放军南京政治学院
- 研究主题:数据挖掘 频繁模式挖掘 频繁子树 网络舆情 FP-树
- 范明

- 作品数:99被引量:354H指数:9
- 供职机构:郑州大学信息工程学院
- 研究主题:数据挖掘 分类器 组合分类器 稀有类 EP