李建飞
- 作品数:2 被引量:4H指数:1
- 供职机构:燕山大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:生物学自动化与计算机技术更多>>
- 基于伪F统计FAMC算法的基因表达数据分析被引量:3
- 2009年
- 基因芯片技术在给人类带来巨大机遇的同时也带来一些挑战。针对基因表达数据的海量性,以及基因类属的不确定性等问题,提出了一种基于伪F统计量(PFS)的模糊属性均值聚类FAMC(fuzzy attribute c-means cluste-ring)算法,并就模糊参数m的确定问题提出了有效的解决方法。最后将其在标准的基因表达数据上进行测试分析,取得了较优的聚类结果。
- 刘文远李建飞王宝文于家新
- 关键词:基因表达数据
- 基于信息论k-modes聚类法的基因表达数据分析被引量:1
- 2009年
- k-均值聚类算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通常用距离法来表示基因间的关系,但不能有效的反应基因间的相互依赖的关系。为此,提出基于信息论的k-modes聚类算法,克服了以上缺点。另外,还引入了伪F统计量,一方面,可以对空间中有部分重叠的点进行有效的分类;另一方面,可以给出最佳聚类数目,从而弥补了k-modes聚类法的不足。使其成为一种非常有效的算法,从而达到较优的聚类效果。
- 刘文远李建飞王宝文于家新
- 关键词:基因表达数据聚类分析互信息