国家自然科学基金(61171053) 作品数:28 被引量:104 H指数:6 相关作者: 黄刚 王汝传 孙力娟 李正杰 杨洋 更多>> 相关机构: 南京邮电大学 南京广播电视大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 江苏省科技支撑计划项目 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于多叉树确定K值的动态K-means聚类算法 被引量:2 2017年 K-means聚类算法是基于划分的经典聚类算法之一,因其简洁、高效得到了广泛的应用。K-means算法具有容易实现、时间和空间复杂度较小的优点。但该算法的初始聚类数K通常不能通过有效的手段事先确定,其初始聚类中心往往是随机选取的,易收敛于局部最优解,造成聚类结果的不准确。基于多叉树确定K值的动态K-means聚类算法是对传统算法的改进,力求在迭代过程中动态分裂合并簇来确定最合理的聚类数,并且能在一定程度上解决聚类结果收敛于局部最优解的问题。文中还探索了相应的数据模型以支持所改进算法的研究,并从横向与纵向两方面与二分K-means算法作了对比实验。实验结果表明,改进后的K-means算法不依赖于全局数据集,更适用于分布式平台运算;算法相对效率随着数据集规模的增大,特别是在洪量数据集下具有明显的优势。 鲍黎明 黄刚关键词:K-MEANS 聚类 多叉树 一种多层网络下动态负载均衡算法 被引量:5 2017年 分布式系统由若干个独立的节点组成,一些节点由于接收到大量请求而过载,还有一些节点却负担较少的请求任务。通过负载均衡技术可以使节点间的负载分配更加合理,最大化利用服务器集群的处理能力,达到扩展服务器集群的带宽和增加吞吐量,加强网络数据处理能力,提高网络的灵活性和可用性的目的。传统的集中式负载均衡方案采用静态负载均衡算法,由控制器全权负责任务分配。它的优点是功耗低而且稳定性强,缺点则是负载均衡效果不是最佳,总体处理速度较慢,中央控制器节点由于负担重容易成为系统瓶颈。同时,它的系统扩展在大规模集群中表现差。相比之下完全分布式方案是可扩展的,由于所有节点既是处理节点,也是分发器,而调度器只负责任务调度,从而减轻了控制器的负担,避免成为系统瓶颈。提出了一种异构分布式计算系统集群的负载均衡策略。该算法采集各个节点CPU使用率、存储器使用率两个系统参数,以决定各节点的工作量。同时,设计两层结构,解决全局通信负担较重的问题。仿真结果表明,该算法有效提高了负载均衡的效率。 刘立帮 黄刚关键词:分布式系统 异构网络 Node correlation clustering algorithm for wireless multimedia sensor networks based on overlapped FoVs 被引量:8 2013年 In this paper, a clustering algorithm is proposed based on the high correlation among the overlapped field of views for the wireless multimedia sensor networks. Firstly, by calculating the area of the overlapped field of views (FoVs) based on the gird method, node correlations have been obtained. Then, the algorithm utilizes the node correlations to partition the network region in which there are high correlation multimedia sensor nodes. Meanwhile, in order to minimize the energy consumption for transmitting images, the strategy of the cluster heads election is proposed based on the cost estimation, which consists of signal strength and residual energy as well as the node correlation. Simulation results show that the proposed algorithm can balance the energy consumption and extend the network lifetime effectively. ZHANG Qian-yan WANG Ru-chuan SHA Chao HUANG Hai-ping关键词:CLUSTERING 移动模型对机会网络路由协议的影响研究 被引量:1 2015年 移动模型对机会网络路由协议的研究起着非常重要的作用,因为几乎没有可以用于性能评估的大型真实网络环境。不同的移动模型使得节点的运动方式各不相同,导致网络拓扑有很大变化,影响了路由协议的仿真结果。文中在介绍机会网络研究中常用的移动模型及其配置方式的基础上,对移动模型进行分类比较,分析各自的特点、适用场景以及移动模型对路由协议仿真的影响。文中设计的仿真实验表明,同一路由协议在不同移动模型下的消息传输率和平均时延有大幅变化,且不同路由协议的变化趋势各不相同,因此需要根据路由协议应用场景选择合适的移动模型。 蒋凌云 冯莹 孙力娟关键词:机会网络 机会路由 基于信任聚类的协同过滤推荐算法 被引量:3 2019年 基于聚类的协同过滤算法是依靠群体的思想,根据最近邻的喜好为目标用户进行推荐,在处理规模较大的数据时是高效和可扩展的。但传统的聚类推荐方法普遍存在准确率和覆盖率较低的问题,评分矩阵稀疏性问题也会下降其推荐性能。针对这一系列问题,提出了一种基于信任聚类的协同过滤算法(TCCF)。该算法使用SVD聚类来处理信任和不信任关系矩阵,以发现信任群体。然后,提出了一种稀疏评分填充算法来生成密集用户评分模型解决稀疏性问题。最后与传统协同过滤算法进行整合推荐。开放数据测试实验表明,该算法可以有效地提高推荐的准确性和质量,并且一定程度上缓解了稀疏性问题,在聚类算法中加入信任关系,有效改善了冷启动问题,优于传统的聚类协同过滤算法。 王菲 黄刚 朱峥宇关键词:协同过滤 冷启动 数据稀疏 基于Docker的Hadoop集群网络性能分析 被引量:6 2018年 针对Hadoop从网络的角度来研究提高Hadoop性能的方法不足的问题,提出了一个通过相关工具,根据不同的网络配置,在虚拟化环境Mininet下监测并分析Hadoop集群的网络特性的系统框架。本系统建立一个在Docker容器内运行的Mininet的Hadoop集群,按照不同的需求,通过配置Mininet方便地修改网络拓扑结构,可以监测容器和虚拟交换机的网络流量,并通过网络流量监视器观察网络行为,分析不同的网络设置对Hadoop性能的影响。实验从集群中没有背景流量、集群中的背景流量无Qo S控制、集群中的背景流量有Qo S控制,三个方面对Hadoop集群网络性能进行了详细分析。 凌杰 黄刚关键词:大数据 HADOOP DOCKER 基于Hadoop平台的C4.5算法的分析与研究 被引量:5 2014年 如何能从海量数据中以更快速、高效、低成本的方式挖掘出有价值的信息成为如今数据挖掘技术面临的新课题。文中在研究Hadoop平台的特征和决策树的C4.5算法的过程中,决定在决策树算法领域中引入云计算思维,实现其在Hadoop平台上的并行化,并且采用MapReduce模型来解决海量数据挖掘问题。最后用打高尔夫球的数据集对新的算法进行验证。实验结果表明对海量数据,基于Hadoop平台的决策树算法可以明显提高数据挖掘的效率,具有可观的高效性和可扩展性,在一定程度上解决了C4.5算法在处理海量数据时计算量大、构建决策树时间长的问题。 孙媛 黄刚关键词:HADOOP MAPREDUCE 数据挖掘 C4.5算法 提取关键字改进协同过滤算法的研究与应用 2019年 协同过滤算法在遇到数据稀疏性问题时,其相似度计算过程会受到很大的影响,导致推荐结果不准确,影响推荐系统用户体验。而影评网站的影评往往很好地概括了电影的特征,从影评网站的影评文字中可以使用关键字提取算法提取特征来进行电影间的相似性计算。TF-IDF是一种高效而常用的关键词提取技术,其通过特定文档中词的相对频率和整个文档语料库中该词的反比例进行比较,最终得出该篇文章的关键字。利用文本信息提取关键字,进而通过文章的关键字词进行文章的相似度计算,可以有效地改进评价矩阵稀疏的问题。通过爬取电影的评价文字来进行关键字提取,改进评分矩阵较稀疏的电影的相似度计算,可以弥补稀疏矩阵的缺陷。实验结果表明,该算法有效提高了准确率、召回率和覆盖率,证明了算法的可行性。 李吉祺 黄刚关键词:推荐系统 协同过滤 Android消息推送机制在分析交互系统中的应用 被引量:1 2016年 探讨一种基于Apache Mina的网络应用框架的推送方案,方案设计一个应用在移动终端的Web服务性能的移动分析系统,该系统可及时推送消息到客户端程序。实验结果表明,该推送方案具有良好的开放性与安全性,有效地降低移动应用开发者的开发周期。 黄刚 黄子娟关键词:移动互联网 ANDROID APACHE 数据推送 多标签图像的识别分类处理算法 被引量:3 2017年 目前卷积神经网络已在单标签图像的识别上得到了高效的应用,而多标签图像的识别需要处理包括尺寸、形状、布局等多个对象,所以单标签图像分类的网络模型架构不能很好地识别出复杂的对象布局和多标签图像场景。文章提出了端到端方式训练的多标签图像识别算法,在对图像进行随机缩放和裁剪后,再进入卷积神经网络,其输出经过池化分类层,筛选出有效区域。同时提出加权、动态的欧式距离损失函数用于神经网络的优化。实验结果显示,该算法有效提高了多标签图像识别的精度。 徐有正 黄刚关键词:卷积神经网络 图像识别