搜索到131篇“ 主题词提取“的相关文章
基于文档内容结构的主题词提取方法
本申请关于一种基于文档内容结构的主题词提取方法,涉及基于文档内容结构的主题词提取方法。该方法包括:获取目标文本片段,目标文本片段为待提取主题词的文本片段;将目标文本片段属于主题词提取模型,输出得到主题词提取结果,主题词提...
马力蔡成龙梁勇
项目主题词提取方法、装置、设备及介质
本发明属于数据处理技术领域,公开了一种项目主题词提取方法、装置、设备及介质。该方法包括:获取项目的文本模态表示,以及获取所述项目的图像模态表示;将所述文本模态表示和所述图像模态表示进行模态对齐,得到对齐向量;确定所述对齐...
陈子锋古英杰张义泽孙奇张迪吴雪陈立强石时党朱博刘桂良舒敏根初瑞
主题词提取方法、装置、存储介质及电子设备
本公开涉及一种主题词提取方法、装置、存储介质及电子设备,以避免提取出的主题词之间毫不相关的情况。该方法包括:接收客户端发送的用于确定目标文本的主题词的请求;响应于接收到所述请求,将所述目标文本输入到主题词模型中进行处理,...
贾弼然崔朝辉赵立军张霞
基于TF-IDF的主题词提取方法、装置、设备及存储介质
本申请公开了一种基于TF‑IDF的主题词提取方法、装置、设备及存储介质,属于主题词提取领域。该方法包括:获取多个商品描述文本并进行分词处理;根据目标分词在目标文本中出现的频率以及目标分词的逆向文本频率得到目标分词的第一权...
王华东张津烽王军
基于关键词共现网络的主题词提取算法被引量:8
2023年
针对主题词提取中关键词提取不准确以及仅考虑单一相关性的问题,提出一种将集成思想与复杂网络相结合的主题词提取算法。首先通过集成算法提取话题数据的关键词,以提高关键词提取的准确性,其次改进传统词共现公式计算关键词的共现度,并建立关键词共现网络,在网络的基础上得到最优连通子图,同时以节点度中心性为权重衡量关键词重要性并从中映射出主题词。最后,使用微博话题数据集进行实例验证,证明该算法是有效的,并优于传统的词共现算法,并在青岛社区话题数据集中进行应用。
张书谙王曦代继鹏隋毅孙仁诚
关键词:关键词
一种基于文本聚类的主题词提取方法
本发明公开了一种基于文本聚类的主题词提取方法,对文本信息进行分词处理;对干扰词积累形成停用词库,加载文本分词集合;针对处理词文档,计算文档词频TF,计算逆文档词频IDF;新建Kmeans模型,训练出各聚类中心词频及其预测...
肖林焱杨安印
一种主题词提取方法、装置、设备及存储介质
本发明公开一种主题词提取方法、装置、设备及存储介质,方法包括:使用TF‑IDF模型对提取范围内各文章的词分别计算TF‑IDF分数,将TF‑IDF分数高于第一设定阈值的作为各文章的第一主题词,其中提取范围是指设定的包含多篇...
赵冲李青龙骆飞
一种主题词提取方法、装置、设备及存储介质
本发明公开一种主题词提取方法、装置、设备及存储介质,方法包括:使用TF‑IDF模型对提取范围内各文章的词分别计算TF‑IDF分数,将TF‑IDF分数高于第一设定阈值的作为各文章的第一主题词,其中提取范围是指设定的包含多篇...
赵冲李青龙骆飞
基于TF-IDF的主题词提取方法、装置、设备及存储介质
本申请公开了一种基于TF‑IDF的主题词提取方法、装置、设备及存储介质,属于主题词提取领域。该方法包括:获取多个商品描述文本并进行分词处理;根据目标分词在目标文本中出现的频率以及目标分词的逆向文本频率得到目标分词的第一权...
王华东张津烽王军
基于语义概念和词共现的微博主题词提取研究被引量:11
2021年
【目的/意义】从海量微博信息中提取准确的主题词,以期为政府和企业进行舆情分析提供有价值的参考。【方法/过程】通过分析传统微博主题词提取方法的特点及不足,提出了基于语义概念和词共现的微博主题词提取方法,该方法利用文本扩充策略将微博从短文本扩充为较长文本,借助于语义词典对微博文本中的词汇进行语义概念扩展,结合微博文本结构特点分配词汇权重,再综合考虑词汇的共现度来提取微博主题词。【结果/结论】实验结果表明本文提出的微博主题词提取算法优于传统方法,它能够有效提高微博主题词提取的性能。【创新/局限】利用语义概念结合词共现思想进行微博主题词提取是一种新的探索,由于算法中的分词方法对个别网络新词切分可能不合适,会对关键词提取准确性造成微小影响。
张孝飞陈航行张春花
关键词:语义概念词共现特征词

相关作者

杨婉霞
作品数:65被引量:53H指数:5
供职机构:甘肃农业大学
研究主题:马铃薯 种子包衣机 信息隐藏 补种 灌溉装置
周蓓蓓
作品数:26被引量:4H指数:1
供职机构:甘肃农业大学
研究主题:主题词提取 诗句 语料 软测量 最小二乘支持向量机
张晓东
作品数:218被引量:1,284H指数:17
供职机构:中国农业大学
研究主题:玉米 玉米果穗 玉米品种 地震 考种
杨庚
作品数:485被引量:1,559H指数:16
供职机构:南京邮电大学
研究主题:无线传感器网络 隐私保护 云计算 密文 加密
陈燕俐
作品数:93被引量:194H指数:8
供职机构:南京邮电大学
研究主题:密文 加密 云计算 密文检索 搜索