搜索到2485篇“ 向量空间模型“的相关文章
- 基于向量空间模型的图书馆资源检索优化
- 2025年
- 本研究基于向量空间模型提出了一种优化的图书馆资源检索系统,旨在提升检索效率与准确性。首先,通过构建信息检索系统,深入研究词频-逆文档频率(term frequency-inverse document frequency,TF-IDF)向量表示方法,以提高文本的区分度;其次,引入学习排序模型,对相似度计算进行优化;为验证方法的有效性,使用Whoosh开源框架进行系统实现,并通过精度、召回率和F_1值等指标对模型性能进行评估。最后,记录多次实验的系统响应时间,验证所提方法在实际应用场景中的效果。结果表明,优化后的系统在精度、召回率以及系统响应速度上均取得了良好的效果。
- 施平
- 关键词:向量空间正则化
- 基于形符的语义向量空间模型视域下英语缩合词语义分类再思考——以X-tel和X-(a/o)holic为例
- 2025年
- 本研究采用基于形符的语义向量空间模型,以X-tel和X-(a/o)holic型缩合词为例,借助COCA、enTenTen21语料库和R软件,重新审视Plag(2003)关于英语缩合词的语义分类方式。结果表明:Plag的二分法有些过于绝对,其所列举的标准缩合词boatel具有与缩略复合词motel相似的语义右向性分布特征,更宜将所有X-tel型缩合词视作一个连续体。就X-(a/o)holic型缩合词而言,依据Plag的分类框架亦无法对shopaholic和chocoholic进行分类,因为二者的语义中心均与来源词1更近。这说明模板词alcoholic的语义凸显度低于hotel,即析取词缀-(a/o)holic相比于词截-tel更加接近派生词缀。我们认为,采用基于原型范畴的渐进式语义描写方式能更准确地反映具有相似形态句法特征的缩合词之间的关联。
- 孟庆楠罗卫华Martin Hilpert
- 关键词:语义分类
- 基于向量空间模型的文本分类研究
- 2024年
- 由于传统的文字数据分类处理方法通常要求投入高昂的人力和时间成本进行标注分类,所以这些传统文字数据分类方法不再适应当前信息时代的要求。因此,急需一种高效快捷地实现对海量文本数据的主题选择和自主归类管理的新文本分类技术。经过研究,提出了一个新文本分类方案,通过文本向量空间模型(VSM),把大量非结构化的文本数据转化成高度结构化的文本向量,然后采用K-means聚类方法对文本向量进行聚类分析,实验结果证实了这种方法的高可行性。该方法提供了一种高效、快捷的文本处理和分类方式,能够快速实现主题选择和自主归类管理,值得进一步研究和探索。
- 刘思杰刘静超郭冰洁张程炳刘一熳
- 关键词:向量空间模型文本分类K-MEANS聚类
- 改进向量空间模型的相似专利检测技术研究
- 2024年
- 为保护专利,提升专利申请者的申请成功率,提出基于改进向量空间模型的相似专利检测技术。改进向量空间模型引入了循环神经网络,通过循环神经网络处理文本序列来获得考虑词语在文档中顺序及上下文信息的词语。采用全球唯一标识符对专利文本进行预处理,通过中文分词系统来将汉语文本划分为有意义的词语。采用改进的向量空间模型来衡量专利文档相似度,并对句子相似度进行识别,达到相似专利检测的目的。将提出的改进向量空间模型应用于实际的专利检索中,并和传统向量空间模型进行对比。结果表明,改进的向量空间模型DCG值与准确率均高于传统向量空间模型。
- 夏清洁攸彩红赵英杰
- 关键词:向量空间模型循环神经网络
- 一种基于向量空间模型的建筑安全评价方法、装置及存储介质
- 本申请公开了一种基于向量空间模型的建筑安全评价方法、装置及存储介质。本申请方法包括:获取原始建筑物数据,并对原始建筑物数据进行分类,在原始建筑物数据中确定需要量化编码的数据;依据预配置的编码规则,对需要量化编码的数据执行...
- 侯站正
- 双重共现潜在语义向量空间模型研究
- 2024年
- 文本的向量表示对文本聚类研究具有重要意义。共现潜在语义向量空间模型(CLSVSM)通过挖掘共现词对的语义关联性,进一步提升了聚类精度。方法 为补充不共现词对的语义关联性,提出在特征词的基础上引入特征项,形成“文献-摘要-关键词”关系链。首先基于两层潜在语义关系构建双重共现潜在语义向量空间模型(D-CLSVSM)。然后通过改进的词频G指数方法提取高频特征词,对模型矩阵进行压缩。局限:研究对象较为单一,仅研究了中文数据。结果/结论 D-CLSVSM增加了对共现词对及不共现词对的双重语义信息的补充,文本表示更充分,聚类结果更好。
- 王世昌陈瑾
- 关键词:文本聚类文本表示
- 基于抽象语法树和向量空间模型的编程题自动评测方法
- 本发明涉及一种基于抽象语法树和向量空间模型的编程题自动评测方法。获取编程题考题信息;将编程题考题信息中的参考答案代码、待评分的代码分别转换成一个抽象语法树RefTree、CondiTree;分别构建并保存RefTree、...
- 王金水林澎辰田文轩陈曙光王钰鹏何剑峰
- 一种基于向量空间模型检索微地图的改进方法
- 本发明公开一种基于向量空间模型检索微地图的改进方法,包括:利用自然语言处理方法将微地图元数据文本划分为若干字段,包括但不局限于名称、类型、评分、经度和纬度;对类型字段进行重分类;计算地图的区域信息;计算地图评分的语义信息...
- 杨维芳侯宇豪闫香蓉王卓马文骏王小龙高墨通彭毅博富璇曹小双董浩杰王炳瑄谢开翼包俊帆余懿韬
- 面向云环境密文排序检索的字典划分向量空间模型被引量:2
- 2023年
- 针对传统向量空间模型(TVSM)生成的向量维度高,计算文档与检索关键词相关度的向量点积运算耗时长的问题,提出一种面向云环境密文排序检索的字典划分向量空间模型(DPVSM)。首先给出DPVSM的具体定义,并证明了DPVSM中检索关键词与文档的相关度得分与TVSM中的相关度得分完全相等;然后,采用等长字典划分方法,提出加密向量生成算法和文档与检索关键词相关度得分计算算法。实验结果表明,DPVSM文档向量的空间开销远少于TVSM,且文档数量越多开销降低越多;此外,DPVSM的检索向量的空间开销以及相关度得分计算的耗时也远低于TVSM。显然,DPVSM在生成向量的空间效率和相关度得分计算的时间效率上均优于TVSM。
- 陆佳行戴华刘源龙周倩杨庚
- 关键词:云计算向量空间模型
- 基于向量空间模型的信息资源关键词智能检索工具的研究被引量:4
- 2023年
- 传统检索工具内部模型存在缺陷,改变搜索阈值会导致检索的查全率和查准率降低,因此设计基于向量空间模型的信息资源关键词智能检索工具。创建优化循环架构,优化处理关键词;计算优化后关键词与未知文档间的夹角,得到信息关键词,转换成特征向量矩阵形式,以空间向量模型为参照,完成检索时相关指标的关联匹配;根据检索工具的特点设计智能检索分布,完善模型转换过程,实现信息资源关键词智能检索工具的设计。实验测试结果显示:所设计检索工具可有效智能检索关键词,在搜索阈值增大时,其F值能保证在70%以上,检索性能更加稳定。
- 刘宁牛佳乐郑剑李思岑王丹丹
- 关键词:向量空间模型信息资源
相关作者
- 林鸿飞

- 作品数:462被引量:3,009H指数:27
- 供职机构:大连理工大学
- 研究主题:生物医学 关系抽取 情感分析 文本 语言模型
- 牛奉高

- 作品数:59被引量:172H指数:9
- 供职机构:山西大学数学科学学院
- 研究主题:向量空间模型 潜在语义 共现分析 研究生教育 词频统计
- 樊孝忠

- 作品数:153被引量:1,214H指数:19
- 供职机构:北京理工大学计算机学院
- 研究主题:信息抽取 向量空间模型 自然语言理解 信息检索 本体
- 吴立德

- 作品数:175被引量:2,019H指数:21
- 供职机构:复旦大学
- 研究主题:自然语言处理 信息检索 图像分割 计算机 神经网络
- 黄萱菁

- 作品数:123被引量:1,475H指数:17
- 供职机构:复旦大学计算机科学技术学院
- 研究主题:自然语言处理 中文信息处理 计算机应用 句子 信息检索