搜索到527篇“ 文档频率“的相关文章
- 基于词频逆文档频率和最大曲率点的实体解析分块方法
- 本发明涉及基于词频逆文档频率和最大曲率点的实体解析分块方法,包括以下步骤:S1、提取记录中的字符串类型的属性,对于数据集中的每条元组,首先按照属性名提取出字符串类型的属性,然后进行分词,分词后的令牌去除停用词,以使得每条...
- 史雯隽耿明明吴怀广张静陈浩然
- 一种基于词频和逆文档频率的精准匹配硬件日志分类方法
- 本发明公开了一种基于词频和逆文档频率的精准匹配硬件日志分类方法,为基于精准正则匹配算法以及词频和逆文档频率算法对日志进行整理、分类,管理硬件日志和其他文本的辅助程序设计和维护的方法。该方法利用正则匹配进行精准匹配和模糊匹...
- 余骁禹曾浩王猛郭连平田雨蒋俊田书林
- 一种基于词频逆文档频率的视频字幕显示优化方法和系统
- 本发明提供了一种基于词频逆文档频率的视频字幕显示优化方法和系统,所述方法包括:获取语料库;基于TF‑I DF算法计算语料库中的每个词的逆文档频率;获取音视频文件中的文本信息和时间戳集合;统计所述文本信息中每个分词的词频;...
- 于智朱则鹏卜佳俊沈宇帆陈杨
- 一种基于词频-逆文档频率和混合损失的表情识别算法被引量:4
- 2023年
- 面部表情能自然高效地表达人类的心理活动和思想状态,影响着人们的沟通交流过程。在诸多智能化应用中,人脸表情识别是人类与机器间建立情感交互的重要基础。在细粒度人脸表情识别任务中,由于特征提取网络对表情产生区域的关键特征处理不足,从而引发细节特征信息丢失问题。提出一种词频-逆文档频率注意力机制TF-IDF SPA,通过该机制调整表情产生关键区域的注意力分布,强化网络对该区域关键细节特征的提取能力。同时,为了应对表情识别任务中普遍存在的类间差异小、类内差异大的问题,设计一种改进型混合加权损失函数,以增强表情类内聚拢性同时增大类间距离。依据数据集中样本的数量分布情况,动态调整损失函数的分类权重值,从而强化模型对小数据量样本的学习能力。在此基础上,将结构简单的TF-IDF SPA模块与卷积层共同堆叠以构建人脸表情识别网络。实验结果表明,该网络具有较好的人脸表情识别性能,在FER2013和CK+数据集上的分类准确率分别达到73.52%和98.27%。
- 蓝峥杰王烈聂雄
- 关键词:表情识别损失函数
- 基于词频逆文档频率的数据处理方法、装置和计算机设备
- 本申请涉及数据处理技术领域,提供了一种基于词频逆文档频率的数据处理方法、装置、计算机设备和存储介质。方法包括:获取用户的初始就诊档案,确定未包含治疗结果的就诊节点,根据预设的数据标签,提取就诊节点中的就诊关键词,预设的数...
- 陈源
- 基于词频与逆文档频率的工控系统异常诊断信息识别方法
- 本发明揭示基于词频与逆文档频率的工控系统异常诊断信息识别方法,包括:建立诊断命令的响应语料库;再次向被测系统发送诊断命令,获得第N+1份回显报文;对所有回显报文进行过滤停用词、分词处理;利用TF‑IDF词频与逆文档频率算...
- 李少森梁钰华孙豪黄剑湘杨光李浩张启浩任君杨铖丁丙侯
- 一种基于子词编码和逆文档频率遮蔽的中文预训练方法
- 本发明提供了一种基于子词编码和逆文档频率遮蔽的中文预训练方法,用于中文语言模型的预训练,包括以下步骤:步骤1,收集中文语料,根据语料通过迭代算法学习一元语言模型,得到词典和出现概率;步骤2,基于一元语言模型对中文语言模型...
- 邱锡鹏邵云帆
- 文本分类中基于文档频率和词频偏差率的特征选择方法研究
- 随着互联网的快速发展,我们面临着越来越多的数据。在这些数据中,文本数据占有很大比例,对文本进行分类迫在眉睫。在文本分类过程中,很容易出现“维灾”现象,进而影响分类效率。特征选择是解决该问题的一种行之有效的方法,所以论文主...
- 马一鸣
- 关键词:文本分类文档频率
- 基于词频-逆文档频率和法律本体的相似案例检索算法被引量:3
- 2021年
- 智慧检务是近年来研究的热点问题,而相似案例检索是智慧检务中公共法律服务模块的基本需求。传统的基于关键词的检索方式使案例的相似性仅局限在浅显的词语层面上,无法满足用户在文章和语义层面上的检索需求。针对公共法律服务中的相似案例检索问题,该文以公共法律服务案例为研究对象,引入能够突出法律语义的案例要素,并以其为依据为案例建模,提出了一种基于语义的相似案例检索算法。该算法首先结合词频-逆文档频率和法律本体,提取出语料库中全部案例要素,再基于向量空间模型,通过欧氏距离计算出用户输入案例和语料库中各案例的相似程度,从而实现语义层面上的相似案例检索。通过对12348中国法网司法行政(法律服务)案例库中案例的分类实验可知,与传统的词频-逆文档频率提取关键词方法相比,该算法在监狱教改类案例分类上,其F1值提高了36.36%。
- 张云婷叶麟方滨兴张宏莉
- 关键词:语义检索文本相似度计算
- 基于词频逆文档频率的数据处理方法、装置和计算机设备
- 本申请涉及数据处理技术领域,提供了一种基于词频逆文档频率的数据处理方法、装置、计算机设备和存储介质。方法包括:获取用户的初始就诊档案,确定未包含治疗结果的就诊节点,根据预设的数据标签,提取就诊节点中的就诊关键词,预设的数...
- 陈源
相关作者
- 周红芳

- 作品数:106被引量:221H指数:5
- 供职机构:西安理工大学
- 研究主题:聚类 数据集 文档频率 测试集 特征选择算法
- 李想

- 作品数:14被引量:3H指数:1
- 供职机构:西安理工大学
- 研究主题:文档频率 特征选择算法 词频 测试集 触点开关
- 胡明

- 作品数:5被引量:1H指数:1
- 供职机构:交通运输部
- 研究主题:词频 常识性 句子 文档频率 文档
- 季秀云

- 作品数:7被引量:7H指数:1
- 供职机构:西安电子科技大学
- 研究主题:图片搜索 图像 测试数据 不良信息 肤色区域
- 顾翀

- 作品数:72被引量:0H指数:0
- 供职机构:华为技术有限公司
- 研究主题:服务器 搜索 移动搜索 客户端 搜索方法