搜索到698篇“ HOWNET“的相关文章
藏语视角下的HowNet共性知识体系研究
2024年
HowNet是我国知识库研究的奠基性成果。目前HowNet已构建出汉英双语的知识表征模式,并在语义相似度计算、向量表示等技术领域取得了较好的效果,但现有研究对HowNet共性知识体系本身的合理性以及跨语言的适应性仍缺乏有益探索。藏语作为施通格语言,与汉语、英语具有较大差别,有助于检验HowNet共性知识体系的合理性。该文以具体藏文实例为依据,从藏语格助词的表义性、动词能所关系以及语义分类特征等方面指出HowNet共性知识体系的跨语言适应性有待完善;结合原型理论及藏文能所关系,以提升HowNet共性知识体系的科学性,并据此对HowNet知识体系的架构数据进行修正。
姚洲赵小兵
关键词:藏语HOWNET
基于HowNet的金融领域新闻知识库的构建研究
随着我国经济的飞速发展和科技的不断进步,各行各业对于信息和知识的需求日益增加。在各个行业中,金融领域对于信息和知识的需求更为突出。然而金融信息量迅速增长以及大量非结构化的金融公告文本的存在,给金融研究团队在信息处理和公告...
赵杰杰
关键词:知识库知识抽取
基于Transformer与HowNet义原知识融合的双驱动语义蕴含识别被引量:1
2023年
语义蕴含识别旨在检测和判断两个语句的语义是否一致,以及是否存在蕴含关系.然而现有方法通常面临中文同义词、一词多义现象困扰和长文本难理解的挑战.针对上述问题,本文提出了一种基于Transformer和HowNet义原知识融合的双驱动中文语义蕴含识别方法,首先通过Transformer对中文语句内部结构语义信息进行多层次编码和数据驱动,并引入外部知识库HowNet进行知识驱动建模词汇之间的义原知识关联,然后利用softattention进行交互注意力计算并与义原矩阵实现知识融合,最后用BiLSTM进一步编码文本概念层语义信息并推理判别语义一致性和蕴含关系.本文所提出的方法通过引入HowNet义原知识手段解决多义词及同义词困扰,通过Transformer策略解决长文本挑战问题.在BQ、AFQMC、PAWSX等金融和多语义释义对数据集上的实验结果表明,与DSSM、MwAN、DRCN等轻量化模型以及ERNIE等预训练模型相比,该模型不仅可以有效提升中文语义蕴含识别的准确率(相比DSSM模型提升2.19%),控制模型的参数量(16 M),还能适应50字及以上的长文本蕴含识别场景.
陈帆黄炎张新访
关键词:TRANSFORMERHOWNET
一种基于HowNet的图模型词义消歧方法和系统
本发明公开了一种基于HowNet的图模型词义消歧方法和系统,属于自然语言处理技术领域,本发明要解决的技术问题为如何充分利用知网知识,深入挖掘知网蕴含的语义知识,将其作为词义消歧的依据,提升词义消歧的性能,采用的技术方案为...
鹿文鹏张旭张若雨成金勇乔新晓张维玉孟凡擎
基于富集分析方法探索知网数据库中“百会”穴所调控的生物分子表达情况
2023年
目的 运用富集分析方法从腧穴、调控因子、疾病角度研究百会穴治疗相关疾病的作用机制,为进一步针灸临床实践提供理论基础。方法 通过检索CNKI数据库中百会穴相关文献,收集并整理百会穴可能影响的生物分子情况,运用DAVID 6.8在线分析工具,分别进行GO(gene ontology,基因本体)功能富集分析和KEGG(kyoto encyclopedia of genes and genomes,京都基因与基因组百科全书)通路富集分析。结果 收集并筛选百会穴调控生物分子50个,其中27种生物分子表达上调,27种生物分子表达下调,4种生物分子表达为上调与下调兼具;GO功能富集分析显示百会穴可通过影响细胞液功能、神经元细胞凋亡、生长因子活性等,调节机体功能;KEGG通路富集分析共计15条信号通路,相关通路主要有TNF信号通路、PI3K-AKT信号通路、TOII受体、HDAC组蛋白等。结论 运用富集分析方法,获取百会穴治疗相关疾病的作用靶点,并初步阐明了其调控的生物分子通路,为后续研究提供一定理论依据。
韩雪杨正飞王蕊杨潇王国芝余广田
关键词:生物分子
中国科技翻译研究二十年(2000-2023)——基于中国知网数据的可视化分析
2023年
以中国知网收录的17种外语类核心期刊为数据来源,借助CiteSpace可视化工具,对中国近二十年科技翻译研究进行分析,客观描述中国科技翻译研究的基本态势。按研究重点将中国近二十年科技翻译研究划分为三个发展阶段;根据中国近二十年科技翻译研究高频关键词表,得出中国科技翻译研究热点——策略、术语、教学研究;根据突发性关键词时序列表得出中国科技翻译研究前沿为“科技语篇”相关研究。
凃朝莲申桃凤
关键词:科技翻译科技语篇翻译策略可视化中国知网
融合HowNet和词林信息含量的词语相似度计算被引量:1
2022年
目前基于信息含量的中文词语相似度算法普遍使用单一的知识库,存在信息不完备的问题.本文在现有的基于HowNet信息含量的词语相似度算法和基于同义词词林信息含量的词语相似度算法基础上,改进了信息含量的计算方法,并根据词语的不同分布情况将两种算法进行动态融合,充分利用了HowNet和同义词词林中的体系结构信息,改善了现有方法的局限性.经Miller&Charles(MC30)数据集测评,该算法所得到的词语相似度值与人工判定值之间的皮尔森相关系数为0.927,验证了融合多知识库策略的可行性,也证明了本文方法在实用方面可以达到符合人类主观判断的效果.
陈靖元周刚卢记仓
关键词:HOWNET同义词词林信息含量
融合HowNet的深度学习文本分类方法研究
随着科技的不断进步和发展,产生了越来越多的文本数据,对于文本数据的处理已经是大势所趋。近年来,文本数据分类技术迅速发展,面对海量新闻数据和舆情数据等其他文本数据的增多,文本分类方法也在不断创新。然而不同的文本数据在结构上...
聂振业
关键词:文本分类主题模型HOWNET
基于改进音形码与HowNet的中文词相似度检测算法被引量:5
2022年
针对基于音形码或HowNet的中文词相似度检测算法无法同时考虑汉字的音、形、义特征,导致检测结果不准确等问题,提出改进音形码与HowNet相结合的中文词相似度检测算法。考虑缺少声母与韵母的情况,采用格雷码编码的音码进行改进。将形码的四角号码编码改为可较为细致描述汉字的笔顺编码。在加权编辑距离的基础上,改进字符串匹配方式。最后将改进的音形码与HowNet相结合。实验表明,无论从音形还是词义检测中文词相似度,算法有更高的准确度。
王华敏黄梦醒冯文龙冯思玲
关键词:知网音形码
HowNet的自然语言处理方法、系统及应用
本发明公开了一种HowNet的自然语言处理方法、系统及应用,应用于自然语言处理技术领域,提出HowNet认知体系,通过HowNet义原表和HowNet知识库描述语言构建HowNet知识库;遵循自然语言内部的预设规律,构建...
董强王宝群

相关作者

何婷婷
作品数:149被引量:861H指数:18
供职机构:华中师范大学
研究主题:语料 中文信息处理 自然语言处理 自动文摘 词义消歧
陈浩
作品数:26被引量:40H指数:3
供职机构:华中师范大学
研究主题:词义消歧 HOWNET K-MEANS聚类 ABC 内部审计
王萌
作品数:74被引量:333H指数:9
供职机构:广西科技大学
研究主题:自动文摘 粗糙集 HOWNET 多文档文摘 碰撞检测
孙茂松
作品数:358被引量:2,405H指数:25
供职机构:清华大学
研究主题:向量 中文信息处理 机器翻译 句子 自然语言处理
王裴岩
作品数:45被引量:100H指数:6
供职机构:沈阳航空航天大学
研究主题:语义知识库 核函数 中文专利 HOWNET 工艺过程