搜索到128篇“ 信息抽取模型“的相关文章
实体及实体关系的确定方法及信息抽取模型的训练方法
本申请涉及计算机技术领域,公开了一种实体及实体关系的确定方法及信息抽取模型的训练方法,该方法包括:对提问信息对应的第一事件信息进行向量化处理,得到第一事件信息对应的监督向量;对提问信息进行特征提取得到多个要素特征;基于第...
司马华鹏华冰涛汤毅平
基于深度学习的信息抽取模型研究
2025年
信息抽取中的关系抽取展开研究,针对现有关系抽取技术中存在的难以捕捉文本间更深层次语义信息的问题提出基于深度学习的信息抽取模型,使用BERT模型进行词向量嵌入,通过图卷积网络构建依存关系图,利用注意力机制为不同特征分配不同权重,Softmax完成关系分类,实现关系的抽取,在DocRED数据集上与5个基准模型做实验对比,证明所提模型的F1值最优,说明该模型能够提高抽取的准确度。
王忠义
关键词:关系抽取
文档信息抽取模型的虚拟对抗训练
本公开涉及用于基于训练技术从文档中提取信息以生成文档基础模型的计算机实现的方法、软件和系统,该文档基础模型用于初始化被微调到商业文档细节的文档信息提取模型。基于从第一预训练模型提供的权重来初始化文档信息提取模型。基于作为...
C·巴特克S·金
基于信息词掩蔽的文档信息抽取模型的自指导预训练
本公开涉及用于基于训练技术从商业文档中提取信息以通过预训练来生成文档基础模型的计算机实现的方法、软件和系统。获得基于多个未标记文档的第一训练数据,以用于训练用于文档信息提取的第一模型。根据针对多个未标记文档中的每个未标记...
C·巴特克
基于统一结构生成式的通用信息抽取模型构建烟草企业的知识图谱问答应用
2025年
随着大数据和人工智能技术的发展,福建烟草积极响应国家和行业的号召,开展数字化转型探索。随着自然语言处理技术的快速发展,人们已经逐步适应通过自然语言进行人机交互,并基于此开展日常工作。本文根据福建烟草的大数据建设基础,通过自然语言模型抽取企业的非结构化文本数据,构建企业知识图谱,并建设知识图谱问答。
刘海龙黄恒博林勇泉
关键词:自然语言烟草行业知识抽取
信息抽取方法以及信息抽取模型训练方法
本说明书实施例提供信息抽取方法以及信息抽取模型训练方法,其中所述信息抽取方法包括:获取信息抽取任务的任务图像;对任务图像进行图像特征提取,获得任务图像特征;将任务图像特征输入信息抽取模型中的编码单元,获得任务编码特征,并...
龙如蛟王鹏飞杨志博姚聪
信息抽取方法以及信息抽取模型训练方法
本说明书实施例提供信息抽取方法以及信息抽取模型训练方法,其中所述信息抽取方法包括:获取信息抽取任务的任务图像;对任务图像进行图像特征提取,获得任务图像特征;将任务图像特征输入信息抽取模型中的编码单元,获得任务编码特征,并...
龙如蛟王鹏飞杨志博姚聪
信息抽取模型训练方法、信息抽取方法、装置及电子设备
本申请提供了一种信息抽取模型训练方法、信息抽取方法、装置及电子设备,应用于深度学习技术领域,其中该方法包括:将领域知识引入到深度学习中进行信息抽取,从而不需要大量的样本训练即能使得训练的模型学习到领域知识,进而提升了模型...
李靖郑邦东
信息抽取模型训练方法、信息抽取方法、装置和电子设备
本申请实施例提供了信息抽取模型训练方法、信息抽取方法、装置和电子设备。方法的实施例包括:获取已标注文档,已标注文档包括至少一个文本框,每个文本框中的文本带有实体标注;通过信息抽取模型的编码器对每个文本框进行编码,获得每个...
魏梦溪 贺一帆
基于小样本学习的标准文档信息抽取模型的研究与实现
在当前大数据时代,利用从文档中提取的信息构建下游知识图谱和进行知识问答等任务变得极为重要。尽管深度学习在信息抽取领域取得了显著进展,但对于目前主流的有监督信息抽取任务,需要大量标注数据进行训练。然而,在某些领域的数据集中...
白少康
关键词:信息抽取命名实体识别

相关作者

叶琪
作品数:68被引量:76H指数:3
供职机构:华东理工大学
研究主题:语言模型 文本 语料 关系抽取 计算机
孙常龙
作品数:39被引量:0H指数:0
供职机构:阿里巴巴集团
研究主题:存储介质 电子设备 文本 信息抽取 文本处理
阮彤
作品数:120被引量:540H指数:12
供职机构:华东理工大学
研究主题:语言模型 知识图谱 电子病历 文本 语料
康杨杨
作品数:32被引量:0H指数:0
供职机构:阿里巴巴集团
研究主题:存储介质 电子设备 文本 文本处理 抽取
王鹏飞
作品数:11被引量:0H指数:0
供职机构:阿里巴巴集团
研究主题:信息抽取方法 页面 图像 移动操作系统 处理图像