搜索到6586篇“ 信息抽取“的相关文章
信息抽取方法及相关设备
本申请提供一种信息抽取方法及相关设备,信息抽取方法包括:基于待抽取要素对待抽取文本进行信息抽取,得到M个第一抽取结果,M为大于1的整数;对所述M个第一抽取结果进行不一致性检测,得到检测结果,检测结果用于反映所述M个第一抽...
陈志阔陶万杰饶齐
一种通用的信息抽取方法
本发明公开了一种通用的信息抽取方法。本发明将信息抽取任务重新表述为跨度抽取和跨度‑跨度关系抽取,从而将信息抽取任务统一为二维矩阵上的目标框检测任务。本发明提出了轻量注意力模块,它结合了Softmax注意力机制和线性注意力...
鲁伟明陈震寰
信息抽取方法、装置、设备及介质
本申请涉及人工智能技术,提供了信息抽取方法、装置、设备及介质,一方面,将提取的文字信息与版面分析后得到的文档布局信息进行融合,能够对文本识别后的结果进行图像还原,以提高模型识别的准确性;一方面,根据信息抽取需求数据从预先...
蒋竹君曾鑫许焱陈永红何锦源
面向工业领域的文档信息抽取方法
本发明提供了一种面向工业领域的文档信息抽取方法,具有这样的特征,包括以下步骤:步骤S1,对通用大模型进行第一阶段微调,得到简单微调模型;步骤S2,根据现有的公开数据构建复杂抽取指令数据集;步骤S3,根据复杂抽取指令数据集...
黄文皓赵津梁家卿冯红伟肖仰华
口语信息抽取方法、系统、设备以及介质
本发明公开了一种口语信息抽取方法、系统、设备以及介质。所述方法包括步骤:获取用户的上文口语信息,根据用户的所述上文口语信息生成上文句向量;获取用户的当前口语信息,所述当前口语信息包括本句语义;根据预设的分词字典对本句语义...
雷志丹江小林罗超邹宇李巍
基于提示增强的LLM信息抽取算法
2025年
信息抽取技术随着自然语言处理技术的发展,已经取得了较好的发展,但在实际应用中,由于算法标注数据需求高、训练代价大,上下文理解难,私有化领域落地一直存在较高瓶颈。本文提出了一种基于提示增强的LLM信息抽取算法(LLM-IE Base on Prompt Enhance),通过将文本信息抽取任务转化为文本生成任务,并基于生成文本进行结构化解析,形成文本信息抽取结果。该方法在实体、关系、事件三类自建数据集上进行测试验证,面对少样本困境,该方法通过提示增强激发模型信息提取任务能力,可以近似达成模型微调的效果,同时相较于其他主流信息抽取模型在准确率与召回率上都有提升。With the development of natural language processing technology, information extraction techniques have made significant progress. However, in practical applications, due to high algorithmic annotation data requirements, large training costs, and challenges in understanding context, private domain implementations have consistently faced high barriers. This paper proposes an information extraction algorithm for LLMs based on prompt enhance (LLM-IE Based on Prompt Enhance). This method transforms text information extraction tasks into text generation tasks and performs structured parsing based on the generated text to form the results of information extraction. The method was tested and validated on three self-built datasets for entities, relationships, and events. In addressing the challenge of limited sample data, this approach can approximate the effect of model fine-tuning by stimulating the model’s information extraction task capabilities through prompt Enhancement. Additionally, compared to other mainstream information extraction models, this method shows improvements in both accuracy and recall rates.
李崭黄浩任秋霖李平
关键词:信息抽取
一种基于深度学习的信息抽取方法
本发明涉及信息处理技术领域,具体涉及一种基于深度学习的信息抽取方法,包括创建模型,该模型包括实体识别模块和实体关系抽取模块,其中实体识别模块是在Bi‑LSTM基础上加上CRF构成,实体关系抽取模块是在Bi‑LSTM基础上...
赵慧雅李心祺蒋严冰
一种PDF文件的信息抽取方法及装置
本发明涉及信息处理领域,尤其涉及一种PDF文件的信息抽取方法及装置,该方法为,针对PDF文件,分别将每一页中的信息生成相应的树形结构;分别统计每一页相应的树形结构中每一个节点的信息,从每一页中识别并抽取标题、正文、图表标...
兰任马超张道泉赵继广
字段信息抽取方法、装置、设备及存储介质
本发明实施例提供一种字段信息抽取方法、装置、设备及存储介质,涉及人工智能领域,该方法包括:获取目标图片,对所述目标图片中的文字进行信息抽取,得到字段抽取结果;根据所述字段抽取结果确定所述目标图片对应的字段提取特征;遍历多...
刘东煜周坤胜
基于知识提示微调的标书信息抽取方法
2025年
当前信息抽取任务主要依赖大语言模型(LLM),而标书信息中广泛存在领域术语,模型缺乏相关先验知识,导致微调效率低且抽取性能不佳。此外,模型的抽取和泛化性能在很大程度上依赖于提示信息的质量和提示模板的构建方式。针对上述问题,提出一种基于提示学习的标书信息抽取方法(TIEPL)。首先,利用生成式信息抽取的提示学习方法对LLM注入领域知识,以实现预训练和微调阶段的统一优化;其次,以LoRA(Low-Rank Adaption)微调方法为框架,单独设计提示训练旁路,并设计标书场景关键词提示模板,从而增强模型信息抽取与提示的双向关联。在自建的招中标数据集上的实验结果表明,相较于次优的UIE(Universal Information Extraction)方法,TIEPL的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation)和BLEU-4(BiLingual Evaluation Understudy)分别提高1.05和4.71个百分点,能更准确和完整地生成抽取结果,验证了所提方法在提高标书信息抽取准确性和泛化性方面的有效性。
孙熠衡刘茂福
关键词:标书

相关作者

朱巧明
作品数:488被引量:1,577H指数:19
供职机构:苏州大学计算机科学与技术学院
研究主题:中文 抽取 篇章 中文信息处理 识别方法
程学旗
作品数:682被引量:6,372H指数:29
供职机构:中国科学院计算技术研究所
研究主题:文本 抽取 大数据 社交网络 标签
樊孝忠
作品数:153被引量:1,214H指数:19
供职机构:北京理工大学计算机学院
研究主题:信息抽取 向量空间模型 自然语言理解 信息检索 本体
张春霞
作品数:56被引量:0H指数:0
供职机构:北京理工大学
研究主题:信息抽取 智能信息处理 文本预处理 注意力 主题检测
林鸿飞
作品数:462被引量:3,009H指数:27
供职机构:大连理工大学
研究主题:生物医学 关系抽取 情感分析 文本 语言模型