搜索到698篇“ 版面分析“的相关文章
一种基于深度学习和版面分析的PDF提取方法和系统
本发明涉及一种基于深度学习和版面分析的PDF提取方法和系统,包括:获取PDF文件,对于扫描版文件和文字版文件分别通过OCR技术和深度学习模型进行元素识别,元素包括文本、图片、表格和公式;根据识别出的元素,将PDF文件的页...
徐超王斌王莎莎李薇何聪辉
一种基于版面分析的OCR提取优化方法
本发明公开一种基于版面分析的OCR提取优化方法,涉及信息处理技术领域,包括以下步骤:图像数据预处理、图像版面布局检测、识别并区分区域大小、对各区域进行OCR文本提取、按顺序读取并拼接文本;本发明通过对图像的像素优化处理,...
石琦王晓邸小丽
一种基于可形变注意力机制的边缘信息融合的文档图像版面分析方法
本发明公开了一种基于可形变注意力机制的边缘信息融合的文档图像版面分析方法,旨在通过融合文档图像边缘信息提升模型版面分析的准确性。首先在文档图像预处理阶段:本发明方法提出了包含三种不同的边缘信息提取算子的边界信息提取模块,...
张旻叶栩见汤景凡姜明
基于版面分析和多模态的信息抽取系统及方法
本发明属于信息抽取技术领域,具体涉及基于版面分析和多模态的信息抽取系统及方法。系统包括:文档解析模块,用于从各种格式的文档中提取关键信息;查询分析模块,用于深入分析和理解用户的查询请求;检索增强模块,用于通过结合大语言模...
曹为华欧阳小刚王灿陈佳伟宋明黎陈存孙林君孙跃刚
基于改进YOLOv5s的文档图像版面分析算法
2025年
针对当前基于深度学习的版面分析方法存在效率低和训练成本高的问题,提出一种基于YOLOv5s改进的单阶段目标检测网络RCW-YOLO,并将其应用于文档图像版面分析任务。首先,通过Res2Net模块改进YOLOv5s中的C3模块,有效增强网络对文档图像多尺度特征的提取能力;其次,引入轻量级上采样算子CARAFE以优化特征融合网络,减少上采样过程中的信息丢失;最后,引入WIoUv3作为边界框回归损失函数,制定合适的梯度权益分配策略,以提升模型泛化能力和整体性能。实验结果表明,在CDLA、IIIT-AR-13K和PubLayNet数据集上,RCW-YOLO在mAP@0.50:0.95指标上分别达到了87.2%、76.4%和94.5%,优于现有的两阶段算法和其他单阶段算法,同时具有更低的计算量、参数量和更快的推断效率。
尹玲李家乐黄勃
关键词:目标检测
边缘感知特征融合的藏文报刊文档图像版面分析
2025年
针对现有分割网络在处理藏文报刊文档图像版面分析过程中,版面结构的复杂多样性,导致出现相邻部分元素相互粘连、相似元素中出现误识别等问题,提出了一种基于编码器-解码器架构的边缘感知特征融合网络EFF-UNet。采用ResNet50作为主干网络,通过改进的残差块EiResBlock实现轻量化设计及特征提取的增强;在解码器和跳跃连接中分别引入了边缘感知特征融合模块(Edge-aware Feature Fusion Module,EFFM)和自适应特征融合模块(Adaptive Feature Fusion Module,AFFM),融合多尺度特征和边缘信息,增强了模型对复杂文档版面细节的分析性能。实验结果表明,所提算法在阿坝藏文日报数据集(Aba Tibetan Newspaper Dataset,AbaTND)和CDLA公共数据集上表现出色,mIoU分别达到84.89%和89.27%,Precision分别达到91.20%和94.97%,实现模型计算效率和推理速度提升的同时具有较高的分割性能。
杨大志王维兰李洪瑞吴振杰
关键词:版面分析图像分割
基于目标检测和关键点检测的证件版面分析方法
本发明公开了一种基于目标检测和关键点检测的证件版面分析方法,包括:步骤A:采集到彩色的证件图像,并对证件图像进行标签标注;步骤B:提取彩色的证件图像的特征信息,对证件图像获得编码特征;步骤C:在损失函数中加入坐标宽度损失...
赖时伍付雪平夏炉系张浒胡刚
基于版面分析和查询生成的RAG知识库构建方法
本申请提供基于版面分析和查询生成的RAG知识库构建方法,方法包括:接收若干查询文档;对每个查询文档,利用版面分析工具对查询文档进行版面分析;根据版面分析结果进行文本内容的分段和合并,得到多个文本段;利用大语言模型为查询文...
石颍乐夏敏易丛文管健
一种基于视觉模型和图模型的背景文档版面分析的方法
本发明公开了一种基于视觉模型和图模型的背景文档版面分析的方法,其方法步骤为:收集自然场景文档图片并完成数据集构建;利用基于大核卷积的视觉网络得到初步版面分析结果;利用图神经网络进行矫正。本发明的有益效果是:本发明建立自然...
王德军朱建豪孟博王俊余思杰周倓卫
复杂版面分析方法、装置、电子设备
本申请公开了一种复杂版面分析方法,属于版面分析技术领域。所述方法包括:获取图像中的题目区域,以及,获取图像中预设类型的题目元素的图像信息,其中,图像信息包括:用于指示相应题目元素是否包含题号的题号属性、相应题目元素在图像...
周航韦秋华刘正珍

相关作者

李涛
作品数:15被引量:4H指数:2
供职机构:河北大学
研究主题:版面分析 模式识别 版面 聚类 智能性
田学东
作品数:87被引量:222H指数:7
供职机构:河北大学
研究主题:数学表达式 印刷体数学公式 纹理特征 GABOR滤波器 字体识别
许灿辉
作品数:8被引量:0H指数:0
供职机构:北大方正集团有限公司
研究主题:图元 版式 版面分析 复合图 模型参数
汤帜
作品数:239被引量:291H指数:6
供职机构:北京大学
研究主题:授权 数字版权保护技术 文档 图像 知识点
郭宝兰
作品数:35被引量:106H指数:6
供职机构:河北大学数学与计算机学院
研究主题:汉字识别 纹理特征 GABOR滤波器 字体识别 汉字