搜索到51篇“ 文种识别“的相关文章
基于DRCoALTP的印刷体文档图像多文种识别方法
2025年
针对视觉结构类似导致的文种相似性问题,基于局部三值模式的相邻共生矩阵(co-occurrence of adjacent local ternary patterns,CoALTP)提出一种具有判别性和鲁棒性的局部三值模式的相邻共生矩阵(discriminant and robust co-occurrence of adjacent local ternary patterns,DRCoALTP)方法,用于获取图像纹理。计算文档图像的相邻稀疏局部三值模式(adjacent sparse local ternary patterns,ASLTP),将采样点数量设定为8,以便获得详细的局部纹理,设计出一种基于自适应中值滤波思想的半自适应阈值方法,用于提取灰度图像中心像素周边对角邻域像素的编码值。ASLTP在邻域像素位置存放稀疏局部三值模式(local ternary patterns,LTP)的值,提取灰度共生矩阵(gray-level co-occurrence matrix,GLCM),从4个方向统计使用ASLTP后灰度图像像素之间的频率关系。该算法在阿拉伯文、俄文、简体中文、哈萨克文、藏文、蒙古文、土耳其文、维吾尔文、英文、吉尔吉斯斯坦文和塔吉克斯坦文11个文种的自建印刷体文档图像数据集中验证。试验结果表明,相较于基线和先进的纹理方法,改进后的方法更具判别性,平均识别准确率为99.14%。为改善CoALTP方法可能产生低效分类特征的问题,提出半自适应阈值方法,有效提高识别率并抑制噪声。此外,针对算法产生的高维特征,采用基于均方差的特征选择方法,通过支持向量机(support vector machine,SVM)分类器特征选择后,识别速度提高284%,对11个文种的平均识别准确率达99.44%。
吴正健吾尔尼沙·买买提杨耀威阿力木江·艾沙库尔班·吾布力
关键词:灰度共生矩阵文种识别
基于自适应特征融合的场景图像文种识别研究
在全球化发展的背景下,各种语言文字经常出现在广告牌、视频字幕、文档及其他公共领域。能够准确地识别文字对信息传播至关重要,有助于促进人们之间的沟通。在文字识别过程中,首先需要进行文种识别,这是确保准确识别的前提。本文旨在解...
彭富犹
关键词:自适应融合
基于双分支卷积神经网络的手机拍摄文档图像文种识别研究
智能信息时代的来临,引发了科技的不断革新,使人们的生活方式发生改变,产生了日新月异的变化。在信息化的环境下,手机的拍摄功能为人们获取文档的相关内容提供了便捷的途径,有利于实现文档材料的检索与查阅,提高文档的分析与识别效率...
邓闽真
关键词:文种识别
基于深度学习的文本图像文种识别研究
互联互通的全球化步伐逐渐加快,通过手机拍摄的文件、图书等文本图像成为便捷高效的信息交流形式。在文本图像分析流程中确定文本图像的语言种类,即文种识别,是多文种OCR技术的重要一步,对于索引和搜索等后续处理步骤至关重要。然而...
丁兆强
关键词:文本图像文种识别卷积神经网络
一种基于混排文档图像识别文种识别装置
本实用新型公开一种基于混排文档图像识别文种识别装置,包括扫描头和外壳,所述外壳的左端设置有扫描头,所述外壳的前端设置有音量按钮和开关按钮,所述音量按钮位于开关按钮的右侧,所述外壳的上端设置有触摸显示屏,所述外壳的右端上...
吴正健
基于LTP和HOG纹理特征融合的中亚文档图像文种识别被引量:3
2021年
针对中亚地区存在一些相似度较高的文种,提出一种基于具有旋转不变性的统一局部三值模式(rotation invariant uniform local ternary pattern, riu2-LTP)和方向梯度直方图(histogram of oriented gradients, HOG)特征交叉融合的文档图像文种方法。使用SVM分类器对包含10个文种共10 000张图片的数据库进行试验;为了提高多文种识别效果,采用贝叶斯优化SVM的超参数。对文档图像提取了半径为1,采样点为8的riu2-LTP;重新对数据库提取HOG;采用交叉融合方法将20维riu2-LTP特征与36维HOG特征分别依次融入到新的特征集。试验表明,本研究方法平均查准率达到99%,相较于单一LTP、riu2-LTP和HOG方法有更好性能。
吴正健木特力甫·马木提吾尔尼沙·买买提阿力木江·艾沙库尔班·吾布力
关键词:LTPHOG文种识别
基于Ridgelet变换的多文种文档图像文种识别
2020年
为提高多文种文档图像的文种识别的效率,提出基于Ridgelet变换的多文种识别方法。对文档图像数据库进行Ridgelet变换,对得到的Ridgelet(脊波变换)系数矩阵提取脊波能量特征,生成特征向量。在分类决策中选择KNN、线性判别分析以及贝叶斯3种分类模型分别对所提特征进行训练和分类。在包括英文、中文、阿拉伯文、土耳其文、吉尔吉斯斯坦文、俄文和国内少数民族文种(蒙文,藏文,维吾尔文)的9个文种共9000张文档图像数据库中进行实验,最高识别率为99.23%,验证了所提算法对多文种识别有较高的识别率和良好的鲁棒性。
热依汗古丽·卡森木木特力铺·马木提吾尔尼沙·买买提阿力木江·艾沙库尔班·吾布力
关键词:文种识别RIDGELET变换
基于融合纹理特征的多文种文档图像文种识别技术研究
当今信息暴增的时代,人们在生活或工作中的纸质文档不仅减少而逐渐递增,为了便于存储或处理人们一般把纸质文档转换为电子文档。随着经济一体化步伐的加快,各个国家的交流也日益频繁了,因此光学字符识别(Optical Charac...
热依汗古丽·卡森木
关键词:脊波变换SIFT特征
基于纹理特征的多文种文档图像文种识别研究
随着信息时代的到来,在数字化大环境中,越来越多的资源以文本图像的形式保存。在全球化的进程中,国家之间交流日益频繁,在海量的信息处理过程中,光学字符识别技术(Optical Character Recognition,OC...
李顺
关键词:曲波变换HOG特征
基于离散曲波变换的多文种文档图像文种识别被引量:5
2019年
为提高文种识别效果,提出一种基于离散曲波变换的文种识别方法。利用文档图像经过曲波变换后得到的cell矩阵中的实数曲波系数,提取共82维能量特征;使用贝叶斯、KNN和判别分析3种分类器进行训练和分类。对两个数据库进行实验,数据库1包含8种文字共1600幅图片,使用3种分类器得到平均大于99%的识别准确率;数据库2包含10种文字共10 000幅图片,得到平均大于98%的识别准确率。实验结果表明,该方法运算速度快,具有良好的鲁棒性,识别效果优于基于小波变换的文种识别方法和基于二元复数小波变换的文种识别方法。
李顺木特力铺.马木提吾尔尼沙.买买提阿力木江艾沙库尔班.吾布力
关键词:文种识别鲁棒性

相关作者

平西建
作品数:202被引量:1,037H指数:16
供职机构:中国人民解放军信息工程大学
研究主题:隐写分析 信息隐藏 文本图像 支持向量机 数字隐写
顾立娟
作品数:12被引量:33H指数:4
供职机构:武汉军械士官学校
研究主题:文种识别 文本图像 纹理特征 放电电流 静电放电
程娟
作品数:33被引量:153H指数:5
供职机构:解放军信息工程大学
研究主题:文本图像 文种 SVM 中间件 纹理特征
阿力木江艾沙
作品数:10被引量:41H指数:5
供职机构:新疆大学
研究主题:维吾尔文 文档图像 文种识别 文本分类 维吾尔语
郝玉保
作品数:10被引量:33H指数:4
供职机构:中国人民解放军75719部队
研究主题:纹理特征 遥感图像检索 文种识别 文本图像 图像检索