优秀研究生学位论文题录展示

印刷体数学表达式自动识别的方法研究

专 业: 计算机软件与理论
关键词: 印刷体 数学表达式 自动识别
分类号: TS8  TP3
形 态: 共 58 页 约 37,990 个字 约 1.817 M内容
阅 读: 全文阅读说明

内容摘要


随着Internet 的迅猛发展,利用Internet 发布和交换信息更加频繁,同时数字图书馆和远程教育也成为热门领域,因此,信息资源的电子化是至关重要的一个问题。

现有的OCR Optical Character Recognition 技术虽然对中英文字和数字等都能获得很好的识别效果,但无法处理数学表达式。

原因在于数学表达式具有复杂的二维嵌套结构,并且符号含义多样性,导致数学表达式在分割和结构分析等方面存在很多困难。

为了方便读者和提高文献的利用率,设计一个系统,实现了将图像格式的印刷体数学表达式转换成可编辑的LaTeX 格式的数学表达式。

所完成的主要工作包括:1、设计实现了一个功能,快速方便地选取文献资料中要识别的数学表达式图像。

2、图像预处理的功能是去除噪声,使反映符号本质特征的部分得到保留甚至突出出来,从而正确识别图像内容。

3、特征提取与选择是图像识别的一个关键问题。

本文对数学符号提取统计特征和结构特征组成45 维特征集,对这样的特征集分类识别不受字体限制,而像素特征集受字体影响比较大,不同字体的同一个符号所提取的像素特征集差异可能比较大。

并且设计实现K-L 正交变换对特征集进行优化处理,去掉冗余信息,经过综合对比,最后确定39 维特征集能取得比较理想的识别效果。

4、支持向量机SVM是在统计学习理论的基础上发展起来的一种最新的机器学习方法。

数学表达式识别是有限样本的多类识别问题,本文应用二类组合分类方法中的成对分类法(即一对一)进行符号识别。

经过大量的实验,找到比较理想的参数,并与其它相关文献中的实验结果进行了比较,识别正确率有所提高。

5、结构分析是数学表达式识别系统与字符识别系统的最大区别,也是难点之一。

由于图像预处理时对符号进行了过分割,所以,设计一些规则检测合并多元结构的符号或函数型符号。

然后,应用基准线的结构分析算法,使用树的存储形式,采用从上至下的分析策略,思想简单,容易实现,且识别正确率较高,速度较快,适合于数学表达式识别的实时系统。

6、TeX 系统是国际公认的最好的数学公式排版系统,LaTeX 建立在TeX 之上。

因此,本文把图像格式的数学表达式转化成LaTeX 格式的数学表达式。

7、本系统全部功能完全在VC++6.0 下实现,速度快,界面简洁,使用方便。

该课题来源于广西区教育厅的科研项目“数学表达式自动识别中的模式识别方法研究”(桂科基0009004)和广西区科技厅的科研项目“印刷体数学表达式自动识别及文本转换方法研究”(桂科自0640067),是其主要部分。

随着互联网的迅速发展,利用网络传播和交换信息日益增多,同时,以互联网为基础的数字图书馆和远程教育也成为热门领域。

数学表达式通常以图像形式保存在科技图书文献资料中。

众所周知,图像的数据量比较庞大,网络传输速度慢,所占的存储空间也较大,另外,对图像形式的数学表达式无法编辑、修改,因此,不能充分利用现有资源。

而OCR(Optical Character Recognition系统虽然能快速准确地识别文字,但由于数学表达式的二维嵌套特性、所包含符号的复杂性及数学符号表达含义的多样性,导致很难正确识别其中的数学表达式。

本系统把数学表达式由图像格式转换成LaTeX 格式,便于数学表达式的编辑和修改,充分利用现有资源,提高工作效率。

同时,降低数学表达式的存储空间,提高网络上的传输速度,推动数字化图书馆及远程教育的发展..……

全文目录


文摘
英文文摘
第一章 绪论
第二章 数学表达式图像预处理
第三章 数学符号统计特征和结构特征的提取
第四章 多类支持向量机的数学符号分类识别
第五章 基于基准线的数学表达式结构分析
第六章 LaTeX 介绍及本系统运行情况
第七章 总结与展望
参考文献
附录

相似论文

  1. 数码印刷客户服务系统的研究与设计,54页,TS805.4
  2. 面向专色工艺的彩色图像分色及印制方法,68页,TS85
  3. 数字水印在印刷品防伪中的应用研究,73页,TS853.6 TP391.41
  4. Deep Web查询接口集成及搜索策略研究,40页,TP311.13
  5. 面向字幕帧的视频图像文本识别,40页,TP391.4
  6. 基于节点能力和品质的P2P网络信任模型,34页,TP393.08
  7. 基于用户信誉值防御DDoS攻击的协同模型,45页,TP393.08
  8. 基于领域本体的用户查询词扩展方法的研究,68 页,TP391.3
  9. 基于形式概念分析的元搜索引擎的结果聚合研究,67 页,TP391.3
  10. 三维织物动态仿真及相关技术研究,108页,TS103.7 TP391.9
  11. 三维柔性织物动态仿真技术的研究,106页,TS101
  12. 数字家庭环境下的嵌入式Web服务器的设计及实现,66页,TS976.9 TP393.09
  13. 盒装液态奶变质的快速无损检测方法研究,68页,TS252.41 TS207.3
  14. 织物外观模拟的研究与设计,79页,TS105.11 TP391.72
  15. 基于IPv6的分布式数字家居的研究,57页,TS976.9 TP393
  16. MMOG中同步机制的研究与实践,58页,TS952.83 TP314
  17. 3D游戏引擎中渲染技术的研究与实践,64页,TS952.83 TP314
  18. 一种支持MMOG的对等网络模型的研究,53页,TS952.83 TP393.02
  19. 基于Elman网络的织物染色配色理论研究与系统开发,55页,TS193.13 TP391.72
  20. 数码喷射印花机的色彩管理,60页,TS194.38
中图分类: > TS8 > 工业技术 > 轻工业、手工业 > 印刷工业
其他分类: > TP3 > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术

© 2012 book.hzu.edu.cn