(2) 阅读 (1671)

光学字符识别 编辑词条词条保护

词条创建者 风中追风

光学字符识别

编辑

光学字符识别,文件的打印图像(通常图像扫描仪中所并入)的字符码是一个软件,它转换到的一列。通常缩写为OCR。OCR 开始于人工智能机器视觉的研究领域。尽管研究仍在继续,但OCR的重点已转移到其实施和应用上。需要数字化打印在纸上的文档并以更紧凑的形式记录它们。此外,通过转换字符代码,可以将其用于输入机器翻译语音合成,还可以进行文本挖掘。研究领域包括模式识别人工智能计算机视觉

光学字符识别

最初,光学字符识别(使用诸如镜子和透镜等光学技术)和数字字符识别(使用扫描仪和算法)被认为是单独的领域。光学字符识别一词现在被认为包括数字字符识别,因为很少有人能幸存为光学技术。

早期的系统需要“培训”以读取特定字体(意味着提前阅读该字体的样本)。目前,可以转换大多数识字率很高的字体。一些系统能够产生与所加载的图像大致相同的格式化输出(例如,文字处理器文件),在该图像中生成一些非文档部分,例如图像。即使其中一些被正确识别。

重视视觉受损

编辑

1974年,光芒Kurzweil是任何字样 Kurzweil的电脑产品进行OCR的发展阅读 。Kurzweil认为,与语音合成技术结合使用时,该技术对视障者最有用。关键技术是CCD 图像扫描仪语音合成。1976年1月13日,该产品揭幕。1978年,库兹韦尔开始销售OCR软件。第一位客户是LexisNexis,它过去曾将新闻和其他文档输入数据库。两年后,库兹韦尔将该公司出售给了施乐。施乐纺丝后关闭其分部作为SCANSOFT,ScanSoft公司是Nuance通讯用合并

OCR技术状态

编辑

在1990年代中期,美国能源部(DOE)指派了信息科学研究所(ISRI)进行任务,以开发打印文件的识别技能。由于五年以上结果OCR精度的年度测试已经总结

准确识别拉丁语印刷文本是一个几乎可以解决的问题,但是识字率(正确识别字符的概率)不是100%,并且在错误无法接受的情况下,人们需要查看结果。根据使用的19世纪和20世纪报纸的开始,简单的商用OCR软件的识字率的研究识别字符一个字符的基础上为98%,71%。对于手写字符,尤其是草书手写字符识别和具有许多字符的语言中的字符识别,仍有研究的空间。

字符识别的精度由几种测量方法表示,并且精度很大程度上取决于实际使用的测量方法。例如,如果识别纯粹是逐个字符,而不使用上下文或词典,则99%的识字率可能导致5%的基于单词的错误率

在线字符识别有时会与光学字符识别相混淆。OCR基本上是脱机字符识别,它可以识别纯静态形状的字符。另一方面,在线字符识别可识别书写字符的动态过程。例如,PenPoint OS平板电脑将手势识别为一种在线识别,并识别笔的方向和移动量。在线手写识别的智能字符识别也被称为 (ICR)。

手写字符识别系统是近年来商业成功的领域。该技术被用作运行Palm OS等的便携式信息终端中的输入手段。苹果牛顿是这项技术的先驱。在这些设备中,输入时已知笔画的顺序,速度和方向,因此识别相对容易。另外,逐渐训练用户书写容易识别的字符。另一方面,用于识别书写在纸上的手写字符的软件不具有上述优点,因此识字率仍然不足。甚至对于书写精美的手写字符而言,识字率范围也从80%到90%不等,而且每页出现数十个无法识别的字符。该级别只能在非常有限的领域中投入实际使用。

关于草书识别的研究很活跃,但是识字率更低。若要提高草书字符识别的识字率,您必须使用上下文和语法信息。例如,识别字典中的单词比识别手写原稿中的单个字符容易。小型词典用于支票上书写的数字序列可以提高读写能力。通过了解要扫描的文档的语言语法,可以确定单词是名词还是动词,从而提高识字率。可以说,只有手写字符才能实现准确的识别(通常为98%或更高)。

OCR技术已经成为先进的扫描技术为基础

一般地,更为复杂的识别问题的神经网络可以使用许多非线性甚至变形线性函数可以是变体

作为在识别文档中难以识别的单词和字符串方面非常成功的技术,存在一种使用人类字符识别能力的reCAPTCHA系统。

内容由风中追风提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://ispeak.vibaike.com/30415

发表评论

登录后才能评论