OCR从未达到100%精确的识读率。因为这点,迅速、精确、纠错是OCR系统的主要要求。

题目

OCR从未达到100%精确的识读率。因为这点,迅速、精确、纠错是OCR系统的主要要求。

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

OCR的识别率不高能调么?如果能怎么弄啊?


ocR的识别率是不能调的,只能找本厂家更高版本的OCR
随着数字化时代的飞速发展,如今随机附带OCR识别软件的扫描仪也是越来越多了,当然这绝大多数都是基础版。由于存在此类OCR软件识别率太低,后期纠正处理过程过于麻烦的想法,很多用户都将其闲置一旁。但事实上,用户只需注意一些使用技巧,此类OCR软件的识别率完全可达实用化水平。

  原稿的质量直接影响到扫描出来的图像质量,更会直接影响最后OCR的正确率,因此我们首先要适当调整原稿。对于报纸一类的低质量稿件,可以考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报纸,OCR的识别率有明显的提高,完全可以和打印稿相比。

  扫描过程中原稿一定要放置正确,不能倾斜,否则扫描出来的字体也是倾斜的,OCR软件将无法正确识别。如果实在无法将原稿摆正,那就需要使用“自动倾斜校正”或者“手动纠斜”功能纠正字体的倾斜。当然选择适当的扫描参数也非常重要,一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对文字的正确识别非常关键,我们可以通过“放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节,调节的工具是扫描仪工具内的“阀值”。

  而对于分辨率,用户选择的原则应为不求最“高”,只求最“佳”。如果分辨率太高,扫描的时间将会大大增加,图形所需的空间也会成倍地增长,无实际意义;如果分辨率太低,给OCR软件的信息量不足,识别率就不会很高。根据笔者的经验,普通五号印刷体采用250~300dpi比较合适;若字号比较大(四号以上),用150~200dpi就足够了;如果是六号或七号等小字体,就要考虑使用400~600dpi了。当然,这也不是绝对的,如果印刷字迹比较模糊,或者笔划较多的识别文本,应适当提高扫描的分辨率。这里额外再提供一个公式供大家参考:文件长度(字节)=(水平尺寸×垂直尺寸×扫描分辨率)/8。

  扫描后,我们还要观察图像是否有污点现象,如有则应使用图像处理软件将这些污点擦去。同时如果有图像存在,也会影响OCR的文字切分,可使用“图像的块擦拭”工具将文档中的图像去除。此外,还应采用适当的辨识方式,注意稿件是横排还是竖排,可选择合适的编排格式按钮,以保持对应。如有必要还可进行版面分析,因为没此步骤的话识别结果会有大量的空格,而OCR通常也将空白处作为识别对象。自动识别虽然可以很好地解决这一问题,但有时却常把不应分开的区域分开,造成识别结果的错误和颠倒。这时可以通过将自动分析与手工分析结合,将不恰当的版面分析删除。现在大多数OCR都提供了简体、繁体、英文的识别方式,也应注意选择。最后,我们还可再次适当地调节对比度和亮度,因为这样可以增加文字和背景的对比度,从而最终均可达到95%以的OCR识别正确率,再略加校对一遍就万事OK了。

  另外提醒用户的是,应充分使用OCR识别软件的用户自学习功能。OCR识别软件内一般都含有用户自学习功能,如果个别字在扫描比较清楚的情况下,软件识别得不正确,就可以把这个字加到用户自定义库中,这样就可以逐渐地提高识别的正确性。要想获得较高的扫描识别率,用户应当不断进行尝试,找出一个适合OCR识别软件的扫描分辨率及扫描亮度以供参考。

如何才能更加有效的提高OCR识别率?
        
        随着数字化时代的飞速发展,如今随机附带OCR识别软件的扫描仪也是越来越多了,当然这绝大多数都是基础版。由于存在此类OCR软件识别率太低,后期纠正处理过程过于麻烦的想法,很多用户都将其闲置一旁。但事实上,用户只需注意一些使用技巧,此类OCR软件的识别率完全可达实用化水平。
        原稿的质量直接影响到扫描出来的图像质量,更会直接影响最后OCR的正确率,因此我们首先要适当调整原稿。对于报纸一类的低质量稿件,可以考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报纸,OCR的识别率有明显的提高,完全可以和打印稿相比。
        扫描过程中原稿一定要放置正确,不能倾斜,否则扫描出来的字体也是倾斜的,OCR软件将无法正确识别。如果实在无法将原稿摆正,那就需要使用“自动倾斜校正”或者“手动纠斜”功能纠正字体的倾斜。当然选择适当的扫描参数也非常重要,一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对文字的正确识别非常关键,我们可以通过“放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节,调节的工具是扫描仪工具内的“阀值”。
        而对于分辨率,用户选择的原则应为不求最“高”,只求最“佳”。如果分辨率太高,扫描的时间将会大大增加,图形所需的空间也会成倍地增长,无实际意义;如果分辨率太低,给OCR软件的信息量不足,识别率就不会很高。根据笔者的经验,普通五号印刷体采用250~300dpi比较合适;若字号比较大(四号以上),用150~200dpi就足够了;如果是六号或七号等小字体,就要考虑使用400~600dpi了。当然,这也不是绝对的,如果印刷字迹比较模糊,或者笔划较多的识别文本,应适当提高扫描的分辨率。这里额外再提供一个公式供大家参考:文件长度(字节)=(水平尺寸×垂直尺寸×扫描分辨率)/8。
        扫描后,我们还要观察图像是否有污点现象,如有则应使用图像处理软件将这些污点擦去。同时如果有图像存在,也会影响OCR的文字切分,可使用“图像的块擦拭”工具将文档中的图像去除。此外,还应采用适当的辨识方式,注意稿件是横排还是竖排,可选择合适的编排格式按钮,以保持对应。如有必要还可进行版面分析,因为没此步骤的话识别结果会有大量的空格,而OCR通常也将空白处作为识别对象。自动识别虽然可以很好地解决这一问题,但有时却常把不应分开的区域分开,造成识别结果的错误和颠倒。这时可以通过将自动分析与手工分析结合,将不恰当的版面分析删除。现在大多数OCR都提供了简体、繁体、英文的识别方式,也应注意选择。最后,我们还可再次适当地调节对比度和亮度,因为这样可以增加文字和背景的对比度,从而最终均可达到95%以的OCR识别正确率,再略加校对一遍就万事OK了。
        另外提醒用户的是,应充分使用OCR识别软件的用户自学习功能。OCR识别软件内一般都含有用户自学习功能,如果个别字在扫描比较清楚的情况下,软件识别得不正确,就可以把这个字加到用户自定义库中,这样就可以逐渐地提高识别的正确性。要想获得较高的扫描识别率,用户应当不断进行尝试,找出一个适合OCR识别软件的扫描分辨率及扫描亮度以供参考。
 
能怎么弄啊

第2题:

以下()是数码相机的主要部件。

A.DSP
B.LCD
C.CCD
D.OCR

答案:C
解析:

第3题:

不属于数码相机主要部件的是()。

A.DSP

B.LCD

C.CCD

D.OCR


参考答案:D

第4题:

简述什么是OCR系统。


正确答案: OCR系统是用于识别提取图片中文字的工具和方法,实现了将印刷文字扫描得到的图片转化为文本文字的功能,提供了一种全新的文字输入手段,大大提高了用户工作的效率。

第5题:

对于天然土,OCR>1时的土是超固结土,OCR=1的土属于(),而OCR<1的土是欠固结土。


正确答案:正常固结土

第6题:

通常将OCR<的天然土程层称为超固结土。


答案:错
解析:

第7题:

OCR系统在20世纪50年代取得了巨大的成功,其中主要的应用就是OCR系统输入的数据可以用于POS系统,比如,汽油销售商在全国安装了POS系统,这样就再不必浏览信用卡销售的发票来确定交易。


正确答案:正确

第8题:

超声语音产品需要现场部署哪些服务()。

A.语音识别和超声语义服务

B.语音识别和OCR服务

C.OCR识别和超声语义服务

D.语音识别、语义服务以及OCR识别


正确答案:A

第9题:

微电子产品的核心是()

  • A、集成电路
  • B、操作系统
  • C、MIS
  • D、OCR

正确答案:A

第10题:

OCR的优点是人眼可识读、可扫描,输入速度和可靠性也优于条码。


正确答案:错误