一、科普
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
二、BAT公司OCR功能短评:
度娘:中文支持挺棒,还支持生僻字,对一些数字,英文,特殊符号支持不太好,
解析速度时快时慢,但是波动不大,忒别模糊的也尽量却识别,保证不丢字虽然识别错了,哈哈,也要点个赞~。合作方大多数是卖药和一些健康顾问以及目前来说比较热门的项目xx轮的公司。
价格:0.005元每次。,
阿狸:开源能力强,价钱相对便宜一些。识别能力稳定,性能也相对稳定。性价比不错~,个体开发相对较多~,总体来说阿狸是面向大众提供平台化的模式。
价格:0.01元 ,500次,
鹅场:对证件照的识别,要求非常高,只能使用通用功能,对英文和特殊符号识别的能力爆表的,~,据一部分网友反馈支持鹅肠的,因为满足场景多元化, 很有亮点~。价格稍微贵了那么一丢丢~。
价格:0.15元每次
总结:三大平台百度的通用的OCR功能的性价比在中文识别上暂时获得头筹!
三、实验
以同一绝对路径下的一张稍微模糊的身份证图片,来测试BAT公司API的响应时间!
度娘的API响应时间:1235ms
阿狸的API响应时间:1419ms
QQ的API响应时间:1419ms
阿里AI平台的-OCR官方体验
腾讯AI平台的-OCR官方体验
百度AI平台的-OCR官方体验