本文首发于公众号 极客枫哥 ,日更分享各种好玩的软件、编程知识和个人成长故事
今天给大家推荐一款网页版的 OCR 工具,免费无限制,而且也支持 PWA 离线使用,而且识别效果上也很不错,它就是 PearOCR,地址是这个:pearocr.com/
页面是长这样的。
看到这里你可能会想,这也太简陋了吧,而且能提供在线 OCR 能力的网页一搜不是一大把吗?这个和其他类似的网站有什么区别呢。
我觉得这个网站最大的特点就是本地计算,就是说你想识别的图片并不用上传到网站的服务器,而是直接在浏览器短进行识别的,保证了数据的安全性。
功能介绍
- 多语言支持,目前已经支持了简体中文,繁体中文,英文,日文,韩文这五种语言;
- 支持批量上传图片,或者直接从剪切板读取,大大的提高了效率;
- 上传完图片后,就可以自动识别,速度很快;
- 导出格式丰富,支持导出为 pdf、word、txt;
- 修改内容,如果发现有识别错误的情况,也可能手动修改识别内容,然后导出;
上手体验
我们来找几个案例来实际演示一下它的功能,我在浏览器中随便截取了一张图片,然后进入网页,点击"读剪切板"
然后就能立马看到识别出来的结果了,页面上也提供了复制按钮,你就可以把识别的内容复制到其他地方了,而且识别的结果版式也基本和图片是保持一致的。
当然你也可以手动的调整版式,目前也提供了如下几种排版方式:单行排版、自动排版、独立分行、自动换行
如果这是我想复制图片中关于 PearOCR 的简介,网页也提供了快捷操作方式,可以直接点击图片上的文字部分,在页面底部会弹出一个小窗,就会显示你点击的文本了,非常方便。
我们来尝试一下将识别的内容导出成 word 看看效果怎么样,点击页面底部的导出
接着再点击"导出为DOCX"就可以了
放到 word 里的效果也还是不错的,工具也提供了一些配置项,可以对错误字符阈值,文本阈值等进行配置,也支持对上传的文件名进行排序
我个人也对这个工具的技术原理比较感兴趣,搜索了一圈,也只是找到了 github 仓库,但是作者并没有开源,只是开放了打包后的代码,有兴趣的小伙伴也可以去研究一下
website 仓库就是网站的代码了
总结
本文介绍了一个在线免费的 OCR 工具,PearOCR 的功能特点和上手体验示例,满足了现代社会对信息处理速度和质量的高要求,是一个日常办公的好助手。