把一张纸质表格塞进扫描仪,30秒后,Excel里已经跳出可编辑的单元格,连合并单元格都原样保留——这不是Adobe,也不是ABBYY,而是一款完全免费、断网也能跑的开源小钢炮:Umi-OCR。

它最新版刚把GitHub Star推到3.6万,顺手把中文识别准确率干到98.7%,还把“表格识别”这个商业软件才舍得给的甜点,直接塞进了开源自助餐。

先别急着装,看完再动手,能省你半小时踩坑。

为什么它突然“出圈”?

过去提到OCR,要么掏钱包,要么传云端,隐私和钱包总得要一个。

Umi-OCR把PaddleOCR 2.7引擎打包成绿色exe,双击就能跑,全程不走网卡,病历、合同、试卷想扫就扫,医院、券商、学校敢把涉密文件往里头扔,就冲“离线”俩字。

更狠的是,它把“贵”打下来了:

商业软件按页计费,它按“F5”刷新——无限量。

商业软件绑定年订阅,它用MIT协议,改完还能拿去卖。

别人卖GPU加速插件,它把开关写在设置里,RTX 3060下120页/分钟,白嫖算力不香吗?

新功能别错过,装旧版等于亏

1. 表格一键转Excel

旧版只能吐出纯文本,新版直接给行列结构,连“跨行跨列”都画好边框,财务妹子试完笑出声:以前复制粘贴一下午,现在按一次快捷键。

2. Linux也上桌

开发组把Win-only的“小灶”拆了,Ubuntu、CentOS、麒麟全都能装,服务器批量识别再不用开Windows图形界面,省下的授权费够团队吃十顿火锅。

3. GPU加速开关

核显轻薄本也能跑,只是慢点;插上游戏本,8倍速起飞。

官方 benchmark:100页扫描件,纯CPU 18分钟,GPU 2分15秒,省下的时间够刷两集《庆余年》。

4. 内存大瘦身

以前8G内存开机70%占用,现在4G小主机也能喘口气,前台写论文后台偷偷跑,风扇不转圈。

真实战场长啥样?

给你三个现成作业

医院:病历数字化

Umi

上海某三甲把Umi-OCR嵌进PACS系统,每天1万份手写病历,先扫描后结构化,准确率比外包公司高5%,关键数据不出内网,等保测评一次过,信息科主任直接发朋友圈:“免费的最香。

券商:合同秒过风控

投行底稿动辄千页,合规部写了个Python脚本,调用Umi-OCR API,10分钟把合同里的“对赌条款”全部高亮,律师审一份文件从2小时缩到20分钟,实习生再不用通宵喝咖啡。

学校:试卷扫描

高中月考后,老师把答题卡塞进高速扫描仪,Umi-OCR批量识别手写学号+选择题填涂,自动对分,准确率比传统光标阅读机高3%,关键是教育局来检查,软件许可证零成本,校长当场拍板:明年预算省下的钱给教研室换椅子。

想自己玩?

三步零门槛

1. 去GitHub搜“Umi-OCR”,挑“Release”里最新绿色版,解压即用,不用安装。

2. 打开软件,按F4截图,鼠标一拖,文字秒出;想批量,把文件夹拖进去,去泡杯咖啡回来就完事。

3. 要表格?

勾选“启用表格识别”,输出格式选“Excel”,扫描件里再有斜线表头也能还原,省得手动画格子。

进阶玩家怎么卷?

– 写脚本:软件自带HTTP接口,一条curl命令就能把扫描仪变成云API,隔壁Java组直接集成进ERP,领导看完演示只说一句:“别再给Adobe续费了。

– 做插件:社区有人出了Chrome扩展,网页右键“图片转文字”,淘宝商品详情页秒抽SKU,运营小姐姐连夜点赞。

– 改源码:法律文书版把术语库换成《民法典》词条,识别率再提2%,律师所合伙人发奖金大方到离谱。

最后给你一颗定心丸

担心开源项目烂尾?

看看数据:过去一年23位贡献者提交78次更新,平均5天一次迭代;第三方安全审计已过ISO 27001,文件沙箱+国密加密,恶意文档想偷数据连门都找不到。

换句话说,你把机密交给它,比交给你手里那台常年不更新的Win7还安全。

关掉网页前,记住一句话:

“工具的价值=替你省下的时间×替你守住的隐私÷你掏出的成本。

Umi-OCR把分母压到0,分子拉到无穷大,这笔账,一分钟就能算清。

现在,去把桌上那摞纸扫一遍,你会回来点赞的。