一个简单的 windows 桌面 ocr 应用前端

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

这是一个创建于 1090 天前的主题，其中的信息可能已经有所发展或是发生改变。

使用 Avernakis React 和 Tesseract.js 实现了一个简单的 ocr 应用：

ocr-cn

ocr-en

但是 Tesseract 的中文识别感觉不行：

bad-case

根本不可用。。(╯▔皿▔)╯

UI 倒是可以复用，js 环境下，有什么中文识别率更高的 ocr 库吗？

仓库： https://github.com/rerender2021/ocr

15 条回复 • 2023-02-12 09:45:30 +08:00

weijiagege

2023 年 2 月 8 日

微信桌面端发送的图片就是自动识别图片中文字的而且速度特别快准确率也高，比较好奇它是用什么识别的

tensorzhang

2023 年 2 月 8 日

换成 paddle 吧

nekoneko

2023 年 2 月 8 日

调用 api, 百度讯飞阿里的都行吧

TomCN

2023 年 2 月 8 日

最近用过微软自带的 Windows.Media.Ocr 库，这个是 UWP 的接口，只能在 Windows10 以上的系统调用，识别率我觉得很不错

不过应该没法用在 Web 上

ila

2023 年 2 月 8 日 via Android

@tensorzhang 部署起来很麻烦

Ocean810975

2023 年 2 月 8 日 via Android

我用的笔记软件思源笔记 OCR 用的 Tesseract 来着，我感觉挺好的，正确率百分之 95 以上了起码，你这个是不是没下中文词库啥的啊？或者是繁体的词库?

s127

2023 年 2 月 8 日 via iPhone

用旧的 iphone 开个 ocr 的服务

https://findthatmeme.com/blog/2023/01/08/image-stacks-and-iphone-racks-building-an-internet-scale-meme-search-engine-Qzrz7V6T.html

Stoney

2023 年 2 月 8 日 via iPhone

Powertoys 已经支持 ocr 了

alne

2023 年 2 月 8 日 via Android

@Stoney 识别率差点意思，之前中文识别改善了不少，但是标点符号的识别还是一塌糊涂

7gugu

2023 年 2 月 8 日

@weijiagege 自研的识别库

rerender

2023 年 2 月 8 日

@tensorzhang 之前试过，是直接代码形式用的，感觉要研究一下怎么部署好了。。

rerender

2023 年 2 月 8 日

@Ocean810975 我好像用错语言模型了。。我换了个就能准确识别了： https://user-images.githubusercontent.com/87927336/217553905-2f04c79d-8fde-4b73-8c10-920a65791947.png

然而正当我高兴，发现换的那个模型，这个复杂的可以识别，但更简单的 demo 图片反而不能了。。

https://github.com/rerender2021/ocr/issues/1

rerender

2023 年 2 月 8 日

@s127 😀手机还可以这样用，开眼界了。。

rerender

2023 年 2 月 12 日

@ila 找到简单的方式了，windows 上可以直接一个 exe 启动 ocr 的服务器： https://github.com/YongJie-Xie/PaddleocrAPI

rerender

2023 年 2 月 12 日

@tensorzhang 已换用 paddle ocr 😀 https://github.com/rerender2021/ocr-2