V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Sh1xin  ›  全部回复第 2 页 / 共 2 页
回复总数  24
1  2  
137 天前
回复了 Sh1xin 创建的主题 程序员 私有化部署 OCR 解决方案请教
@Ipsum @ersic 刚试了 wxocr 的效果,很差....文字识别错误,多检测框重合。至少 Paddle 文字识别全部正确
137 天前
回复了 Sh1xin 创建的主题 程序员 私有化部署 OCR 解决方案请教
@test00001 gemini 不是开源的,没法私有化部署,不考虑。之前也试过直接发给 GPT O3 模型,识别效果特别好。可惜没法私有化部署。直接把图片发送给 gemma 3 27b 的话,识别的文字错误率太高,不可用
137 天前
回复了 Sh1xin 创建的主题 程序员 私有化部署 OCR 解决方案请教
@xomix 我是想让 OCR 识别出来的结果。直接发送给 AI ,根据提示词可以获得我所需要的内容。但是现在部分场景检测框重合,OCR 输出的格式就错了,AI 识别有问题
137 天前
回复了 Sh1xin 创建的主题 程序员 私有化部署 OCR 解决方案请教
@ersic 好的,我试一下这个 OCR 效果
1  2  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5291 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 08:51 · PVG 16:51 · LAX 00:51 · JFK 03:51
♥ Do have faith in what you're doing.