很高频的一个需求,领导不知道从哪发了一张表格的照片给你,要你做一个电子版出来。
市面上有些能图片转 Word ,Excel 的工具,但是效果都不理想。AI 模型 OCR 识别率超高,但是都是给你输出 Markdown 的格式,所以有能直接吐文件的 AI 吗
1
nulIptr 65 天前
那不就是扫描全能王这种软件么,ios 付费榜常年第一
|
2
ccraohng 65 天前
夸克的也不错
|
![]() |
3
maymay5 65 天前
|
4
ijk0 64 天前 via iPhone
ChatGPT 应该可以吧 python 转完给你下载地址
|
5
Leon1234567 9 天前
正好今天有需求,要转一个大几十页的 PDF 里的全部模糊表格(表格应该是拍照后 merge 成 PDF 的),市场上一个好用的 AI 工具都没有(试了 Grok, ChatGPT, Perplexity, Gemini, Claude, Kimi, 文小言, ds, 元宝, 通义, 豆包)。倒是都能转成网页显示的表格(Grok 会输出 HTML 代码,预览后就是表格),复制黏贴到 Excel 就行了。白描也试了,数据识别没问题,文字识别很差(一条文字经常被分割成好几条)。ChatGPT 可以生成直接下载的 Excel 表格,可惜没用,因为数据都能少一列,其他内容也识别的一塌糊涂。国外工具识别简中真的差。不过最离谱的是百度,输出的表格和提供的完全就不是一个东西,没有一条能对上的,张三李四王五这些东西都出来了,一切随心所欲,有一条能对上算我输。
最后 Kimi+腾讯混元结合用的,表头一旦复杂(涉及到合并等形式)所有 AI 工具都失效,比如 15 列给你输出 13 列,只能截图(没表头的数据)识别,而且每次输出还得肉眼仔细核对(因为经常有出入)。 |
![]() |
6
lurui45 OP @Leon1234567 怎么结合使用
|
7
Leon1234567 9 天前
@lurui45 就是针对不同类型的表格,有时候 Kimi 好用,有时候混元好用,纯玄学。总的来说就一条建议吧,复杂表格最好是简单的一行一行的,没有任何合并操作,每个行列只对应一条数据,然后再去识别吧,不然真是有的搞了。。。
|