V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
NonClockworkChen
V2EX  ›  问与答

有这样一件事,文字对比工作,不知道怎么加速。

  •  
  •   NonClockworkChen · 2020-08-31 20:51:58 +08:00 · 1019 次点击
    这是一个创建于 1556 天前的主题,其中的信息可能已经有所发展或是发生改变。
    客户会给我们一个 word 格式的新闻稿。
    我们需要用 CMS 编辑好后,上传到后台发布。因为一些特殊原因,这个 CMS 使用起来复杂。所以,我们不太能要求,上传的同事,一点错都不出。那么我负责检查工作,怎么能批量检查 word 中每行字,都在网页中。
    不需要检查样式,只要保证,字对就行。经常漏内容- -,我再解释一遍,这个 CMS 比较复杂而且不能替换,我自己上去传内容,都不能保证一定不出错。。。
    7 条回复    2020-09-01 13:47:50 +08:00
    pelloz
        1
    pelloz  
       2020-08-31 21:03:58 +08:00
    有很多工具包可以读取 word,然后再和你们发布的网页内容对比一下就能告诉你是不是完整的。程序实现应该不难。
    pelloz
        2
    pelloz  
       2020-08-31 21:15:25 +08:00
    我想到的最简单而且不用写代码就能完成这件事情的方法是,把原始 word 内容全选复制粘贴到 1.txt 文本文件,然后全选 CMS 输出的内容到 2.txt ,然用 beyondCompare 工具进行比对的到结果。
    dlsflh
        3
    dlsflh  
       2020-08-31 21:18:46 +08:00 via Android
    CMS 是什么?
    TimePPT
        4
    TimePPT  
       2020-08-31 21:33:37 +08:00 via Android
    @dlsflh 内容管理系统
    sadfQED2
        5
    sadfQED2  
       2020-09-01 08:52:16 +08:00 via Android
    你会编程的话,写代码读取 word 内容,然后再通过爬虫抓 cms 数据,然后对比。

    如果你不会的话,楼下大佬解答吧
    soho176
        6
    soho176  
       2020-09-01 11:52:05 +08:00
    换个简单的办法,word 直接转换成图片,cms 中直接贴图片
    xiaoxinshiwo
        7
    xiaoxinshiwo  
       2020-09-01 13:47:50 +08:00
    将网页的文字复制出来保存为 word,然后用比较工具例如:beyondCompare 比较下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5679 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 01:37 · PVG 09:37 · LAX 17:37 · JFK 20:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.