这是一个创建于 3713 天前的主题,其中的信息可能已经有所发展或是发生改变。
公司有好多分 word 文档, 现在要抓取里面一些固定的信息, 然后格式化放入数据库里面.
这种需求怎么做比较好啊?
目前想到的办法就是 word->xml->匹配->保存
4 条回复 • 2015-11-17 12:44:06 +08:00
 |
|
1
blueset 2015 年 11 月 16 日
存成 HTML ?
|
 |
|
2
chalio 2015 年 11 月 16 日
NPOI
|
 |
|
3
myth 2015 年 11 月 16 日
可以试下 python-docx
|