上个月看到大佬发的/t/599166,国庆研究了一下代码和论文,把大佬的代码用 JavaScript 写了一遍,做了一些修改,目前感觉效果还可以。
下一步考虑在浏览器中运行。
repo: zenghongtu/general-news-extractor-js
online demo: https://general-news-extractor-demo.stayin.cn
1
Sanko 2019-10-09 12:48:09 +08:00 via Android
资瓷
|
2
momocraft 2019-10-09 12:54:44 +08:00
不是新闻网页(比如没有日期)也适用吗?
|
3
cydian 2019-10-09 13:38:40 +08:00 via Android
图片呢?
|
4
0o0O0o0O0o 2019-10-09 13:38:49 +08:00
早就想要了,感谢楼主。
整到了 cloudflare workers 上 ```sh $ curl -s -o test.html http://baijiahao.baidu.com/s?id=1646431966952708911 $ curl -s -X POST https://demo.extract.workers.dev/demo -d @test.html | jq { "title": "国庆黄金...000 万人次", "author": "", "publishTime": "10 月 4 日", "content": "..." } ``` |
5
optional 2019-10-09 13:45:32 +08:00
|
7
zjiecode 2019-10-11 08:24:12 +08:00
|
8
jason94 OP @mrjiejiejie 这篇应该正文太短了,最后算出来的分数低了一点,晚点我看看怎么修正
|