来了挺久了一直潜水,最近在写 tg 推送 rss 的东西,想追下论坛最新的帖子
现在是抓取的 https://www.v2ex.com/index.xml 这个地址,但是有新回复也会推送
我的需求是,只要新主题,请问各位有没有这个源?
1
yesha 171 天前
|
3
yesha 171 天前
帮不了你了. 你可以自己用 api 数据,自己做个 xml 源
|
4
s1xu OP 有道理噢,新思路,多谢
|
5
shuxhan 171 天前
|
6
sleepm 171 天前
上数据库,新增记录前查找,存在就不新增
|
7
s1xu OP @sleepm 主要用的这个地址不是通用的 rss 格式,我用 py 的 feedparser 做了一个通用的,只提取 title 和 link ,index.xml 这个地址的 link 会显示回复的地址,所以不太好用
|
8
elechi 171 天前
https://www.v2ex.com/feed/tab/tech.xml
我订阅的这个,没有回复 |
10
fixbugs 171 天前
可以使用 rsshub
|
11
Zaden 171 天前
@Zaden #9 发现就在右侧栏里 https://www.v2ex.com/index.xml
|
14
eaststarpen 171 天前
https://fast.v2ex.com/t/1040682 里有站长的回复 " https://www.v2ex.com/changes"
该页面底部存在描述 "本页面是全站最新的 100 个主题......" 我简单查看了里面的帖子,似乎也是根据回复时间刷新的 或许你可以 at 站长问一下 |
15
0o0O0o0O0o 171 天前 via iPhone
我也一直觉得应该分为两个,最新发布的主题是一个,有最新回复的主题是另一个。我记得它会在后面带上#reply 并且没有唯一的 ID ,就会重复推送了。
|
16
encro 171 天前
不用了,直接 ID 加 1 解决。
|
17
s1xu OP @0o0O0o0O0o 是的,这里的主题和帖子是两个概念,rss 这个推送的是帖子,也就是最新的回复,我的想法是只监听最新的主题
|
18
s1xu OP @eaststarpen 这个帖子我搜索过,最后一条回复就是我
|
19
fydss 171 天前
https://www.v2ex.com/recent?p=1 这个最近的主题是不是
|
22
fydss 171 天前
@s1xu https://www.v2ex.com/feed/tab/all.xml 我把楼上老哥的地址改了一下,还真是可以访问的 XML ,乐
|
24
NewYear 171 天前
|
25
0o0O0o0O0o 171 天前
@NewYear #24 #15 我看了下,v2ex 的 RSS 是有 ID 的,是我记错了
遇到过有的 RSS 不带 ID ,RSS 工具就会自己算 id/guid , # 后面的内容也会被带进去计算 |