V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  BeiChuanAlex  ›  全部回复第 17 页 / 共 18 页
回复总数  345
1 ... 9  10  11  12  13  14  15  16  17  18  
2023-06-28 20:53:08 +08:00
回复了 Atomontheway 创建的主题 Telegram 有没有什么好玩的 tg 群组,适合上班摸鱼。
https://www.tgqun.xyz/
从 5000+个电报群组 /频道 /机器人中精心筛选出的优质账号
@xiaoxuan6 哪个?
@TArysiyehua 啥都不用改,代码运行就是所有数据,代码里没过滤
@virlaser 做数据挖掘的前提是数据有价值,按照目前 Tg 的生态,数据没什么价值,换个方向吧。
@bjzhush @pengtdyd 谢谢
@jzyzcz 应该是爬的,然后做成接口
@Arvin567 谢谢
@guazila 已删除
@hoor 科学上网相关内容的账号没有放到表格里,相关的账号里太多买卖机场的内容了,很难筛选。
@BRmeng 在项目的 telegram_info.sql 文件中可以自己看
@delete26 用户越多,管理的成本会直线上升,运营一个好的账号本身也是需要不小的成本,私人群确实能更方便的管理。
@modao3 好的,感谢反馈
@cooper2020 谢谢提醒
@tanmrs48 tg 有客户端接口,可以用这个来做
@kingwrcy 可以爬,有现成的接口。
@kingwrcy 大部分的群 /频道 /机器人里面的内容都是日常闲聊的内容,对话内容爬出来也没有什么价值。
@gablic 所有的数据都在 GitHub 项目的这个文件里面:telegram_info.sql
@missdeer 确实也不少注水的,这也和样本数量及样本来源有关,目前能找到的 URL 集有限。
@Cheons 优质的中文内容不光是 Telegram 上很少,其他平台上也不多,只是 Telegram 上更少罢了,这个是生态决定的。
1 ... 9  10  11  12  13  14  15  16  17  18  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   968 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 21:42 · PVG 05:42 · LAX 14:42 · JFK 17:42
Developed with CodeLauncher
♥ Do have faith in what you're doing.