V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  freefreesea  ›  全部回复第 3 页 / 共 4 页
回复总数  66
1  2  3  4  
2025 年 12 月 23 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@mertas 热的历史追踪吗
2025 年 12 月 23 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@metalvest 是,目前没有用大模型,单纯用的文本指纹判断的,准确度还是有比较大的问题
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@yaoppp 新闻标题前面的趋势线 icon 是可以点击的,功能是历史热点追踪,后面带火的,是对应平台自己的热度值。所以还是不太一样的应该
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@yaoppp 热点基本是每分钟刷新一次,所以时间显示需要精确到秒级
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@topang 只要主站没问题,excel 应该就没问题,因为是同一套数据。
我刚看了一下,进去 excel 的时候,里面默认展示的分类是你在网站主页的分类。

如果主页你是在 [突发热点] / [收藏] 这两个页面的话,进去 excel 里面就会显示没数据,因为这两个数据是独立的,并且突发热点的数据形式在 excel 里面是没法展示的。

如果你是从非上面两个页面进去 excel ,那数据应该是都是展示正常的。
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@sunnysab 你数据量不大的情况下,比如一天就几万条数据,喂给 ai 最多也就是几十万个字符。这个 ai 处理起来就很轻松了,只要你的数据里包含时间这个属性,他基本就理的明明白白的。
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@sunnysab 其实有个困难点。
就是文本指纹聚类,也就是如何判断某些标题属于同一个。我目前是自己给标题算的 simhash 然后通过汉明距离去判断的,当然这样存在误判的可能性。最好的方案是交给 ai 去判断,但是数据源太多了,我每天会产生 1500 万+条热点数据,假设每个标题十个字符(极其保守),那么就是一次要喂给 AI 1.5 亿个字符。而这还仅仅是一天的数据量,那如果是一个月,就是 50 亿个字符了,实际几百上千亿字符。

问题就在这,一是大部分 ai 支持不了这么大的吞吐,而是就算支持,这个费用也是普通人远远无法承担的,再就是处理返回的时间会非常非常久。这是最大的问题,通俗点就是如何找相同热点。
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@yu65112233ga1ac 是有点不太相关哈,哈哈哈。不过是因为,个人觉得现在很多技术领域的东西对普通人很不友好,所以能通过自己去做一点对普通大众的日常生活有落地用处的东西,是长久以来的夙愿。甜甜的,美美的,科技不该冰冷
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@cryptovae 简报的话,点击旁边的非简报区域就关闭了
2025 年 12 月 18 日
回复了 freefreesea 创建的主题 互联网 问下佬们在 LinuxDo 这个网站体验怎么样
@Wcowin 可以可以,看了下确实不错
2025 年 12 月 16 日
回复了 freefreesea 创建的主题 分享创造 我的热榜站 100%全面开源啦,欢迎佬们体验
@hellodigua 可以呀,随便弄,项目既然开源,那么你看下他标注的协议,GPL3 就是随意使用。如果一个人的项目开源了,你参考他的去做东西,他给你逼逼赖赖的话,那这种人就永远是地沟里的老鼠
@RangerWolf 你再试下其他两个看看
@ronyin 他们都是闭源的,收费项目一大堆,咱这做公益站的,人家肯定不会和咱交流
@NewYear 是的,咱俩心路历程一样啊,我也是弄 L 站的,过不了验证,然后 smzdm 也是,偶尔可以访问成功,再就是要么出 403 ,要么出腾讯验证码,还会出别的!难啊兄弟
@queue 全网几乎 80%的热榜站都有什么值得买的榜单,而且已经很多年。那么这种情况下,你觉得是 [什么值得买] 的技术团队一直发现不了这件事,还是说本身这件事就是允许的
@queue 所以呢,我看全网很多地方都有什么值得买的榜单,说明他是可取的,只是我的方案不对,我来咨询下正确方案有什么问题呢,这位朋友
@Pipecraft 了解了,佬,感谢🙏
2025 年 12 月 13 日
回复了 freefreesea 创建的主题 互联网 问下佬们在 LinuxDo 这个网站体验怎么样
统一回复一下。没有任何引流的想法。

一:初来 v 站,翻了会儿没找到社会规则的帖子,然后去了解社区的分类。
二:分类里面看到了创造分享和推广还有其他的,着重看了下这两个。然后在创造分享下看到基本都是大家自己的开源项目,然后细化翻到多个帖子在去看。很多帖子分享的开源项目里都带有私链、登录、超链等,那既然能存在这么多帖子,我就以为凡是大家自己开源的项目都是可以放到那个分类下。
三:我在创造分享分类下还看很多帖子里有人直接在帖子文本里打着自己的各个社交平台的即时通讯账号。所以我理解是基于某个人自己的开源项目然后辐射到的东西都算开源分享

那这么一来,我就搞不清创造分享和推广的界限或者指标标准。

然后这里发这篇问与答,就是为了问社区规则,同时放出了在 L 站里被定义为推广的网站,在 v 站自己综合看下来大致属于创造分享分支的网站,来这里问规则。

难不成我还能在一个平台因为不了解规则就一次被永封的情况在,还会专门跑另一个平台又犯同样的毛病嘛,况且站点还是个公益站,所以我没有任何动机或者说利益驱动,像各位说的通过这篇帖子去进行所谓的推广。

然后看上面佬们回复了很多,但是一条关于社区规则的标准或者帖子好像都没看到。我单纯是想了解社区规则,有哪位佬可以发下地址嘛,我是翻了会儿真没翻到。
2025 年 12 月 13 日
回复了 freefreesea 创建的主题 互联网 问下佬们在 LinuxDo 这个网站体验怎么样
@Forerunner23 我主要是比较反感他动不动拉黑人,也不给理由,你一问他,他就说你问的目的是什么
2025 年 12 月 13 日
回复了 freefreesea 创建的主题 互联网 问下佬们在 LinuxDo 这个网站体验怎么样
@clueglue 你是说我那个开源热榜嘛。那个卡片标题的话,分辨率小的时候确实会挤下来,我前端不太行,调不太来,不过提供了自定义设置。可以隐藏后面的数据时间,也可以选择卡片标题超过一行隐藏等等。很多自定义的方式可以实现。
1  2  3  4  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1345 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 17:13 · PVG 01:13 · LAX 09:13 · JFK 12:13
♥ Do have faith in what you're doing.