BeautifulSoup

BeautifulSoup

V2EX 第 572961 号会员,加入于 2022-02-16 18:15:56 +08:00
今日活跃度排名 22053
根据 BeautifulSoup 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
BeautifulSoup 最近回复了
不止 cn2 ,日本方向光缆最近确实有问题,软银线路炸得一塌糊涂,昨天才开始有改善
3 天前
回复了 vhisky 创建的主题 宽带症候群 最近家里的网络对代理节点不友好
@hc8903 只能说某些线路下好用。移动海外 pop 可没有电信联通多
我们新项目现在默认用 PostgreSQL ,存量业务随着大版本更新逐步淘汰 MySQL 。
MySQL 据称是新版本性能反而比老版本差,参考 https://blog.vonng.com/db/sakila-where-are-you-going/
2025 年 12 月 26 日
回复了 crc8 创建的主题 宽带症候群 国内三大是不是只剩联通家没连 CF?
@ArcherL 电信是有欧陆光缆的,非精品网去阿姆斯特丹直接 peer 到 AMSIX 延迟比去美西低。看 itdog.cn 测试,电信家宽现在 100%去 AMS
2025 年 12 月 25 日
回复了 crc8 创建的主题 宽带症候群 国内三大是不是只剩联通家没连 CF?
电信现在直连 cf 去欧洲阿姆斯特丹,以前是去美西的...
2025 年 12 月 24 日
回复了 summerLast 创建的主题 分享创造 各位大佬,现在有 LLM,本地自建今日头条可行了
@marquina
> 要想做的好的话需要考虑图数据库,包括实体(时间/地点/人物/事件)、实体属性、实体之间的关联,不然就永远只见树木不见森林

想法很好,但首先从无结构文本中抽取实体误差就不小,还涉及到实体标准化对齐等等一整个 pipeline (比如川普、特朗普、Trump 都指向一个实体)。这类想法学术界研究很多,但我的体会是落地很难,最主要原因是:1.既然要从文本中抽取这些片段,那为什么不直接用原始文本; 2.维护图数据库(也就是知识图谱)代价太高,更新困难。
2025 年 12 月 24 日
回复了 summerLast 创建的主题 分享创造 各位大佬,现在有 LLM,本地自建今日头条可行了
@summerLast 我觉得做到 embedding 匹配一步就可以了,faiss 或者向量数据库都可以实现。大模型做画像的问题是要强行用离散文字表述一个连续隐含特征,信息损失太大,边际收益太低。
2025 年 12 月 24 日
回复了 summerLast 创建的主题 分享创造 各位大佬,现在有 LLM,本地自建今日头条可行了
@marquina 生成式推荐大概率是个伪命题,落地的没有几家。楼主这种用例直接向量匹配就足够了,主要问题是历史数据太少,需要训练的模型学不出来什么信号
2025 年 12 月 12 日
回复了 zl1995 创建的主题 分享发现 避雷百度搜索,这次微软 Bing 搜索“放血硬钢”!
从 19 年开始切换到 bing ,每天大概搜索 10 多次,基本每半年可以换一次 100 元肯德基卡。app 好像还有更多活动赚积分,懒得弄😅
2025 年 12 月 6 日
回复了 ltltfuture 创建的主题 分享发现 深夜头脑风暴和 ai 对线,探寻 ai 革命机会和终点
跟 AI 谈宏观问题,基本全是幻觉
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3600 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 10:39 · PVG 18:39 · LAX 02:39 · JFK 05:39
♥ Do have faith in what you're doing.