V2EX › dandankele 的所有回复 › 第 1 页 / 共 6 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6

❮

❯

5 天前

回复了 Leo295 创建的主题 › 分享创造 › 做了半年的 AI 图片站， 431 用户， 11 人到结账页， 0 收入——第二大流量来源是 ChatGPT

还是产品定位问题

定位为工具站，目标人群其实都是散客，说白了都是公司的一些执行员工可能为了工作所需或者纯玩体验的人。但这部分人群早已被大厂免费的产品割走了。而且对于这部分人，付费意愿与产品功能存在很大关系，你这产品功能如 V 友所说，类似纯套壳，没好好打磨。

但除了工具站还能做什么？需要了解到市场需求。但了解市场需求的渠道对于个人开发者来说太少了，就以我所了解的来说，现在一般都需要与企业自身的产品需求、内部需求来做结合，结合 AI 来为企业提供更大价值。单纯的通用型的工具在 V 站见过太多了，竞争压力不仅大，与大厂来比直接被碾压。

2025 年 12 月 1 日

回复了 young1 创建的主题 › 程序员 › 用户体系

权限常见的两大类做法，一类是在技术层面、资源层面做的，例如 1 楼所说的，对 api 路径、rpc 路径做权限控制，还有一类是在业务层面的，例如 xx 操作只允许 xx 级别的会员用户才能操作。。。不过这两类做法不是相互代替的，可以同时兼有。。具体问问 AI 吧

2025 年 11 月 28 日

回复了 arnoldnuo 创建的主题 › 程序员 › 现在说的用 AI 就是调 API 消耗 token 吗？前几年常用的训练模型，现在对个人来说既没可能也没必要了吗？还有必要学习机器学习这些算法吗？

AI 范围很广啊，只是近几年火起来的是语言模型，token 消耗量作为计费项也只针对语言模型。。以前的机器学习还可能还会用在风控（爬虫检测等）、产品质检等各种应用方向，那些可能会按次数、时间等其他维度作为消耗量的指标。而且针对企业自身独有领域的 AI 应用，更是需要掌握算法的人的

2025 年 11 月 26 日

回复了 edg 创建的主题 › 程序员 › Java 端怎么弄大模型的长期记忆

你的问题核心应该是知识检索吧，用户提问，但你不知道去拿哪些数据来喂给大模型？
看你的描述像是围绕个人画像数据方面做的检索，身高、体重、血糖，如果个人的数据量不大、字段不多的话，考虑整体扔给大模型。。。
如果个人数据量比较大，那么就要考虑你的问题了，如何抽取出所需的信息给大模型。。

我目前有两种想法：
1. 将个人画像数据做简单处理，将大量维度数据按小维度扔进向量库，然后根据用户提问做相似性检索取出扔给大模型。
2. 调整应用编排，多次调用大模型，每次调用针对不同关注点做处理。例如首次调用主要是引入意图识别，让大模型根据用户问题帮你识别出可能需要什么 category 下的哪个 key 的个人信息，然后你再去 es 检索。这种缺陷可能会增加响应时间。

2025 年 11 月 21 日

回复了 cj323 创建的主题 › PHP › 未来属于 PHP

这要是发到小某书我还以为是起号的。。。

2025 年 11 月 14 日

回复了 szq8014 创建的主题 › 程序员 › cn 域名有效期无法自动化查询，各位大佬有解决方案吗

用 whois 命令查也行吧，不知道限不限制频率，而且你的客户也不多，查询间隔时间长一点，然后存储起来就行

root@localhost:~# whois nmc.cn
Domain Name: nmc.cn
ROID: 20030310s10001s00013947-cn
Domain Status: ok
Registrant: 国家气象中心（中央气象台）
Registrant Contact Email: [email protected]
Sponsoring Registrar: 北京国科云计算技术有限公司（原北京中科三方网络技术有限公司）
Name Server: ns1.sfn.cn
Name Server: ns2.sfn.cn
Registration Time: 2003-03-10 19:14:55
Expiration Time: 2026-12-08 13:45:51
DNSSEC: unsigned

2025 年 11 月 12 日

回复了 julyclyde 创建的主题 › 云计算 › 腾讯云这几个功能是不是重复了

@liuleixxxx 完了你，举报了

2025 年 11 月 11 日

回复了 pollosss 创建的主题 › JavaScript › 发现了两个关于 JavaScript 语言好玩的网站，让人血压升高

You got 6 out of 25 correct!

2025 年 11 月 11 日

回复了 boneyao 创建的主题 › 程序员 › 隐私号码保护的企业服务

这玩意儿运营商管的很严。。要看使用场景的。。大多数都是用来做陌拜的。。全是骚扰电话

2025 年 11 月 4 日

回复了 monway 创建的主题 › 云计算 › 关于全球性的网站加速问题

你这个慢你有没有分析大概是慢在哪些环节？服务器上创建新环境、应用启动初始化慢？还是服务器处理用户请求的复杂逻辑的慢？还是服务器响应后返回到终端用户的网络慢？

另外你这“下载 5M 的 js 文件”，指的是你临时环境中拉取这个 js 到你服务器上？还是用户从你服务器拉这个 js 到他们自己电脑上？

2025 年 10 月 16 日

回复了 gouguoyin 创建的主题 › Go 编程语言 › go-carbon v2.6.13 发布，一个轻量级、语义化的 golang 时间处理库

才发现 dromara 社区有那么多熟悉的项目..这是个什么神奇的组织

2025 年 10 月 13 日

回复了 macscsbf 创建的主题 › 职场话题 › 是待在现在这家小厂，还是去一个中厂外包

你这要是发在小某书，我还以为是起号的。。

2025 年 9 月 30 日

回复了 jqknono 创建的主题 › 分享创造 › 阿里云 ESA 边缘函数转发代理 docker registry

这玩意儿容易被封吧。。

2025 年 9 月 28 日

回复了 longmeier90 创建的主题 › Go 编程语言 › go 项目中对模型映射数据库表结构的解决方案是什么？

@lasuar 有个问题想咨询下大佬。。有的 db migration 迁移工具中，提供的都是基于.sql 文件方式去做数据库表结构变更的。这样对于纯 DDL 基本是有效的，但是不知有没有这样的场景，例如在做了 DDL 之后还要做一些数据处理工作，如原有 A 字段可能因早期设计不合理，现在需要新增一个 B 字段，这是 DDL 部分，但是还需要将 A 字段中已有的数据通过脚本提取、处理、转换并更新到 B 字段上。这时数据处理的逻辑就不太好放在.sql 中编写了吧。

我的做法都是引入第三方工具库，然后自己写脚本的，在脚本中调用库的 DDL 方法，然后再写一些额外的数据处理逻辑的。不知大佬这种抛开第三方工具独立维护的方案中，如何处理这样的需求的

2025 年 9 月 15 日

回复了 hetal 创建的主题 › 程序员 › 求 perl 高手，解决 pt-table-sync 的一个 json 字段的中文乱码问题

@hetal 好的感谢，大致的参照了下上面老哥的处理方式做了调整。。好像是 json 类型字段并没有做 utf8 解码，问题在于 perl 的 DBI 的库 https://github.com/perl5-dbi/DBD-mysql/issues/309 ，希望给后人留下一些有用信息

2025 年 9 月 12 日

回复了 hetal 创建的主题 › 程序员 › 求 perl 高手，解决 pt-table-sync 的一个 json 字段的中文乱码问题

@zhanglintc 老哥。。pt-archiver 也有类似问题，能否照这思路帮忙改一下，官方都 5 年没动静了。。原问题： https://forums.percona.com/t/when-pt-archiver-archives-mysql-json-fields-garbled-characters-appear/39307

2025 年 8 月 29 日

回复了 dandankele 创建的主题 › 程序员 › 有什么 AI 应用平台可以支持多模态模型、带图提问检索的？

主要是各位有没有具体的实践啊，选了多模态模型之后，开源的 AI 工作流平台选哪个，coze 貌似还不支持多模态模型，dify 好像仅能用 gemini ？ ragflow 中添加了工具之后就无法分析上传的图片。。。

2025 年 8 月 21 日

回复了 larisboy 创建的主题 › 问与答 › RAG 召回率低？可能是知识库分段没做好！求问大佬们的经验

1. 知识库的源文档可以是任何形式的文件，如 docx 、ppt 、pdf 等等，那么此时需要做第一步，将这些多种形式的、非结构化的数据转化为结构化的数据结构，如都统一转化为 markdown

2. 分段问题是整个工程里比较重要的且棘手的一项问题。要考虑分段大小是否匹配模型窗口、分段后上下文如何不丢失、语义不丢失等。。应该没有固定的一种手段。。要保证上下文的话，可以分段是保留一些重叠，或者构建知识图谱（这个又引入了复杂性）。。分段策略可以网上搜一下，一大堆资料，一些 rag 框架里也会自带的

3. 多模态的还没尝试过，也在研究。可以将图片也转化为文本描述，那么入库的都是文本了，后续检索也只需要根据文本检索，但这严重依赖文本的准确性，可能导致检索精度丢失。。另一种就是用多模态模型了，让图片向量与文本向量存储在同一空间里，直接做图文检索。。

1 2 3 4 5 6

❮

❯