现在 ChatGPT 这些很火,但是比如开发了一个私人助理,这个需要调用很多私人数据,
感觉这一波 ChatGPT 这个难点好难突破。
1
swulling 2023-04-03 16:04:32 +08:00 via iPhone
反正最后不都传给 OpenAI 了么。用户不相信,不想数据上传,那他肯定就用不了啊。
除非用私有化的 LLM |
2
op351 2023-04-03 16:07:52 +08:00
就算你加密了
你的转发加密了 openai 也没保证不会利用你上传的数据 |
3
Removable 2023-04-03 16:10:42 +08:00 via iPhone
@op351 实际上是保证了的,openai 明确说明了不会利用 API 的数据进行训练等操作,并会在 30 天后删除数据。
|
4
DjvuLee OP @swulling 现阶段还是没有大量的本地数据上传的,比如你本地的数据库,有的都只是 chat query 里面的。
但是想要想有个性化的效果,这个是无法避免的。但是私有化部署 LLM 其实就有第二个问题。 |
6
DjvuLee OP @Removable 目前我还是相信 openAI ,但是你看他的 chat 页面上面有 vote-up 和 vote-down ,估计还是会做一些分析的。
|
7
op351 2023-04-03 16:16:14 +08:00
@Removable
https://help.openai.com/en/articles/6783457-chatgpt-general-faq 请看第 6 条 很明显没有保证 而且态度很暧昧 用的“maybe” |
8
Removable 2023-04-03 16:16:23 +08:00 via iPhone
@DjvuLee 你指的是 openai 自己做的 ChatGPT 的数据吗?那个是会拿去做训练的。我说的是 api
|
10
libook 2023-04-03 16:17:22 +08:00
三星刚刚因为 ChatGPT 出了几次数据泄漏事故。
如果 AI 引擎是实时学习的,那么肯定保不齐会成为大喇叭,给点赛博咒语就把别人的隐私吐出来了。 现在的主要问题还是,GPT 只是个语言模型,它是基于概率来计算最可能出现的上下文,它不可能理解逻辑和人情世故,只能尽可能猜得符合惯例。即便是私有化部署企业内使用,也还是要解决信息从高安全等级的岗位流向低安全等级的岗位的问题。 要么 OpenAI 自己想出办法从底层来解决,要么就只能用于非敏感场景。 |
11
justfindu 2023-04-03 16:20:14 +08:00
保证不了 三星不是刚出事么
|
12
hahastudio 2023-04-03 16:32:58 +08:00
基于 ChatGPT 不行,ChatGPT 是 OpenAI 的应用,它会有人来阅读你的聊天记录 https://help.openai.com/en/articles/6783457-chatgpt-general-faq
> 6. Will you use my conversations for training? > Yes. Your conversations may be reviewed by our AI trainers to improve our systems. 基于 OpenAI API 的恐怕也不行,虽然 https://platform.openai.com/docs/guides/chat/do-you-store-the-data-that-is-passed-into-the-api 里面说 > Do you store the data that is passed into the API? > As of March 1st, 2023, we retain your API data for 30 days but no longer use your data sent via the API to improve our models. Learn more in our data usage policy. 但是 https://openai.com/policies/usage-policies 里面说 > If we discover that your product or usage doesn’t follow these policies, we may ask you to make necessary changes. Repeated or serious violations may result in further action, including suspending or terminating your account. 你猜它怎么做到这一点 如果是基于 LLaMA 、ChatGLM 、Colossal-AI 这些可以本地部署的模型的话,那么数据隐私性就依靠你自己实现了 |