OpenAI 接口访问速度问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 1040 天前的主题，其中的信息可能已经有所发展或是发生改变。

发现使用 stream 模式能非常快的响应结果. 但是如果直接使用 gpt3.5-turbo 模式的话, 每个问题的答案生成需要 20s 左右。不知道大家有什么好办法么?

目前使用了新加坡机场和 aws 日本节点, 都非常的慢。

8 条回复 • 2023-03-31 00:00:51 +08:00

charmToby

2023 年 3 月 29 日

就用 Stream 模式就行，很快的，可以了解下 SSE ，很简单的，每次返回一个字，和官网效果一样。

swulling

2023 年 3 月 29 日

总时长是一样的，只是 stream 让你感觉快了而已

cocomiko

2023 年 3 月 29 日

stream 从第一个字到最后一个字也差不多要花 20s 左右

tool2d

2023 年 3 月 29 日 via Android

你写代码只能用 stream 模式，用非 stream 实在太慢了。

yrj

2023 年 3 月 30 日

如果不是做聊天，没必要搞打字效果。。

TomsOutside

2023 年 3 月 30 日

感觉跟你的问题有关，偏综合性的，比较性的，会更慢一些

ex1gtnim7d

2023 年 3 月 30 日

接机器人的时候就很蛋疼，因为各种场景和应用下的机器人，基本都不支持流式输出

MarlonFan

2023 年 3 月 31 日 via iPhone

感谢大家，了解了，可能确实体感占据很大一部分因素