V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xuliang12187  ›  全部回复第 1 页 / 共 1 页
回复总数  4
@fov6363 vertex 先阶段 没有 endpoint 独立实例概念,现在只有 global 全球的。说是有不同付费级别。那个是针对业务并发量高。并不能解决 接口延迟问题
@chenluo0429 调过一样,很慢都超过 17s
2025 年 12 月 12 日
回复了 devloperchen 创建的主题 程序员 Android Studio AI 工具要怎么才能正常使用啊!
gemini-3-pro-preview 用这个模型速度咋样。Google 云平台 Vertex AI 服务 流式输出非常慢 超过 17s ,你那边有啥解决方案嘛
用了 gemini-2.0-flash 模型首个 token 输出 300ms 200 字的故事,3-4s 就返回了全部内容了 gemini-2.5-flash 首 token 超过 3s 很慢,总时间长度超过 5s ,gemini-3-pro-preview 首个 token 超过 12s ,我们用的 google cloud 企业服务 vertex AI apI 接口。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   995 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 23:19 · PVG 07:19 · LAX 15:19 · JFK 18:19
♥ Do have faith in what you're doing.