
描述: restaurant menu card

描述:cheesecake store

描述:Advertisement of limited offer in McDonald's
1
jr55475f112iz2tu 2024-02-21 11:02:03 +08:00 “需要用几个简单的词描述一下图片里的内容”
举个例子,最后要描述成什么样 |
2
casatAway 2024-02-21 11:06:16 +08:00 gpt4 不是提供了 api 了吗,minigpt4 和 gpt4 差距很大
|
4
Egfly OP @h272377502 gpt4 api 有调用频率限制吗
|
5
dobelee 2024-02-21 11:59:43 +08:00 看你的例子可不“简单”。图二需要通过 cake 等字眼结合分析才能得到是餐厅,图三需要识别麦当劳的 logo 才能得出是麦当劳的广告。一般给照片内容识别打标签的 AI 没训练到这程度吧,还是得上 chatgpt 或者 gemini 。
|
7
jZEdn7k4 2024-02-21 12:38:53 +08:00 via iPhone 你这个任务叫 image captioning ,github 用这个关键词搜一下,不少开源代码和模型的,当然质量比不上 gpt 也不会太差
|
8
Puteulanus 2024-02-21 12:57:13 +08:00 我之前用过 IBM Watson Visual Recognition ,不知道现在还活着没
国内的用过腾讯的万象优图 https://cloud.tencent.com/document/product/460/39082 |
9
loi1noG2463cVpXu 2024-02-21 13:17:59 +08:00 via Android 人工,增加工作机会,造福社会
|
10
vivisidea 2024-02-21 16:45:04 +08:00 |