1
zcf0508 2022-12-20 13:11:34 +08:00
|
4
kuantingchen 2022-12-21 09:53:15 +08:00
|
5
edis0n0 OP @kuantingchen #4 和 google 那个识别率差不多,和 sonix 这个差的还是有点远
|
6
js8510 2022-12-21 15:27:12 +08:00
我自己尝试在 AWS 上搭建了一个类似的服务。后来由于成本太高,准确率太差,没有盈利的可能。并没有投入运营。我用脱口秀大会口音比较重的一些选手做输入,准确率只有~70%。 如果是用 CCTV 的节目专业播音员的视频,准确率也就能到 95%。
很好奇,你觉得怎样的收费算合理呢? 另外,我知道 https://www.descript.com/pricing 做的很好用,他们收费很低了。反正我觉得全跑在 AWS 上我做不到这么低的价格又这么多功能 |
7
edis0n0 OP @js8510 我觉得能在存在公共场所背景杂音时保持 75%识别率,收费 1~2 美元 /小时比较合理,但我实测即使是 sonix 这个日语+存在公共场所背景杂音准确率也只有 65%左右,远比不上人工
|