Comment on: 消费级显卡(比如5090/4090等)下的RTF统计
Repo: k2-fsa/OmniVoice by cacard
344秒时长音频 耗时51秒 RTF=0.15
测试方法:
1)自定义一个http server,仅加载一次 model,后续 http 请求都复用显存的model;
2)随机50个音频clone请求,串行;
3)统计【生成音频总时长】和【总耗时】;
结论:
【共生成344秒时长音频】【 耗时51秒】所以 RTF=0.15
机器: 5090laptop
GitHub Issue
SaaS Metrics