@thex #12 https://github.com/vibevoice-community/VibeVoice Emmm 可以去读一些小黄文.. 效果还是不错的 然后要 STT 的话就是 sherpa-onnx 看看吧 画涩图的话 qwen-image turbo + 一个 lora (civitai 上找一下)
跑一下 TTS 或者 STT 吧
或者看看能不能画涩图
@megatron #11 大佬细说
换
@thex #12
https://github.com/vibevoice-community/VibeVoice
Emmm 可以去读一些小黄文.. 效果还是不错的
然后要 STT 的话就是 sherpa-onnx 看看吧
画涩图的话 qwen-image turbo + 一个 lora (civitai 上找一下)
现在本地电脑部署的翻译模型哪家强?
7b用来tts,stt绰绰有余,聊天推理肯定不行啊
小模型幻觉很严重的,27-35b最多这个级别也最多干干翻译的活,推理要求的参数少说100b起。
gemma4出来的时候就试过了 普通电脑就是找虐