
上周,阿里把 Qwen3-TTS 全家桶开源了。而且 0.6B 模型只需要 1.2GB 显存 ,没有独显的话,纯 CPU 也能跑。我特地用一台普通云电脑跑了下,慢是慢了点,但是能用! 这下就再也不用担心TTS这方面的问题了,而且还可以克隆声音,

我封装了一个skill,有需要的可以前往github下载,我用的是WSL环境,可能还需要自己用AI根据环境调整一下!
这里有一个演示视频!
官方GitHub 地址:https://github.com/QwenLM/Qwen3-TTS
Hugging Face 在线体验:https://huggingface.co/spaces/Qwen/Qwen3-TTS
<video width="600" controls>
<source src="https://ali.wangwangit.com/api/raw?path=/👀分享专用/out.mp4" type="video/mp4">
您的浏览器不支持 video 标签。
</video>
是要让某某某每天喊你起床吗
收了
视频声音转语种不换音色可以做到吗
@entire6548 #1 咦,咋这边不支持视频语法么.我调整下试试
@szfzxxxjs #4 你有字幕文件就能实现,可以每段文字用不同的音色,你多准备一些音色就可以了.
能实现收款到账语音播报么
@wangwangit #6
https://github.com/Huanshere/VideoLingo
这个项目试过效果还不错
收藏了
@szfzxxxjs #8 这个我以前就看到过,我封装这个skill也不是为了生成视频用.文章中的只是刚刚用RemotionIntro这个skill测试了下