最强中文文本转语音!ChatTTS安装部署方法 本地一键部署chattts、谷歌colab部署 GitHub Codespaces部署 普通话文本转语音TTS流畅和自然度的天花板 中文解说视频必备工具

  Рет қаралды 13,130

氪學家

氪學家

Күн бұрын

Пікірлер: 85
@weijie_wang
@weijie_wang 3 ай бұрын
mac用户骂骂咧咧点开了视频,并留下了一个赞😊
@kexue
@kexue 3 ай бұрын
哈哈
@tyvanhou7800
@tyvanhou7800 3 ай бұрын
macOS真的没有一点办法吗?想用M1的MacBook部署到本地到底能不能实现啊?请教各位神仙哥哥姐姐,神烦!
@jjcm6675
@jjcm6675 3 ай бұрын
先赞为敬
@kexue
@kexue 3 ай бұрын
感谢支持哈哈
@QAZ0501
@QAZ0501 Ай бұрын
正经老师,有没有哪个文本转语音的软件可以配出生气的语调?这个能配出笑声,不能配出生气吧
@user-vw1pq8bb8p
@user-vw1pq8bb8p 3 ай бұрын
第一个好,可以a卡跑的快 感谢
@dfsfsdas330
@dfsfsdas330 29 күн бұрын
A卡怎么跑
@Restful.Reveries
@Restful.Reveries Ай бұрын
你好,有个问题请教一下。我第一次打开就能执行,但是关掉浏览器后重新打开就执行不下去了。
@user-kl5qv5go5o
@user-kl5qv5go5o 3 ай бұрын
你显卡太牛,我980表示羡慕
@kexue
@kexue 3 ай бұрын
前。。。前辈好
@dfsfsdas330
@dfsfsdas330 28 күн бұрын
能否局域网使用?
@shawvi3892
@shawvi3892 3 ай бұрын
请问下博主,colab里面生成的声音seed后,如何在关闭后的第二天,再次打开colab训练的时候还可以找到这个seed?
@kexue
@kexue 3 ай бұрын
colab里生成的seed 编号记下来 下次重开的时候填入就好了呀
@zoearthmoon
@zoearthmoon 2 ай бұрын
❤❤
@statnet-bv2qu
@statnet-bv2qu 3 ай бұрын
good
@kexue
@kexue 3 ай бұрын
奈斯
@Mobaiya
@Mobaiya 3 ай бұрын
期待训练模型
@kexue
@kexue 3 ай бұрын
哈哈 好饭不怕晚
@user-hh7sr3lt1n
@user-hh7sr3lt1n Ай бұрын
大佬,有流式输出音频的视频没
@fenqin-td9zf
@fenqin-td9zf 3 ай бұрын
这执行力还是可以了
@fenqin-td9zf
@fenqin-td9zf 3 ай бұрын
请问你运营这个油管你是服务器ip还是专门买的住宅了
@kexue
@kexue 3 ай бұрын
就最普通的✈
@fenqin-td9zf
@fenqin-td9zf 3 ай бұрын
@@kexue 多谢了
@kexue
@kexue 3 ай бұрын
@@fenqin-td9zf 加油
@iithades
@iithades 3 ай бұрын
真是盼什么来什么,想学什么就出什么,氪学家威武霸气屌炸天!
@kexue
@kexue 3 ай бұрын
哈哈 请给我寄点护肝片
@iithades
@iithades 3 ай бұрын
@@kexue 请教个问题大佬,如果我要增加笑声是在想增加的地方填写[laugh]还是填写[uv_laugh]? 还有[laugh_2]的意思是啥,laugh 2s么?
@kexue
@kexue 3 ай бұрын
@@iithades 额 参数我也没来得及研究抱歉 可以都试一下。。。我主要就调了一下温度还有top p和top k 这几个值调小之后音频会更稳定 吃字和错字更少
@user-ze6ys9kx1g
@user-ze6ys9kx1g 3 ай бұрын
感觉是比GPT-sovits好,sovits用起来吞字情况特别多。
@kexue
@kexue 3 ай бұрын
嗯 不是一个类型的 sovits主打小样本训练克隆 tts主要是流畅度和拟人化
@user-fe3bo6ss1m
@user-fe3bo6ss1m 3 ай бұрын
有api接口版本吗?
@kexue
@kexue 3 ай бұрын
第三个提到的本地版本是有个API的按钮的 但是我没测试过
@user-gw7xd8nx3q
@user-gw7xd8nx3q 3 ай бұрын
群满了
@kexue
@kexue 3 ай бұрын
哈哈太火了
@tyvanhou7800
@tyvanhou7800 3 ай бұрын
请问下win一键整合包要如何使用?Mac用户在ai这件事情上感觉严重落后。谢谢作者,期待回复!
@kexue
@kexue 3 ай бұрын
mac下可以参考这个 github.com/jianchang512/ChatTTS-ui?tab=readme-ov-file#macos-%E4%B8%8B%E6%BA%90%E7%A0%81%E9%83%A8%E7%BD%B2 (我不是mac所以测试不了抱歉)
@tyvanhou7800
@tyvanhou7800 3 ай бұрын
@@kexue 非常感谢您!
@raylloxo
@raylloxo 3 ай бұрын
玩玩可以,还是等后期完善吧
@kexue
@kexue 3 ай бұрын
嗯 官方在憋大招
@user-td9mf8ey6r
@user-td9mf8ey6r 3 ай бұрын
如何匹配到视频上用?只是读文字,那只能用于播客
@kexue
@kexue 3 ай бұрын
??我这个视频的开头算不算用在了视频上。。。如果说要对口型的话 需要配合其他lip-sync项目 可以参考kzbin.info/www/bejne/p4jZdHl6gsmeq6M
@weizhang-en9ks
@weizhang-en9ks 3 ай бұрын
大佬,我问一下 为什么我用谷歌云端训练完成,下载模型的时候同时下载了三个模型,但是只有一个下载到了,其余两个蓝色圈圈转完了 浏览器下载那里也看不到另外两个模型,下载文件那里也没有😅。
@kexue
@kexue 3 ай бұрын
???这个模型不支持训练啊?
@weizhang-en9ks
@weizhang-en9ks 3 ай бұрын
@@kexue 不是,我用的是花儿开发的那个谷歌云,训练完成了,下个那个模型的时候只能下载一个,其余的点了下载 蓝色圈圈转完也没有看到文件。。。
@weizhang-en9ks
@weizhang-en9ks 3 ай бұрын
他们都用本地部署,问他们全都不了解,看你用谷歌云 想问问你知不知道什么问题,哈哈 还请见谅。
@kexue
@kexue 3 ай бұрын
@@weizhang-en9ks 大概率是梯子不稳 或者浏览器拦截了 现在浏览器为了安全只能下载一次 下载第二次的时候 会在地址栏右边 有一个感叹号 需要手动确认
@weizhang-en9ks
@weizhang-en9ks 3 ай бұрын
@@kexue 哈哈,他是一点提示都没有 就很离谱,我已经换个Dl云端解决了。
@jinxing-xv3py
@jinxing-xv3py 3 ай бұрын
呀咩爹😂
@kexue
@kexue 3 ай бұрын
哒咩!
@user-de4xv7dk6k
@user-de4xv7dk6k 3 ай бұрын
同样的音色(一摸一样的配置)2次配的音都不一样,大家有没有测试到
@kexue
@kexue 3 ай бұрын
有遇到过这种情况 可以多刷几次
@dianzhonglong1123
@dianzhonglong1123 3 ай бұрын
怎么训练特定的音色呢
@kexue
@kexue 3 ай бұрын
现在还没开训练。。。
@RogelSeavey
@RogelSeavey 2 ай бұрын
QQ群已经满了,申请加入组织。
@kexue
@kexue 2 ай бұрын
额 我没组织没记录无业游民抱歉大佬。。。
@allaboutEPL
@allaboutEPL 3 ай бұрын
学习ING
@kexue
@kexue 3 ай бұрын
加油加油!
@stu-work3326
@stu-work3326 3 ай бұрын
声音模型咋训练呢?
@kexue
@kexue 3 ай бұрын
官方未开放训练
@stu-work3326
@stu-work3326 3 ай бұрын
@@kexue 那只能抽卡,抽出三上老师了啊😅
@kexue
@kexue 3 ай бұрын
@@stu-work3326 哈哈哈 请交出你的番号。。。额不是。。。SEED。。。哔。。。我们是一个正经的频道
@stu-work3326
@stu-work3326 3 ай бұрын
@@kexue 不要种子,现在是磁力时代😜
@kexue
@kexue 3 ай бұрын
@@stu-work3326 啥呀 我说的是声音的seed哈哈哈
@hujuzhang
@hujuzhang 2 ай бұрын
你这个头像出个教程可好?
@kexue
@kexue 2 ай бұрын
这不用教程啊 就是一个静态的图片 然后嘴巴用了几个不同的形状拼了一下循环播放
@user-ix8re6lj6g
@user-ix8re6lj6g 3 ай бұрын
为什么我关闭了梯子,也关闭了代理,app.exe打不开,打开闪退
@kexue
@kexue 3 ай бұрын
试一下我视频中提到的另一个
@jiupeak9250
@jiupeak9250 3 ай бұрын
本期番号多少
@kexue
@kexue 3 ай бұрын
110120119
@vidyamayi
@vidyamayi 3 ай бұрын
可以克隆声音吗
@kexue
@kexue 3 ай бұрын
现在不行
@mantulife
@mantulife 3 ай бұрын
不能
@wujie3883
@wujie3883 3 ай бұрын
只能生成30秒
@user-rc4up2oy6n
@user-rc4up2oy6n 3 ай бұрын
话说,up主,使用的是什么靠谱科学上网😂
@raylloxo
@raylloxo 3 ай бұрын
一般只要主做视频的都是自建的,网上教程多的是,还有,这个应该叫youtuber,UP主是B站的称呼
@NoneCc-dw3pm
@NoneCc-dw3pm 3 ай бұрын
​@@raylloxo对的,长期使用还是自己搭建一个好
@TPDR
@TPDR 2 ай бұрын
将近3G的软件下载了,安装过程中提示没发现GPU显卡,只能用CPU生成声音,结果就是处理速度极慢200多字的英文生成声音需要将近10分钟!
@kexue
@kexue 2 ай бұрын
关于用GPU的方式我在视频中提到了 而且视频下面描述也有方法 可以参考下
@TPDR
@TPDR 2 ай бұрын
@@kexue 谢谢
@kexue
@kexue 2 ай бұрын
@@TPDR 加油
@kunzew7503
@kunzew7503 3 ай бұрын
如果不能固定住人声,无限制长度,没鸟用
@kexue
@kexue 3 ай бұрын
下一版可能会好一些 这个版本用官方的话说 应该是“学术探讨”,只不过没想到放出来这么火
@liujinhui7046
@liujinhui7046 3 ай бұрын
群满了
@kexue
@kexue 3 ай бұрын
太火了哈哈
拉了好大一坨#斗罗大陆#唐三小舞#小丑
00:11
超凡蜘蛛
Рет қаралды 16 МЛН
Angry Sigma Dog 🤣🤣 Aayush #momson #memes #funny #comedy
00:16
ASquare Crew
Рет қаралды 48 МЛН
Alat yang Membersihkan Kaki dalam Hitungan Detik 🦶🫧
00:24
Poly Holy Yow Indonesia
Рет қаралды 11 МЛН
Aura vs LifeLock 2024 Comparison: Unlock the Best Identity Protection
9:06
拉了好大一坨#斗罗大陆#唐三小舞#小丑
00:11
超凡蜘蛛
Рет қаралды 16 МЛН