阿里巴巴近期发布了开源语音大模型项目FunAudioLLM，该项目包含了两个核心模型：SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆

No video

阿里巴巴近期发布了开源语音大模型项目FunAudioLLM，该项目包含了两个核心模型：SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆

Рет қаралды 291

DeepHub AI

Күн бұрын

SenseVoice：精准多语言识别与情感辨识
SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测，支持超过50种语言的识别，其效果显著优于现有的Whisper模型，尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音，还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示，SenseVoice在情感辨识能力上也取得了行业领先的成果，能够检测到多种情感表现。
CosyVoice：自然语音生成的新标杆
CosyVoice则聚焦于自然语音生成，支持多语言、音色和情感控制，涵盖中文、英文、日文、粤语和韩语五种语言的生成。与传统语音生成模型相比，CosyVoice在生成效果上有显著提升。它仅需要3至10秒的原始音频，即可生成模拟音色，包含韵律和情感等细节，甚至能够实现跨语言的语音生成。
此外，CosyVoice还支持通过富文本或自然语言形式，对生成语音的情感和韵律进行细粒度控制，大大提升了生成语音在情感表现力上的细腻程度。
#人工智能
#阿里巴巴
#语音生成
#声音克隆
#语音大模型
#FunAudioLLM
#CosyVoice
#SenseVoice

Пікірлер: 3

Open Source Voice Project Ceiling! 3 seconds sample to imitate timbre real emotions comparable to

5:20

Open Source Voice Project Ceiling! 3 seconds sample to imitate timbre real emotions comparable to

玄离199

Рет қаралды 883

CosyVoice | 超神AI声音克隆，3s音频极速复刻，支持多语种，跨语种，语气标签控制，效果好到爆炸！

10:30

CosyVoice | 超神AI声音克隆，3s音频极速复刻，支持多语种，跨语种，语气标签控制，效果好到爆炸！

AI工坊#十个骑士

Рет қаралды 7 М.

Василиса пошла В ПЕРВЫЙ класс! А что у вас в рюкзаке)))?

00:14

Василиса пошла В ПЕРВЫЙ класс! А что у вас в рюкзаке)))?

Денис Кукояка

Рет қаралды 2,3 МЛН

What will he say ? 😱 #smarthome #cleaning #homecleaning #gadgets

01:00

What will he say ? 😱 #smarthome #cleaning #homecleaning #gadgets

EasyHomePlus

Рет қаралды 9 МЛН

English or Spanish 🤣

00:16

English or Spanish 🤣

GL Show

Рет қаралды 15 МЛН

Fake watermelon by Secret Vlog

00:16

Fake watermelon by Secret Vlog

Secret Vlog

Рет қаралды 2,7 МЛН

注意看，这些全是 AI 配音。

5:22

注意看，这些全是 AI 配音。

Topbook

Рет қаралды 283 М.

21世纪最重要的发明：LoRA，让每个人都能微调大语言模型！将会如何重写世界规则？（用笔记本就能做大模型）

27:09

21世纪最重要的发明：LoRA，让每个人都能微调大语言模型！将会如何重写世界规则？（用笔记本就能做大模型）

Ph.D. Vlog

Рет қаралды 18 М.

10 分钟理论 + 实操搞懂 WebSocket

9:03

10 分钟理论 + 实操搞懂 WebSocket

FireUG技术社区

Рет қаралды 22 М.

GPT-4 登場！先理解 ChatGPT 原理，才知道怎麼利用 AI 幫你輸入！

14:55

GPT-4 登場！先理解 ChatGPT 原理，才知道怎麼利用 AI 幫你輸入！

PanSci 泛科學

Рет қаралды 556 М.

9月必买3支股票！

13:53

9月必买3支股票！

老李玩钱

Рет қаралды 42 М.

只需2分钟，免费克隆你的声音，完美还原音色，效果惊人！

11:04

只需2分钟，免费克隆你的声音，完美还原音色，效果惊人！

AI学长小林

Рет қаралды 21 М.

【 Ollama + Open webui 】这应该是目前最有前途的大语言LLM模型的本地部署方法了。提升工作效率必备！| Llama2 | Gemma | Mistral

10:56

【 Ollama + Open webui 】这应该是目前最有前途的大语言LLM模型的本地部署方法了。提升工作效率必备！| Llama2 | Gemma | Mistral

AI白爷爷

Рет қаралды 10 М.

Hugging Face + Langchain in 5 mins | Access 200k+ FREE AI models for your AI apps

9:48

Hugging Face + Langchain in 5 mins | Access 200k+ FREE AI models for your AI apps

AI Jason

Рет қаралды 326 М.

赚钱工具ChatGPT+AI一帧秒创 /5分钟生成影片，全网最完整步骤介绍！

16:55

赚钱工具ChatGPT+AI一帧秒创 /5分钟生成影片，全网最完整步骤介绍！

林杰AI笔记

Рет қаралды 383 М.

从零开始学习大语言模型（一）

20:13

从零开始学习大语言模型（一）

林亦LYi

Рет қаралды 207 М.

Василиса пошла В ПЕРВЫЙ класс! А что у вас в рюкзаке)))?

00:14

Василиса пошла В ПЕРВЫЙ класс! А что у вас в рюкзаке)))?

Денис Кукояка

Рет қаралды 2,3 МЛН