¡CLONA TU VOZ GRATIS con este NUEVO MODELO OPEN SOURCE!

¡CLONA TU VOZ GRATIS con este NUEVO MODELO OPEN SOURCE! | F5-TTS

Рет қаралды 44,954

Dot CSV Lab

Күн бұрын

Пікірлер: 202

@javierfernandez7472 Күн бұрын

11:15 Suenas a scammer indú

@ricko13 Күн бұрын

eso mismo pensé

@pacobarbas2475 Күн бұрын

Lo estuve probando la semana pasada, pero mientras siga sin soporte para español seguiré usando XTTS2. Y la calidad de audio tampoco me pareció tan espectacular después de haber oído lo que pueden hacer modelos como GPT-SoVITS V2.

@javiergacitua8634 Күн бұрын

Este hombre como puede estar en la GitHub Universe con Midudev y grabar un video chulísimo al mismo tiempo, un Crack!!

@luisfernanadoperezalvarado Күн бұрын

lo mismo me lo pregunté

@XaviIntheHouse Күн бұрын

@@luisfernanadoperezalvarado👀 Usa IA, se ha clonado y ahora hay varios Carlos Santanas dando charlas del uso de IA

@SrFrederick Күн бұрын

@@XaviIntheHouse Eso mismo pensé, mueve las manos con un patrón repetitivo, está usando un avatar? xD

@okamiBoom Күн бұрын

quien es midudev?

@ClickPlanet... Күн бұрын

Porque lo grabó antes...

@SinergiaAlUnisono Күн бұрын

Gracias Carlos, esperaré a que salga en español. Ojalá publiques un video nuevo cuando eso suceda. Abrazo

@rodrigov.9252 Күн бұрын

no lo va a hacer. ya lo dijo en un twiter

@inteligentia_ 20 сағат бұрын

Gran vídeo. Esto avanza muy rápido, es apasionante!

@Kakauet Күн бұрын

Siempre que publicas un nuevo vídeo me sacas una sonrisa ❤❤

@zorrolisto1 Күн бұрын

Muchas Gracias por poner una tarea! me parece muy interesante ponerla en mi TODO list!

@foreropa Күн бұрын

Gracias, gracias, gracias por Pinokio!!!! Para mi siempre ha sido difícil entender cómo instalar programas de IA, no siempre me funcionan, algunos como Sable diffusion para AMD han sido difíciles, pero lo he conseguido, pero otros? Imposible, algo siempre falla. Con este programa, todo se vuelve fácil!!

@mdchaparror10 11 сағат бұрын

Muchas gracias, excelente vídeo como siempre

@alexisdawn6255 Күн бұрын

Está muy bueno para ser un prototipo base, se escucha que el tono es mas agudo en cada Output, supongo que es por como está construido el modelo, pero aún asi conserva el estilo del hablante, muy bueno.

@arquitectog Күн бұрын

MUCHAS GRACIAS, esta buenisimo el ejemplo, saludos desde Guatemala.

@felixbel5 Күн бұрын

Como siempre excelente contenido y explicacion, super fluido y entretenido y claro lo mas importante. Saludos!

@Marleos Күн бұрын

¡Al fin! he estado esperando esto desde hace mucho :y

@xaxoxaxonopuedeser69 3 сағат бұрын

Increible! Eres un grande!

@Davilocoo Күн бұрын

Que piensas sobre los doblajes? Parece simple con estas herramientas traducir a cualquier idioma. Meta tambien parece estar trabajando en algo de esto, dijeron que doblarian todos los videos de instagram a todos los idiomas.

@drillerdev4624 Күн бұрын

Es algo que va a llegar antes o después (creo que ya hay alguna cosa por ahí, vaya) La cuestión es cómo manejarán los cambios de cadencia y ritmo entre distintos idiomas

@alexiscaceresmontes5271 Күн бұрын

Ayer justo lei un post, donde varios actores de dobaljes, locutores y demás que son freenlancer, decían que le había bajado las ofertas de trabajo por la IA un 80% y que muchos ya no son ofrecen sus servicios, y se dedican a otros proyectos mas estables. Pero hay que dejar claro, que el que sepa manejar las IA, fácilmente va poder crear un ministudio. Y con lo potente que se están volviendo las pc y el trabajo de la comunidad open source, va ser una locura en unos años.

@carabelaableful6321 Күн бұрын

Muchas gracias por todo. Maestro!

@oscarjavier9744 Күн бұрын

Está super interesante la tecnología, con sus riesgos, pero interesante.

@angelbarraza3224 Күн бұрын

Jeje 15 segundos con ka GPU de la NASA que tiene Carlos, lo probe con una RX 6600 y demora 40mins con un audio nuevo, y al rededor de 10 minutos con el audio precargado, aún así, los resultados son espectaculares, mi novia es abogada y le hice una pequela broma, le pedi que me mandara un audio leyendo un parrafo en ingles que le mande, para evaluar su progreso en dualingo, luego clone su voz e hice una cesión de derechos verbal de sus bienes a mi persona jajaja

@DotCSVLab Күн бұрын

En mi caso está ejecutado en un Mac con un M2, no es un mal procesador pero no debería de generar tantas diferencias, así que revisa si tienes algo mal configurado

@angelbarraza3224 Күн бұрын

@DotCSVLab wow, no esperaba respuesta, te sigo desde hace años, revisaré la configuración, gracias!, saludos desde Sinaloa.

@torretacosmica Күн бұрын

@@angelbarraza3224 en una 3090 sencillita tarda solo 20 segundos... Quiza solo acepta CUDA y como tienes AMD te esta procesando con CPU?

@APMI-OFICIAL 21 сағат бұрын

las IAs no funcionan bien con graficas AMD, todas se hacen especificamente para su uso en graficas de Nvidia, si quieres usar IAs en local tenes que comprar una grafica de Nvidia

@torretacosmica 21 сағат бұрын

@ tampoco es taaan asi, no desinformes. Hay muchos modelos que si corren en amd, pero es cierto el rendimiento y compatibilidad todavía esta muy lejos. Pero no es siempre asi como decis. Stable diffusions por ejemplo corre en ATI a aproximadamente un 0.7 de rendimiento

@ElInventor Күн бұрын

Yo estoy esperando un modelo opensource que nos permita hacer esto mismo pero no con texto sino con voz. En plan yo digo algo con mi voz y suena con la tuya.

@bobobo1673 Күн бұрын

Da mal rollo tanto lo que quieres como tú foto

@MusicaImpactante Күн бұрын

Eso ya existe hace rato. ¿Cómo crees que hacen los covers de canciones con voces de artistas famosos? Investigá por ese lado, cómo hacer covers con IA y voces de famosos. Es de código y abierto, los odelos están principalmente en GitHub.

@jordirivero Күн бұрын

Esto que pides es muy facil de hacer, hay que pasar de voz a texto y de texto a voz... el unico problema por ahora es el delay de pasar de texto a voz porque no se podria hacer algo con sensacion de realtime como seguro que te gustaría

@ElInventor 3 сағат бұрын

@@bobobo1673 Si quiero hacer que DotCSV cante, con el texto no puedo.

@ElInventor 3 сағат бұрын

@@jordirivero No busco realtime, busco grabar mi voz cantando algo, dárselo a la IA y que me lo devuelva con la voz de DotCSV cantando.

@MsJonny26 Күн бұрын

Ufff, clonación de muy buena calidad. Se puede guardar en archivos de audio la voz clonada leyendo el texto?

@cu_cu_xiijdd4489 Күн бұрын

Me viene. Al pelo para mí trabajo

@vendeconalma Күн бұрын

Me ha dado error de instalación pinokio y me faltan 3 paquetes de 8 he repetido dos veces la instalación Gracias Carlos.

@content1 Күн бұрын

muy interesante la herramienta, gracias! hay algun modelo de audio para Stable Diffusion?

@dimitridavit7236 Күн бұрын

Me leíste la mente. Estaba ayer buscando algo así y estaba a punto de instalar Coqui tts pero ahora voy a probar este. PD: oh no está en español. Pues toca esperar 😢

@santiagomatellan5313 Күн бұрын

😂

@rincondepython Күн бұрын

buenas! Aca un argentino, estuve jugando con Coqui TTS, y salvo que seas español, no clona bien la voz para este idioma. Estuve probando puntualmente XTTS, que es lo mas "sencillo" de entender a la hora de leer e implementar la documentacion que tienen.

@dimitridavit7236 Күн бұрын

@@rincondepython en realidad estaba buscando algo que mejore la voz en locuciones para que suene más profesional y con mejor modulación. Igual creo que no me servía jaja

@Vay0 Күн бұрын

buenisimoooooo, pero de que tarjeta de video mínimo estamos hablando????

@roberthazidio 22 сағат бұрын

Pero me quede con la duda de que requisitos de hardware necesita para ser instalado? A parte de cuanto texto soporta en una clonacion continua?

@adrieljonasroitman3783 Күн бұрын

Hola Carlos y a toda la comunidad. Alguno ha podido correr esto en un Google Colab?

@jaypee6644 Күн бұрын

Hay alguna IA que traduzca un audio de un idioma a otro, algo tipo voice2voice? Manteniendo ya sabes la entonación pausas etc...

@ElPolemista Күн бұрын

9:40 hazlo con critical drinker

@lucife1130 Күн бұрын

Si tienes pinokio e instalar modelos ia cuales son los requisitos recomendables para estos modelos? ram, tarjeta video etc. soy nuevo en esto

@Zirulnikoff Күн бұрын

Pregúntale al gpt mi rey

@lucife1130 Сағат бұрын

@@Zirulnikoff no

@neoghini Күн бұрын

Lo he probado con Pinokio y me muestra el siguiente error: ENOENT: no such file or directory, stat 'C:\IA\pinokio\api\E2-F5-TTS\{{input.event[0]}}'

@RelatosdeRiqueza Күн бұрын

No puedo creer que algo tan 'embarazosamente fácil' sea gratuito. ¿Alguno ya lo probó?

@lucife1130 Күн бұрын

Al instalar e2-f5-tts en pinokio en local ¿con una tarjeta de 4gb gtx 1650 y 8 de ram es suficiente o que se necesita? porque al ejecutar e2-f5-tts en pinokio no me deja y se que se instalo bien pero me sale un link de nvidia y no el programa.

@davidvalencia6256 Күн бұрын

Crees que dentro de poco haya algo como el asistente de voz de openAI, pero opensource?

@paisa20 Күн бұрын

Welcome to The Warning ❤❤❤

@aedroknowledge9057 Күн бұрын

Hay alguno funcional aunque de menor calidad utilizable desde Pinokio pero en español?

@ManuelMariscalMariscal Күн бұрын

Buenas! he visto que no funciona hacer ningun test en huggingface, te suena por que?

@albertovlc933 Күн бұрын

Ojala este pronto en ESPAÑOL

@Josman-ih3mz Күн бұрын

Mmmmm q nivel de pc necesitaríamos? Para usar pinokio

@KSSenpai Күн бұрын

Chat GPT [Crea un título super creativo para mi modelo AI de texto a voz]

@david-w4k1w Күн бұрын

GPT: [modelo de voz creativa]

@Marcos_777 Күн бұрын

Puedes hacer un video cuando haya forma de utilizarlo en Español ??

@orochimaru423 Күн бұрын

Lo intenté pero no logro que genere un audio, siempre sale vacio. ¿A alguien más le ha pasado?

@benjaminnunez8273 17 сағат бұрын

Yo tampoco lo consigo.

@Danmaxlara Күн бұрын

Jejeje genial si es mi voz. En español es como si quisiera hablar en español agringado😂😂😂🎉

@sanderpacheco5679 Күн бұрын

sueño con el día que mediante una video llamada se traduzca mi audio en tiempo real y la de la persona con la que hablo para no tener mas barreras en el idioma

@dvoraklovelace2801 Күн бұрын

La semana que viene sin falta

@danielamado1813 Күн бұрын

esto si seria un gamechanger tio, te imaginas hablar con un nativo aleman, y que te entienda el español sin pedo, y que tu le entiendas a el en una llamada por meet por ejemplo

@valentinasdasas6182 Күн бұрын

Este modelo el potencialmente peligrosoo, tengan ojito para las futuras clonaciones de voz... si alguien lo hizo y no lo publica, otro lo hará....

@david-w4k1w Күн бұрын

ya hoy x hoy, podemos casi clonar a una persona en video haciendo lo que sea, si parece peligroso la parte de editar voces, vamos mal, el uso esta en la responsablidad de cada uno

@SeñorSommer Күн бұрын

Avísanos cuando esté disponible en español

@orlandocastellanos9263 Күн бұрын

Cuales son los requerimientos de Hardware? Como se si mi maquina aguanta esta demo

@federiedel Күн бұрын

10:27 como crees que hablas ingles. 😎 11:14 como realmente hablas inglés. 🤣

@Selenaai95 Күн бұрын

Se puede utilizar para canto

@niwdehu Күн бұрын

iguala o mejora a xTTS v2?

@josetdm6246 Күн бұрын

Espectacular ⭐️⭐️⭐️⭐️⭐️

@magat155 Күн бұрын

Maravilloso 🤍✨✨✨

@j.kstudios1 Күн бұрын

Ta chido 😃👍

@Yenyeri Күн бұрын

no me funciono , el audio que me da como resultado no aparece nada :c

@leonardox222 3 сағат бұрын

es mejor que whisper??

@Lv7-L30N Күн бұрын

gracias joven

@Danmaxlara Күн бұрын

Cuanto es el imput maximo de texto a leer. ??

@dei8bit Күн бұрын

Funcionara bien en español? :o

@OscarLaura Күн бұрын

Creo que ah{i mismo tenía el entrenamiento para entrenar en español.

@JuanMartinRuiz Күн бұрын

embarazosamente

@WannaCry. Күн бұрын

Cuando esté en español y más idiomas vuelve mostrarlo por favor

@JR-mxcu Күн бұрын

Es posible mejorar la calidad de audio, suena un poco latoso, imagino porque está muy comprimido

@abell46s Күн бұрын

Gracias señor

@Ruanerz Күн бұрын

con un demonio lo que me faltaba.jpg ... todavía no está en español :(

@LeonardoGalindo-v1b 21 сағат бұрын

El modelo en Higgingface ya no funciona, ahora da error!

@VLAD5842 13 сағат бұрын

Brutaaaaal !!!

@alitomix Күн бұрын

¿Si clonas la voz y entonces con IA la cambias un poco? no sería la misma voz y no sería ilegal

@cesarfranco5745 Күн бұрын

Creo que habria un vacio legal, ya que si usas una voz de otra persona, la otra persona no estaria accediendo al uso de su voz ni como input ni como entrenamiento para un modelo de IA.

@david-w4k1w Күн бұрын

lo que no se puede hacer tambien es en publicacion, clona las voces que quieras como si son de famosos o conocidos, pero no lo subas o pubiques porque eso si es ilegal, la persona de la voz puede denunciar

@nicolasallweb3077 20 сағат бұрын

esta bueno

@KarelyQueen Күн бұрын

Hey buenísimo esto

@johngonzalezvideo Күн бұрын

Que tal las pruebas en español?

@Aristocles-x4k Күн бұрын

Cual era el nombre del narrador que dijo?

@gilianskalari Күн бұрын

Spoiler: solo disponible en yanki y en chingchongchung

@laultimaverdad1187 Күн бұрын

Algún día en español

@ministerofjoy Күн бұрын

Gracias, aterra!

@patagonia4kvideodrone91 Күн бұрын

la pregunta del millon, sirve en español?¡ xd

@diegocardona8632 Күн бұрын

Ya lo vi, bórralo.

@2emmmanuel Күн бұрын

Pensé lo mismo 🗿

@Carlospp18 Күн бұрын

@Zarpion12 Күн бұрын

Bbo vk😊😊j9 0 v p j00 h. 00 bjkpj jb kvhbyo o uvk0b 0vb0c 0k0np9 jvph9bbo 0kv 0b. Hg0bv😊😊@@2emmmanuel

@XaviIntheHouse Күн бұрын

noo que no lo he visto aun

@XaviIntheHouse Күн бұрын

ya ahora si ya lo terminé de ver, que lo borre

@eduardo29742 20 сағат бұрын

Cuando los extorsionadores buscaban cobre y encontraron no oro sino diamantes

@JuanjoSanchez Күн бұрын

A ver si entre todos logramos que funcione en español

@jpgallegoar Күн бұрын

Estoy en ello ;)

@rodrigov.9252 Күн бұрын

@@jpgallegoar yo ya lo hice no es necesario que lo hagas crack

@jpgallegoar Күн бұрын

@@rodrigov.9252 compartelo porfa!

@NesbyBone Күн бұрын

@@rodrigov.9252 comparte crack dale

@cesarfranco5745 Күн бұрын

@@jpgallegoar Que cambios estas haciendo para lograrlo?

@yosepyo.z9905 Күн бұрын

omaigaaa

@felixbel5 Күн бұрын

Pinokio es lo mismo que LLM STUDIO?

@elmegapeluco Күн бұрын

No, Pinokio es una suite de herramientas de IA, LLM Studio de Google es una herramienta para crear Podcast con IA. Para mayor información pregunta a Chat Gpt xD

@cesarfranco5745 Күн бұрын

@@elmegapeluco Te columpiaste llm studio es algo similar a pinokio que permite descargar y ejecutar modelos de IA, pero va mas enfocados a llms, lo que tu hablas es notebookllm de google

@felixbel5 Күн бұрын

@elmegapeluco Hola gracias por tu respuesta! Pero si no estoy mal me parece q llm studio no es de google, si lo es Notebook LLM, llm studio se instala en tu pc para poder correr diferentes AI de forma local. Por eso preguntaba la diferencia. Ya que El siempre lo promocionaba por eso qieria ssber la diferencia para El. Muchas gracias! Salidos atte.

@alamalonzo Күн бұрын

plzz déjanos saber cuando este en español

@sopompo3196 Күн бұрын

o sea que no lo puedo usar para hacer videos de youtube?

@TROPETIMAN Күн бұрын

me da error

@benjaminnunez8273 16 сағат бұрын

Otro por aquí. O somos torpes o el programa muy fino no va.

@diesirae4546 Күн бұрын

Genial

@MegaLino111 Күн бұрын

scarlet Johanson está en peligro

@Xictus Күн бұрын

Fue la primera en quien pensé para clonar xD

@MrBlackgobbo Күн бұрын

¿Una vez que produces el audio, si es tu voz, cómo saben que estas haciendo un uso no comercial?

@david-w4k1w Күн бұрын

me quede pescando con la pregunta esta como 5 min. pos no lo saben chico,,,🤣🤣🤣

Күн бұрын

no funciona dice error

@albertovlc933 Күн бұрын

Da error al convertir

@ramoneces Күн бұрын

Sam Almant 😝

@rodrigov.9252 Күн бұрын

yo ya cree mi canal con la voz de DOT CSV, AHORA SERÁS MI ESCLAVO :D. es internet todo es libre.

@Ericzon Күн бұрын

poca broma, es un tema interesante. ¿sabemos a nivel legal qué implicaciones tendría algo así?

@rodrigov.9252 Күн бұрын

@@Ericzon na no me importa, porque en internet todo es libre

@juancitox Күн бұрын

Esaaa

@italo9537 Күн бұрын

Poco a poco nos acercamos a la clonacion perfecta de las voces y asi poder hacer contenido en diferentes idiomas

@misaelperez6654 Күн бұрын

Necesito la version en español

@darthporterus Күн бұрын

dot suena a tutorial indio en la clonación XD

@luchessi1000 Күн бұрын

No se te ocurrió hacer la prueba con una voz en castellano ?

@SuperFoxy8888 Күн бұрын

Hace un minuto, 20 visitas, cuenta en decadencia 😞

@anthonygriman8674 Күн бұрын

Es un capo, que sea viral es una cosa pero que te de información de vamos es otra

@SuperFoxy8888 Күн бұрын

@@anthonygriman8674Es un chiste 🤦

@carlosprieto2554 Күн бұрын

Esta acabado, mis fuentes me cuentan que el tocayo se fue a California a trabajar en un Mcdonald

@danielveraec Күн бұрын

Que hay del uso de voz de personas fallecidas? Por ejemplo implementar alguna plataforma con QRs en lápidas por ejemplos que muestre por ejemplo a la imagen y la voz del fallecido quizás narrando en primera persona datos de quien fue en vida. Sería legal ?

@ourtravels3140 Күн бұрын

Depende de quién patrocine al gobierne en turno

@rosendocamalt Күн бұрын

Añade a esa situación la implicación cultural.

@david-w4k1w Күн бұрын

si es legal, no deberia, pero me parece un tema estupendo pa irme a dormir.