Lo estuve probando la semana pasada, pero mientras siga sin soporte para español seguiré usando XTTS2. Y la calidad de audio tampoco me pareció tan espectacular después de haber oído lo que pueden hacer modelos como GPT-SoVITS V2.
@javiergacitua8634Күн бұрын
Este hombre como puede estar en la GitHub Universe con Midudev y grabar un video chulísimo al mismo tiempo, un Crack!!
@luisfernanadoperezalvaradoКүн бұрын
lo mismo me lo pregunté
@XaviIntheHouseКүн бұрын
@@luisfernanadoperezalvarado👀 Usa IA, se ha clonado y ahora hay varios Carlos Santanas dando charlas del uso de IA
@SrFrederickКүн бұрын
@@XaviIntheHouse Eso mismo pensé, mueve las manos con un patrón repetitivo, está usando un avatar? xD
@okamiBoomКүн бұрын
quien es midudev?
@ClickPlanet...Күн бұрын
Porque lo grabó antes...
@SinergiaAlUnisonoКүн бұрын
Gracias Carlos, esperaré a que salga en español. Ojalá publiques un video nuevo cuando eso suceda. Abrazo
@rodrigov.9252Күн бұрын
no lo va a hacer. ya lo dijo en un twiter
@inteligentia_20 сағат бұрын
Gran vídeo. Esto avanza muy rápido, es apasionante!
@KakauetКүн бұрын
Siempre que publicas un nuevo vídeo me sacas una sonrisa ❤❤
@zorrolisto1Күн бұрын
Muchas Gracias por poner una tarea! me parece muy interesante ponerla en mi TODO list!
@foreropaКүн бұрын
Gracias, gracias, gracias por Pinokio!!!! Para mi siempre ha sido difícil entender cómo instalar programas de IA, no siempre me funcionan, algunos como Sable diffusion para AMD han sido difíciles, pero lo he conseguido, pero otros? Imposible, algo siempre falla. Con este programa, todo se vuelve fácil!!
@mdchaparror1011 сағат бұрын
Muchas gracias, excelente vídeo como siempre
@alexisdawn6255Күн бұрын
Está muy bueno para ser un prototipo base, se escucha que el tono es mas agudo en cada Output, supongo que es por como está construido el modelo, pero aún asi conserva el estilo del hablante, muy bueno.
@arquitectogКүн бұрын
MUCHAS GRACIAS, esta buenisimo el ejemplo, saludos desde Guatemala.
@felixbel5Күн бұрын
Como siempre excelente contenido y explicacion, super fluido y entretenido y claro lo mas importante. Saludos!
@MarleosКүн бұрын
¡Al fin! he estado esperando esto desde hace mucho :y
@xaxoxaxonopuedeser693 сағат бұрын
Increible! Eres un grande!
@DavilocooКүн бұрын
Que piensas sobre los doblajes? Parece simple con estas herramientas traducir a cualquier idioma. Meta tambien parece estar trabajando en algo de esto, dijeron que doblarian todos los videos de instagram a todos los idiomas.
@drillerdev4624Күн бұрын
Es algo que va a llegar antes o después (creo que ya hay alguna cosa por ahí, vaya) La cuestión es cómo manejarán los cambios de cadencia y ritmo entre distintos idiomas
@alexiscaceresmontes5271Күн бұрын
Ayer justo lei un post, donde varios actores de dobaljes, locutores y demás que son freenlancer, decían que le había bajado las ofertas de trabajo por la IA un 80% y que muchos ya no son ofrecen sus servicios, y se dedican a otros proyectos mas estables. Pero hay que dejar claro, que el que sepa manejar las IA, fácilmente va poder crear un ministudio. Y con lo potente que se están volviendo las pc y el trabajo de la comunidad open source, va ser una locura en unos años.
@carabelaableful6321Күн бұрын
Muchas gracias por todo. Maestro!
@oscarjavier9744Күн бұрын
Está super interesante la tecnología, con sus riesgos, pero interesante.
@angelbarraza3224Күн бұрын
Jeje 15 segundos con ka GPU de la NASA que tiene Carlos, lo probe con una RX 6600 y demora 40mins con un audio nuevo, y al rededor de 10 minutos con el audio precargado, aún así, los resultados son espectaculares, mi novia es abogada y le hice una pequela broma, le pedi que me mandara un audio leyendo un parrafo en ingles que le mande, para evaluar su progreso en dualingo, luego clone su voz e hice una cesión de derechos verbal de sus bienes a mi persona jajaja
@DotCSVLabКүн бұрын
En mi caso está ejecutado en un Mac con un M2, no es un mal procesador pero no debería de generar tantas diferencias, así que revisa si tienes algo mal configurado
@angelbarraza3224Күн бұрын
@DotCSVLab wow, no esperaba respuesta, te sigo desde hace años, revisaré la configuración, gracias!, saludos desde Sinaloa.
@torretacosmicaКүн бұрын
@@angelbarraza3224 en una 3090 sencillita tarda solo 20 segundos... Quiza solo acepta CUDA y como tienes AMD te esta procesando con CPU?
@APMI-OFICIAL21 сағат бұрын
las IAs no funcionan bien con graficas AMD, todas se hacen especificamente para su uso en graficas de Nvidia, si quieres usar IAs en local tenes que comprar una grafica de Nvidia
@torretacosmica21 сағат бұрын
@ tampoco es taaan asi, no desinformes. Hay muchos modelos que si corren en amd, pero es cierto el rendimiento y compatibilidad todavía esta muy lejos. Pero no es siempre asi como decis. Stable diffusions por ejemplo corre en ATI a aproximadamente un 0.7 de rendimiento
@ElInventorКүн бұрын
Yo estoy esperando un modelo opensource que nos permita hacer esto mismo pero no con texto sino con voz. En plan yo digo algo con mi voz y suena con la tuya.
@bobobo1673Күн бұрын
Da mal rollo tanto lo que quieres como tú foto
@MusicaImpactanteКүн бұрын
Eso ya existe hace rato. ¿Cómo crees que hacen los covers de canciones con voces de artistas famosos? Investigá por ese lado, cómo hacer covers con IA y voces de famosos. Es de código y abierto, los odelos están principalmente en GitHub.
@jordiriveroКүн бұрын
Esto que pides es muy facil de hacer, hay que pasar de voz a texto y de texto a voz... el unico problema por ahora es el delay de pasar de texto a voz porque no se podria hacer algo con sensacion de realtime como seguro que te gustaría
@ElInventor3 сағат бұрын
@@bobobo1673 Si quiero hacer que DotCSV cante, con el texto no puedo.
@ElInventor3 сағат бұрын
@@jordirivero No busco realtime, busco grabar mi voz cantando algo, dárselo a la IA y que me lo devuelva con la voz de DotCSV cantando.
@MsJonny26Күн бұрын
Ufff, clonación de muy buena calidad. Se puede guardar en archivos de audio la voz clonada leyendo el texto?
@cu_cu_xiijdd4489Күн бұрын
Me viene. Al pelo para mí trabajo
@vendeconalmaКүн бұрын
Me ha dado error de instalación pinokio y me faltan 3 paquetes de 8 he repetido dos veces la instalación Gracias Carlos.
@content1Күн бұрын
muy interesante la herramienta, gracias! hay algun modelo de audio para Stable Diffusion?
@dimitridavit7236Күн бұрын
Me leíste la mente. Estaba ayer buscando algo así y estaba a punto de instalar Coqui tts pero ahora voy a probar este. PD: oh no está en español. Pues toca esperar 😢
@santiagomatellan5313Күн бұрын
😂
@rincondepythonКүн бұрын
buenas! Aca un argentino, estuve jugando con Coqui TTS, y salvo que seas español, no clona bien la voz para este idioma. Estuve probando puntualmente XTTS, que es lo mas "sencillo" de entender a la hora de leer e implementar la documentacion que tienen.
@dimitridavit7236Күн бұрын
@@rincondepython en realidad estaba buscando algo que mejore la voz en locuciones para que suene más profesional y con mejor modulación. Igual creo que no me servía jaja
@Vay0Күн бұрын
buenisimoooooo, pero de que tarjeta de video mínimo estamos hablando????
@roberthazidio22 сағат бұрын
Pero me quede con la duda de que requisitos de hardware necesita para ser instalado? A parte de cuanto texto soporta en una clonacion continua?
@adrieljonasroitman3783Күн бұрын
Hola Carlos y a toda la comunidad. Alguno ha podido correr esto en un Google Colab?
@jaypee6644Күн бұрын
Hay alguna IA que traduzca un audio de un idioma a otro, algo tipo voice2voice? Manteniendo ya sabes la entonación pausas etc...
@ElPolemistaКүн бұрын
9:40 hazlo con critical drinker
@lucife1130Күн бұрын
Si tienes pinokio e instalar modelos ia cuales son los requisitos recomendables para estos modelos? ram, tarjeta video etc. soy nuevo en esto
@ZirulnikoffКүн бұрын
Pregúntale al gpt mi rey
@lucife1130Сағат бұрын
@@Zirulnikoff no
@neoghiniКүн бұрын
Lo he probado con Pinokio y me muestra el siguiente error: ENOENT: no such file or directory, stat 'C:\IA\pinokio\api\E2-F5-TTS\{{input.event[0]}}'
@RelatosdeRiquezaКүн бұрын
No puedo creer que algo tan 'embarazosamente fácil' sea gratuito. ¿Alguno ya lo probó?
@lucife1130Күн бұрын
Al instalar e2-f5-tts en pinokio en local ¿con una tarjeta de 4gb gtx 1650 y 8 de ram es suficiente o que se necesita? porque al ejecutar e2-f5-tts en pinokio no me deja y se que se instalo bien pero me sale un link de nvidia y no el programa.
@davidvalencia6256Күн бұрын
Crees que dentro de poco haya algo como el asistente de voz de openAI, pero opensource?
@paisa20Күн бұрын
Welcome to The Warning ❤❤❤
@aedroknowledge9057Күн бұрын
Hay alguno funcional aunque de menor calidad utilizable desde Pinokio pero en español?
@ManuelMariscalMariscalКүн бұрын
Buenas! he visto que no funciona hacer ningun test en huggingface, te suena por que?
@albertovlc933Күн бұрын
Ojala este pronto en ESPAÑOL
@Josman-ih3mzКүн бұрын
Mmmmm q nivel de pc necesitaríamos? Para usar pinokio
@KSSenpaiКүн бұрын
Chat GPT [Crea un título super creativo para mi modelo AI de texto a voz]
@david-w4k1wКүн бұрын
GPT: [modelo de voz creativa]
@Marcos_777Күн бұрын
Puedes hacer un video cuando haya forma de utilizarlo en Español ??
@orochimaru423Күн бұрын
Lo intenté pero no logro que genere un audio, siempre sale vacio. ¿A alguien más le ha pasado?
@benjaminnunez827317 сағат бұрын
Yo tampoco lo consigo.
@DanmaxlaraКүн бұрын
Jejeje genial si es mi voz. En español es como si quisiera hablar en español agringado😂😂😂🎉
@sanderpacheco5679Күн бұрын
sueño con el día que mediante una video llamada se traduzca mi audio en tiempo real y la de la persona con la que hablo para no tener mas barreras en el idioma
@dvoraklovelace2801Күн бұрын
La semana que viene sin falta
@danielamado1813Күн бұрын
esto si seria un gamechanger tio, te imaginas hablar con un nativo aleman, y que te entienda el español sin pedo, y que tu le entiendas a el en una llamada por meet por ejemplo
@valentinasdasas6182Күн бұрын
Este modelo el potencialmente peligrosoo, tengan ojito para las futuras clonaciones de voz... si alguien lo hizo y no lo publica, otro lo hará....
@david-w4k1wКүн бұрын
ya hoy x hoy, podemos casi clonar a una persona en video haciendo lo que sea, si parece peligroso la parte de editar voces, vamos mal, el uso esta en la responsablidad de cada uno
@SeñorSommerКүн бұрын
Avísanos cuando esté disponible en español
@orlandocastellanos9263Күн бұрын
Cuales son los requerimientos de Hardware? Como se si mi maquina aguanta esta demo
@federiedelКүн бұрын
10:27 como crees que hablas ingles. 😎 11:14 como realmente hablas inglés. 🤣
@Selenaai95Күн бұрын
Se puede utilizar para canto
@niwdehuКүн бұрын
iguala o mejora a xTTS v2?
@josetdm6246Күн бұрын
Espectacular ⭐️⭐️⭐️⭐️⭐️
@magat155Күн бұрын
Maravilloso 🤍✨✨✨
@j.kstudios1Күн бұрын
Ta chido 😃👍
@YenyeriКүн бұрын
no me funciono , el audio que me da como resultado no aparece nada :c
@leonardox2223 сағат бұрын
es mejor que whisper??
@Lv7-L30NКүн бұрын
gracias joven
@DanmaxlaraКүн бұрын
Cuanto es el imput maximo de texto a leer. ??
@dei8bitКүн бұрын
Funcionara bien en español? :o
@OscarLauraКүн бұрын
Creo que ah{i mismo tenía el entrenamiento para entrenar en español.
@JuanMartinRuizКүн бұрын
embarazosamente
@WannaCry.Күн бұрын
Cuando esté en español y más idiomas vuelve mostrarlo por favor
@JR-mxcuКүн бұрын
Es posible mejorar la calidad de audio, suena un poco latoso, imagino porque está muy comprimido
@abell46sКүн бұрын
Gracias señor
@RuanerzКүн бұрын
con un demonio lo que me faltaba.jpg ... todavía no está en español :(
@LeonardoGalindo-v1b21 сағат бұрын
El modelo en Higgingface ya no funciona, ahora da error!
@VLAD584213 сағат бұрын
Brutaaaaal !!!
@alitomixКүн бұрын
¿Si clonas la voz y entonces con IA la cambias un poco? no sería la misma voz y no sería ilegal
@cesarfranco5745Күн бұрын
Creo que habria un vacio legal, ya que si usas una voz de otra persona, la otra persona no estaria accediendo al uso de su voz ni como input ni como entrenamiento para un modelo de IA.
@david-w4k1wКүн бұрын
lo que no se puede hacer tambien es en publicacion, clona las voces que quieras como si son de famosos o conocidos, pero no lo subas o pubiques porque eso si es ilegal, la persona de la voz puede denunciar
@nicolasallweb307720 сағат бұрын
esta bueno
@KarelyQueenКүн бұрын
Hey buenísimo esto
@johngonzalezvideoКүн бұрын
Que tal las pruebas en español?
@Aristocles-x4kКүн бұрын
Cual era el nombre del narrador que dijo?
@gilianskalariКүн бұрын
Spoiler: solo disponible en yanki y en chingchongchung
@laultimaverdad1187Күн бұрын
Algún día en español
@ministerofjoyКүн бұрын
Gracias, aterra!
@patagonia4kvideodrone91Күн бұрын
la pregunta del millon, sirve en español?¡ xd
@diegocardona8632Күн бұрын
Ya lo vi, bórralo.
@2emmmanuelКүн бұрын
Pensé lo mismo 🗿
@Carlospp18Күн бұрын
XD
@Zarpion12Күн бұрын
Bbo vk😊😊j9 0 v p j00 h. 00 bjkpj jb kvhbyo o uvk0b 0vb0c 0k0np9 jvph9bbo 0kv 0b. Hg0bv😊😊@@2emmmanuel
@XaviIntheHouseКүн бұрын
noo que no lo he visto aun
@XaviIntheHouseКүн бұрын
ya ahora si ya lo terminé de ver, que lo borre
@eduardo2974220 сағат бұрын
Cuando los extorsionadores buscaban cobre y encontraron no oro sino diamantes
@JuanjoSanchezКүн бұрын
A ver si entre todos logramos que funcione en español
@jpgallegoarКүн бұрын
Estoy en ello ;)
@rodrigov.9252Күн бұрын
@@jpgallegoar yo ya lo hice no es necesario que lo hagas crack
@jpgallegoarКүн бұрын
@@rodrigov.9252 compartelo porfa!
@NesbyBoneКүн бұрын
@@rodrigov.9252 comparte crack dale
@cesarfranco5745Күн бұрын
@@jpgallegoar Que cambios estas haciendo para lograrlo?
@yosepyo.z9905Күн бұрын
omaigaaa
@felixbel5Күн бұрын
Pinokio es lo mismo que LLM STUDIO?
@elmegapelucoКүн бұрын
No, Pinokio es una suite de herramientas de IA, LLM Studio de Google es una herramienta para crear Podcast con IA. Para mayor información pregunta a Chat Gpt xD
@cesarfranco5745Күн бұрын
@@elmegapeluco Te columpiaste llm studio es algo similar a pinokio que permite descargar y ejecutar modelos de IA, pero va mas enfocados a llms, lo que tu hablas es notebookllm de google
@felixbel5Күн бұрын
@elmegapeluco Hola gracias por tu respuesta! Pero si no estoy mal me parece q llm studio no es de google, si lo es Notebook LLM, llm studio se instala en tu pc para poder correr diferentes AI de forma local. Por eso preguntaba la diferencia. Ya que El siempre lo promocionaba por eso qieria ssber la diferencia para El. Muchas gracias! Salidos atte.
@alamalonzoКүн бұрын
plzz déjanos saber cuando este en español
@sopompo3196Күн бұрын
o sea que no lo puedo usar para hacer videos de youtube?
@TROPETIMANКүн бұрын
me da error
@benjaminnunez827316 сағат бұрын
Otro por aquí. O somos torpes o el programa muy fino no va.
@diesirae4546Күн бұрын
Genial
@MegaLino111Күн бұрын
scarlet Johanson está en peligro
@XictusКүн бұрын
Fue la primera en quien pensé para clonar xD
@MrBlackgobboКүн бұрын
¿Una vez que produces el audio, si es tu voz, cómo saben que estas haciendo un uso no comercial?
@david-w4k1wКүн бұрын
me quede pescando con la pregunta esta como 5 min. pos no lo saben chico,,,🤣🤣🤣
Күн бұрын
no funciona dice error
@albertovlc933Күн бұрын
Da error al convertir
@ramonecesКүн бұрын
Sam Almant 😝
@rodrigov.9252Күн бұрын
yo ya cree mi canal con la voz de DOT CSV, AHORA SERÁS MI ESCLAVO :D. es internet todo es libre.
@EriczonКүн бұрын
poca broma, es un tema interesante. ¿sabemos a nivel legal qué implicaciones tendría algo así?
@rodrigov.9252Күн бұрын
@@Ericzon na no me importa, porque en internet todo es libre
@juancitoxКүн бұрын
Esaaa
@italo9537Күн бұрын
Poco a poco nos acercamos a la clonacion perfecta de las voces y asi poder hacer contenido en diferentes idiomas
@misaelperez6654Күн бұрын
Necesito la version en español
@darthporterusКүн бұрын
dot suena a tutorial indio en la clonación XD
@luchessi1000Күн бұрын
No se te ocurrió hacer la prueba con una voz en castellano ?
@SuperFoxy8888Күн бұрын
Hace un minuto, 20 visitas, cuenta en decadencia 😞
@anthonygriman8674Күн бұрын
Es un capo, que sea viral es una cosa pero que te de información de vamos es otra
@SuperFoxy8888Күн бұрын
@@anthonygriman8674Es un chiste 🤦
@carlosprieto2554Күн бұрын
Esta acabado, mis fuentes me cuentan que el tocayo se fue a California a trabajar en un Mcdonald
@danielveraecКүн бұрын
Que hay del uso de voz de personas fallecidas? Por ejemplo implementar alguna plataforma con QRs en lápidas por ejemplos que muestre por ejemplo a la imagen y la voz del fallecido quizás narrando en primera persona datos de quien fue en vida. Sería legal ?
@ourtravels3140Күн бұрын
Depende de quién patrocine al gobierne en turno
@rosendocamaltКүн бұрын
Añade a esa situación la implicación cultural.
@david-w4k1wКүн бұрын
si es legal, no deberia, pero me parece un tema estupendo pa irme a dormir.
@DaniTebaКүн бұрын
Me encantaria usarlo para eliminar mi acento español cuando hablo en ingles
@LeonardoGraciottiКүн бұрын
The checkpoints support English and Chinese. 😪
@Charly__UY12 сағат бұрын
mmmm.... no suena bien la segunda prueba.... parece Bad Bunny con su Autotune