3 TUTORIALES para usar WHISPER GRATIS ▶ Whisper: Herramienta de TRANSCRIPCIÓN DE AUDIO con IA

  Рет қаралды 48,645

Xavier Mitjana

Xavier Mitjana

Күн бұрын

Пікірлер: 108
@anacorujoamado3615
@anacorujoamado3615 2 ай бұрын
Una pasada. Transcribo audios de media hora de duración, con una transcripción perfecta. Me ahorra muchísimas horas de trabajo.
@yamelhurtado4672
@yamelhurtado4672 Жыл бұрын
Gracias Xavier, lo use hoy y me lo hizo genial, agradecida por tú apoyo ☺️
@Marge573
@Marge573 11 ай бұрын
He visto varios tutoriales al respecto y este ha sido el mejor de todos!!!!! sobrepasa a los demas por muchos, super sencillo y claro, sobretodo para mi que no soy experta en computadores
@pegasoaqua448
@pegasoaqua448 Жыл бұрын
Xavier ¿No conoces otra página o herramienta que transcriba sin límite de tiempo y totalmente gratis por casualidad?
@vicentbellverloizaga7117
@vicentbellverloizaga7117 Жыл бұрын
Buenas, Xavier: El enlace de Google Colab me da problemas, no sé si ha pasado alguna cosa. Enhorabuena por el vídeo.
@Sanantta
@Sanantta Жыл бұрын
Muchas gracias por este video. Fue muy útil. Una pregunta. ¿Sabes cuál es el límite gratis de Replicate? Porque después de un par de audios (más o menos largos) me notifica que el límite gratis expiró, pero no sé si se renueva o algo así. Gracias de antemano. Saludos.
@jrsolid1312
@jrsolid1312 6 ай бұрын
Muchas gracias por el tutorial. Tengo que transcribir un audio y da error al subir el archivo de audio.mp3 - he cortado el audio incluso a solo 10 minutos, ni aun por esas. ¿que estoy haciendo mal?. Saludos.
@claudiaoviedomartinez1914
@claudiaoviedomartinez1914 5 ай бұрын
Hola @Xavier Mitjana, no me permite entrar al google collab en 2024, tendrás alguna solución?
@varg1814
@varg1814 Жыл бұрын
Que hacer si sale Whisper comand not found?
@kurrito3
@kurrito3 Жыл бұрын
Geniales soluciones, muchas gracias por el video con la explicación tan sencilla.
@Mfernandezreina
@Mfernandezreina 6 ай бұрын
Hola, lo probé y funciona muy bien. Pero para audios largos, como una entrevista de media hora, pide pago😥😥
@LautaroPagnutti
@LautaroPagnutti 21 күн бұрын
hoy todas piden plata, existe a agosto 2024 alguna que sea 100% gratuita?
@ZDaPlay
@ZDaPlay Жыл бұрын
Podrías hacer un vídeo de como ejecutarlo en local?
@XavierMitjana
@XavierMitjana Жыл бұрын
Lo tenemos en la lista de pendientes. 😉
@mariomjc4_4
@mariomjc4_4 Жыл бұрын
Genial, la segunda y la tercera son muy buenas opciones.
@monicadiez6763
@monicadiez6763 Жыл бұрын
Muchas gracias por su orientación, realicé el proceso, pero debo preguntar si hay un límite de espacio, ya que pase un archivo de sonido, pero no lo hizo en su totalidad
@trumandaniel
@trumandaniel 19 сағат бұрын
Pues a mi no me va, no hace clic para subir el archivo de audio...
@latabletagrafica
@latabletagrafica Жыл бұрын
Gran tutorial, pero por favor, reescala la ventana para que podamos verlo en dispositivos más pequeños, estoy en un portátil de 15" y me cuesta mucho leer los textos.
@XavierMitjana
@XavierMitjana Жыл бұрын
Muchas gracias por el consejo. Como verás, en los siguientes tutoriales intento hacerlo. Aunque a veces se me olvida. 😅
@DanielGarcia-gs9ji
@DanielGarcia-gs9ji Жыл бұрын
Muchas gracias, me sirvió mucho.
@PexPloras
@PexPloras Жыл бұрын
gracias por el video. Consulta que alternativas conoces a google traductor, necesito algo mejor que puede ayuda a transcribir y traducir videos del ingles al español y no solo de youtube. Gracias,
@AgurtzaneAramendi
@AgurtzaneAramendi Жыл бұрын
Yo he podido traducir varios audios pero ahora no me aparece submit y no me deja subir un audio... por qué es esto??? he introducido varios audios y ahora no consigo que me deje.. a qué se debe?
@martelfernando
@martelfernando Жыл бұрын
Podría usar voz a texto en bing chat con Whisper? En mi móvil. Que puedo hacer pues tengo deficiencia visual. Grácias
@savant482
@savant482 Ай бұрын
Funcionó cuatro veces en replicate y se acabo la historia. Creo q es pq hay q pagar. Estoy en lo cierto?. Gracias por el video
@jjosemorillas
@jjosemorillas Жыл бұрын
Hola. Muy buen vídeo, muchas gracias. ¿Alguien sabría si con la opción de Google Colab se puede predeterminar el idioma en el que va a estar el audio en vez de que lo detecte whisper?
@johnnydogdry7350
@johnnydogdry7350 Жыл бұрын
La opción en google colab me funciona, pero la transcripción aparece sin signos de puntuación, como comas y puntos. ¿Me puede decir alguien qué puede estar pasando para que no aparezcan? Gracias
@sergioalejandroherrerapuen5369
@sergioalejandroherrerapuen5369 Жыл бұрын
Excelente video muchas gracias
@FlamesoulSatseNosfET
@FlamesoulSatseNosfET Жыл бұрын
Hasta cuantos minutos te permite subir
@elreydelanime12
@elreydelanime12 Жыл бұрын
xavier una pregunta rapida, coces alguna buena pagina donde puedas subir tu imágenes creadas en la máxima calidad posible?
@XavierMitjana
@XavierMitjana Жыл бұрын
¿Te refieres a un lugar donde subirlas para que se puedan consultar públicamente, uso propio o algo específico para imágenes con IA? Para lo primero creo que Flickr debería servirte, para lo segundo en principio Google Photos debería guardar las imágenes en el formato original en que las subas y para lo tercero, pues la verdad es que no tengo ninguno localizado.
@elreydelanime12
@elreydelanime12 Жыл бұрын
@@XavierMitjana gracias. estaria bueno que en un futuro hagas un video explicando como usar bien img2img, realmente es confuso.
@puntocardinalmonitoreodeme5227
@puntocardinalmonitoreodeme5227 Жыл бұрын
Hola Xavier, ¿es posible implementar el whisper de modo off line para reducir el tiempo de procesamiento con archivos de gran tamaño o larga duración?
@XavierMitjana
@XavierMitjana Жыл бұрын
Sí, aunque nosotros no lo hemos buscado y no sé si alguien lo ha implementado, pero sí se puede ejecutar en un Colab, puede ejecutarse online.
@ArchivosPC
@ArchivosPC Жыл бұрын
Buenas herramientas, gracias.
@Leopooldo
@Leopooldo Жыл бұрын
Hola, en qué pagina podría contratar la licencia original
@vanche2030
@vanche2030 Жыл бұрын
Gracias Xavier!
@ion4497
@ion4497 Жыл бұрын
genial gracias !!!
@alejandrojoseph2781
@alejandrojoseph2781 Жыл бұрын
Hola, Xavier, me da problemas de credenciales en Colab, ¿es necesaria alguna acción adicional?
@XavierMitjana
@XavierMitjana Жыл бұрын
En principio no, asegúrate que la cuenta de gmail que usas en Colab sea la misma que tienes activa en el navegador. Es lo único que se me ocurre que pueda generar conflicto.
@yolandamenjibar2242
@yolandamenjibar2242 Жыл бұрын
Gracias Xavier, me parece genial esta herramienta. La he usado dos veces, la primera sin problema, la segunda me ha pedido que introduzca mi email y una contraseña y después de recibir un código e introducirlo.... me ha salido una pantalla diciendo que replicate puede acceder a mis correos personales!! Personal user data Email addresses (read-only) This application will be able to read your private email addresses. Esto es un poco sospechoso, no?
@XavierMitjana
@XavierMitjana Жыл бұрын
Que raro, en principio se puede usar sin correo electrónico. Al menos des del ordenador.
@yolandamenjibar2242
@yolandamenjibar2242 Жыл бұрын
@@XavierMitjana la primera vez que lo usé fue sin correo, pero hoy me pedido que me registre a través de GitHub... 😞
@jmiguel113
@jmiguel113 Жыл бұрын
Hola Xavier estoy utilizando la herramienta pero solo me deja transcribir 30 segundos, puedes hacer un tutorial es como realizar este paso pero para más tiempo? Saludos y buen video
@XavierMitjana
@XavierMitjana Жыл бұрын
Es otra de las cosas que tenemos pendiente en la lista. A ver si me voy organizando y voy sacando deberes. 😉
Жыл бұрын
kzbin.info/www/bejne/gKawdqB8Ypd5qaM
@Matzoom73
@Matzoom73 Жыл бұрын
Hay alguna limitación en cuanto a duración o tamaño en los archivos mp3 para pasar a texto?
@XavierMitjana
@XavierMitjana Жыл бұрын
Hola Matías, por parte del whisper no debería haberlo, pero al ejecutarse en Colab y Replicate es posible que el uso de sus servidores esté restringido a cierto tiempo y pueden interrumpir el servicio. Pero creo que es cuestión de probar, con el tiempo de ejecución que permite Colab cuando entrenamos Stable Diffusion debería ser más que suficiente para transcribir audios muy largos.
@OlayonChingon
@OlayonChingon Жыл бұрын
acabo de transcribir un audio de 22 min en colab, oka
@nahiara2295
@nahiara2295 Жыл бұрын
@@OlayonChingon Hola fabi, me contas exactamente como lo hiciste? Yo tambien estoy intentando convertir audios largos. Me seria de ayuda
@OlayonChingon
@OlayonChingon Жыл бұрын
@@nahiara2295 Usas la opcion de " colab" q plantea Xavier en el video (Minuto 4.14). Importante que ejecute la primera celda que carga librerias. Luego subis el audio a transcribir y copias direccion en la celda con opcion "solo trascribir audio al idioma original". Ejecutas la celda y listo
@geraibaceta6719
@geraibaceta6719 Жыл бұрын
Hola, como estas? Estoy buscando transcribir video qe están en vimeo, es posible con esta app?
@XavierMitjana
@XavierMitjana Жыл бұрын
Si puedes proporcionarle el audio de un vídeo (aquí habría que verse como extraer el audio de los videos de vimeo) hace la transcripción sin problema. Por lo que diría que de un modo u otro debería ser posible.
@Elcanaldesole
@Elcanaldesole Жыл бұрын
Hola!! No me deja seleccionar el texto para pegar mi ruta copiado como en el minuto 5:38 !!!
@XavierMitjana
@XavierMitjana Жыл бұрын
Hola Sofía, voy a revisarlo. El vídeo es del momento en que salió Whisper y es posible que el cuaderno haya cambiado. Intentaré subir un tutorial nuevo y actualizado pronto.
@Elcanaldesole
@Elcanaldesole Жыл бұрын
@@XavierMitjana gracias por su respuesta!! estaré pendiente!!!
@jcasamo1
@jcasamo1 11 ай бұрын
Lo hace de lujo, sólo que me detecta el audio en gallego 🤣 ¿hay alguna manera de forzarlo a que lo transcriba en áspalo siempre? Muchas gracias por el video
@XavierMitjana
@XavierMitjana 11 ай бұрын
Creo que se puede seleccionar el idioma, al menos en la aplicaición de replicate te permite marcarlo. Lo que no sé es cuales son los idiomas del selector disponibles.
@ingadorovskysvetlana5884
@ingadorovskysvetlana5884 Жыл бұрын
falta el de subtitle edit
@adriana_lr
@adriana_lr Жыл бұрын
Hola, podrías indicarme como descargar los archivos que genera replicate? Hasta ahora no he encontrado como descargar el archivo srt o la transcripción, solo con copiar y pegar.
@XavierMitjana
@XavierMitjana Жыл бұрын
Creo que a través de replicate solo se puede hacer así, copiando y pegando.
@adriana_lr
@adriana_lr Жыл бұрын
@@XavierMitjana muchas gracias.
@carlosmaya5190
@carlosmaya5190 Жыл бұрын
amigo, te pregunto donde puedo encontrar un tutorial para instalar whisper en Subtitle Edit
@antonio_qp
@antonio_qp Жыл бұрын
como como? eso se puede?
@vladimirjb3113
@vladimirjb3113 Жыл бұрын
y si lo quiero usar pero en un video de google drive?
@XavierMitjana
@XavierMitjana Жыл бұрын
Hola Vladimir, Whisper es Open Source, por lo que es muy posible que hayan implementado la solución. Nosotros aún no lo hemos probado, pero debería ser posible hacer lo mismo en local. Nos informamos y vemos si podemos traer algo más de información sobre el tema.
@mccandela1
@mccandela1 Жыл бұрын
Hay algún Ia para transcribir podcast?
@XavierMitjana
@XavierMitjana Жыл бұрын
Te refieres a alguna que te separe los diferentes interlocutores? Para eso puedes usar happyscribe. Aunque es de pago.
@XFalc
@XFalc Жыл бұрын
Cómo se puede traducir del inglés al español?
@XavierMitjana
@XavierMitjana Жыл бұрын
Deberías pasarlo por un software de traducción tipo deepl Xavi.
@noa4714
@noa4714 Жыл бұрын
A este paso se podrían traducir videos de KZbin de diferentes idiomas al español no :) ?
@XavierMitjana
@XavierMitjana Жыл бұрын
Sí, de hecho esto en principio, la tecnología de Whisper ya debería permitirlo, aunque creo que de momento solo está disponible para hacerlo al revés, de otros idiomas al inglés.
@ChristianAyalaCampeon
@ChristianAyalaCampeon Жыл бұрын
Con eso se clona mi voz
@XavierMitjana
@XavierMitjana Жыл бұрын
No, esta herramienta no es para crear voces, es para lo contrario, generar transcripciones.
@marcoguida2063
@marcoguida2063 2 ай бұрын
En el gpt de chatgpr versión de pago, ha fallado, tanto con archivos ogg de telegram, opus de whatsapp y mp3 de mi grabadora, estoy haciendo algo mal?
@mercedesugarte4553
@mercedesugarte4553 Жыл бұрын
Sí m sale whisper not found?
@r.c.psamuelmedina6132
@r.c.psamuelmedina6132 Жыл бұрын
Mi respeto, tremenda ayuda, te ganaste un suscriptor más, lo máximo muchas gracias.
@SaraCidMartin
@SaraCidMartin 4 ай бұрын
no funciona :(
@ozzy1987mr
@ozzy1987mr Жыл бұрын
el colab me da error de credenciales
@valentinmolinuevo1813
@valentinmolinuevo1813 Жыл бұрын
sigue siendo open source? a un amigo que la intento usar en una aplicacion de unity le restringio su uso porque supero el limite de usos.
@XavierMitjana
@XavierMitjana Жыл бұрын
El modelo de whisper es open source, pero los servicios que lo utilizan pueden ser de pago.
@daniestevegarcia6548
@daniestevegarcia6548 Жыл бұрын
Sirve para traducir audio libros del ingles al castellano?
@XavierMitjana
@XavierMitjana Жыл бұрын
Hola Dani, Whisper como tal puede servir para esta función, de hecho, puedes probar como lo hace "al revés" en la tercera herramienta del Colab de DotsCSV. Lo que aún no tengo localizada ninguna herramienta de "producción" o más dirigida al usuario final para realizar este tipo de tareas. Pero con lo rápido que avanza esto seguro que no tardan en salir.
@aaronbautista4378
@aaronbautista4378 Жыл бұрын
lo pudiste hacer bro? yo ahce años estaba buscando algo asi
@gustavoiglesias7711
@gustavoiglesias7711 5 ай бұрын
Saludos cordiales estimado Xavier. Excelente y funcional la 1era opción, lo que si no dice si tiene una cantidad limitada de uso, como el caso de Replicate, que solo permite 3 veces. La opción de Google Colab no abre o no se conecta el cuaderno, podrías por favor revisar si aún esta activo dicho cuaderno/enlace. Muy agradecido por tu video, muy claro y didáctico, ha sido de mucha utilidad. Un fuerte abrazo.
@sandratrujillo2047
@sandratrujillo2047 Жыл бұрын
Bueno, esa función la tengo en el celular y llevo meses utilizándola y funciona muy bien, todo es buena dicción y hacerlo más bien a un ritmo adecuado. Geniales tus videos, seguimos aprendiendo.
@XavierMitjana
@XavierMitjana Жыл бұрын
Muchas gracias Sandra!
@luisrincon2444
@luisrincon2444 Жыл бұрын
Como la tienes?
@sandratrujillo2047
@sandratrujillo2047 Жыл бұрын
@@luisrincon2444 En mi caso tengo Android. Activas el teclado para enviar texto, por ejemplo en WhatsApp, en el mismo ves un micrófono, es diferente al de enviar mensaje de audio, lo activas y dictas tu texto, los haces con buena dicción, seleccionas, copias y pegas.
@julianruiz-ai
@julianruiz-ai Жыл бұрын
@@sandratrujillo2047 hola sandra quiero utilizar esta herramienta para practicar mi ingles y conectar el texto con chat gpt para que me muestre los errores gramaticales, como usas las herramienta desde tu telefono, que medio de los que explicaron en el video usas ?
@xanderbustamante9093
@xanderbustamante9093 Жыл бұрын
yo tengo la función de subtitular con la api de Google que genera subtítulos en KZbin pero lo tengo en una aplicación externa que usa esa función de Google
@ignaciajesusbarreramanriqu5809
@ignaciajesusbarreramanriqu5809 Жыл бұрын
hola, si quiero transcribir una entrevista o video, cómo puedo hacerlo?
@tinipichon2060
@tinipichon2060 Жыл бұрын
Hola Xavier, si lo que quiero es traducir un texto en ingles a español, como sería el comando? en el que has puesto solo pone de español a ingles. Muchas gracias!
@dyoanima
@dyoanima Жыл бұрын
solo por añadir, pude usar el .ipynb de Dot csv de forma local cambiando algunas cositas, super comodo ademas de generarte los tiempos en .srt
@XavierMitjana
@XavierMitjana Жыл бұрын
Gran aporte! Lo vamos a investigar, porque el siguiente paso es ejecutarlo en local. Es una herramienta menos vistosa que Stable Diffusion, pero más útil en tareas del día a día habituales.
@dbarrasa
@dbarrasa Жыл бұрын
Esto me interesa. ¿Se le podría poner por ejemplo una dirección de youtube y que te genere los subtítulos?
@XavierMitjana
@XavierMitjana Жыл бұрын
@@dbarrasa técnicamente creo que sí, ahora falta que alguien desarrolle el aplicativo, pero justo para cosas como estás está pensado.
@romermedrano5948
@romermedrano5948 10 ай бұрын
excelente video estimado, simple y muy facil de usar.
@MrMauroneto
@MrMauroneto Жыл бұрын
Excelentes Datas!!
@XavierMitjana
@XavierMitjana Жыл бұрын
Ostras, replicate no lo genera en texto plano? Si te lo genera en format correcto sería simplemente copiar, pegarlo en un blog de notas y guardarlo como .srt. Pero no sé si a través de replicate genera el formato correcto.
@fernandovalencia2615
@fernandovalencia2615 Жыл бұрын
Se puede hacer que en vez de escribir en chat gpt se le pregunté por medio de Audio y la IA responda también por Audio?
@XavierMitjana
@XavierMitjana Жыл бұрын
Sí, sería cuestión de combinar herramientas ya existentes (whisper+ChatGPT+Microsoft Azure), lo que no sé es si alguien ha montado ya un aplicativo para hacerlo.
@henryrangel1849
@henryrangel1849 Жыл бұрын
Amigo necesitas tratar el audio de tus videos con Adobe Podcast o algo parecido urgente.
@XavierMitjana
@XavierMitjana Жыл бұрын
Estás viendo un vídeo antiguo. 😉 Échale una escucha a los últimos.
@symbiocreativo6648
@symbiocreativo6648 Жыл бұрын
eres uno de los mejores, gracias.
@victorzambrano3019
@victorzambrano3019 Жыл бұрын
replicate no es gratis tengo que pagar con tarjeta ?? o alguien lo usa ilimitado al rato me pidio pago ejje
@XavierMitjana
@XavierMitjana Жыл бұрын
Hola Victor, para usar la API o desarrollar con ellas hay que pagar, para usar las demos públicas, hasta ahora, yo no he tenido ni tan siquiera que registrarme. Se puede acceder a ellas como si de un espacio más de HuggingFace se tratase.
@victorzambrano3019
@victorzambrano3019 Жыл бұрын
@@XavierMitjana gracias si las probe y todas ok, solo esa era mi duda
@jonathancastro1275
@jonathancastro1275 Жыл бұрын
Excelente video, gracias. ¿Que tan factible sería (hablando de dificultad e integración) utilizar Whisper para hacer esto mismo, pero en tiempo real?
Офицер, я всё объясню
01:00
История одного вокалиста
Рет қаралды 2,8 МЛН
HAH Chaos in the Bathroom 🚽✨ Smart Tools for the Throne 😜
00:49
123 GO! Kevin
Рет қаралды 15 МЛН
From Small To Giant Pop Corn #katebrush #funny #shorts
00:17
Kate Brush
Рет қаралды 69 МЛН
Поветкин заставил себя уважать!
01:00
МИНУС БАЛЛ
Рет қаралды 6 МЛН
Best FREE Speech to Text AI - Whisper AI
8:22
Kevin Stratvert
Рет қаралды 982 М.
Pasa AUDIO a TEXTO con la inteligencia artificial de forma GRATUITA y sin ERRORES
7:47
Academy TotemGuard - Meritxell Viñas
Рет қаралды 70 М.
TEXTO a VOZ ► Mejor Herramienta de IA ONLINE Gratis
8:52
Camino Digital
Рет қаралды 29 М.
Тест кнопки iPhone 16 под водой
0:39
Romancev768
Рет қаралды 664 М.
Китайцы сделали телефон БАЯН
0:14
Собиратель новостей
Рет қаралды 963 М.
Apple Event - September 9
1:38:50
Apple
Рет қаралды 26 МЛН
От iPhone 16 такого не ожидал никто!
0:43
ÉЖИ АКСЁНОВ
Рет қаралды 1,4 МЛН