Inteligência Artificial para Transcrição de Áudio com Whisper Open AI | IA na Prática #01

  Рет қаралды 2,834

Programação Dinâmica

Programação Dinâmica

Күн бұрын

Neste vídeo, mergulhamos de cabeça na incrível tecnologia de transcrição de áudio em texto, usando a API Whisper da OpenAI. Este é o primeiro vídeo da série IA na Prática, em que trazemos exemplos práticos de programação em Python para você aprender a utilizar a inteligência artificial para criar soluções inovadoras.
✅Ainda precisa aprender a programar? Aprenda Python do Jeito Certo e desenvolva uma base fundamental para se tornar capaz de pensar e criar soluções para problemas escrevendo código: vai.pgdinamica.com/pjc-dados
Nesta aplicação de inteligência artificial na prática, Kizzy Terra, guia você através do processo de utilização da API Whisper para transcrever vídeos do KZbin usando a linguagem de programação Python. Prepare-se para uma jornada fascinante onde exploramos desde a instalação dos pacotes OpenAI Whisper e YT-DLP até a aplicação de modelos variados para aprimorar a precisão da transcrição. Todo o código foi realizado no Google Colab, um ambiente de desenvolvimento em nuvem criado e mantido pela Google.
👩🏾‍💻 Você pode aprender a utilizar o Google Colab para programar e analisar dados neste outro vídeo: • Como usar o Google COL...
Kizzy conclui o vídeo com dicas sobre como salvar as transcrições em arquivos de texto e sugestões para você experimentar e se juntar à gente nesta jornada de aprendizado sobre inteligência artificial na prática. Dê uma olhada no que você pode esperar:
0:00 Introdução sobre IA na Prática
1:02 Apresentação do Whisper e suas aplicações
1:56 Inspiração e motivação do problema
2:27 Instalação dos pacotes OpenAI Whisper e YT-DLP
3:11 Download de áudio de vídeo do KZbin
4:22 Carregando um modelo tiny Whisper para transcrição de áudio em texto
6:21 Utilizando um modelo maior no Whisper para comparar o resultado
7:34 Comparando o modelo medium do Whisper
8:45 Salvando o resultado da transcrição em um arquivo de texto em Python
10:06 Conclusão e ideias de trabalhos futuros
▶️ Vídeos relacionados:
1. O que é Inteligência Artificial? e o que NÃO É Também! • O que é Inteligência A...
2. O que é Rede Neural Artificial • O que é Rede Neural Ar...
3. O que é ChatGPT, por que ele está ALUCINANDO e onde estão os HUMANOS? • O que é ChatGPT, por q...
4. Introdução ao PyTorch | Redes Neurais | Primeiros passos com Pytorch kzbin.infocGxv8tOa...
💻 O código construído no vídeo está disponível neste link: github.com/pgdinamica/ianapra...
🧠 Confira a playlist Inteligência Artificial na Prática • Inteligência Artificia...
▶️ Episódio do podcast Data Hackers em que falamos sobre Visão Computacional: bit.ly/podcast-cv
📚 Livros recomendados de Data Science: amzn.to/2XZyxUr
📚 Livros de Algoritmos e Estruturas de Dados: amzn.to/3d5wK4m
SetUp - Equipamentos: amzn.to/37Cg3N2
🟣 Canal na Twitch para lives: / pgdinamica
🟦 Canal do Telegram para receber todos os vídeos: t.me/pgdinamica
🥰 Se você gosta do nosso trabalho e acha relevante a nossa atuação no KZbin, considere nos apoiar se tornando membro do canal: kzbin.info...
✉️ E-mails:
- Propostas comerciais: pgdinamica@brunch.ag
- Demais assuntos: contato@programacaodinamica.com.br
👩🏾‍💻👨🏾‍💻 Confira mais conteúdo em nosso blog: / programacaodinamica
TikTok: @pgdinamica
📸 Nos siga no Instagram: / pgdinamica
📸 @kizzy_terra @hallpaz
🐦 Nos siga no Twitter: / pgdinamica
🐦 @kizzy_terra @hallpaz
* Curta a Programação Dinâmica no facebook: pgdinamica
* Nosso repositório no Github: github.com/programacaodinamica
* Confira os artigos no Python Café: pythoncafe.com.br
#IAnaPrática

Пікірлер: 30
@Marcos-ht1cs
@Marcos-ht1cs 3 ай бұрын
Excelente vídeo. Obrigado Kizzi!
@pgdinamica
@pgdinamica 3 ай бұрын
De nada! Que bom que gostou!
@RafaelaSantana-bz9ld
@RafaelaSantana-bz9ld Ай бұрын
Conteúdo excelente! Obrigada por este vídeo!
@pgdinamica
@pgdinamica Ай бұрын
De nada! ☺️
@idcesares
@idcesares 3 ай бұрын
Essa aula sobre o Whisper foi demais! Ajudou muito em um projeto de transcrição de vídeos longos e sumarização automática. Um plus é que usei a versão da engine do Colab com GPU, conseguindo usar o modelo LARGE sem problemas. Demora mais um pouco, mas o resultado é ótimo! 👏
@pgdinamica
@pgdinamica 3 ай бұрын
Que legal! Obrigada por compartilhar sua experiência!
@franciscomartinshoffmann6551
@franciscomartinshoffmann6551 3 ай бұрын
isso é a versão paga?
@igormoreira1901
@igormoreira1901 3 ай бұрын
Como sempre, um ótimo conteúdo. #IA
@pgdinamica
@pgdinamica 3 ай бұрын
Muito obrigada! ☺️
@gabrieladarosaneto1809
@gabrieladarosaneto1809 3 ай бұрын
Excelente conteúdo. Obrigada pelo excelente compartilhamento de conhecimento 😍🧡
@pgdinamica
@pgdinamica 3 ай бұрын
Obrigada! 🙌🏾🥰
@salvatoreverde4167
@salvatoreverde4167 3 ай бұрын
Excelente como sempre IA
@pgdinamica
@pgdinamica 3 ай бұрын
Muito obrigada!
@patrickpires
@patrickpires 3 ай бұрын
Bom demais, galera! Vai ajudar muito nos estudos! hehee!
@pgdinamica
@pgdinamica 3 ай бұрын
Que ótimo! 🙌🏾
@francinildolunguinho
@francinildolunguinho 3 ай бұрын
Bom dia. Eu Gostei, Foi Uma Aula Muito Interessante.
@pgdinamica
@pgdinamica 3 ай бұрын
Muito obrigada! Fico feliz que tenha gostado!
@jaderfacid
@jaderfacid 3 ай бұрын
👆🏻👏🏻👏🏻
@pgdinamica
@pgdinamica 3 ай бұрын
😉
@CONTABIL1MOBI
@CONTABIL1MOBI 18 күн бұрын
porque quando eu tento fazer demora tanto tempo pra rodar? leva 10 min pra um audio de 2 min em mp3
@carlospinto7149
@carlospinto7149 3 ай бұрын
Perfeito, Kizzi, já compartilhei o vídeo com os meus colegas analistas de dados! Você conhece algum setup parecido para a conversão inversa, de texto para áudio?
@pgdinamica
@pgdinamica 3 ай бұрын
Muito obrigada! Quanto ao problema, há algumas opções como esta biblioteca (pypi.org/project/pyttsx3/) ou a Google Text to Speech API. Pode ser um tema de vídeo futuro 😉
@canegreiros9546
@canegreiros9546 3 ай бұрын
#IA
@pgdinamica
@pgdinamica 3 ай бұрын
😁🙌🏾
@mteixeira87
@mteixeira87 3 ай бұрын
#ia
@pgdinamica
@pgdinamica 3 ай бұрын
😉😄
@Eduardo-ns9ik
@Eduardo-ns9ik 3 ай бұрын
Parabéns, como seria para transcrever um vídeo em inglês e já traduzir para português?
@pgdinamica
@pgdinamica 3 ай бұрын
Esta é uma ótima ideia de continuação pra este vídeo 😉 Você poderia, por exemplo, usar a API do Google Tradutor em cima da transcrição do texto.
Valores, Memória, Tipos de Dados e Variáveis | Python do Jeito Certo 2.0
26:04
Programação Dinâmica
Рет қаралды 7 М.
когда повзрослела // EVA mash
00:40
EVA mash
Рет қаралды 3,5 МЛН
Получилось у Вики?😂 #хабибка
00:14
ХАБИБ
Рет қаралды 6 МЛН
Жайдарман | Туған күн 2024 | Алматы
2:22:55
Jaidarman OFFICIAL / JCI
Рет қаралды 1,5 МЛН
Alat Seru Penolong untuk Mimpi Indah Bayi!
00:31
Let's GLOW! Indonesian
Рет қаралды 13 МЛН
Testando o Google AI Studio e a API do Gemini
23:26
Educa Prática
Рет қаралды 166
Como Transcrever Qualquer Áudio com Python - OpenAI Whisper
12:31
Hashtag Programação
Рет қаралды 23 М.
Como eu fiz as TRANSCRIÇÕES das minhas entrevistas no doutorado!
13:22
Introdução ao PYTHON e Como PROGRAMAR do JEITO CERTO | Python do Jeito Certo 2.0
16:30
Ciência de Dados no Concurso da Anatel | Edital e Dicas de Material de Estudo
11:51
CRIE VÍDEOS  AUDIOBOOK ( Resumo de livro ) COM LEONARDO I.A
21:18
RENILDO E MAYARA
Рет қаралды 2,8 М.
3 APLICATIVOS GRÁTIS PARA TRANSFORMAR TEXTO EM VOZ NATURAL!
7:23
Onde eu Clico
Рет қаралды 512 М.
Hisense Official Flagship Store Hisense is the champion What is going on?
0:11
Special Effects Funny 44
Рет қаралды 2,5 МЛН
#miniphone
0:16
Miniphone
Рет қаралды 3,7 МЛН
Собери ПК и Получи 10,000₽
1:00
build monsters
Рет қаралды 2 МЛН