Como fazer TRATAMENTO de DADOS com PYTHON

  Рет қаралды 8,140

Nerd dos Dados

Nerd dos Dados

Күн бұрын

Пікірлер: 33
@diegovir
@diegovir 23 күн бұрын
gosto de videos direto ao ponto, parabéns pelo conteúdo.
@OlecramHPP
@OlecramHPP 7 ай бұрын
Melhor canal do mundo!! E não é exagero!!
@joaocoimbra4032
@joaocoimbra4032 Жыл бұрын
Você é o melhor do mundo, estou aguardando seu curso
@nerddosdados
@nerddosdados Жыл бұрын
Olá João, hoje vai sair um vídeo novo daqui a pouco, obrigado pelo seu feedback. Valeu. O curso está em preparação, vale a pena esperar um pouquinho porque vai ter muitoooo conteúdo top.
@leandrocabunitin8560
@leandrocabunitin8560 2 ай бұрын
Ótimo video!!
@juliokaro
@juliokaro Жыл бұрын
Ótimo vídeo. Bati cabeça para usar o pacote locale, pois não funcionava de jeito nenhum no google colab. Testei em outros ambientes e funcionou.
@claudio1417
@claudio1417 2 жыл бұрын
Show. Parabéns
@nerddosdados
@nerddosdados 2 жыл бұрын
Muito obrigado
@leandrocarvalho5945
@leandrocarvalho5945 2 жыл бұрын
Mais um ótimo vídeo
@micaelaandrade414
@micaelaandrade414 Жыл бұрын
Cai no seu canal por acaso e já estou grata! Obrigada por compartilhar conhecimento tão bem, de uma forma didática e sem enrolação! 😊 partiu assistir todos os seus vídeos kkk
@nerddosdados
@nerddosdados Жыл бұрын
Obrigado
@odaird7
@odaird7 2 жыл бұрын
Ótimo conteúdo
@davilopes8737
@davilopes8737 2 жыл бұрын
Explicação show!! uma coisa que tenho dúvida é como filtrar um período específico pela coluna data_vendas, por exemplo pegar as vendas apenas de um determinado mês
@nerddosdados
@nerddosdados 2 жыл бұрын
Olá, você pode fazer o filtro pela data_vendas de varias maneiras. Pode usar notação de slice do pandas, fazer uma engenharia de atributos criando campos de dia, mes, ano e depois separando pelo período desejado, ou então usar filtros como se fosse fazer um select. Vou deixar 2 vídeos aqui que fala sobre o Pandas e Analise de Dados Avançada, tem muitos tipos de filtro que vai te ajudar a compreender melhor, mas caso haja alguma dúvida pode me perguntar também. Analise de Dados Avançada kzbin.info/www/bejne/eaPRd5lsrMuGj9E Pandas kzbin.info/www/bejne/jIHZcoqql9GmiNE
@MrGhustavo22
@MrGhustavo22 2 жыл бұрын
top demais
@flaviakrollguimaraes727
@flaviakrollguimaraes727 Жыл бұрын
Muito bom
@lavqueirozz
@lavqueirozz Ай бұрын
não estou conseguindo ver a mediana do passat, esta dando erro falando que nao converti para numerico
@rodrigocezar664
@rodrigocezar664 Жыл бұрын
Travei nessa parte do vídeo 5:23, meu questionamento seria por conta de que a coluna 'VALOR' possuia apenas um valor com 'SEM VALOR', aí você viu que era do modelo PASSAT, até aqui tudo bem, porém eu não entendi por que você alterou todos os valores do modelo PASSAT que tinha como 'VALOR' igual a 200.000 se tornarem o valor 0.
@nerddosdados
@nerddosdados Жыл бұрын
Nesse caso lá no vídeo e no script faz o contrário. Eu coleto a média do modelo passat que é 200.000 e então eu preencho com 200.000 somente o valor que está igual a 0 (zero)
@canaljesusnazareno
@canaljesusnazareno 7 ай бұрын
Olá, esse vídeo tem continuação ? Achei que fossemos utizar agora os códigos para treinar algorítimos.
@nerddosdados
@nerddosdados 7 ай бұрын
Esse vídeo fala sobre tratamento de dados no canal tem outros vídeos com modelos preditivos completos
@pauloavelar252
@pauloavelar252 2 жыл бұрын
Olá parabéns pelo Canal. Vc poderia me ajudar com uma dúvida. Rodei seu código na minha maquina e da esse erro: unsupported locale setting.
@nerddosdados
@nerddosdados 2 жыл бұрын
Olá bom dia Você utiliza Windows ou Linux ?
@pauloavelar252
@pauloavelar252 2 жыл бұрын
@@nerddosdados Mac.
@paulorltenorio
@paulorltenorio Жыл бұрын
O link para download dos arquivos não está funcionando.
@nerddosdados
@nerddosdados Жыл бұрын
Verifique se não há nada bloqueando o download pois outros inscritos conseguiram baixar normalmente
@paulorltenorio
@paulorltenorio Жыл бұрын
df_dados.loc[(df_dados['VALOR'] == 'SEM VALOR'), 'VALOR'] = 0 df_dados.loc[df_dados['MODELO'] == 'PASSAT'].median( ) df_dados.loc[(df_dados['VALOR'] == 200000), 'VALOR'] = 0 Na última linha acima não entendi. Pois na primeira linha acima entendi que na coluna VALOR onde o dado é igual a SEM VALOR substitui pelo dado 0. Na segunda linha conseguimos o valor da mediana que é 200000. Então seguindo a lógica da primeira linha acima, temos na terceira linha acima onde o dado é 200000 na coluna VALOR e substitui por 0. Mas não é assim que você disse. Você disse que onde é 0 substitui por 200000. Então não entendi.
@nerddosdados
@nerddosdados Жыл бұрын
Olá Paulo, boa noite. Verifique se não há algum bloqueio de pop-up na sua máquina que esteja impedindo o download do material, fiz um teste e consegui baixar o material com o link que está na descrição do vídeo, outros inscritos do canal tambem conseguiram. Em relação a sua dúvida, vamos lá, vou tentar explicar a linha de código passo a passo. A linha de código é essa --> df_dados.loc[(df_dados['VALOR'] == 200000), 'VALOR'] = 0 Observe que dentro do parenteses eu estou colocando que o campo VALOR será igual a 200000 que é o valor da mediana. Depois do parenteses está assim 'VALOR'] = 0 Essa é a sintaxe python onde estou fazendo a atualização do valor que é ZERO para 200000 df_dados.loc[(df_dados['VALOR'] == 200000) aqui altera para 200000 'VALOR'] = 0 na continuação significa que o valor que for igual a 0 será alterado para 200000 Espero ter tirado sua dúvida. Abraços
@mistermagoo1372
@mistermagoo1372 Жыл бұрын
Quero parabenilaza-lo pelas aulas, são excelente. peço ajuda com esse comando: # Vamos identificar o valor mediana do modelo LAMBORGUINI todos os locais onde tem .median() deu erro, df_dados.loc[df_dados['MODELO'] == 'LABORGUINI'].median(), usando o median() tenho erro, só funciona quando tiro o.median(0, uso Vscode com python, jupyter notebook, windows 10. a imagem importo ela de onde?
@nerddosdados
@nerddosdados Жыл бұрын
Como está usando o vscode verifique se não tem alguma parte do código que está incorreta ou comentada
@mistermagoo1372
@mistermagoo1372 Жыл бұрын
Obrigado pela gentileza de responde. Cheguei a conclusão que o problema da execução está no VScode, usei o colab.goolge e o programa roda sem erro. Muito obrigado.
@davicossuol211
@davicossuol211 10 ай бұрын
@@mistermagoo1372 Opa irmão! A questão é que na nova versão do método .median() ele tenta resultar a mediana de todas as variáveis do dataframe, então o ideal seria que você passasse o valor True para o parâmetro numeric_only. Ficando dessa forma: df_dados.loc[df_dados['MODELO'] == 'LABORGUINI'].median(numeric_only=True)
@canaljesusnazareno
@canaljesusnazareno 7 ай бұрын
@@davicossuol211 Tenho me perguntado o por que nos códigos do pessoal que geralmente faz esses vídeos não precisa passar median(numeric_only=True) e funciona. Quando vamos rodar acontece isso e muita gente não sabe e não é mencionado nos vídeos.
Como fazer Análise de Dados com Python
14:25
Nerd dos Dados
Рет қаралды 3,7 М.
COMO FAZER UM TRATAMENTO DE DADOS DE QUALIDADE
26:53
Nerd dos Dados
Рет қаралды 1,5 М.
🎈🎈🎈😲 #tiktok #shorts
0:28
Byungari 병아리언니
Рет қаралды 4,5 МЛН
Como Tratar Valores Vazios em uma Base de Dados com Python
31:40
Hashtag Programação
Рет қаралды 17 М.
Como fazer NORMALIZAÇÃO e PADRONIZAÇÃO de DADOS (O Guia Completo)
42:30
Limpeza e Tratamento de Dados Ausentes e Duplicados com Pandas em Python
22:04
ESTATÍSTICA BÁSICA PARA CIÊNCIA DE DADOS
21:10
Nerd dos Dados
Рет қаралды 13 М.
Como fazer CLUSTERIZAÇÃO com Python
23:20
Nerd dos Dados
Рет қаралды 7 М.
Análise de Dados em Python
26:59
Universidade dos Dados
Рет қаралды 13 М.
É o FIM do ANALISTA de DADOS?
14:48
Asimov Academy
Рет қаралды 24 М.
Como colocar um modelo de Machine Learning em PRODUÇÃO
26:00
Nerd dos Dados
Рет қаралды 2 М.
COMO FAZER UMA ANALISE EXPLORATÓRIA DE QUALIDADE
28:13
Nerd dos Dados
Рет қаралды 3,6 М.