Pra calcular o RMSE no sklearn é só mudar o parâmetro 'squared' do mean_squard_error para False, como em: sklearn.metrics.mean_squared_error(y_true, y_pred, *, sample_weight=None, multioutput='uniform_average', squared=False) Obrigado pelas aulas! um abraço.
@letsdataAI2 жыл бұрын
Boa, Germano!! Valeu, mestre!
@thiagotavares23842 жыл бұрын
Parabéns, professor. Ótima aula.
@letsdataAI2 жыл бұрын
Valeu, Thiago!!
@wesley_breno Жыл бұрын
Adorei o conteudo!!! Didatica incrivel! 😁
@letsdataAI Жыл бұрын
Valeu demais, Wesley!! Aproveite que estamos com evento aberto, entra no letsdata.ai e participe! Abraços!
@orrafaellis2 жыл бұрын
Muito boa a aula! Obrigado!
@letsdataAI2 жыл бұрын
Valeu, Rafael!!!
@riptorforever22 жыл бұрын
Quando gosto muito da aula, ainda que eu não tenha nada relevante pra comentar, cedo a irrelevância mesmo só para contribuir com o algoritmo de recomendação do youtube.. Aulas fantásticas! Apesar de superficial, dá uma 'visão de águia' sobre o escopo da lib, a organizacao da documentacao e a praticidade do uso ^^
@letsdataAI2 жыл бұрын
Valeu demais pela força!!!
@RafaelRivetti Жыл бұрын
Já tem vídeo de implementação para séries temporária? Se não tiver, faz por favor!! Seria legal usar o preço de ações em bolsa de valores. Abraço!
@letsdataAI Жыл бұрын
Tem vídeo de séries temporais! Depois nos diga se gostou!
@guilhermemartins98242 жыл бұрын
Aula muito boa!
@letsdataAI2 жыл бұрын
Valeu, Guilherme!!!
@tiaofilho1232 жыл бұрын
Muito boa a aula, León. Parabéns pela didática simples e assertiva.👍🏼 Agora só um pequeno detalhe, na parte do consumo dos veículos o de valor "mpg" máximo (46,6) seria o mais econômico e o mínimo (9,0) é que seria o "Hummer"! Você falou o contrário 😉. Abs.
@letsdataAI2 жыл бұрын
Valeu, Tião!! Verdade! Mais milhas por galão, mais econômico, obrigado!
@DDarkoBR2 жыл бұрын
Professor, uma sugestão é fazer uma aula de xgboost para séries temporais.
@letsdataAI2 жыл бұрын
Ótima sugestão!!
@DDarkoBR2 жыл бұрын
@@letsdataAI Graças a essa aula consegui aplicar com gs o xgboost no meu trabalho. Abs.
@letsdataAI2 жыл бұрын
Que massa, Cairo!!! Felizes de saber que ajudou.
@benjaminrondonneto6377 Жыл бұрын
Vc possue algum curso sobre o tema de analise de dados no panda?
@letsdataAI Жыл бұрын
Tudo bem, mestre? Temos um programa educacional completo, inclui pandas para análise de dados: www.letsdata.ai/a-jornada
@benjaminrondonneto6377 Жыл бұрын
@@letsdataAI muito obrigado... Estou finalizando o curso introdutório sobre python e já irei me inscrever no seu curso. Quero muito aprender sobre calibragem/otimização de parâmetros para modelos preditivos.
@maikerodrigo42492 жыл бұрын
Show de bola!
@letsdataAI2 жыл бұрын
Valeu, Maike!!
@edwardsouza76032 жыл бұрын
Parabéns pelo vídeo! Principalmente pela "canja" de "we are the champions". kkk
@letsdataAI2 жыл бұрын
Valeu, mestre!!!
@orafaelgf2 жыл бұрын
Parabéns pelo vídeo e didática. Tô fazendo uma maratona no canal e ainda não encontrei algum modelo de classificação onde foi preciso balancear as classes. Caso tenha, pode indicar, por favor? Caso não, fica sugestão de vídeo. Abs e sucesso ao canal.
@letsdataAI2 жыл бұрын
Valeu, Rafael!! Boa sugestão! A gente aqui advoga por não balancear as classes por conta de muitas evidências que não melhoram a performance do modelo e ainda se corre um grande risco de data leakage. Nossa sugestão é escolher bem uma métrica que puna mais os erros na classe minoritária. Um ótimo assunto para um vídeo, vai entrar na lista! :)
@orafaelgf2 жыл бұрын
@@letsdataAI legal, entendi. Vou estudar mais sobre leakages e tentar descobrir modelos que lidam bem com o desbalanceamento de dados. Obrigado e sucesso.
@guimaraesalysson2 жыл бұрын
Você faz por meio do parâmetro scale_pos_weight, mas é melhor usar somente nos casos em que for MUITO desbalanceado (ex. 5% x 95%). Nos outros modelos comuns você tem que balancear com undersample/oversample e treinar nessa base, mas tem essa questão do data leakage
@RafaelRivetti6 ай бұрын
O bootstrap pode gerar problemas em séries temporais no sentido de alterar pontos de dados que precisam obedecer uma sequência (ordem) temporal? Isso seria um problema para modelos de bagging (como Random Forest) ao serem usados em séries financeiras como ações, butcoin, etc, alterando os pontos de dados na reamostragem?
@letsdataAI6 ай бұрын
Excelente dúvida, Rafael, fez a gente matutar um bocado aqui 😂 Pode sim!! Como as amostras usadas no bagging são randômicas, podemos perder informação que tenha relações temporais. Não é comum tratar isso e acabamos “aceitando” porque essa problema não inviabiliza a utilização dos modelos (como seria o caso de overfitting, por exemplo). Pra resolver tem que mudar a forma de amostragem, o que normalmente não é parametrizado nos principais pacotes. Ou seja: tem que fazer “na mão”.
@ederson.madruga2 жыл бұрын
León, excelente aula. Obrigado. Vocês irão disponibilizar o notebook?
@letsdataAI2 жыл бұрын
Mestre Ederson! Repositório no ar! :)
@ederson.madruga2 жыл бұрын
@@letsdataAI valeu LéON.
@tiaofilho1232 жыл бұрын
@@letsdataAI . León, onde fica o repositório deste notebook da aula?
@letsdataAI2 жыл бұрын
Aqui!! github.com/letsdata
@guimaraesalysson2 жыл бұрын
Por que transformar o target em variável quant. discreta na classificação?
@letsdataAI2 жыл бұрын
No cross validate a API do XGBoost do scikit learn dá um erro porque ele transforma no fit mas não no predict. Deve ter outro jeito de corrigir, mas essa foi a opção mais simples que achamos.
@lucasfescina Жыл бұрын
Alguém poderia me dizer porque não precisa usar kfold nesse crossval score
@letsdataAI Жыл бұрын
Se não passar parâmetro o default é 5-fold :)
@anacarolinaghizelliniwyatt6700 Жыл бұрын
boa tarde, professor. Esse notebook tá disponível em algum lugar pra gente baixar?
@letsdataAI Жыл бұрын
Tá na mão: github.com/letsdata/gradient-boosting-com-xgboost