Classificação e regressão com XGBoost

  Рет қаралды 6,470

Let's Data

Let's Data

Күн бұрын

Пікірлер: 47
@germanojorge349
@germanojorge349 2 жыл бұрын
Pra calcular o RMSE no sklearn é só mudar o parâmetro 'squared' do mean_squard_error para False, como em: sklearn.metrics.mean_squared_error(y_true, y_pred, *, sample_weight=None, multioutput='uniform_average', squared=False) Obrigado pelas aulas! um abraço.
@letsdataAI
@letsdataAI 2 жыл бұрын
Boa, Germano!! Valeu, mestre!
@thiagotavares2384
@thiagotavares2384 2 жыл бұрын
Parabéns, professor. Ótima aula.
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu, Thiago!!
@wesley_breno
@wesley_breno Жыл бұрын
Adorei o conteudo!!! Didatica incrivel! 😁
@letsdataAI
@letsdataAI Жыл бұрын
Valeu demais, Wesley!! Aproveite que estamos com evento aberto, entra no letsdata.ai e participe! Abraços!
@orrafaellis
@orrafaellis 2 жыл бұрын
Muito boa a aula! Obrigado!
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu, Rafael!!!
@riptorforever2
@riptorforever2 2 жыл бұрын
Quando gosto muito da aula, ainda que eu não tenha nada relevante pra comentar, cedo a irrelevância mesmo só para contribuir com o algoritmo de recomendação do youtube.. Aulas fantásticas! Apesar de superficial, dá uma 'visão de águia' sobre o escopo da lib, a organizacao da documentacao e a praticidade do uso ^^
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu demais pela força!!!
@RafaelRivetti
@RafaelRivetti Жыл бұрын
Já tem vídeo de implementação para séries temporária? Se não tiver, faz por favor!! Seria legal usar o preço de ações em bolsa de valores. Abraço!
@letsdataAI
@letsdataAI Жыл бұрын
Tem vídeo de séries temporais! Depois nos diga se gostou!
@guilhermemartins9824
@guilhermemartins9824 2 жыл бұрын
Aula muito boa!
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu, Guilherme!!!
@tiaofilho123
@tiaofilho123 2 жыл бұрын
Muito boa a aula, León. Parabéns pela didática simples e assertiva.👍🏼 Agora só um pequeno detalhe, na parte do consumo dos veículos o de valor "mpg" máximo (46,6) seria o mais econômico e o mínimo (9,0) é que seria o "Hummer"! Você falou o contrário 😉. Abs.
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu, Tião!! Verdade! Mais milhas por galão, mais econômico, obrigado!
@DDarkoBR
@DDarkoBR 2 жыл бұрын
Professor, uma sugestão é fazer uma aula de xgboost para séries temporais.
@letsdataAI
@letsdataAI 2 жыл бұрын
Ótima sugestão!!
@DDarkoBR
@DDarkoBR 2 жыл бұрын
@@letsdataAI Graças a essa aula consegui aplicar com gs o xgboost no meu trabalho. Abs.
@letsdataAI
@letsdataAI 2 жыл бұрын
Que massa, Cairo!!! Felizes de saber que ajudou.
@benjaminrondonneto6377
@benjaminrondonneto6377 Жыл бұрын
Vc possue algum curso sobre o tema de analise de dados no panda?
@letsdataAI
@letsdataAI Жыл бұрын
Tudo bem, mestre? Temos um programa educacional completo, inclui pandas para análise de dados: www.letsdata.ai/a-jornada
@benjaminrondonneto6377
@benjaminrondonneto6377 Жыл бұрын
@@letsdataAI muito obrigado... Estou finalizando o curso introdutório sobre python e já irei me inscrever no seu curso. Quero muito aprender sobre calibragem/otimização de parâmetros para modelos preditivos.
@maikerodrigo4249
@maikerodrigo4249 2 жыл бұрын
Show de bola!
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu, Maike!!
@edwardsouza7603
@edwardsouza7603 2 жыл бұрын
Parabéns pelo vídeo! Principalmente pela "canja" de "we are the champions". kkk
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu, mestre!!!
@orafaelgf
@orafaelgf 2 жыл бұрын
Parabéns pelo vídeo e didática. Tô fazendo uma maratona no canal e ainda não encontrei algum modelo de classificação onde foi preciso balancear as classes. Caso tenha, pode indicar, por favor? Caso não, fica sugestão de vídeo. Abs e sucesso ao canal.
@letsdataAI
@letsdataAI 2 жыл бұрын
Valeu, Rafael!! Boa sugestão! A gente aqui advoga por não balancear as classes por conta de muitas evidências que não melhoram a performance do modelo e ainda se corre um grande risco de data leakage. Nossa sugestão é escolher bem uma métrica que puna mais os erros na classe minoritária. Um ótimo assunto para um vídeo, vai entrar na lista! :)
@orafaelgf
@orafaelgf 2 жыл бұрын
@@letsdataAI legal, entendi. Vou estudar mais sobre leakages e tentar descobrir modelos que lidam bem com o desbalanceamento de dados. Obrigado e sucesso.
@guimaraesalysson
@guimaraesalysson 2 жыл бұрын
Você faz por meio do parâmetro scale_pos_weight, mas é melhor usar somente nos casos em que for MUITO desbalanceado (ex. 5% x 95%). Nos outros modelos comuns você tem que balancear com undersample/oversample e treinar nessa base, mas tem essa questão do data leakage
@RafaelRivetti
@RafaelRivetti 6 ай бұрын
O bootstrap pode gerar problemas em séries temporais no sentido de alterar pontos de dados que precisam obedecer uma sequência (ordem) temporal? Isso seria um problema para modelos de bagging (como Random Forest) ao serem usados em séries financeiras como ações, butcoin, etc, alterando os pontos de dados na reamostragem?
@letsdataAI
@letsdataAI 6 ай бұрын
Excelente dúvida, Rafael, fez a gente matutar um bocado aqui 😂 Pode sim!! Como as amostras usadas no bagging são randômicas, podemos perder informação que tenha relações temporais. Não é comum tratar isso e acabamos “aceitando” porque essa problema não inviabiliza a utilização dos modelos (como seria o caso de overfitting, por exemplo). Pra resolver tem que mudar a forma de amostragem, o que normalmente não é parametrizado nos principais pacotes. Ou seja: tem que fazer “na mão”.
@ederson.madruga
@ederson.madruga 2 жыл бұрын
León, excelente aula. Obrigado. Vocês irão disponibilizar o notebook?
@letsdataAI
@letsdataAI 2 жыл бұрын
Mestre Ederson! Repositório no ar! :)
@ederson.madruga
@ederson.madruga 2 жыл бұрын
@@letsdataAI valeu LéON.
@tiaofilho123
@tiaofilho123 2 жыл бұрын
@@letsdataAI . León, onde fica o repositório deste notebook da aula?
@letsdataAI
@letsdataAI 2 жыл бұрын
Aqui!! github.com/letsdata
@guimaraesalysson
@guimaraesalysson 2 жыл бұрын
Por que transformar o target em variável quant. discreta na classificação?
@letsdataAI
@letsdataAI 2 жыл бұрын
No cross validate a API do XGBoost do scikit learn dá um erro porque ele transforma no fit mas não no predict. Deve ter outro jeito de corrigir, mas essa foi a opção mais simples que achamos.
@lucasfescina
@lucasfescina Жыл бұрын
Alguém poderia me dizer porque não precisa usar kfold nesse crossval score
@letsdataAI
@letsdataAI Жыл бұрын
Se não passar parâmetro o default é 5-fold :)
@anacarolinaghizelliniwyatt6700
@anacarolinaghizelliniwyatt6700 Жыл бұрын
boa tarde, professor. Esse notebook tá disponível em algum lugar pra gente baixar?
@letsdataAI
@letsdataAI Жыл бұрын
Tá na mão: github.com/letsdata/gradient-boosting-com-xgboost
@anacarolinaghizelliniwyatt6700
@anacarolinaghizelliniwyatt6700 Жыл бұрын
@@letsdataAI muito obrigada!!
@nandojau1
@nandojau1 Жыл бұрын
esse canal é PIÇA
@letsdataAI
@letsdataAI Жыл бұрын
😂 valeu demais! Conte com a gente
CRISP-DM: a melhor metodologia para projetos de Data Science
21:04
Matriz de Confusão | Explicação e exemplos práticos
18:12
Let's Data
Рет қаралды 9 М.
World’s strongest WOMAN vs regular GIRLS
00:56
A4
Рет қаралды 22 МЛН
MAGIC TIME ​⁠@Whoispelagheya
00:28
MasomkaMagic
Рет қаралды 38 МЛН
the balloon deflated while it was flying #tiktok
00:19
Анастасия Тарасова
Рет қаралды 35 МЛН
Introdução a Gradient Boosting
19:55
BeeData USP
Рет қаралды 2,4 М.
GUIA BÁSICO XGBOOST- ASPIRANTES A CIENTISTA DE DADOS
30:22
Eduardo | Ciência dos Dados
Рет қаралды 1,5 М.
Understanding and Applying XGBoost Classification Trees in R
17:46
Time Series Forecasting with XGBoost - Advanced Methods
22:02
Rob Mulla
Рет қаралды 128 М.
XGBoost Made Easy | Extreme Gradient Boosting | AWS SageMaker
21:38
Prof. Ryan Ahmed
Рет қаралды 39 М.
Ultimate XGBoost Tutorial in R Programming
18:38
Data Heroes
Рет қаралды 11 М.
Entenda o Algoritmo de Machine Learning Random Forest.
17:25
Tuning XGBoost using tidymodels
50:36
Julia Silge
Рет қаралды 18 М.
World’s strongest WOMAN vs regular GIRLS
00:56
A4
Рет қаралды 22 МЛН