Рет қаралды 3,174
Nesse vídeo de hoje eu vou trazer pra você um conteúdo bem bacana sobre outliers. Eu vou te mostrar aqui passo a passo e na prática uma forma muito rápida da gente identificar esses outliers.
Sabemos que os outliers são registros discrepantes que podem estar muito abaixo ou muito acima dos dados em geral que temos em nosso conjunto de dados e quando estamos criando modelos preditivos de machine learning precisamos analisar e tratar esses outliers, ou seja, esses valores discrepantes.
A gente vai utilizar o pacote Pandas do Python, o pacote Numpy do Python, o pacote Matplotlib do Python e o pacote Seaborn do Python pra gente exibir alguns gráficos para realizarmos nossas analises da forma tradicional e a gente vai utilizar um conjunto de dados pequeno que possui outliers que pra este nosso objetivo é um ótimo DataFrame.
Utilizando os métodos tradicionais como Boxplot e Scaterplots conseguimos identificar os outliers, mas se precisarmos listar esses registros temos que fazer mais alguns passos para gerar um novo DataFrame e uma lista com os outliers.
E por isso que vou mostrar pra vocês uma forma mais prática e muito mais rápida de identificarmos e listarmos esses outliers, utilizando a biblioteca PYOD do Python que possui uma série de algoritmos para identificar, analisar e tratar outliers. No nosso exemplo iremos utilizar o algoritmo KNN para calcular os outliers e também gerarmos um DataFrame somente com os outlieres, dessa forma vai facilitar e agilizar muito nosso trabalho, pois a biblioteca PYOD possui muitas ferramentas para agilizar nosso trabalho.
Compartilhe este vídeo: • Como IDENTIFICAR OUTLI...
Vídeos que também possam te ajudar:
Como fazer um modelo de Machine Learning PERFEITO em 7 ETAPAS
• Como fazer um modelo d...
Como fazer GRÁFICOS com Python - Passo a Passo
• Como fazer GRÁFICOS co...
Como AGILIZAR sua Analise de Dados com Python
• Como AGILIZAR sua Anal...
Como fazer Análise de Dados com Python para um E-COMMERCE
• Como fazer Análise de ...
Como INTEGRAR Python com SQL - Na PRÁTICA Passo a Passo
• Como INTEGRAR Python c...
COMO FAZER PREVISÃO DE VENDAS COM MACHINE LEARNING
• COMO FAZER PREVISÃO DE...
Os links abaixo são de afiliados, comprando através desses links eu ganho uma pequena comissão do site. É uma forma de você me ajudar a continuar produzindo esses excelentes conteúdos.
👍 Equipamentos que utilizo no meu dia a dia
🖥️ Monitor Dell: amzn.to/3Sj5Dvb
💻 Notebook Dell: amzn.to/3Qw2uGQ
🖱️ Mouse Microsoft: amzn.to/3Q6Xwio
🔌 Filtro de linha: amzn.to/3QuLmQP
🔋 Smart Plug Wi-Fi: amzn.to/3FxlZse
⚙️ Novo Echo Dot 5ª geração: amzn.to/473eSDL
📚 Livros que me ajudam a aprimorar meus conhecimentos
📚 Python para Data Science: e Machine Learning descomplicado: amzn.to/40agbys
📚 Microsoft SQL Server 2016 express edition interativo: amzn.to/3MhjfTM
📚 Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina: amzn.to/3MgRiLT
📚 Business Intelligence e Análise de Dados para Gestão do Negócio: amzn.to/3Mf9bdO
📚 Estatística prática para cientistas de dados: 50 conceitos essenciais: amzn.to/3rWup9H
Link para download do arquivo do Jupyter Notebook utilizado neste vídeo:
docs.google.co...
#outliers
#python
#cienciadedados