Manipulando colunas em um dataframe pandas (Python para Machine Learning - Aula 16)

  Рет қаралды 90,571

Didática Tech

Didática Tech

Күн бұрын

Aprenda comandos úteis para manipular colunas de tabelas (dataframes pandas) nesse vídeo. Veremos como mudar os nomes das colunas (variáveis da tabela), como atribuir dados de uma coluna para outra variável, como contabilizar os valores únicos dentro de uma coluna (comando value_counts()), entre outros.
Essa é a aula 16 desse curso. Próxima aula (aula 17): • Como excluir uma colun...
Todas as aulas desse curso de Python para machine learning e análise de dados estão organizados nessa página: bit.ly/pythonp...
E também nessa playlist: • Python para Machine Le...

Пікірлер: 73
2 жыл бұрын
Olá pessoal! Liberamos CERTIFICADO para este curso gratuito. Para solicitar o seu, basta conferir o curso no link abaixo: didatica.tech/curso-de-python-para-machine-learning-e-ciencia-de-dados-gratuito/
@lukasveiga4577
@lukasveiga4577 3 жыл бұрын
O inplace não é para "ocultar" o resultado da função rename, mas para escolher se a alteração será gravada no dataframe original. O default da função é inplace=False, caso não seja alterado para True você pode armazenar as alterações em uma nova variável.
@hallysonnobres1520
@hallysonnobres1520 3 жыл бұрын
Ótima explicação, percebi essa diferença fazendo o rename. Ao dar o comando "rename" sem o "inplace = True", quando eu rodava "dados.head()" ainda estava em inglês, após colocar o "inplace = True" e dar um "dados.head()", o resultado estava em português. Não tinha entendido o motivo mas agr ficou claro cm sua explicação, muito obrigado :)
@adrielzaum
@adrielzaum 4 жыл бұрын
Apenas um detalhe ao qual temos que nos atentar: Existem nomes repitidos na lista porque um atleta pode competir por mais de uma modalidade, então seu nome aparece repetidas vezes, e isso significa que usar o comando value_counts() na coluna 'sex' não garante a amostragem de quantos atletas participaram e sim a amostragem em relação a todas as modalidades e não ao atleta como indivíduo.
@ContandooOntem
@ContandooOntem 3 жыл бұрын
Qual seria o comando para conseguir então?
@informaticateen
@informaticateen 3 жыл бұрын
Tudo bem! Parabéns pelo canal!
@izapetite
@izapetite 3 жыл бұрын
ótima didática
@irvainemacedo2892
@irvainemacedo2892 3 жыл бұрын
Obrigado amigão!
@VanessaLimaSantos95
@VanessaLimaSantos95 3 жыл бұрын
TOP TOP TOP 👏💖
@devbresilien6169
@devbresilien6169 2 жыл бұрын
Ótima aula! Como faz para reorganizar a coluna, deslocando a colunaA para ficar do lado da colunaD, por exemplo?
@thiagodias15
@thiagodias15 Жыл бұрын
Para retornar mais de 1coluna, digamos 4, usamos a notação dados[['coluna_1', 'coluna_2', 'coluna_3', 'coluna_4']]? Com colchetes duplos? Neste caso o tipo dele será um dataframe
@gersonchadijunior7499
@gersonchadijunior7499 3 жыл бұрын
No caso do .value_count(), de for desejado fazer plotagem de gráfico, sem cdúvida, o mais interessante é usar groupby
2 жыл бұрын
Ótima aula. Deixa eu tirar uma dúvida, Tenho 8 lista com 35 valores cada uma. Como faço para importar cada uma dessas listas para uma planilha xlsx , distribuindo esses valores em 5 colunas e 7 linhas, e posteriormente, salvando esse arquivo. Valeu!
@patrickrattes
@patrickrattes 3 жыл бұрын
Inplace é para gravar as alterações.
@estudanton
@estudanton 2 жыл бұрын
como ficaria caso eu quisesse por exemplo "Comparar 2 colunas, caso seja Falso (Não seja igual) retornar o valor da célula que não é igual" como é feito isso?
@raquelpereira3733
@raquelpereira3733 2 жыл бұрын
Muito bom! Uma dúvida, eu consigo multiplicar mais de uma coluna de uma vez? Por exemplo : teste['coluna 1', 'coluna 2'] =teste['coluna 1', 'coluna 2']*dados['coluna'] Esse dados seria outro dataframe
@azizconsultoria
@azizconsultoria 3 жыл бұрын
olá, não quero fazer nenhuma malandragem, mas preciso descobrir o email de uma pessoa que está num site, tem como usar esse metodo para entrar no banco de dados? teria um outro video especifico? obrigado
@informaticateen
@informaticateen 3 жыл бұрын
Estou usando um dataframes com muitas linhas... consigo transferir as definições das colunas, nomes e tal... para a parte inferior do df? Pois não consigo visualizar quando ele roda, diante da quantidade de linhas... desde já obrigado
@aureamarjosegarciarocha1322
@aureamarjosegarciarocha1322 3 жыл бұрын
tem alguma função para diminuir a quantidade de casas decimais depois da função describe()?
@andonythespinoza7991
@andonythespinoza7991 3 жыл бұрын
Não sei se serei respondido. Mas, se eu escolher certas columnas, e preciso apagar o resto, como eu faria?, teria que usar o "dados.drop" em cada columna?. Vou resaltar que são 101 columnas, e só preciso de 4 kkk.
@Rafael-Neris
@Rafael-Neris 3 жыл бұрын
Ola, todos os meus nomes das colunas ficaram como Unnamed, como posso alterar isso?
@mybiblebrasil4308
@mybiblebrasil4308 4 жыл бұрын
Gostei muito da aula. A unica dúvida que fiquei foi como gravar as substituições feitas no arquivo csv?
@andrevictorxavierpires
@andrevictorxavierpires 4 жыл бұрын
Dataframe1.to_csv('nome do arquivo')
@lucianotome8627
@lucianotome8627 3 жыл бұрын
boa tarde. ao tentar dar o comando value_counts aparece o erro: list indices must be integers or slices, not str. tentei fazer a mudança de str para int. mas sem sucesso.
@aureamarjosegarciarocha1322
@aureamarjosegarciarocha1322 3 жыл бұрын
Parabéns pelas aulas! tenho uma duvida, depois de usar as função - ex.: dados['City'].value_counts(), como posso usar o retorno desses valores para fazer comparações?
@ygorholowka2211
@ygorholowka2211 4 жыл бұрын
Olá, como eu separo um conjunto de dados específico de uma coluna usando como condição o valor em outra coluna ?
@nettoork5216
@nettoork5216 5 жыл бұрын
Caramba, os velhinhos eram loucos kkkkkk file.loc[file['Age'] >= 96]
@akronotecinfo1036
@akronotecinfo1036 5 жыл бұрын
kkkkkkkkkkkkkkkkkkkkkkkkkkk também testei isso kkkkkkk
@akronotecinfo1036
@akronotecinfo1036 5 жыл бұрын
tu comentou isso a um mês atrás, prosseguiu com os estudos? se sim, pode dar dicas de por onde anda estudando?
@nettoork5216
@nettoork5216 5 жыл бұрын
@@akronotecinfo1036 Ah, infelizmente não, estava ocupado com estudos (ainda estou no 2º ano do ensino médio, aí estava nessa de Enem e etc), mas pretendo no futuro assistir à playlist nova do canal sobre TensorFlow, parece ser interessante. De resto, só pesquisando mesmo... Estou na mesma que você kkkkk, bons estudos!
@akronotecinfo1036
@akronotecinfo1036 5 жыл бұрын
@@nettoork5216 É no ensino médio que percebemos o quão escasso é o nosso tempo, né? sdhayudadsy Enfim, boa sorte nos estudos para você também!
@lorebas12
@lorebas12 3 жыл бұрын
alguem consegue me ajudar? coloquei o seguinte codigo: import pandas as pd dados = pd.read_csv('C:/Users/elizeu/Desktop/Curso MachineLearning/arquivo2.csv') dados.rename(columns={'Name':'Nome'}) print(dados) Estou usando o vs code, e na aba de "saída", que é onde vejo os resultados dos códigos, não está aparecendo a coluna "Name", está tudo muito colado, não aparece nem duas colunas
@iOiOf7
@iOiOf7 2 жыл бұрын
Em vez de colocar o NOME da coluna, teria como coloar a posicao dela ? tipo [0,1] ?
@gabrielsantos-mo2nu
@gabrielsantos-mo2nu 2 жыл бұрын
não
@pijiyx
@pijiyx Жыл бұрын
​@@gabrielsantos-mo2nusim
@laurianops
@laurianops 4 жыл бұрын
parabéns pelo vídeo, as modificações no dataset são sequenciais, ou seja, a mudanca 2 vai sobrepor a mudança 1 .. ? e uma outra dúvida, essas alterações realizadas no dataset atraves do pandas são atualizadas no arquivo local ? grato
@andrevictorxavierpires
@andrevictorxavierpires 4 жыл бұрын
Pra modifcar o arquivo use Dataframe1.to_csv('nome do arquivo')
@klaussantos4712
@klaussantos4712 4 жыл бұрын
E se eu quiser trocar o nome nas linhas, por exemplo: onde tem 'Gold' da coluna Medal colocar 'Ouro', 'Silver' trocar para 'Prata' ??
@Vanderson818
@Vanderson818 3 жыл бұрын
Tem várias formas de se fazer isso. Acredito que a mais simples seja com "replace". dados.apply(lambda x: x.replace('Golden', 'Ouro'))
@leonardomelo5776
@leonardomelo5776 2 жыл бұрын
Tem como transformar linha em head?
@gabrielsantos-mo2nu
@gabrielsantos-mo2nu 2 жыл бұрын
que?
@pedroaocdev9402
@pedroaocdev9402 3 жыл бұрын
o meu nao mudou nada nessa parte de renomar
@dwj6506
@dwj6506 2 жыл бұрын
Existe a possibilidade de modificar os valores de uma coluna formada por uma string 0,08k para 0,08*1000, ou seja 8?
@gabrielsantos-mo2nu
@gabrielsantos-mo2nu 2 жыл бұрын
sim mano, se toda a coluna estiver nessa contagem é só multiplicar toda ela por 100 para conseguir um inteiro, mas o python ainda deve ler como float e colocar 8.0
@arthuranselmo7144
@arthuranselmo7144 4 жыл бұрын
Parabens pela série de vídeos. Eu tenho uma dúvida. Estou com uma base de dados que é relativa aos inscritos do enem de 2016. Ela têm muitas linhas, mas tbm têm muitas colunas, quando tento ver quais são as colunas (usando head) o próprio Jupyter omite algumas (substituindo-as por reticencias). O que fazer para ver todas?
4 жыл бұрын
pd.set_option('display.max_columns', numero_colunas_desejado)
@francisko369
@francisko369 4 жыл бұрын
Gostaria de saber como juntar dataframes, ou seja, no video ele separou parte da tabela, para criar una nova; supondo que foi dividida em várias partes, mas depois seria necessário juntar de novo, como seria?
4 жыл бұрын
Procura pela função concat do pandas
@cristianoliveira426
@cristianoliveira426 3 жыл бұрын
pq quando eu coloco : dados['Height'] aparecem só as primeiras cinco e as últimas cinco linhas e não todas as mais de 200 mil linhas? 0 China 1 China 2 Denmark 3 Denmark/Sweden 4 Netherlands ... 271111 Poland-1 271112 Poland 271113 Poland 271114 Poland 271115 Poland Name: País, Length: 271116, dtype: object
3 жыл бұрын
Usa o código: pd.set_option('display.max_rows', None)
@cleciopedra
@cleciopedra 4 жыл бұрын
Boa tarde, como faço para ver duas colunas no resultado ?
@gabrielzonatto1386
@gabrielzonatto1386 4 жыл бұрын
Descobriu?
@lucaskpinheiro5998
@lucaskpinheiro5998 2 жыл бұрын
Usa .loc[ : , [ 'NOME DA COLUNA1' , 'NOME DA COLUNA2' ] ] Onde está os dois pontos vazios é para as linhas(não interfere sobre as colunas), neste caso está chamando todas as linhas daquelas colunas
@matheusfilipemartins8309
@matheusfilipemartins8309 4 жыл бұрын
No Colab; from google.colab import files uploaded = files.upload()
@laurianops
@laurianops 4 жыл бұрын
verdade, uso o colab, usei pouco o jupiter .
@joaomarcosn.dasilva7069
@joaomarcosn.dasilva7069 4 жыл бұрын
Boa noite. Eu puxei um arquivo .csv pra fazer análises usando o pandas, porém o arquivo contem uma única coluna, porém essa única coluna é composta por outas 7 mais que seriam úteis para análises. Qual comando eu uso pra converter. tentei de tudo: set_index e atá agora não consegui!
4 жыл бұрын
Sem ver o arquivo fica difícil, mas você pode tentar o comando split(): df['coluna'].str.split(expand=True)
@cassianofb5730
@cassianofb5730 4 жыл бұрын
Talvez de para usar o comando texto para colunas do Excel, busca no youtube ou no google que é razoavelmente fácil de usar, espero que te ajude.
@marcostadeudosreis
@marcostadeudosreis 5 жыл бұрын
Como faço para juntar valores de duas ou mais colunas? não é somar nem multiplicar. Por exemplo : valor 1, valor 2, valor 3 em uma unica coluna ficaria 123
5 жыл бұрын
Oi Marcos, nesse caso você pode somar dataframes usando a função map(). Esse artigo tem bons exemplos: datatofish.com/concatenate-values-python/
@marcostadeudosreis
@marcostadeudosreis 5 жыл бұрын
Obrigado pelo dica foi muito util
@jairojsf
@jairojsf 5 жыл бұрын
Esta dica também me ajudou muito @
@netoalves9211
@netoalves9211 4 жыл бұрын
Se o meu Data frame tiver muitas colunas, como faço para mostrar todas?
4 жыл бұрын
Colunas: pd.set_option('display.max_columns', None) Linhas: pd.set_option('display.max_rows', None)
@acoliveira91
@acoliveira91 4 жыл бұрын
Gostaria de saber se é possível usar o count.values com duas variáveis. Exemplo: Quantas medalhas de ouro ganharam por cidade? Também como contar quantos atletas únicos ganharam medalha de ouro. Se tiver isso em outra aula, poderia me indicar? Suas aulas são Incríveis!!! Muito Obrigada!!!
@leonardovasconcelos349
@leonardovasconcelos349 3 жыл бұрын
Oi, acho que não precisa mais, mas tá aqui: df = df.drop_duplicates(subset="city")
@hakku001
@hakku001 3 жыл бұрын
Ta e como eu faria pra pegar apenas 1 nome de uma coluna, literalmente so o nome Joao. Pq eu quero atribuir esse João a uma variável, então não preciso do resto
@LofilabLofiHipHop
@LofilabLofiHipHop 4 жыл бұрын
06-02-21
@BetoWagner
@BetoWagner 3 жыл бұрын
Nan = not a number
Seu primeiro código de Machine Learning com Python!
28:57
Didática Tech
Рет қаралды 108 М.
When you have a very capricious child 😂😘👍
00:16
Like Asiya
Рет қаралды 18 МЛН
It works #beatbox #tiktok
00:34
BeatboxJCOP
Рет қаралды 41 МЛН
Support each other🤝
00:31
ISSEI / いっせい
Рет қаралды 81 МЛН
Exercícios - Estruturas I e II
14:23
Professor Elmo Fernandes
Рет қаралды 34
Learning Pandas for Data Analysis? Start Here.
22:50
Rob Mulla
Рет қаралды 136 М.
Conditional Formatting with Pandas and Python | Excel Hacks
14:00
SATSifaction
Рет қаралды 38 М.
Cientista de Dados do ZERO ao AVANÇADO em UMA hora! (Projeto completo)
1:04:05
Introdução ao Pandas no Python - [SAIA DO ZERO EM 1 AULA]
50:59
Hashtag Programação
Рет қаралды 284 М.
Exploratory Data Analysis with Pandas Python
40:22
Rob Mulla
Рет қаралды 527 М.
When you have a very capricious child 😂😘👍
00:16
Like Asiya
Рет қаралды 18 МЛН