Data Science and Machine Learning - #5 Pandas
28/04/2021Neste tutorial vamos iniciar o aprendizado da biblioteca Pandas, que é uma das principais libs utilizadas na análise de dados.
Python e Pandas
Para instalarmos a biblioteca vamos rodar o seguinte comando:
!pip install pandas
Importando Libs
import numpy as np
import pandas as pd
Criando DataFrame
Abaixo estão listadas algumas formas de criar DataFrames com Pandas:
#df = pd.DataFrame([['a','b','c'],[1,2,3]])
#df = pd.DataFrame({'a':[1,2,3],'b':[5,6,7]})
#df = pd.DataFrame(np.random.randn(3,2))
df = pd.DataFrame(np.random.randint(1,10,6).reshape(2,3),
columns=['Cruzeiro','Atletico','America'],
index=['Gols','Vitorias'])
df
O DataFrame criado acima ficou assim:
Seleção de Dados
Nesta seção iremos demonstrar as formas de selecionar valores e séries do DataFrame.
type(df['Atletico'])
df['Cruzeiro']['Vitorias']
df.Cruzeiro
A diferença do método loc para o iloc é que o loc pega pelo número ou valor do índice, já o iloc pega pela posição do índice.
df.loc['Vitorias']
df.loc[['Vitorias'],['Atletico','America']]
df.iloc[1]
df.iloc[0,1:3]
Por hoje é só! Sucesso nos códigos e na vida!
Precisa de um professor? webdesignemfoco@gmail.com
Posts Relacionados
Data Science and Machine Learning - #4 Numpy II
Nesse tutorial vamos continuar falando sobre a lib Numpy que é uma das bases para a análise de dados com Python.
Data Science and Machine Learning - #6 Pandas II - Manipulando DataFrame
Nesse tutorial vamos aprender como realizar a manipulação de um DataFrame utilizando Python e Pandas.