Data Science and Machine Learning - #38 Projeto Completo (Plotagem de Dados)
21/04/2022Na aual de hoje aprenderemos como plotar gráficos dos dados através do Seaborn e Matplotlib utilizando como linguagem de programação o Python.
Gráficos - Data Science
Vamos utilizar o pairplot para ter uma visão geral dos dados:
sns.pairplot(df)
Vamos ver também o mapa de calor para verificar as relações existentes:
plt.figure(figsize=(12,8))
sns.heatmap(df.corr(),annot=True)
Podemos também ampliar a análise dos dados utilizando o jointplot
sns.jointplot(data=df,y='median_house_value',x='median_income',kind='reg')
sns.jointplot(data=df,x='median_house_value',y='total_rooms_per_households',kind='reg',ylim=20)
Verificaremos agora um gráfico para demonstrar a relação indiretamente proporcional entre latitude e longitude:
df.plot(kind='scatter',x='longitude',y='latitude',alpha=0.4,c='median_house_value',cmap=plt.get_cmap("jet"))
Como percebemos outliers na quantidade de cômodos, podemos limitar a média de cômodos encontradas, no caso 20 cômodos:
df[df['total_rooms_per_households']>20].shape
df.drop(df[df['total_rooms_per_households']>20].index.to_list(),axis=0,inplace=True)
df.shape
sns.jointplot(data=df,x='median_house_value',y='total_rooms_per_households',kind='reg')
Por hoje é só! Sucesso nos códigos e na vida!
Posts Relacionados
Data Science and Machine Learning - #37 Projeto Completo (Preparação dos Dados)
Nesse tutorial vamos preparar o nosso Data Frame para que apresente dados concretos para o posterior uso do Machine Leaning.
Data Science and Machine Learning - #39 Projeto Completo (Entendendo o Machine Learning)
Nesse tutorial vamos fazer uma análise dos objetivos e dos passos que trabalharemos para verificar qual bairro podemos investir para ter o maior retorno.