Data Science and Machine Learning - #2 Conceitos de Python e EstatÃstica
18/04/2021No tutorial de hoje relembraremos alguns conceitos fundamentais de estatÃstica que servirão de base para a aplicação da ciência de dados e aprendizado de máquina.
EstatÃstica com Python
DataFrames
DataFrames são matrizes multidimensionais formadas por colunas e linhas e seus respectivos Ãndices.
Séries
Série é o conjunto formado por uma coluna e seus respectivos Ãndices. Um conjunto de séries forma um DataFrame.
Listas, Tuplas e Dicionários
Listas e tuplas são conjuntos unidimensionais de dados no Python, sendo as listas representadas por [] e as tuplas por (). A diferença entre as duas é que as tuplas são imutáveis.
Dicionários por sua vez, são conjuntos de dados multidimensionais.
Média, Mediana, Moda e Desvio Padrão
Média é a soma dos valores dividido pela quantidade de valores.
Mediana é o valor que divide o conjunto de dados ao meio.
Moda é o valor que mais aparece no conjunto de dados.
Desvio padrão é a relação entre os dados e a diferença para a média desses dados.
Gráficos
� muito importante saber selecionar corretamente o gráfico para ilustrar bem o seu conjunto de dados.
Por hoje é só! Sucesso nos códigos e na vida!