Please enable JavaScript.
Coggle requires JavaScript to display documents.
Python do Zero ao DS, Módulo 02, Módulo 03, Módulo 05, Módulo 06, Módulo 1…
Python do Zero ao DS
Módulo 02
Tipos de variáveis em Python
Numérica (Inteiro, float)
Int
Valor sem vírgula inteiro
Float
Valor com vírgula Float
Categórica (characters, string)
"o" "m" - "meigarom"
Dates (date, timestamp)
Date: Ano-Mes-Dia
Timestamp: Ano-Mes_Dia H:M:S
Manipulação de Dados
Criar
Linhas e Colunas
Deletar
Linhas e Colunas
Selecionar
Pelo nome das colunas
Pelo índice das colunas
Dados[linhas,colunas]
.iloc = se precisar o index das linhas e colunas, eu preciso usar o iloc
Pelo índice das linhas e pelo nome das colunas
loc
Pelo índice booleano (True e False)
Os tipos de variáveis
Precisa de um nome e um tipo
Boas práticas para criar nome de uma função
"Snake Case"
house_price
Minúscula por anderline
Palavras que realmente significam o que tem
"Kamel case"
HousePrice,
Letras maiúsculas
Primeira coisa é identificar os tipos da variável
dtypes
Ou tudo Int """""32""" ou coloca tudo int """"64"""
Função
sequencia de comandos
recebe uma entrada > devolve uma saída
Módulo 03
Operações
Contagem.
Mínimo.
Máximo.
Soma.
Média.
Mediana.
Desvio Padrão.
4 estruturas de dados mais usadas no python
Lista
Dataframe
Armazenam dados na forma tabular
com nomes nas linhas e colunas
Armazenam dados na forma tabular com nomes nas linhas e colunas
Precisam de um nome.
Estrutura de Dados -
Dataframes
Um dataframe vazio
df = pd.DataFrame()
Um dataframe a partir um dicionário
data = {'size': ['P', 'M', 'G'], 'price': [139.90, 89.90, 29.90], 'color': ['black', 'red', 'white'] }
df = pd.DataFrame( data )
Tuples
Dicionário
Quarda as informações em estrutura de chave-valor
Precisa ter chave {}
Precisam de um nome
Ex:
dict = {‘chave01’: valor01, ‘chave02’: valor02, ‘chave03’: valor03, ‘chave04’: valor04 }
skirt = {'size': 'M', 'price': 139.90, 'color': 'black'}
skirt = {'size': 'M', 'price': 139.90, 'color': 'black', ‘launch_date’: ’2020-01-01’}
acesso aos valores
via chave
skirt['size']
skirt['color'][0]
um dicionário vazio
skirt = {}
Adicionar valores
skirt['category'] = 'bottom'
groupby
sequência de 3 tarefas (separar, aplicar, combinar) faz um filtro
conda install -c conda-forg jupyter_contrib_nbextensions
Módulo 05
Código Junior
Faz código macarrônico
Faz código só para ele ninguém mais entende.
Não as estruturas de dados corretas, acho que tudo é dataframe
Não usa funções.
Não organiza seus códigos de forma lógica e simples ( a lógica só está na cabeça do Junior ) :
Código Senior
Faz código modular.
Faz para código para o seu time e a sua empresa.
Sabe exatamente quando usar as estruturas de dados.
Usar funções para modular e escalar o código, mas com sabedoria.
Seus códigos parecem livros.
Dashboards interativos na Web
Stream Lit
Funções
Módulo 06
Linhas
crescimento ou decaimento
barra
comparar proporção
Tabela
exploração e comparação
pizza
Até dias comparações
Módulo 1
Problema do Negócio
O que a Empresa faz?
Plataforma de compra e vendas de imóveis
Principal estratégia
Fontes externas para encontrar bons negócios
Perguntas do CEO
Quantas casas podem ser compradas
Quantos atributos as casas possuem? (número de quartos, banheiros, etc)
Quais os atributos
Qual a casa mais cara do portfólio?
Qual a casa com o maior número de quartos?
Solução do Negócio
Planejamento do Produto Final
Planejamento do Processo
Onde está a info? (excel, VD, API, manual)
Como coletar as informações (SQL, Python, Streamlit
Responder as perguntas
Qual a casa com o maior número de quartos?
Contar o número de linhas pela coluna número de quartos
Quais os atributos
Mostrar o nome das colunas
Quantos atributos as casas possuem? (número de quartos, banheiros, etc)
Contar o número de colunas do conjunto de dados
Qual a casa mais cara do portfólio?
Ordenar as linhas pela coluna de preço
Quantas casas podem ser compradas
Contar o número de linhas do conjunto de dados
Planejamento das Ferramentas
Python
1) O que eu preciso fazer
2) Qual função faz pra mim
3) Qual biblioteca tá armazenada?
Módulo 04
Laços
Laço For
Aplica transformações de dados em intervalos escolhidos pelo time de negício
É necessário conhecer o tamanho do laço (até quando eu vou repetir os comandos)
Laço While
Infinito, por isso tem que saber sair do WHILE pra não queimar a memória do computador
else:
break
Laços
Compara as linhas até que a condição seja satisfeita
1> 0 and < 10 = balao
1>11 and < 20 = balao azul
Estruturas de Controle
Listas
Possui valores numéricos, categóricos
Valores são mapeados por posição
a = [ 2, 3, 4, 5, 6, 7] -> valores
0 1 2 3 4 5 -> posições
a[0]
lista de números
lista de strings
lista de lista
lista de números + strings
como adicionar um novo elemento
.append(59) Sempre coloca um elemento no final da lista
.insert(4, 49) Coloca na posição de escolha (Posição, valor)
len(data) Como medir o tamanho da lista
Tuples
Aula avançada (SQL + Python)
Estrutura de Controle
Condicional
igual
Maior
Maior ou igual
menor
Menor ou igual
OR
|
AND
&
Módulo 08
Etapas de um projeto de Ciência de Dados
Questão de negócio
Entendimento do Negócio
Coleta de Dados
Limpeza de Dados
Exploração de Dados
Modelagem de Dados
Aplicação dos algoritmos de Machine Learning
Avaliação da Performance dos Modelos
1 more item...
Projeto do tipo de Insights
Questão de negócio
Entendimento do Negócio
Coleta de Dados
Limpeza de Dados
Exploração de Dados
Módulo 07
Streamlit