Please enable JavaScript.
Coggle requires JavaScript to display documents.
Estatística, Fant = frequência simples anterior, MPSC, Pode ser repetido…
Estatística
probabilidade
-
La Place
-
frequência relativa: quando o número de realizações do experimento tende ao infinito. Definição limitada a número de eventos que pode crescer indefinidamente.
-
-
-
amostragem
-
-
-
definições :warning:
Parâmetro (θ)
definição: medida que descreve alguma característica numérica da população. É sempre constante, invariável.
-
-
amostragem: processo de seleção de uma amostra [representativa] que permite tirar conclusões sobre a população.
-
probabilidade2
probabilidade :red_flag:
definição: igual incerteza sobre o resultado. Determinável número de possibilidades e evento favorável.
léxico
experimento: pode ser repetido sob as mesmas condições inúmeras vezes e os resultados não podem ser previstos com absoluta certeza.
-
-
-
combinações
A∩B ocorre se e somente se os dois eventos ocorrerem. Ocorrência de x ou y eventos: ocorrência de um número par ou ímpar.
-
A U B Ocorre se e somente se A ou B ou ambos ocorrerem. Ocorrência de x e y eventos: ocorrência de um número par e ímpar.
-
-
-
-
medidas
posição :red_flag:
-
tipos
tendência central
-
-
definição: promédias, em torno desses valores que os dados observados tendem a se concentrar.
separatrizes
quartis, decis e percentis
-
-
-
mediana
definição: valor que separa um rol em duas partes com a mesma quantidade de ocorrências (frequências acumuladas).
-
-
dispersão :red_flag:
definição: avaliam o grau de variabilidade dos valores de uma variável em relação a um valor fixo escolhido como referência.
tipos
absolutas
-
-
-
desvio padrão :red_flag:
definição: indica, em termos absolutos, o afastamento dos valores observados em relação à ma estudada.
-
-
-
relativas
-
-
Pearson :red_flag:
definição: quociente entre S e Ma. Medida de dispersão relativa, adimensional. Assim, pode ser apresentada em forma percentual. Serve para comparar dispersões de duas séries.
-
-
-
Regressão
Simples :red_flag:
correlação linear
definição:Gráfico granulado que pode aparentar ter uma reta chama-se gráfico de dispersão. Se houver a aparente linha, afirma-se correlação linear entre as variáveis.
-
regressão :warning:
definição: Nos casos em que existe relação linear (grau forte), a expressão matemática que relaciona Y em função de X.
-
-
-
-
-
Múltipla :red_flag:
Definição: uso de diversas variáveis explicativas. 𝛽i são coeficientes parciais de regressão e 𝜀 é o erro.
consideração: O número de observações da amostra deve exceder o número de variáveis explicativas por pelo menos 2.
pressuposições
-
-
-
Erros têm distribuição normal. Nenhuma relação linear (multicolinearidade) pode existir entre as variáveis independentes.
-
-
teste ANOVA
para testar pelo menos uma das variáveis explicativas (independentes) está relacionada com a variável explicada (dependente).
-
Amostragem
amostragem :red_flag:
-
-
léxico
-
estatística (^θ): estimador é uma função matemática (fórmula) de seus elementos, expressão matemática obtida a partir dos valores da amostra
-
erro amostral (𝜀): ^𝜃 - 𝜃 O valor do estimador varia em cada uma das possíveis amostraas tiradas da população. Assim, trata-se de uma variável aleatória com distribuição igual a da população.
tipos de amostragem
probabilísticas
2.por estratificação: divide-se a população em estratos (sub-conjuntos) e aplica-se amostragem simples
3.conglomerados: contrário da estratificação. Ex: salário entre montadoras apresentam baixa variabilidade, contudo, dentro de cada montadora há uma grande variabilidade.
-
-
não probabilísticas
2.por julgamento: entrevistador buscará por elementos que possuem características definidas de acordo com seu interesse.
3.por cotas: Na amostragem por cotas, a amostra extraída de cada estratificação é selecionada por um método não probabilístico.
1.por conveniência ou disponibilidade: sem relação com perfil do entrevistado, meramente facilidade.
-
Variáveis aleatórias
discretas :red_flag:
-
características
Média da função de probabilidade (esperança) E(X): basta multiplicar cada valor pela respectiva probabilidade e somar.
-
-
-
𝑣𝑎𝑟(𝑋 + 𝑌) = 𝑣𝑎𝑟(𝑋) + 𝑣𝑎𝑟(𝑌) + 2 ∙ 𝑐𝑜𝑣(𝑋, 𝑌)
-
-
-
-
Pode ser repetido sob as mesmas condições “n” vezes. Resultados não poderão ser previstos com absoluta certeza. Contudo, é possível descrever espaço amostral.
-
-
-
-
-
Ex: 54x cara em 200 arremessos de moeda. Com a repetição ao infinito, a tendência é uma distribuição equitativa (50%).
-
-
-
-
-
-
-
-
-
-
De 7 em 7, 10 em 10, 50 em 50.
-
-
A diferença entre a amostragem por cotas da estratificada é que esta aplica uma amostragem aleatória simples em cada estrato. Na por cotas, amostra é selecionada por método não probabilístico.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
Pode ser unimodal, bimodal, multimodal ou amodal.
Estimar a representatividade de uma média: valores concentrados em torno de uma média tem maior valor resumitivo da série.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
Simplificação: 1.aplica-se divisão para todos os pontos médios da série 2. obtém-se o resultado da medida de dispersão desejada 3.multiplica-se o resultado pelo mesmo fator de divisão
A=(2,3,5) e B=(40,41,43) tem S iguais. r=38.
-
-
-
-
-
S, só quando medidas e médias similares.
-
-
Cálculo pp.13-15 #malmente, a ques#
Quanto mais próximo do extremo do intervalo r, maior a força. Mais ao centro (0), menor. O sinal só indica a relação direta/gráfico crescente (+) ou inversa/ gráfico decrescente (-).
Mede-se a relação linear entre duas variáveis, não significa relação causa e efeito.
-
Indica se ela é crescente (m>0), decrescente (m<0) ou constante (m=0).
-
pura assim, há erros (desvios) cometidos entre valores observados e estimados de Y.
-
Calculado, “a” vem por tabela.
Em resumo, testar se a variável explicativa (independente) está relacionada com a variável explicada (independente).
O teste de hipóteses trabalhado pela Análise de Variância está relacionado ao coeficiente angular 𝛽.
-
diferença entre o valor que o modelo de regressão prevê ^Yi e o valor de médio Y. SQM=Σ(^Yi-Y)² ou bx[(Xi-X)(Yi-Y) ou b²*Σ(Xi-X)²]
-
Próximo de 1: grande parte da variação de Y é explicada pelo modelo de regressão linear. Próximo de 0: correlação fraca, baixa explicação.
O coeficiente de determinação exprime a proporção da variação total de Y que é explicada pela reta de regressão.
-
Uma prática comum para a regressão múltipla é calcular o coeficente de determinação ajustado, simbolizado por R². Esta estatística ajusta a medida da força de explicação para o número de graus de liberdade. O coeficiente de detrminação ajustado é obtido dividindo SQR e SQT pelos respectivos graus de liberdade.
R_²i= [1 – SQR / (n-2)] / SQT / (n-1)
-
-
-
Quando o modelo de equação f(x) = mx, a ausência de 'p" indica origem
-
-
-
-
-
-
t: Exponencial, indica a operação de transposição.
As estimativas de máxima verossimilhança coincidem com as estimativas de mínimos quadrados, desde que a distribuição de erros seja normal.
-
-
Parâmetros populacionais importantes: média, variância e desvio padrão.
Estimadores importantes: média amostral (x_), variância amostral (s²), desvio padrão amostral (s) e coeficiente de correlação (r).
Ex: (1,3,7,9) 𝜇=5 (2,4,4,8) 𝜇=4,5
Como o estimador ^𝜃 é uma variável aleatória, podemos calcular a sua média (esperança) e sua variância.
-
Método: divide-se a população em conglomerados, sorteia-se conglomerado(s) e entrevista todos os elementos daquele conglomerado.
Pode ser por ordem alfabética, por exemplo. Amostra de altura para mil alunos selecionando de 20 em 20.
diferente da probabilística pro estratificação em que se aplica aleatória simples para selecionar nos estratos.
-
Distribuição amostral com reposição: mesma da população, mesmos possíveis elementos com mesmas probabilidades. Coleção de variáveis aleatórias independentes e identicamente distribuídas.
-
-
-
Assim, 𝑋é uma variável aleatória. A média em torno dos quais devem variar os possíveis valores de 𝑋 éa própria média da população. Ademais, a variância com que 𝑋se dispersa em torno de sua média é 𝑛vezes menor do que a variância populacional de onde é retirada a amostra.
-
-
Média amostral é aquele que possui a menor variância possível: minimiza desvios, estimador de mínimos quadrados.
-
-
-
-
-
-
-
se houver número par de termos, Ma dos termos do meio.
-
-
A Correção de Bessel corresponde à divisão por n−1 e não por n, no cálculo da variância amostral (s²)
-
-
valor máximo para o bigode é 1,5x amplitude box plot
-
-
padrão ou reduzida: ponto médio é igual a zero e variância e (decorrentemente) desvio padrão = 1 ∴ N(0,1) μ=0 𝝈²=1
-
-
-
-
- P(RejH0/H0éV)=α. Nível de significância.
-
Desvio médio: variabilidade dos dados em torno da média aritmética, representatividade da média.
Desvio padrão: representa o quanto um conjunto de dados é uniforme ou o grau de dispersão do conjunto. Mais próximo de zero, mais homogênea. Homogeneidade do conjunto.
Coeficiente de variação: variabilidade dos dados estatísticos excluindo a influência da ordem de grandeza da variável. DP para mesma ordem de grandeza.
-
-
Não existe fórmula que relacione α e ẞ. Ou seja, α + ẞ = 1 ou qualquer outro valor é falso.
-
-
Erro padrão de X_ é o desvio padrão da média amostral, 𝝈/√n.
-
-
Quando não se tem o desvio padrão da população mas a amostra é grande, pode-se utilizar o 𝝈 da amostra. Nesse caso, x_ ± To*s/√n. To≅Zo. Nível de confiança: 95% z=1,96. Nesse caso, o grau d liberdade é n-1.
-
Variáveis aleatórias são representadas por letras maiúsculas (X) e seus valores, por minúsculas (x). Variável aleatória X (nº de filhos) assume um valor numérico x (7 filhos).
-
Cov(X,Y) = Σ (Xi - ^X)*(Yi - ^Y) / n-1
-
Se forem independentes, cov (X,Y) = 0. Contudo, cov 0 não quer dizer necessariamente que sejam independentes.
Verdade absoluta, independente da dependência ou independência entre as variáveis.
-
-
-
-
-
-