Curso de Métodos Inferenciais

Venha conhecer os conceitos estatísticos que são a base da ciência de dados, com aplicações práticas do dia a dia e ensaios sobre o processo legislativo e a Ciência Política. Neste curso você aprenderá a formular as perguntas corretas, fazer inferências estatísticas e publicar resultados por meio do método científico.

Linha do Aprendizado

Aula 1

Boas-vindas

Neste primeiro encontro apresentarei os objetivos do curso, a estrutura de aulas e os principais desafios para os alunos.

Aula 2

Pesquisa Estatística

Introduz os conceitos da Ciência de Dados, métodos de análise, coleta de dados, variáveis, tipos de variáveis, método científico, formulação de perguntas de pesquisa e hipóteses.

Estatística Descritiva

Descreve técnicas de apresentação de dados: tabelas de distribuição de frequências, histogramas, medidas de tendência central (média, moda e mediana), medidas de dispersão (amplitude, amplitude interquartil, variância, desvio padrão e coeficiente de variação), distribuições simétricas e assimétricas, achatamento ou curtose.

Primeiros comados no R

Nesta aula utilizamos abordagem prática para apresentar as primeiras instruções do R utilizando o ambiente RStudio.

Estatística Descritiva na prática

Este é o primeiro laboratório em que aprenderemos como reproduzir as técnicas de estatística descritiva utilizando scripts de código R e a tecnologia Markdown.

Função de Densidade de Probabilidade

Nesta aula você aprenderá como migramos das nossas distribuições de frequência discretas, representadas por histogramas, para o modo contínuo, representado por funções de densidade de probabilidade. Veremos como calcular probabilidades por meio da integração das funções de densidade de probabilidade em intervalos determinados e conheceremos o conceito de curva normal padrão.

Áreas sob a Curva Normal

Neste laboratório você conhecerá funções do R para o cálculo de probabilidades sob a Curva Normal: Curva Normal - script dnormal(); Curva Normal Padrão - script dnormalp(); funções pnorm, qnorm, rnorm e dnorm.

Inferência Estatística

Nesta aula você aprenderá os conceitos que formam a base da inferência estatística:

- Assintotismo.
- Lei dos Grandes Números.
- Teorema Central do Limite.
- Intervalos de Confiança.

Teorema Central do Limite na prática

Nesta aula o funcionamento do Teorema Central do Limite será mostrado por meio de simulações na linguagem R.

Teste de Hipótese

Nesta aula apresentaremos os passos do método científico, os conceitos de hipótese e teoria, o princípio da falseabilidade, como elaborar a pergunta de pesquisa e formular hipóteses, como testar as hipóteses, identificar os tipos de erro e, por fim, como estimar a força do teste.

Lab 4

Teste de Hipótese na prática

Neste laboratório você conhecerá a função dnormalComp() escrita em R para comparar médias de duas amostras. A função reproduz as respectivas distribuições normais, regiões críticas e intervalos de confiança, provendo uma representação gráfica do teste de hipótese que auxilia na compreensão dos conceitos teóricos. 

Aula 8

Teste t-Student

Nesta aula estudaremos a estística t, a distribuição de Student e como são definidos os intervalos de confiança para a realização de testes de hipótese. Serão apresentados os testes de grupos pareados e de grupos independentes, com variâncias iguais ou diferentes. Também serão apresentados os testes de Shapiro-Wilk e Kolmogorov-Smirnov para verificação da normalidade de uma distribuição de dados.

Lab 5

Teste t-Student na prática

Neste laboratório você aplicará o teste t-Student para comparar: a média da população e a média de uma amostra; as médias de duas amostras independentes; e as médias de duas amostras pareadas.

Aula 9

Correlação e Regressão Linear

Nesta aula estudaremos a Correlação Linear e o modelo de Regressão Linear. Veremos o algoritmo dos mínimos quadrados e como interpretar os coeficientes de regressão. Aprenderemos como a adição do erro gaussiano se insere ao modelo e estabelece as premissas de qualidade. Por fim, definiremos o conceito de Coeficiente de Determinação e os fatores de incerteza associados à predição de valores.

Lab 6

Regressão Linear Simples na prática 

Neste laboratório são propostos exercícios de regressão linear com os objetivos de: estimar os coeficientes de regressão; plotar o gráfico de dispersão e a reta de regressão; plotar o histograma dos resíduos e o gráfico dos resíduos em função do preditor; determinar o valor esperado para certos valores do preditor; verificar o valor de R2; determinar as bandas de confiança e de predição.

Aula 10

Regressão Linear Múltipla

Nesta aula você conhecerá o modelo linerar geral e como os coeficientes de regressão são expressos em termos dos resíduo da regressão pela origem dos regressores dois a dois e de cada regressor com a variável dependente Y.  A base Swiss do pacote dataset do R é utilizada para a construção de modelo de regressão múltipla.

Aula 11

Variáveis Dummies

Nesta aula você conhecerá o conceito de variáveis dummies, que são variáveis categóricas, agrupadoras, e como analisá-las no modelo de regressão linear. Também veremos quando o modelo de regressão é capaz de detectar possíveis efeitos decorrentes do agrupamento dos dados pelas categorias presentes nas variáveis dummies (efeito de grupo).

Aula 12

Premissas do Modelo de Regressão Linear

Nesta aula aprenderemos a testar as premissas do modelo de regressão linear e discutiremos técnicas e conceitos que auxiliam na construção de um bom modelo e na decisão de se adicionar ou não preditores ao modelo:

- Análise Residual
- Identificação de outliers:
- Inflação de variãncia: influência e alavancagem

Lab 7

Análise de Regressão Linear, base Prestige

Neste laboratório construiremos um modelo de regressão múltipla a partir da base de dados "Prestige", do pacote "car" da linguagem R.

Apresentaremos o passo-a-passo da escolha dos preditores combinando técnicas matemáticas que nos permitem avaliar a redução da soma dos erros quadráticos, que define a qualidade da estimativa pontual, e a inflação da variância, que define o intervalo de confiança e a qualidade da inferência do modelo.

Regressão Logística - sigmoide

Nesta aula veremos a situação em que a variável dependente é categórica e assume valores binários ou binomiais, com apenas duas categorias. Estudos dessa natureza são denominados problemas de classificação e não são lineares. Apresentaremos, também, a estrutura de modelos lineares generalizados e a função logística, ou sigmoide, utilizada para a representação de modelos cuja variável resposta é binária.

Regressão Logística - logit

Nesta aula são apresentados o conceito de chance, como a razão entre a probabilidade de sucesso e a de insucesso, e transformação logit, definida pelo logarítmo natural da chance. O logarítmo natural da chance, calculada por meio da função sigmoide, tem comportamento linear e equivale ao componente sistemático da função sigmoide.

Regressão Logística, construção do modelo

Neste laboratório apresentaremos o passo-a-passo da escolha dos preditores para um modelo de Regressão Logística. Serão utilizados a Estatística do Desvio, o Critério de Informação de Akaike e o Critério de Informação Baiesiano para auxiliar na decisão de incluir ou não vaiáveis ao modelo.

Análise de Variância

Nesta aula você aprenderá a técnica da Análise de Variância - ANOVA, utilizada para a comparação de médias de amostras independentes. Será apresentado o conceito da estatística F e suas distribuições de probabilidade, utilizados para testar a hipótese de que duas variâncias são iguais. Também são apresentados os testes post hoc e a ANOVA como um caso especial da Regressão Linear.

Teste Qui-quadrado


Nesta aula você conhecerá o Teste Qui-quadrado, que é um teste não paramétrico cujo princípio básico é verificar as possíveis divergências entre as frequências observadas e esperadas para um certo evento. Veremos a aplicação do teste nos casos em que conhecemos o valor esperado do evento e nos casos em que desejamos verificar a dependência de duas variáveis categóricas, por meio de tabelas de contingência.

Licença Creative Commons    Este trabalho está licenciado com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional.

Made with Mobirise website maker