Não foi possível enviar o arquivo. Será algum problema com as permissões?

Essa é uma revisão anterior do documento!


CE-071: Análise de Regressão Linear

CE-071: Análise de Regressão Linear

Detalhes da oferta da disciplina

Scripts, notas e documentos

Apostilas e textos úteis: ce071_livros.zip (84 MB)

Histórico das Aulas do Curso

Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas.

  1. 10/02:
    • Informação sobre a oferta da disciplina;
    • Introdução à regressão linear;
    • Panorama do conteúdo previsto.
  2. 12/02:
    • Análise gráfica exploratória visando aplicação de regressão.
  3. 17/02:
    • Representação matricial;
    • Interpretação geométrica;
    • Estimação pelo método dos mínimos quadrados.
  4. 19/02:
    • Métodos numéricos considerados na estimação: decomposição QR e de Cholesky.
  5. 24/02:
    • Estimação baseada na verossimilhança.
  6. 26/02:
    • Esperança e variância dos estimadores;
    • Teorema de Gauss-Markov;
    • Análise de variância.
  7. 10/03:
    • Regressão linear múltipla, resultados representados matricialmente;
    • Quadro de análise de variância;
  8. 12/03:
    • Propriedades distribucionais dos estimadores;
    • Teste F de uma função linear para inferência sobre \beta;
    • Teste F do quadro de análise de variância.
  9. 17/03:
    • Teste de hipótese para \beta e subconjuntos de \beta;
    • Teste da soma de quadrados extra;
    • Intervalos de confiança para \beta_j e funções lineares de \beta;
    • Intervalos de confiança para o valor predito e para observação futura.
  10. 19/03:
    • Prática de regressão linear múltipla com o R;
    • Estudo sobre o preço de imóveis em função da área.
  11. 24/03:
    • Fórmulas e matrizes correspondentes ao declarar modelos;
    • Tipos de parametrizações em modelos lineares para variáveis categóricas;
    • Prática de regressão linear múltipla com o R.
  12. 26/03:
    • Prática de regressão linear múltipla com o R;
    • Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio;
    • Especificação e testes de hipóteses entre modelos aninhados.
  13. 31/03:
    • Ajuste do modelo e previsão de valores;
    • Intervalos de confiança e intervalos de predição.
  14. 02/04:
    • Análise dos pressupostos do modelo;
    • Medidas de influência;
    • Tipos de resíduos (crus, padronizados, studentizados);
    • DFfits, DFbetas e distância de Cook;
  15. 07/04:
    • Análise dos resíduos e medidas de influência;
    • Prática de regressão linear múltipla com o R;
    • Estudo sobre o preço de relógios antigos;
    • Estudo sobre o salário de trabalhadores sociais.
  16. 09/04:
    • Medidas de colinearidade;
    • Fator de inflação da variância.
  17. 14/04:
    • Polinômios ortogonais;
    • Centralização das variáveis;
    • Prática de regressão linear múltipla com o R;
    • Estudo sobre nível de ddt em peixes;
    • Estudo sobre o gasto em consumo de alimentos por família.
  18. 16/04:
    • Seleção de variáveis;
    • Seleção forward, backwad e stepwise baseados em critérios de informação (AIC e BIC);
  19. 23/04:
    • Prática de regressão linear múltipla com o R;
    • Estudo sobre a qualidade de vinhos;
    • Estudo sobre o salario de executivos.
  20. 28/04
  21. 30/04
  22. 05/05
  23. 07/05
  24. 12/05
  25. 14/05
  26. 19/05
  27. 21/05
  28. 26/05
  29. 28/05
  30. 02/06
  31. 04/06
  32. 09/06
  33. 11/06
  34. 16/06
  35. 18/06
  36. 23/06
  37. 25/06

Cursos, dados e scripts sobre Regressão Linear

Cartões de referência

Medidas de diagnóstico

Regressão com variáveis categóricas

Avaliações

Trabalho 1

  • Função para estimação de beta a partir de X e y. Implementar o método de estimação literal, decomposição de Cholesky e decomposição QR.
  • Função para calcular o quadro de análise de variância.
  • Função para tabela de estimativas com erro-padrão e IC.
  • Função para quadro de anova particionado.
  • Função para calcular o valor predito com IC.
  • Entregar o código impresso das funções programadas no dia 24/03/14.

## Estima o vetor de parâmetros \beta
mycoef <- function(X, y, method){
...
}
 
## Retorna o quadro de análise de variância corrigido para a média
myanova <- function(X, y){
...
}
 
## Retorna a tabela com erros padrões, t-valor, p-valor e IC para \betas
mycoeftable <- function(X, y, conf=0.95){
...
}
 
## Retorna o quadro de análise de variância particionado para X1
myanovapart <- function(X, y, X1){
...
}
 
## Retorna o valor predito com IC
mypredict <- function(x0, betas, vcov, conf){
...
}

Trabalho 2

  • Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes.
  • Verificar que Graph, Graph, e que Graph têm distribuição Normal.
  • Verificar que Graph e que Latex têm distribuição F sob H0 que Graph.
  • Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior.
  • Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14.

## Função que retorna estimativas de parâmetros e estatísticas sob uma
## amostra aleatória simulada ao ser executada.
mysimula <- function(X, beta, sigma, A, m=beta){
...
}
 
results <- replicate(10000, mysimula)

Trabalho 3

  • Programar funções para obter:
    • Resíduos ordinários, padronizados e studentizados;
    • Valores de alavancagem;
    • Distância de Cook;
    • DFfits, DFbetas;
  • As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas;
  • Alavancagem

Graph

  • Resíduos crus

Graph

  • Resíduos padronizados (ou internamente studentizados)

Graph

  • Resíduos studentizados (ou externamente studentizados)

Graph

  • Distância de Cook

Graph

  • DFfits

Graph

  • DFbetas

Graph

##-----------------------------------------------------------------------------
## Definições da sessão.
 
require(lattice)
require(latticeExtra)
 
##-----------------------------------------------------------------------------
## Lendo dados sobre os joagadores da liga européia de futebol.
 
da <-
    read.table("http://www.leg.ufpr.br/~walmes/data/euro_football_players.txt",
               header=TRUE, sep="\t", quote="", encoding="utf-8")
str(da)
 
da <- subset(da, select=c("pos","kg","cm"))
 
da$gk <- ifelse(da$pos=="GK", 1, -1)
da$gk[grep("^M\\(?.?\\)?$", da$pos)] <- 0
 
da <- subset(da, gk>=0)
str(da)
 
names(da)[2:3] <- c("peso","altura")
table(da$gk)
 
xyplot(peso~altura|gk, data=da)
 
##-----------------------------------------------------------------------------
## Preço dos carros em função da categoria (simples, sedan ou cross).
 
db <-
    read.table("http://www.leg.ufpr.br/~walmes/data/hb20_venda_webmotors_280314.txt",
               header=TRUE, sep="\t")
str(db)
 
db <- subset(db, select=c("carro","km","preco"))
db <- transform(db, km=km/1000, preco=preco/1000)
 
xyplot(preco~km|carro, data=db)
 
##-----------------------------------------------------------------------------


QR Code
QR Code disciplinas:ce071-2014-01 (generated for current page)