The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.
Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by jpsg.1984, 2019-09-28 22:07:11

Morettin_e_Bussab-Estatástica_Básica_6_ed

Estatística Básica

Keywords: Estatística Básica

484 C A P Í T U L O 1 6 — R E G R E S S Ã O L I N E A R S I M P L E S

Para ajustar a reta resistente, consideramos três conjuntos de cinco pontos. É fácil
ver que obtemos

~vt = 21,56 – 0,92t, t = 1, 2, ..., 15 (16.80)

também representada por uma linha tracejada na figura.

Figura 16.22: Reta de MQ (––––) e resistente (– – – –) para os da-
dos de velocidade do vento.

16.9 Problemas e Complementos

16. Com o modelo ^z = α^ + β^x para a acuidade visual, desenvolvido nos problemas anteriores:
(a) construa o IC de 95% para a acuidade visual média dos indivíduos com 18 anos
de idade;
(b) construa o IC de 95% para a acuidade visual esperada para indivíduos com 30 anos
de idade; e
(c) construa o IC com 95% de confiança para a acuidade visual média dos indivíduos
com 80 anos. Comente o resultado.

17. No Problema 6, qual o tempo médio esperado para empacotar um volume com 30 dm3?

18. Os dados abaixo referem-se a meses de experiência de dez digitadores e o número de
erros cometidos na digitação de determinado texto.

Meses x 1 2 3 4 5 6 7 8 9 10
Erros y
30 28 24 20 18 14 13 10 7 6

Dados: Α xi = 60, Αx 2 = 460, Α yi = 170, Α xi yi = 768
i

(a) Represente graficamente esse conjunto de dados.

(b) Assumindo que um modelo de regressão linear é adequado, determine os coeficientes
da equação pelo método dos mínimos quadrados.

16.9 PROBLEMAS E COMPLEMENTOS 485

(c) Represente a reta de regressão no gráfico feito anteriormente.
(d) Qual a posição do ponto (⎯x,⎯y) em relação à reta de regressão?
(e) Qual o número esperado de erros para um digitador com 5 meses de experiência?

19. Os dados abaixo correspondem às variáveis renda familiar e gasto com alimentação
numa amostra de dez famílias, representadas em salários mínimos.

Renda familiar (x) Gasto com alimentação (y)

3 1,5
5 2,0
10 6,0
20 10,0
30 15,0
50 20,0
70 25,0
100 40,0
150 60,0
200 80,0

Obtenha a equação de regressão ^y = α^ + β^x.
(a) Qual a previsão do gasto com alimentação para uma família com renda de

170 reais?

(b) Qual a previsão do gasto para famílias com excepcional renda, por exemplo 1.000
reais? Você acha esse valor razoável? Por quê?

(c) Se você respondeu que o valor obtido em (b) não é razoável, encontre uma explica-
ção para o ocorrido. (Sugestão: interprete a natureza das variáveis X e Y e o compor-
tamento de Y para grandes valores de X.)

20. A análise do lucro anual de uma ação, como função linear da sua cotação média anual,
forneceu os resultados abaixo com alguns campos em branco. Preencha as lacunas e
interprete os resultados.

ANOVA

Fonte g.l. SQ QM F

Regressão 1209
Resíduo

Total 11 1766

Descrição Coef. EP Modelo valor-p LI (95%) LS (95%)
t –1,34 0,45
Intercepto 49,00 22,00 0,055
Cotação 0,30 0,07 0,003

21. Um jornal quer verificar a eficácia de seus anúncios na venda de carros usados. A
tabela abaixo mostra o número de anúncios publicados e o correspondente número de

486 C A P Í T U L O 1 6 — R E G R E S S Ã O L I N E A R S I M P L E S

carros vendidos por seis companhias que usaram apenas esse jornal como veículo
de propaganda.

Companhia ABCDEG

Anúncios 74 45 48 36 27 16

Carros vendidos 139 108 98 76 62 57

Ajustando-se a reta de regressão, obteve-se y = 1,516x + 27,844 e F = 70,17. Como você
argumentaria com a companhia G para que ela aumentasse o número de anúncios,
aumentando a venda de carros?

22. O custo de manutenção de tratores parece aumentar com a idade do trator. Os seguin-

tes dados foram obtidos (X representa idade em anos e Y o custo por seis meses):
(a) Ajuste o modelo ^y = β^0 + β^1x e teste a hipótese de interesse para o nível α = 0,10.
(b) Devemos procurar um modelo mais adequado?

(c) Determine uma “previsão” para o custo de manutenção para tratores com 5 anos de
idade e obtenha um intervalo de confiança com γ = 0,90.

(d) Teste as hipóteses H : β = 300, H : β > 300, para o nível α = 0,05.
00 10

XY

0,5 163
0,5 182
1,0 978
1,0 466
1,0 549
4,0 495
4,0 723
4,0 681
4,5 619
4,5 1.049
4,5 1.033
5,0 890
5,0 1.522
5,0 1.194
5,5 987
6,0 764
6,0 1.373

23. Origem do Termo Regressão. O uso do termo regressão deve-se a Francis Galton, por
volta de 1885, quando investigava relações entre características antropométricas de
sucessivas gerações. Uma de suas constatações era de que “cada peculiaridade de um
homem é transmitida aos seus descendentes, mas, em média, numa intensidade menor”.
Por exemplo: embora pais com baixa estatura tendam a ter filhos também com baixa
estatura, estes têm altura média maior do que a altura média de seus pais. O mesmo
ocorre, mas em direção contrária, com pais com estatura alta. Essa afirmação pode ser
mais bem compreendida observando-se os dados usados por Galton, e representados
parcialmente na Figura 16.23. Se as características permanecessem as mesmas de

16.9 PROBLEMAS E COMPLEMENTOS 487

geração para geração, esperar-se-ia que a reta de regressão tivesse seu coeficiente
angular próximo de 1. Em sua análise, Galton encontrou o valor 0,516, mostrando que
a reta tende para aquela paralela ao eixo x e passando pela média ( y =⎯y). A esse
fenômeno de a altura dos filhos mover-se em direção à altura média de todos os ho-
mens ele chamou de regressão, e às vezes de reversão, tendo aparecido num artigo de
1885, no Journal of the Anthropological Institute, com o título “Regression Towards Mediocrity
in Hereditary Stature” — Regressão para a Mediocridade em Estaturas Hereditárias;
mediocridade, aqui, referindo-se a média.

Figura 16.23: Média da altura de filhos contra altura com-
posta dos pais, baseada no estudo de Galton.

Os dados abaixo referem-se a outro experimento de Galton, dentro da mesma investiga-
ção, procurando estudar a relação entre o diâmetro, em centésimos de polegada, de
ervilhas-pais (x) e ervilhas-filhas (y). Analise a reta de regressão para os dados e interprete
os coeficientes.

Pais (x) Diâmetros em 0,01 de polegadas de sementes de ervilhas 21,0
Filhos (y) 15,0 16,0 17,0 18,0 19,0 20,0 17,3
15,4 15,7 16,0 16,3 16,6 17,0

24. Um pesquisador deseja verificar se um instrumento para medir concentração de ácido
lático no sangue está bem calibrado. Para isso ele tomou 20 amostras de concentrações
conhecidas e determinou a respectiva concentração através do instrumento. Como uma
análise de regressão poderia auxiliar o pesquisador? Modele o problema acima, espe-
cificando as variáveis independente e dependente e as hipóteses de interesse.

25. Os dados abaixo correspondem a duas variáveis X e Y, onde:
X = concentração conhecida de ácido lático e
Y = concentração de ácido lático registrada pelo instrumento

488 C A P Í T U L O 1 6 — R E G R E S S Ã O L I N E A R S I M P L E S

XY

1 1,1 0,7 1,8 0,4
3 3,0 1,4 4,9 4,4 4,5
5 7,3 8,2 6,2
10 12,0 13,1 12,6 13,2
15 18,7 19,7 17,4 17,1

Ajuste o modelo ^y = β^0 + β^1x e teste a hipótese H0 : β1 = 1 contra a alternativa
H1 : β1 1. Tire conclusões com base no resultado desse teste.

26. Sejam X: volume de precipitação pluvial
Y: produção de trigo por alqueire

(a) Você acha que um modelo do tipo Y = α + βx + e seria adequado para essas variáveis?
Por quê?

(b) Caso esse modelo não seja adequado, esboce um gráfico do tipo de relação que
você esperaria existir entre X e Y.

27. Num experimento foram aplicadas três doses diferentes de insulina em coelhos e foram
observadas quedas na quantidade de açúcar no sangue (variável Y) depois de determi-
nados períodos. Nesse tipo de experimento, é usual admitir-se que a relação entre queda
de açúcar e o logaritmo da dose da insulina é linear.

log da dose (X )

0,36 0,56 0,76

17 64 62
21 48 72
49 34 61
54 63 91

São dados:

Α xi = 6,72; Α xi2 = 4,0832; Α xiyi = 385,16;

Α yi = 636; Α yi2 = 38.602; ⎯x = 0,56; ⎯y = 53.

Faça um estudo completo sobre o ajuste do modelo y = β0 + β1x + ε a esses dados.

28. A indústria farmacêutica MIMI vende um remédio para combater resfriado. Após dois

anos de operação, ela coletou as seguintes informações trimestrais:

Trimestre Vendas Despesas Temperatura
(10.000) c/Propaganda Média do Trimestre

(Y ) (X ) (Z )

1 25 11 2
2 13 5 13
38 3 16
4 20 9
5 25 12 7
6 12 6 4
7 10 5 10
8 15 9 13
4

16.9 PROBLEMAS E COMPLEMENTOS 489

Α y = 128; Α y2 = 2.352; Α yx = 1.101;
Α x = 60; Α x2 = 522; Α yz = 897;
Α z = 69; Α z2 = 779; Α xz = 397.

(a) Faça os gráficos (x, y) e (z, y).
(b) Encontre as retas ^y = a + bx e ^y = c + dz.
(c) Qual das duas você acha estatisticamente mais adequada para prever as vendas?

Por quê?
(d) De acordo com a decisão acima, qual a previsão de vendas para um trimestre em

que a despesa de propaganda será 8 e a temperatura prevista 10?

29. Para construir um modelo linear relacionando a quantidade de fertilizantes usada (x) e a
produtividade obtida ( y) com uma amostra de sete canteiros, o pesquisador obteve as
seguintes estatísticas:

⎯x = 400, ⎯y = 60, sx = 216,02, sy = 13,84 e r = 0,922.
(a) Encontre as estimativas do modelo ^y = α^ + β^x.
(b) Construa a tabela ANOVA.
(c) Analise os resultados.

30. Mostre que o coeficiente angular β^ da fórmula (16.14) pode ser escrito como

β^ = Α(xi –⎯x )(yi –⎯y ) = sxy
Α(x s2
i –⎯x )2 x

Prova. De (16.14) temos:

β^ = Αxiyi – n⎯x⎯y .
Αx 2
i – n⎯x 2

Mas,

Α(xi –⎯x )(y –⎯ y ) = Α(xi y –⎯ x y –⎯ y x +⎯ x⎯ y)
i i i i

= Αxi y –⎯x Αyi –⎯y Αxi + n⎯ x⎯ y
i

= Αxi y – n⎯ x⎯ y – n⎯ x⎯ y + n⎯ x⎯ y = Αxiyi – n⎯ x⎯ y.
i

De modo análogo,

Α(xi –⎯x )2 = Αx2i – n⎯x 2.

Definindo-se sxy = 1 Α(xi –⎯x )(y –⎯ y) e
n–1 i

s2 = 1 Α(xi –⎯x )2
x n–1

a demonstração está completa.

490 C A P Í T U L O 1 6 — R E G R E S S Ã O L I N E A R S I M P L E S

31. Demonstre a fórmula (16.30), ou seja:

Α(yi –⎯y )2 = Α(^yi –⎯y )2 + Α^e2i .

Prova. De (16.29)
yi –⎯y = yi – ^yi –⎯y = ^ei + (^yi –⎯y ),

e elevando ao quadrado ambos os membros e somando-os, obtemos

Α(yi –⎯y )2 = Α^e2i + Α(^yi – y )2 + 2Α(^yi –⎯y )^ei .

Mas, como

^yi =⎯y + β^(xi –⎯x ) e ^ei = yi –⎯y – β^(xi –⎯x ),

teremos

Α^ei (^yi –⎯y ) = Α[(yi –⎯y ) – β^(xi –⎯x )][β^(xi –⎯x )]

= β^Α(y –⎯y )(x –⎯x ) – β^2Α(x –⎯x )2.
i i i

Usando a expressão de β^, do Problema 30, obtemos

Α^ei (^yi –⎯y ) = 0,

o que demonstra a expressão.
32. Mostre que E(Se2) = σ e2.

Prova. Vamos decompor a demonstração em três partes:

(a) Vejamos quanto vale E(SQTot). Temos:

Y = α + βx + e , i = 1, 2, ..., n; e ϳ N(0, σ e2).
i ii i

Somando as n parcelas em cada membro e dividindo por n, obtemos:

⎯Y = α + β⎯x +⎯e , ⎯e ϳ N (0; σ e2/n),

e, ainda,

Yi –⎯Y = β (xi –⎯x ) + ei –⎯e ,

SQTot = Α(Yi –⎯Y)2

SQTot = β 2 Α(xi –⎯x )2 + Α(ei –⎯e )2

+ 2β Α(xi –⎯x )(e –⎯e ).
i

Calculando a esperança, teremos:

E(SQTot) = β2(Α(xi –⎯x)2 + E[Α(ei –⎯e )2]

= + 2β Α(xi –⎯x )E (ei –⎯e )

= β 2Α(xi –⎯x )2 + E [Α(ei –⎯e )2] + 0.

16.9 PROBLEMAS E COMPLEMENTOS 491

Mas

Α(ei –⎯e )2

n–1
΄ ΅E[Α(ei –⎯e )2] = (n – 1)E = (n – 1)σ 2 ,
e

pois é equivalente à variância de uma amostra aleatória simples de tamanho n,

retirada da população N(0, σ 2e), e já vimos que essa é a expressão de um estimador
não viesado da variância σ 2e. Então:

E(SQTot) = β2Α(xi –⎯x )2 + (n – 1) σ 2 .
e

(b) Vamos calcular agora E(SQReg). De (16.33),

SQReg = Αβ^2 (x –⎯x )2
i

e de (16.37),

Var(β^) = σ 2 /Α(xi –⎯x )2.
e

Mas da definição de variância, sabemos que

Var(β^) = E(β^2) – E2(β^) = E(β^2) – β2

pois E(β^) = β. Combinando estas expressões, teremos:

E[SQReg] = Α(xi –⎯x )2E(β^2) = [Var(β^) + β^]Α(xi –⎯x )2

σe2

Α(xi –⎯x )2
Ά ·= Α(xi –⎯x )2
+ β2

= σ 2 + β 2 Α(xi –⎯x )2.
e

Explicitamente, E[SQReg] = σ 2 + β2 Α(xi –⎯ x )2.
e

(c) Finalmente, como

SQRes = SQTot – SQReg,

E [SQRes] = [β2Α(xi –⎯x )2 + (n – 1)σ e2] – [σ 2 + β 2 Α(xi –⎯x )2],
e

E[SQRes] = (n – 2)σ e2,

a partir de que podemos escrever:

SQRes
n–2
΂ ΃E = σ 2 ,
e

ou seja,

Se2 = Α(yi – ^yi)2

n–2

é estimador não viesado de σ2e.

33. Prove que Cov⎯( Y, β^) = 0.
(a) Inicialmente vamos provar que, se X e Y são independentes, U = aX + bY e
V = mX + nY, então

Cov(U, V ) = amVar(X ) + bnVar(Y ).




















































































Click to View FlipBook Version