The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

LIBRO COMPLETO - ESTADISTICA DESCRIPTIVA BASICA ed_1 libro ok 4

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by LUIS ARTURO, 2021-02-26 22:11:05

LIBRO COMPLETO - ESTADISTICA DESCRIPTIVA BASICA ed_1 libro ok 4

LIBRO COMPLETO - ESTADISTICA DESCRIPTIVA BASICA ed_1 libro ok 4

Correlación y Regresión lineal

r  38635.77143 
( 34122444.967) ( 64018544754907.6415051)

r  38635.77143  38635.77143
( 967.033) ( 1646946.358495) (31.097) (1283.33)

r  38635.77143  0.968
39907.71

r  0.97

r  0.97

Actualmente con el avance tecnológico se hace indispensable el uso de soft-
ware para el tratamiento de los datos. A continuación, se ilustra el desarrollo
de esta misma parte, usando Software SPSS v23.

Configuramos las variables en la solapa Variable View

Estadística Descriptiva Básica ~ 139 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ingresamos los datos del enunciado.

Configuramos la aplicación para que reconozca la tercera columna como las
frecuencias absolutas.

Estadística Descriptiva Básica ~ 140 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Damos click en OK, y para determinar la correlación seguir la siguiente se-
cuencia de pasos.

Realizamos la siguiente configuración en la presente ventana y damos click
en OK.

Estadística Descriptiva Básica ~ 141 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

A continuación, se presenta la siguiente información” Resultados”, donde:
r = 0.97

b) Encontrar la ecuación de regresión de Y en X
y  x

Solución

Para completar la ecuación de regresión requerimos primero determinar alfa
y beta.

k

 i 1 f i xi yin x y 

fi xi2  n x 2 ;   yx

k

i 1 f i x i y i n x y    3412 38635.77143  40.100
fi xi2  nx2  (70)(5.914285712 )


 
  y   x    260.628571  40.100(5.91428571)



  23.466

Estadística Descriptiva Básica ~ 142 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Entonces la ecuación de regresión está dada por:
y  x
y  23.466  40.100x
También podemos resolver esta parte con el software SPSS, a continuación,
la secuencia de los pasos para dicho proceso.

Ahora dar click en Statistics

Y marcar las siguientes casillas, ahora dar click en Continue.

Estadística Descriptiva Básica ~ 143 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora realizamos la siguiente configuración y damos click en OK.

Estadística Descriptiva Básica ~ 144 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora se muestra los siguientes resultados:

Estadística Descriptiva Básica ~ 145 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Llegamos al mismo resultado:
y  x
y  23.466  40.100x

c) ¿las maquinarias con una antigüedad de 20 años que gasto aproxi-
mado demandarían?

Solución

Para responder esta pregunta, usamos el modelo determinado previamente
en b)

y  x  y  825.4656307  y  825.46
y  23.466  40.100x
y  23.466  40.100(20)

La interpretación la dejamos para el lector.

Ejemplo 2.- Dado los siguientes datos correspondiente al rendimiento acadé-
mico y número de horas de estudio por semana de un grupo de estudiantes,
determinar:

a) El diagrama de dispersión
b) Modelo de regresión en SPSS paso a paso.
c) Determinar el rendimiento académico para 10 horas de estudio.

Estadística Descriptiva Básica ~ 146 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Solución:
Abrimos el software estadístico SPSS versión 23.

Estadística Descriptiva Básica ~ 147 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Primero definimos las variables que vamos a usar en la pestaña Vista de Va-
riables

Ahora vamos a la pestaña Vista de datos e ingresamos los siguientes datos:

Estadística Descriptiva Básica ~ 148 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Primero calculamos el diagrama de dispersión de los datos para ver si hay
indicios de que existe alguna relación entre las 2 variables.

Estadística Descriptiva Básica ~ 149 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Estadística Descriptiva Básica ~ 150 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Se obtiene la siguiente gráfica:

Estadística Descriptiva Básica ~ 151 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora realizamos la siguiente secuencia de pasos

Estadística Descriptiva Básica ~ 152 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Hacemos clic en el botón Guardar:

Estadística Descriptiva Básica ~ 153 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Hacemos check en no estandarizados (para que cree esta nueva columna
en la matriz de datos – donde se mostraran los valores predecidos), y en la
parte inferior damos una dirección para que guarde el modelo matemático
para usarlo en otras predicciones
Ruta: E:\CURSO REGRESIÓN LINEAL\modelo matemático de regresion.xml

Estadística Descriptiva Básica ~ 154 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Coeficientesa

Coeficientes no estan- Coeficientes estan-

darizados darizados

Modelo B Error estándar Beta t Sig.

1 (Constante) 6,057 ,710 8,528 ,000

Horas de estu- ,700 ,076 ,907 9,155,000
dio/semana

a. Variable dependiente: Rendimiento académico

Ahora tenemos el valor predecido, y según este modelo podremos predecir
más valores.

Estadística Descriptiva Básica ~ 155 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

A continuación, se tiene:

y en disco genera el archivo XML, que contiene el modelo de regresión gene-
rado.

Estadística Descriptiva Básica ~ 156 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora para predecir nuevos valores eliminamos las columnas Y y PRE_1, esto
con el propósito de predecir nuevos valores con el modelo de regresión que
guardamos previamente(en un nuevo ejemplo).

Estadística Descriptiva Básica ~ 157 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora vamos a utilidades y seleccionamos asistente de puntuación.

Estadística Descriptiva Básica ~ 158 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Clic en el botón Examinar, para ubicar nuestro modelo que previamente guar-
damos

Ahora damos clic en siguiente:

Estadística Descriptiva Básica ~ 159 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Damos clic en siguiente (aquí des seleccionamos Error estándar – un check)

Estadística Descriptiva Básica ~ 160 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora le damos clic en el botón Finalizar.
A continuación, se tiene los valores predecidos.

Estadística Descriptiva Básica ~ 161 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal ECUACIÓN

MODELOS DE REGRESIÓN yˆ =βˆ 0 +βˆ1.x
MODELO
yˆ=βˆ 0 +βˆ1.ln[x]
Lineal
Logarítmico yˆ = βˆ 0 + βˆ 1 . 1
Inverso x
Cuadrático
Cúbico yˆ=βˆ 0 +βˆ1.x+βˆ 2.x2
Potencia
Compuesto yˆ=βˆ 0 +βˆ1.x+βˆ 2.x2 +βˆ3.x3
Logístico
Crecimiento yˆ = βˆ 0 .x βˆ1
Exponencial
yˆ = βˆ 0 .βˆ 1x

yˆ = βˆ 1 x
+βˆ 1.βˆ 2
0

yˆ=exp[βˆ 0 +βˆ1.x]

yˆ =βˆ 0.exp[βˆ1.x]

e = 2,7182

Regresión no lineal simple (Curvilínea). - Es cuando la recta de regresión
es no lineal curvilíneo, estas se generan con los modelos de regresión pre-
sentados en la tabla anterior.

Estadística Descriptiva Básica ~ 162 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Sin embargo, los modelos presentados anteriormente solo abordan una varia-
ble independiente, lo cual es aplicable teóricamente. Siendo mas
recomendable el análisis de datos con múltiples variables independientes al
cual en adelante llamaremos Regresión no lineal Múltiple.
Regresion no lineal Simple

Regresion no lineal multiple

Ejemplo 3.- Dada la siguiente información de una empresa importadora de
maquinaria Textil correspondiente a los gastos en publicidad (en miles de so-
les) y las ventas de dichas maquinarias textiles (en miles de soles) durante el

Estadística Descriptiva Básica ~ 163 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

2017. A continuación, se presenta la información registrada durante dicho pe-
riodo.

Gastos Publici- 1,2 2,8 3,5 4 4,4 6,1 7 7,5 7,4 7,4
dad(X)

Ventas(Y) 1,1 1,5 2,5 3 3,5 4 6,3 8 9 10

Continua…

7,5 7,3 7,6 7,7 3,3 4 4,9 5,9 7,8 4 2 4 2,8 6,5 7
11 12 14,4 15 2,7 3 3,7 4,2 14,2 3 2 2,5 3 5 7,5

Se pide:

Genere todos los modelos de regresión en SPSS

Determinar el modelo de regresión más adecuado para tener una
predicción de inversión óptima (explique porque).

Solución:

Iniciamos el programa SPSS

Estadística Descriptiva Básica ~ 164 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora configuramos las variables a abordar.

Ingresamos los datos.

Estadística Descriptiva Básica ~ 165 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Ahora realizar la siguiente secuencia de pasos:

Estadística Descriptiva Básica ~ 166 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

A continuación, hacemos las siguientes selecciones y damos click en OK.

Estadística Descriptiva Básica ~ 167 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Obtenemos los siguientes resultados:

Estadística Descriptiva Básica ~ 168 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Correlación y Regresión lineal

Identificamos el mejor modelo basado en la correlación, también lo podríamos
hacer al generar residuos (el modelo que genere menos residuos será el indi-
cado), el cual requería una configuración previa como en la siguiente ventana.

Estadística Descriptiva Básica ~ 169 ~ Huanca S., Jhon R & Auquitias C., Gladys M.



CAPÍTULO V

OUTLIER Y FUNDAMENTOS BÁSICOS DE
SOFTWARE R

Outliers .-Se dice que una distribución de datos no es normal cuando tiene
valores atípicos, también denominados outlier, estos valores están lejos del
promedio de la distribución o fuera de rango, para su cálculo usamos la si-
guiente formula.

Zi  Xi  X
Sx

Donde :

Xi :Valores de la var iable X

X : Media aritmetica de la var iable X

Sx : Desviacion es tan dar de la var iable X
Zi : valores transformados para identificar los outliers

Condiciones de para identificar los outliers

- SI Z i está por encima de +3 o por debajo de -3, entonces el dato en
cuestión es un valor atípico -Outlier (caso muestras grandes; cuando n >
80 )

- SI Z i está por encima de +2.5 o por debajo de -2.5 entonces el dato en
cuestión es un valor atípico -Outlier (caso muestras pequeñas; cuando: n
< 80 )

Estadística Descriptiva Básica ~ 171 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

Según las condiciones identificamos los valores atípicos, para evaluar su per-
manencia en el grupo de datos.

Ejemplo: Dada las siguientes edades de un grupo de 34 estudiantes de una
institución educativa de nivel superior de la región de Puno, se pide identificar
los valores atípicos.

25, 23, 22, 22, 21, 21, 21, 21, 20, 20, 20, 20, 20, 20, 20, 20, 20,

20, 20, 20, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 18, 18, 18, 18

Solución
Aplicando la formula se tiene los Z i

Zi  Xi  X donde previamente de det er min a : X  19.94 y Sx  1.48
Sx

 

Estadística Descriptiva Básica ~ 172 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

ESTUDIANTE EDAD Zi Outlier y fundamentos básicos de software R
1 25 3.43
2 23 2.07 20 20 0.04
3 22 1.39 21 19 -0.64
4 22 1.39 22 19 -0.64
5 21 0.72 23 19 -0.64
6 21 0.72 24 19 -0.64
7 21 0.72 25 19 -0.64
8 21 0.72 26 19 -0.64
9 20 0.04 27 19 -0.64
10 20 0.04 28 19 -0.64
11 20 0.04 29 19 -0.64
12 20 0.04 30 19 -0.64
13 20 0.04 31 18 -1.32
14 20 0.04 32 18 -1.32
15 20 0.04 33 18 -1.32
16 20 0.04 34 18 -1.32
17 20 0.04
18 20 0.04
19 20 0.04

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 173

Outlier y fundamentos básicos de software R

Es así que identificamos como Outlier al registro número 1, con el valor de edad
= 25.
Podemos hacer lo mismo desde Software R
Edades = c(25, 23, 22, 22, 21, 21, 21, 21, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20,
20, 20, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 18, 18, 18, 18)
datos <- data.frame(edades)
edades.outlier <- abs(scale(datos$edades)) > 3
outlier <- rbind(datos[edades.outlier ,])
plot(edades, pch=0)
points(outlier , pch=16)

Ahora el software muestra la distribución de datos, indicando el valor atípico
(Outlier) Sombreado en negrita. Ver siguiente gráfico.

- 174 Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

La estadística con software R

Hoy en día se tiene herramientas informáticas que contribuyen ampliamente en el
procesamiento de datos. Por lo que se tiene software propietario como IBM SPSS,
SAS, Epidat, Minitab, InfoStat entre otros. También se tiene Software Libre como
Scilab y R, este último abordaremos en el presente texto.

Software R

R es un software de libre distribución, fue desarrollado por Robert Gentleman y
Ross Ihakaâ también conocidos como "R & R". Pertenecientes al departamento
de estadística de la universidad de Auckland en Nueva Zelandia. R Está enfocado
a la computación estadística y a la creación de gráficos estadísticos, compila y
corre en una variedad de plataformas como Unix, Linux, MacOS, y Windows.

Instalación

R instala su aplicación principal al ejecutar R-3.2.1-win.exe. R trabaja con paque-
tes los cuales contienen funciones personalizadas para el procesamiento de los
datos. Por lo tanto es importante instalar los paquetes y actualizarlos Online.

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 175

Outlier y fundamentos básicos de software R

R También puede instalarse localmente, siempre en cuando se cuente con los
binarios, se requiere verificar la Versión de R antes de instalar los componentes
adicionales que se requiere.
Para la instalación de los paquetes en línea siga el siguiente procedimiento, paso
a paso.
Una vez instalada la aplicación ejecutamos R, dando doble clic en el siguiente
icono.

En el menú Paquetes seleccionar la opción Instalar paquetes(s)…

Si aparece la ventana CRAN mirror, Seleccione Spain(Madrid) y en la ventana
Packages seleccione Rcmdr y todos los paquetes que inicien con Rcmdr.xxx,

Estadística Descriptiva Básica ~ 176 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

asi como se muestra en las siguientes ventanas. A continuación en cada ventana
damos clic en OK.

Ahora comienza la descarga en línea.

Una vez terminada la descarga inicie R Commander. Desde el menú.

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 177

Outlier y fundamentos básicos de software R

Ahora presionamos el botón OK
Si no se genera ningún error cargara R Commander. Mostrando la siguiente ven-
tana.

Si se presenta algún error y no carga la ventana del R Commander. Revisar la
ventana de R Console, lugar donde indica el error.

Estadística Descriptiva Básica ~ 178 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

Para la instalación de los paquetes cuando no se disponga de internet, es impor-
tante instalar, la primera vez R Online, en este proceso se descarga todos los
archivos binarios que contienen a los paquetes que usa R, para ubicar la dirección
donde se encuentran los binarios seguimos el siguiente procedimiento.
Una vez terminada la instalación en línea de R buscamos la dirección de descarga
en la ventana R Console, así como se muestra en la siguiente imagen.

Mediante el explorador de Windows nos ubicamos en la carpeta indicada.

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 179

Outlier y fundamentos básicos de software R

Copiamos todo el directorio: downloaded_packages
Ahora cuando instalamos R por primera vez y sin internet, al momento de actua-
lizar realizamos el siguiente procedimiento.
En Paquetes: Seleccionamos Instalar paquetes(s) a partir de archivos zip lo-
cales…

Seleccionamos todos los archivos y damos clic en Abrir, ahora automáticamente
comenzara a instalar todos los paquetes seleccionados.

Estadística Descriptiva Básica ~ 180 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

Una vez culminada la instalación y Si al intentar ejecutar el paquete Rcmdr desde
el menú, no abre y sale la siguiente ventana.

Le damos clic en Si para que los instale, puesto que indica que faltan esos pa-
quetes para que funcione Rcmdr(R Commander).

R pregunta desde donde se realizara la actualización (online o desde un directorio
local). Damos clic en la opción Indicar el directorio con los paquetes, ubicamos
el directorio donde se encuentran nuestros archivos binarios de R y presionamos

el botón OK. A Continuación procederá a instalar los paquetes indicados.

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 181

Outlier y fundamentos básicos de software R

Una vez culminada las actualizaciones iniciara automáticamente R Commander.
Visualizando la siguiente ventana.

En caso de no iniciarse Rcmdr (R Commander), iniciarlo desde el menú paquetes.
Siga la siguiente secuencia.

Estadística Descriptiva Básica ~ 182 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

Si aparece la ventana CRAN mirror, Seleccione Spain(Madrid) y en la ventana
Select One seleccione Rcmdr(R Commander).

A continuación inicia R Commander

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 183

Outlier y fundamentos básicos de software R

Ahora ya podemos usar R para el cálculo de las operaciones estadísticas.
También podemos iniciar Rcmdr desde R Console, para lo cual digitamos li-
brary(Rcmdr) y enter. Asi como se muestra a continuación.

Este procedimiento carga también R Commander.

Estadística Descriptiva Básica ~ 184 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

R Console: permite realizar cálculos estadísticos por línea de orden, por otro lado
R tiene varios bancos de datos incorporados, uno de ellos tiene por nombre iris,
como modo de ejemplo usamos esta data.
En R Console Realizar el siguiente procedimiento:
> data(iris) enter #este procedimiento toma los datos del banco de datos iris
Ahora:
> iris enter #este procedimiento muestra todos los datos contenidos en la data

iris.

A continuación se muestra los datos contenidos en la data Iris

Ahora vemos por partes el uso Rcmdr commander:

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 185

Outlier y fundamentos básicos de software R

Cargar Rcmd
Una vez instalado todos los componentes requeridos ejecutamos la siguiente ins-
trucción
Crear una DataSet
R tiene una facilidad para crear bancos de datos, a través de R console o mediante
Rcmdr, este último tiene una interfaz gráfica que permite diseñar tablas de datos
a medida.
Obtener los descriptivos
- Registrar cadena de valores en datos

sum: sumatoria de los datos

mean: Promedio de los valores ingresados

Estadística Descriptiva Básica ~ 186 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Outlier y fundamentos básicos de software R

var: Varianza
sd: Desviación típica

Coeficiente de variación

Los Cuartiles

Los Deciles y Percentiles

Estadística Descriptiva Básica - Huanca S., Jhon R & Auquitias C., Gladys M. - 187

Outlier y fundamentos básicos de software R

Gráficos estadísticos

Según la Resolución de contraloría Nº 473 - 2014 – CG, pág 92 - 110, se hace
uso de la metodología de muestreo en la auditoria de cumplimiento.

Estadística Descriptiva Básica ~ 188 ~ Huanca S., Jhon R & Auquitias C., Gladys M.


Click to View FlipBook Version