The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

LIBRO COMPLETO - ESTADISTICA DESCRIPTIVA BASICA ed_1 libro ok 4

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by LUIS ARTURO, 2021-02-26 22:11:05

LIBRO COMPLETO - ESTADISTICA DESCRIPTIVA BASICA ed_1 libro ok 4

LIBRO COMPLETO - ESTADISTICA DESCRIPTIVA BASICA ed_1 libro ok 4

ESTADÍSTICA

DESCRIPTIVA BÁSICA

JHON RICHARD HUANCA SUAQUITA
GLADYS MARLENY AUQUITIAS CONDORI



Jhon Richard Huanca Suaquita
Gladys Marleny Auquitias Condori

ESTADÍSTICA DESCRIPTIVA BÁSICA

Autores:
- JHON RICHARD HUANCA SUAQUITA
- GLADYS MARLENY AUQUITIAS CONDORI

Editor:
JHON RICHARD HUANCA SUAQUITA
[email protected]
Dirección: Jr. Machupicchu MZ ”A” LT “1D”
Celular: +51 951672429

1a Edición Febrero del 2021
Tiraje: 100 ejemplares

HECHO EL DEPÓSITO LEGAL EN LA BIBLIOTECA NACIONAL DEL PERÚ Nº 2021-01406

ISBN: 978-612-00-5996-8

Se terminó de imprimir en febrero del 2021 en:
LUCERO IMPRESIONES
RUC 10411509015
De Antonia Ccama Quispe
Av. Floral Nº 1025 – Puno
Teléfono 051 208093 – Cel. 921 431042

No está permitido la reproducción total o parcial del contenido de este libro, ni su
tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio,
ya sea electrónico, mecánico, fotocopia, por registro u otros métodos, sin el permiso
previo de los autores.

EL orden mundial académico requiere de
la existencia de todos los niveles académi-
cos desarrollados, el rol que
desempeñemos en el nivel que decidamos,
es nuestra elección, que determinará nues-
tra miseria o éxito profesional.

Jhon R. Huanca

Los analfabetos del siglo XXI no serán
aquellos que no sepan leer o escribir, sino
aquellos que no puedan aprender, des-
aprender y reaprender

Alvin Toffler



PRESENTACIÓN

En pleno siglo XXI la estadística continua contribuyendo en la ciencia,
ahora con más intensidad con sus métodos y técnicas que permiten cuan-
tificar el comportamiento de la información, se han desarrollado y se
vienen desarrollando múltiples trabajos de investigación en diferentes
áreas del conocimiento en los niveles de investigación: descriptivo, corre-
lacional y explicativo, por ello, el presente texto muestra una descripción
desarrollada de la estadística descriptiva ensayada en casos de estudios
prácticos, donde se esboza paso a paso el análisis de variables y trata-
miento de datos según las técnicas estadísticas, los cuales se dirigen a los
estudiantes de pre-grado de la Escuela Profesional de Ingeniería Estadística
e Informática y demás escuelas profesionales de la Región.

Para ejemplificar los procedimientos se utilizó el software estadístico
R el cual es usado principalmente para el análisis de datos estadísticos. R
tiene una tecnología basada en componentes reutilizables, su operación se
basa en tareas tradicionales desarrollados en software estadísticos tradi-
cionales como SAS, empleando una interfaz de usuario gráfica y una
consola de línea de orden para operaciones específicas, así mismo es im-
portante resaltar que el presente texto está basado en la analogía
matemática de varios textos de primer nivel, así como el de Maximo Mi-
tacc Meza y Ciro Martinez Bencardino. Finalmente agradecemos a las
personas que tengan a bien hacer llegar sugerencias y recomendaciones,
con el fin de mejorar su contenido.

Juliaca, febrero del 2021

Los Autores



ÍNDICE

CAPÍTULO I
LA ESTADISTICA Y SUS FUNDAMENTOS BASICOS
Estadística ......................................................................................................3
Clasificación de la estadística ........................................................................3
Método deductivo ...........................................................................................3
Método inductivo ............................................................................................3
Estadística Descriptiva ...................................................................................4
Estadística Inferencial ....................................................................................4
Parámetro.......................................................................................................4
Estadístico: .....................................................................................................4
Estadística paramétrica ..................................................................................4
Estadística no paramétrica .............................................................................5
POBLACIÓN Y MUESTRA.............................................................................6
Población........................................................................................................6
Muestra...........................................................................................................7
El Muestreo ....................................................................................................7
Determinación del tamaño muestral...............................................................7
Técnicas de muestreo probabilísticas ............................................................8
Técnicas de muestreo no probabilísticas .......................................................8
Técnicas de muestreo probabilísticas ..........................................................12
Técnicas de muestreo no probabilísticas .....................................................12
UNIDAD DE ANALISIS.................................................................................13
Las variables ................................................................................................15
Variables estadísticas...................................................................................15
Variables nominales .....................................................................................15
Definición de variables nominales. ...............................................................16
Variables ordinales .......................................................................................16
Variables discretas .......................................................................................17
Variables continuas ......................................................................................19
Variables dicotómicas...................................................................................19
Variables politómicas....................................................................................20

Variables fijas ...............................................................................................20
Variables aleatorias ......................................................................................20
Variables endógenas....................................................................................21
Variables exógenas ......................................................................................21
TABLAS DE DISTRIBUCION DE FRECUENCIAS ......................................24
Distribuciones discretas................................................................................25
Distribuciones continuas...............................................................................25
Frecuencia absoluta de los datos (fi) ............................................................25
Frecuencia absoluta acumulada de los datos (Fi) ........................................26
Frecuencia relativa de los datos (hi) .............................................................26
Frecuencia relativa de los datos acumulados (Hi) ........................................26
Marcas central de clase (Xi) .........................................................................27
Rango (R) .....................................................................................................27
Numero de clases (K)...................................................................................27
Amplitud (A)..................................................................................................27

Límite Inferior del primer intervalo de clase ( Y0' )..........................................28

Tipos de gráficos ..........................................................................................28
CAPÍTULO II

MEDIDAS DE TENDENCIA CENTRAL
Medidas de tendencia central.......................................................................33
Media aritmética ...........................................................................................33
Propiedades de la media aritmética .............................................................34
Media aritmética ponderada .........................................................................36
Mediana (med) .............................................................................................37
Moda.............................................................................................................42
Media geométrica .........................................................................................44
Media cuadrática ..........................................................................................45
Media armónica ............................................................................................45
Ejercicios resueltos.......................................................................................47
Cuartiles(ci) ..................................................................................................92
Deciles(Di) ....................................................................................................97
Percentiles(pi)...............................................................................................98
Quintiles(qi) ................................................................................................100

CAPÍTULO III
MEDIDAS DE DISPERSIÓN DE DATOS
Varianza .....................................................................................................109
Desviación estándar o desviación típica.....................................................109
Coeficiente de variación .............................................................................110
Utilidad del coeficiente de variación ...........................................................110
Varianza para n grupos de una población..................................................112
Exactitud.....................................................................................................114
Precisión.....................................................................................................114
Ejercicios resueltos.....................................................................................116
Ejercicios propuestos .................................................................................123

CAPÍTULO IV
CORRELACION Y REGRESION LINEAL
Correlación lineal........................................................................................125
Covarianza (Sxy) ........................................................................................126
Regresión lineal simple ..............................................................................133
MODELOS DE REGRESION .....................................................................162
Regresión no lineal simple (Curvilínea)......................................................162

CAPÍTULO V
OUTLIER Y FUNDAMENTOS BASICOS DE SOFTWARE R
Outliers . .....................................................................................................171
Condiciones de para identificar los outliers ................................................171
La estadística con software R ....................................................................175
REFERENCIAS BIBLIOGRÁFICAS ...........................................................189



INTRODUCCIÓN

Durante casi todas las actividades que realiza el hombre, este hace uso de la
estadística, por ejemplo, al comenzar el día uno revisa la hora que marca el
reloj y en función a la hora, calcula el tiempo promedio en vestirse, ducharse
y preparar su alimento, así como el tiempo para preparar el material que lle-
vará o usara en el trabajo. Como segundo ejemplo en el contexto investigativo:
al realizar la evaluación de muestras del agua pluvial durante la temporada de
lluvias, se busca determinar el grado de alcalinidad del agua. En este trabajo
también se tienen que medir varias variables, así como el pH, turbidez, solidos
entre otras. Como siguiente ejemplo podríamos hacer referencia a la actividad
que realizan los emprendedores empresariales que en la mayoría de los casos
son pequeños negocios, que para lograr el salir adelante, tienen que hacer un
previo trabajo de predicción y diagnóstico de inversión y ventas, esta actividad
también aborda la cuantificación de datos, entradas y salidas ”compras - ven-
tas”.

Por tanto, es importante resaltar que en los previos ejemplos es indispen-
sable el uso de las técnicas estadísticas.

Las empresas corporativas enfrentan problemas similares, pero en gran
escala, estas deben garantizar su producción y venta, haciendo estudios de
mercadeo, tomando muestras al azar y también por conveniencia en distintos
puntos estratégicos, también deben cuantificar y totalizar las ventas por día,
semana, mensual y por temporada según el tipo de articulo y/o servicio que
presten, en todo ese proceso se hace uso implícito de la estadística.

En el contexto del transporte terrestre, aéreo y marítimo sucede lo mismo,
se toman puntos de partida y puntos de llegada, ya sea a nivel nacional e
internacional en este ultimo las empresas navieras tienen que tomar rutas
desde Asia hasta los países latinoamericanos como el Perú, rutas en las cua-
les se tiene que contemplar un número de días de tránsito en el mar, número
de contenedores a entregar en cada puerto, número de días de descarga,
numero de transbordos marítimos entre naves. Todos estos procesos requie-
ren siempre tomar datos, y en función a estos, realizar la programación de
entrega de mercancías en cada destino, como es el caso del Perú: Callao,
Matarani y en Chile: Iquique para luego volver al continente asiático con pro-
ductos de exportación. Así como en este ultimo la estadística está presente
en cada actividad que el hombre realiza.

Estadística Descriptiva Básica ~ 1 ~ Huanca S., Jhon R & Auquitias C., Gladys M.



CAPÍTULO I

LA ESTADÍSTICA Y SUS
FUNDAMENTOS BÁSICOS

La estadística y sus fundamentos básicos.- La estadística es usada coti-
dianamente por las personas, muchas veces sin saber de lo que se trata. Pero
está en su día a día, desde tiempos inmemorables su presencia justifica y
hasta sustenta el porqué de la importancia del conteo, como forma de medi-
ción inicial empírica hasta su reconocimiento desde el nivel investigativo
descriptivo.

Estadística. - Es una ciencia basada en técnicas de procesamiento de datos,
que permite la toma de información prospectiva y retrospectiva, con lo cual se
realiza el análisis e interpretación, evidenciando resultados cuantificables que
contribuyen en la toma de decisiones. También se define a la estadística
como: la ciencia que trata de la toma de decisiones, basado en datos obser-
vados cuando se tiene presencia de incertidumbre.

Clasificación de la estadística: Por lo general se clasifica en estadística des-
criptiva o deductiva, cuando los resultados del análisis no pretenden ir más
allá del conjunto de datos, e inferencial o inductiva cuando el objetivo del es-
tudio es estimar conclusiones generales a partir de un conjunto de datos
muéstrales.

Método deductivo: Este método está asociado a la estadística descriptiva,
debido a que en esta parte de la estadística se realiza la recolección, clasifi-
cación, presentación, e interpretación de un grupo de datos utilizando
métodos numéricos y esquemas gráficos que resumen y presentan la infor-
mación contenida en ellos.

Método inductivo: Este método está asociado a la estadística inferencial se
basa en el cálculo de probabilidades, se hace un análisis de cálculos y esti-
maciones a partir de datos muestrales, las estimaciones obtenidas
contribuyen en la toma de decisiones y predicciones sobre un conjunto de
datos poblacionales.

Estadística Descriptiva Básica ~ 3 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

A continuación, se explica los tipos es estadística según los métodos deduc-
tivo e inductivo:

Estadística Descriptiva.- La estadística descriptiva aborda la selección, or-
ganización e interpretación de datos (está asociado al proceso de medición y
presentación de la información a través de la frecuencia).

Estadística Inferencial. - La estadística Inferencial es la parte de la estadís-
tica que explica el comportamiento de los datos a partir de datos muéstrales,
específicamente realiza la aproximación (estimación del estadístico al Pará-
metro), el cual contempla un margen de error mínimo asociado a los
resultados obtenidos.

Es así que se puede conceptuar los estadísticos como: parámetro y estadís-
tico.

Parámetro: se refiere al indicador poblacional (ejm:, ).

Estadístico: Se refiere al indicador muestral también conocido por otros in-
vestigadores como estadígrafo (ejm: x,s )

Nota: Es importante indicar que dentro de la estadística inferencial se puede
identificar la estadística paramétrica y la estadística no paramétrica, los cuales
se asocian al adecuado tratamiento estadístico según la naturaleza de los da-
tos. A continuación se explica brevemente la estadística paramétrica y la
estadística no paramétrica.

Estadística paramétrica. - en la práctica es una rama de la estadística infe-
rencial la cual comprende de procedimientos estadísticos, basados en
distribuciones conocidas. Las pruebas paramétricas cambian de requerimien-
tos según la naturaleza de los datos a abordar, por ejemplo: si se trata de un
grupo, dos grupos independientes, 2 grupos repetidos o relacionados, k-gru-
pos independientes y k grupos repetidos o relacionados. En cada caso se
requiere que cumpla con los supuestos de normalidad, homogeneidad de va-
rianzas; en las medidas repetidas la esfericidad es indispensable entre
grupos. A continuación listamos algunas pruebas paramétricas.

- T de Student para una muestra
- T de Student para muestras independientes
- T de Student para muestras relacionadas
- Anova de un factor Inter-sujetos

Estadística Descriptiva Básica ~ 4 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

- Anova de un factor Intra-sujetos
- Correlación de Pearson

- Manova
- Ancova
- Mancova
- Diseño factorial completa al azar (DCA)
- Diseño factorial incompleta al azar (DIA)
- Diseño Superficie Respuesta
- Regresión Lineal
- Regresión Lineal múltiple

Estadística no paramétrica. - Es una rama de la estadística inferencial la
cual comprende de procedimientos estadísticos basados en las pruebas y mo-
delos estadísticos cuyas distribuciones de probabilidad asociadas se supone
contemplan algunas condiciones de comportamiento en los datos. ”Las prue-
bas no paramétricas no están asociadas a una distribución en particular”.

En la estadística no paramétrica los modelos estadísticos utilizados no son
determinados inicialmente como los paramétricos, sino que son obtenidos di-
rectamente de los datos observados a través de estudios prospectivos. Es por
lo que los parámetros que los definen son flexibles y cambiantes en función
de estos datos. A continuación listamos algunas pruebas no paramétricas.

- Prueba Bernoulli
- Prueba Binomial
- Prueba de Anderson-Darling
- Prueba de Cochran
- Prueba de Cohen kappa
- Prueba de Fisher
- Prueba de Friedman
- Prueba de Kendall
- Prueba de Kolmogórov-Smirnov
- Prueba de Kruskal-Wallis
- Prueba de Mann-Whitney
- Prueba de Wilcoxon

Estadística Descriptiva Básica ~ 5 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

- Prueba de McNemar
- Prueba de rachas o de aleatoriedad
- Coeficiente de correlación de Spearman
- Tablas de contingencia
- Prueba de Wald-Wolfowitz
- Prueba de los rangos con signo de Wilcoxon

POBLACIÓN Y MUESTRA

Población. - La población está definida por el total de elementos o universo
de unidades de observación en un estudio.

Ejemplos:

- Registro de docentes en regina de la región de Puno
- Registro de docentes ordinarios de la universidad
- Registro de docentes contratados en la región de Puno
- Registro de graduados de pregrado de la universidad de Juliaca
- Registro de graduados de postgrado de la universidad de Puno
- Registro de docentes ordinarios con más de 25 años de servicio en la

UNAP
- Registro de grados y títulos en el vicerrectorado académico de la UNMSM
- Registro de docentes con grado de magister Scientiae en la UNAP
- Registro de docentes con grado de doctoris Scientiae en la UPeU
- Registro de programas de segunda especialidad en la región de Puno
- Registro de programas de maestría en la UNAP
- Registro de programas de doctorado en la región de Arequipa.
- Registro de estudiantes inscritos en el comedor universitario de la UNAP
- Registro de libros de la biblioteca especializada de la escuela profesional

de Ingeniería Química
- Registro de libros de la biblioteca central de la UNAP
- Registro de trabajadores administrativos en la UNAJ
- Registro de trabajadores CAS en la UNMSM
- Registro de libros publicados por los docentes de la universidad Privada
- Registro de estudiantes con intercambio estudiantil en la UNAP

Estadística Descriptiva Básica ~ 6 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

- Registro de bienes en específico de la UNAP
- Registro de proveedores de la UNAP
- Registro de universidades licenciadas por la SUNEDU
- Registro de docentes aprobados por los estudiantes según dese peño do-

cente.
- Registro de libros con depósito legal en la Biblioteca Nacional del Perú.
Muestra. - Es una parte del universo o población, para su cálculo se hace uso
de la determinación del tamaño muestral y para su selección de sus unidades
se hace uso de técnicas de muestreo probabilísticas y no probabilísticas. Este
grupo o sub conjunto debe ser representativo de la población, ya sea por
muestreo probabilístico o no probabilístico, se toman ciertos criterios de se-
lección con el objeto de cuantificar e investigar las características de la
población de estudio.
Ejemplos de grupos muéstrales:

- Registro de docentes en regina de la escuela profesional de Ingeniería
Estadística e Informática de la UNAP.

- Registro de docentes ordinarios de la facultad de derecho de la UNAP
- Registro de docentes contratados de la escuela profesional de ingeniería

civil de la UNAP
- Registro de graduados de pregrado de la escuela profesional de Ingenie-

ría Sanitaria y Ambiental de la UANCV
- Registro de docentes con grado de doctoris scientiae en la Escuela Pro-

fesional de Estadística de la UNAP.
- Registro de investigadores que corresponden al nivel I del grupo María

Rostowrosky en la Facultad de Estadística e Informática de la UNAP.

El Muestreo. - El muestreo es una técnica estadística y que es usada como
herramienta fundamental en la investigación científica. Su función es determi-
nar que parte de una realidad en estudio (población o universo) debe
examinarse con la finalidad de hacer inferencias sobre toda la población o
grupo de estudio.

Determinación del tamaño muestral. - Esta técnica estadística nos permite
conocer el número exacto de unidades con que contara nuestra muestra. Para
su obtención se tiene que conocer:

Estadística Descriptiva Básica ~ 7 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

El número grupos, población conocida, población desconocida, nivel de signi-
ficancia, error, probabilidad de éxito (p) y probabilidad de fracaso (q). Para
realizar la selección de unidades muéstrales, se hace uso de las técnicas de
muestreo probabilísticas y no probabilísticas.

Técnicas de muestreo probabilísticas

Entre las más conocidas se tiene:

- Muestreo aleatorio simple con o sin reposición
- Muestreo por conglomerados
- Muestreo estratificado
- Muestreo Sistemático

Técnicas de muestreo no probabilísticas
- Muestreo por juicio
- Muestreo por conveniencia
- Muestreo bola de nieve
- Muestreo por racimos

A continuación, algunos ejemplos para determinar el tamaño de muestra:

TAMAÑO DE MUESTRA PARA VALORES PROPORCIONALES – VARIA-
BLE CUALITATIVA

1.- Tamaño de muestra para la estimación de frecuencias (población cono-
cida / variable cualitativa)

n  d2 N * Z12 2* p * q p*q
*(N1)  (Z12 /2 ) *

Donde:

N : es el total poblacional

 : Alfa, también denominado error tipo I o tolerancia o nivel de desconfianza

 : Nivel de confianza o error tipo II, está dado por:   1 2

Z : Valor en tabla

p : Probabilidad de ocurrencia

Estadística Descriptiva Básica ~ 8 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

q : Complemento de p

d : Precisión

n : Tamaño de muestra

Ejemplo: Dado los siguientes datos determinar el tamaño de muestra “n”.

N = 400 ,  =0.05 ,   (1 2)  0.975 , Z(1 2) = 1.96 , p = 0.30 , q
= 0.70 , d  0.060 , n  ?

n  d2 N * Z12 2* p * q p*q
*(N1)  (Z12 /2 ) *

Reemplazando tenemos:

n  0.0602 400*1.962 *0.30*0.70  143.85  144
*(400 1)  (1.96)2 *0.30*0.70

n  144

2.- Tamaño de muestra para la estimación de frecuencias (población desco-
nocida / variable cualitativa)

n  Z12 2* p*q
d2

Donde:
 : Alfa, también denominado error tipo I o tolerancia o nivel de desconfianza
Z : Valor en tabla
p : Probabilidad de ocurrencia

q : Complemento de p

d : Precisión
n : Tamaño de muestra
Ejemplo: Dado los siguientes datos determinar el tamaño de muestra “n”.

Estadística Descriptiva Básica ~ 9 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

 =0.05 , Z(1 2) = 1.96 , p = 0.30 , q = 0.70 , d  0.060 , n  ?

n  Z12 2* p*q
d2

Reemplazando tenemos:

n  1.962 * 0.20 * 0.80  0.614656  384.16 385
0.0402 0.0016

n  385

TAMAÑO DE MUESTRA PARA VALORES NO PROPORCIONALES – VA-
RIABLE CUANTITATIVA

1.- Tamaño de muestra para la estimación de promedios (población conocida
/ variable cuantitativa).

n  d2 N * Z12 2* S 2
*(N1)  (Z12 /2 ) * S 2

Donde:

N : es el total poblacional

 : Alfa, también denominado error tipo I o tolerancia o nivel de desconfianza

 : Nivel de confianza o error tipo II, está dado por:   1 2

Z : Valor en tabla
S : Desviación estándar

S2 : Varianza
d : Precisión(error)
n : Tamaño de muestra
Ejemplo: Dado los siguientes datos determinar el tamaño de muestra “n”.

N = 170 ,  =0.05 ,   (1 2)  0.975 , Z(1 2) = 1.96 , S = 3.5

S2 = 12.25 , d  1.2 , n  ?

Estadística Descriptiva Básica ~ 10 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

n  d 2 N * Z12 2* S 2
*(N1)  (Z12 /2 ) * S 2

Reemplazando tenemos:

n  1.22 * 170*1.962 *3.52 * 3.502  27.546  28
(170 1)  (1.96)2

n  28

2.- Tamaño de muestra para la estimación de promedios (población descono-
cida / variable cuantitativa).

n  Z12 2 * S 2
d2

Donde:
 : Alfa, también denominado error tipo I o tolerancia o nivel de desconfianza
Z : Valor en tabla

S : Desviación estándar

S2 : Varianza

d : Precisión
n : Tamaño de muestra
Ejemplo: Dado los siguientes datos determinar el tamaño de muestra “n”

N = Desconocido ,  =0.05 ,   (1 2)  0.975 , Z(1 2) = 1.96 , S =
5, S2 = 25 , d  0.45 , n  ?

n  Z12 2 * S 2
d2

Estadística Descriptiva Básica ~ 11 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Reemplazando tenemos:

n Z12 2 * S 2  (1.96)2 *(25)  96.04  474.27
d2 0.452 0.2025

n  475

NOTA:

La determinación del tamaño muestral se aplica cuando se tiene dos grupos
categóricos o numéricos, bajo la siguiente denominación:

- Tamaño de muestra para comparar frecuencias en dos grupos(categóri-
cos)

- Tamaño de muestra para comparar promedios en dos grupos(numéricos)

Por su puesto requiere ser abordado en detalle, sin embargo, este apartado
ya corresponde a la Estadística Inferencial.

Cuando ya se dispone del tamaño de muestra, toca seleccionar la técnica de
selección de unidades de observación, esta se desarrolla de acuerdo a la na-
turaleza de los datos, por tanto, se puede usar una técnica de muestreo
probabilística o una técnica de muestreo no probabilística.

Técnicas de muestreo probabilísticas. - estas se basan en la selección
aleatoria de las unidades de observación, las cuales conformaran el tamaño
de muestra.

Técnicas de muestreo no probabilísticas. - estas se basan en la selección
no aleatoria de las unidades de observación, con los cuales se conforma el
tamaño de la muestra.

A continuación, planteamos algunos ejemplos teóricos de su aplicación:

1.- En el caso que: “El presidente regional de puno, requiera reorganizar su
equipo técnico para su gestión de gobierno 2019 – 2022, el cual deberá
estar conformado por un número de integrantes con capacidad técnica
calificada”. En este caso el presidente regional no podría tomar en cuenta
todo el padrón electoral de la región de puno y de allí seleccionar al azar
los miembros de su equipo técnico; lo más idóneo sería que la selección
de individuos sea a juicio, basándose en criterios de calidad y capacidad
técnica comprobada, debido que la dirección de la región puno, debe
mostrar calidad en cada proceso que realiza y no de forma improvisada.

Estadística Descriptiva Básica ~ 12 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

La selección aleatoria del equipo técnico generaría desaciertos y como
consecuencia retrasos en la implementación y desarrollo de proyectos
para la región de puno, es por lo que se recomienda que la selección sea
basada a juicio de expertos. El planteamiento se ajusta a la técnica de
muestreo no probabilística a juicio, por los fundamentos indicados.

2.- En el caso que: “Un investigador asociado a las ciencias de la salud logre
elaborar un nuevo fármaco que permita contrarrestar efectivamente la
diabetes, este requerirá comprobar sus resultados en un grupo alta-
mente representativo de la población de estudio”. La característica de
conformación de la población de estudio para este caso será, que todos
los individuos tengan la enfermedad. Partiendo de esta premisa y según
la característica ”diabetes” en cada individuo, se podrá realizar la selec-
ción aleatoria de individuos, los cuales pasaran a conformar la muestra
donde se aplicara el fármaco. Si en este grupo muestral el fármaco re-
sulta altamente significativo, se podría extender su aplicación a toda la
población que tiene la enfermedad, lo cual sería bueno para el área de
conocimiento de la medicina y salud de las personas.

Si en la muestra replanteamos la sección de los individuos de la siguiente
manera: Se selecciona solo los Individuos que se encuentren clínicamente
menos enfermos excluyendo a los individuos crónicos para la prueba de efec-
tividad del fármaco, para este caso, los resultados serían imprecisos, no se
podría evidenciar el grado real del efecto del fármaco en el grupo muestral (los
resultados estarían sesgados), lo cual no sería bueno, tampoco saludable. El
planteamiento inicial se ajusta a la aplicación a la técnica de muestreo proba-
bilística por los fundamentos indicados, no siendo aplicable en el
replanteamiento.

Para el Lector: Defina 05 planteamientos no probabilísticos y 05 planteamien-
tos probabilísticos asociados a su actividad académica y sus líneas de
investigación científica de su escuela profesional, indicando los criterios que
justifican la aplicación de dichas técnicas de muestreo.

UNIDAD DE ANÁLISIS

Las unidades de análisis o unidades de observación están representadas por
los sujetos, objetos y teorías y/o definiciones sobre un tema en concreto. A
continuación, algunos ejemplos:

Estadística Descriptiva Básica ~ 13 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Sujetos

- Los estudiantes de pre-grado de la universidad de Sao Pablo en Brasil
- Los hombres del planeta tierra
- Los docentes de la región de puno
- Los enfermos con cáncer terminal
- Los Investigadores concytec - regina
- Los habitantes de ciudad de Juliaca
- Los egresados de la facultad de ingenierías de la universidad de Juliaca.
- Los especialistas en caracterización de la fibra de los camélidos sudame-

ricanos de la región
- Los ingenieros sanitarios de la ciudad de Juliaca

Objetos

- Los computadores de la escuela profesional de administración y nego-
cios internacionales de la universidad privada de Puno.

- Los vehículos automotores que se encuentran en la ciudad de Puno
- Las viviendas construidas en el barrio bellavista de la ciudad de Puno
- Los minerales alcalinos que se encuentran en la región de Puno
- Los libros que lleva un estudiante de secundaria
- Los instrumentos de recolección de datos

Teorías y/o Definiciones

- Las distintas definiciones sobre el concepto de la estadística según cada
autor y/o investigador.

- La concepción de las teorías sobre la creación del universo según los
Investigadores alrededor del mundo.

- Las definiciones sobre la Ingeniería sanitaria ambiental según opiniones
de sus propios egresados

- Las definiciones de la ingeniería mecatrónica según sus docentes de es-
pecialidad

- Los paradigmas de la ciencia de datos según especialistas en cada una
de las áreas del conocimiento humano.

Estadística Descriptiva Básica ~ 14 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Para el lector: ¿El agua es definida como unidad de análisis?, explique y jus-
tifique su respuesta. Además, incluya 10 ejemplos de unidad de análisis
“sujetos” y 10 ejemplos de unidad de análisis “objetos” todos asociados a su
escuela profesional.

En conclusión, al conjunto de las unidades de análisis, ya sean sujetos, obje-
tos y teorías y/o definiciones se les denomina “la población de estudio”.

Las variables

Variables estadísticas. - La variable en sí, es una característica de las uni-
dades de observación pertenecientes a una determinada población. Por lo
general las variables se clasifican en variables cualitativas y variables cuanti-
tativas. Las variables se sub dividen en nominales, ordinales, discretas y
continuas. Sin embargo, existen otros tipos de variables tales como: las varia-
bles cualitativas dicotómicas (Dummy - variables ficticias), politómicas, fijas,
aleatorias, endógenas y exógenas.

Las variables también pueden ser aleatorias numéricas o categóricas. En un
estudio en particular se recomienda trabajar con variables numéricas porque
estas traen más información que las categóricas debido a que las variables
numéricas tienen más atributos que las categóricas:

Los atributos de Medición de las variables son: orden, distancia y origen, y el
orden de las variables según estos es:

1.- Sin orden – variables nominales
2.- Con orden - variables ordinales
3.- Orden y distancia – son de intervalo
4.- Orden, distancia y origen - son variables de escala de razón (variables

numéricas).
Y el requisito principal para que una variable sea variable es que este varié de
unidad de análisis en unidad de análisis / o de unidad de observación en uni-
dad de observación.

Variables nominales. - Son aquellas variables que tienen una representación
literal (no numérica) cuya característica es que no hay un orden u jerarquía
entre sus categorías.

Estadística Descriptiva Básica ~ 15 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Ejemplos:

Variables nominales:

- La belleza
- La felicidad
- La ignorancia
- La utilidad
- El género
- El color de los ojos
- El miedo
- La creatividad
- La religión que se profesa
- Lugar de nacimiento
- El idioma de los habitantes en la tierra
- El grupo sanguíneo
- La nacionalidad
- La raza

Definición de variables nominales. - la definición de estas variables debe
precisar: la variable, la unidad de análisis, la muestra o población de donde
proviene e inclusive en algunos casos lugar y tiempo.

- El color de los ojos de los estudiantes del I semestre de la escuela Profe-
sional de Ingeniería Estadística e Informática de la UNAP - 2019.

- El lugar de nacimiento de los egresados de la escuela profesional de me-
dicina humana de la UNAP – 2019.

- Las principales razas humanas en el mundo (negra, malaya, caucásica,
mongola y americana).

- Los tipos de gobierno que existe en el mundo al año 2021
- La nacionalidad de los inmigrantes en los estados unidos al año 2022

Variables ordinales. - Son aquellas variables que tienen una representación
literal (no numérica) cuya característica es que tienen un orden u jerarquía
entre sus categorías de respuesta.

Estadística Descriptiva Básica ~ 16 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Ejemplos:

- Nivel de pobreza
- Categoría de un docente ordinario universitario
- Grado de enfermedad
- Grado de satisfacción
- Los pasos del método científico que adopta un investigador
- La Intensidad de dolor
- Grado de desgaste de un producto o pieza
- El coeficiente intelectual categórico determinado
- El estado civil de los egresados de la universidad
- El nivel de satisfacción de los estudiantes con el programa estadístico

utilizado
- Los tipos de clases sociales (alta, media, baja)
- El orden de llegada de los estudiantes al salón de clase
- El cargo jerárquico de un oficial de aduanas
- El proceso de desarrollo e implementación de un proyecto de ingeniería

de software.

Definición de variables ordinales.- La definición de estas variables debe
precisar: la variable, la unidad de análisis, la muestra o población de donde
proviene e inclusive en algunos casos lugar y tiempo. Todo esto para delimitar
el tiempo o periodo en el cual se llevó a cabo el estudio.

El grado académico alcanzado por los docentes de la UNAP, 2019

- La intensidad de dolor de los pacientes con tratamiento de quimioterapia
- El grado de satisfacción de los egresados de la carrera de Ingeniería textil

de la Universidad de Juliaca con los componentes curriculares ofertados
hacia ellos durante el periodo 2014 - 2020.
- El ciclo de vida de los seres humanos
- Las etapas del desarrollo embrionario humano
Variables discretas. - son aquellas variables que tienen una representación
no literal, son del tipo numérico este resulta del producto de un conteo.

- El número de accidentes en la vía puno - Juliaca
- El número de grados de un docente de ingeniería mecatrónica en la UNI

Estadística Descriptiva Básica ~ 17 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

- El número es exámenes que rinde un estudiante en la UNAP
- En número de inasistencias de un docente de pregrado
- La cantidad de empleados en la región de puno
- La cantidad de denuncias del ex-gobernador de la región de puno
- La cantidad de regiones del perú que no cuentan con un proyecto para

contrarrestar la contaminación de polietileno a y sus derivados
- El número de leyes aprobadas por los congresistas de la región de puno
- El número de camélidos sudamericanos en el distrito de cabana
- El número de plantas de tratamiento de residuos sólidos en la región de

puno
- El número de importaciones realizadas por los empresarios de la ciudad

de Juliaca.
- El número de exportaciones realizadas por los productores alpaqueros de

la región de puno
- El número de investigadores regina de la universidad privada de juliaca
- El número de patentes de invención realizadas por los profesionales de

la región de puno
- Número de doctorados ofertados por la universidad nacional de puno
- Número de artículos científicos desarrollados por los docentes de las uni-

versidades privadas de la región de puno
- Número de hermanos que tiene un estudiante de pregrado de la UNAJ

Definición de Variables discretas.- en la definición de estas variables se
debe precisar la variable, la unidad de análisis, la muestra y/o población de
donde proviene, e inclusive en algunos casos lugar y tiempo. Todo esto para
delimitar el tiempo o periodo en el cual se llevó a cabo el estudio.

- Número de hermanos que tiene un estudiante de la escuela profesional
de Ingeniería sanitaria de la universidad privada de la ciudad de juliaca,
2019

- El número de accidentes vehiculares en la vía puno-juliaca, durante el
periodo agosto - diciembre del 2020

- El número de leyes aprobadas por los congresistas del partido de frente
amplio A favor de población en materia de seguridad informática, 2019 -
2021.

Estadística Descriptiva Básica ~ 18 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

- En número de puntos muestrales identificados para realizar un análisis
de presencia de coliformes totales y fecales en la ciudad de Juliaca - 2019

- El número de estudiantes con que cuentan la escuela profesional de in-
geniería ambiental y forestal de la universidad de cusco, 2020-II.

Variables continuas. - son aquellas variables que tienen una representación
no literal, son del tipo numérico, cuya característica es que resultan del pro-
ducto de una medición, la cual se realiza a través de un instrumento mecánico,
documental, o artefacto de medición. - La temperatura registrada a las 00:00
horas durante una semana

- La proporción de población en edad infantil en el distrito de cabana
- La presión sanguínea de los pacientes en un hospital
- El pH registrado en veinte puntos muestrales del rio torococha de Juliaca
- La velocidad registrada por los vehículos pesados en la ruta juliaca - puno
- El diámetro de ruedas de un vehículo
- El peso total en TN de los residuos sólidos recolectados durante cada

semana.

Variables dicotómicas. - También denominas variables dummy, son aque-
llas variables que tienen la característica de tener 2 categorías de respuesta,
por tanto, se asocian a las variables cualitativas categóricas.

Ejemplos:

- El género de un ser humano: hombre/ mujer
- La representación de los códigos binarios: cero / uno
- El estado de un día en referencia a: día / noche
- El fallo de un juez ante un procesado por la justicia será: positivo / nega-

tivo.
- Las personas que sufrieron un accidente podrán resultar con vida / o sin

vida después de un tiempo en cuidados intensivos.
- La situación académica de un estudiante de pre-grado en un determinado

curso al final de año será: aprobado / desaprobado.
Definición de variables dicotómicas.- la definición de estas variables debe pre-
cisar: la variable, la unidad de análisis, la muestra o población de donde
proviene, inclusive en algunos casos lugar y tiempo.

Estadística Descriptiva Básica ~ 19 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

- La situación académica de un estudiante de pre-grado de la escuela pro-
fesional de ingeniería química de la universidad de puno, en el curso de:
diseño de experimentos al final del año académico 2020. Será: aprobado
/ desaprobado.

- El género de un recién nacido en la posta de nombre Santa Adriana de la
ciudad de Juliaca será: masculino / femenino.

Variables politómicas.- Son aquellas variables que tienen más de dos cate-
gorías de respuesta.

- El ciclo de vida de los seres humanos (nacen, crecen, se reproducen,
mueren)

- El grado de instrucción de los trabajadores administrativos de la Munici-
palidad Provincial de San Román (primaria incompleta, primaria
completa, secundaria incompleta, secundaria completa, superior com-
pleta, etc).

- El grado de dolor de un paciente (intenso, moderado, leve, sin dolor)
- El grado académico alcanzado por los docentes de la universidad de la

lima.

Nota: las variables pueden ser dicotómicas nominales, dicotómicas ordinales, poli-
tómicas nominales, politómicas ordinales. Estas se basan en función de la
naturaleza de los datos.

Variables fijas. - son aquellas variables que no cambian a través del tiempo,
permanecen en su estado inicial de registro.

- El colegio de procedencia de los estudiantes de Ingenierías del VI-SEM
de la universidad de Lima.

- El lugar de nacimiento de los estudiantes de la escuela profesional de
Sociales del VIII-SEM de la universidad de Lima.

Variables aleatorias. - son aquellas variables que si cambian a través del
tiempo, no permanecen en su estado inicial de registro.

- El peso de los estudiantes del 4to año del colegio de educación secunda-
ria Politécnico Regional de los Andes - Juliaca, 2019 - 2021.

- El número de accidentes registrados en la vía puno – juliaca durante el
año 2021.

Estadística Descriptiva Básica ~ 20 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Variables endógenas. - son aquellas variables que por lo general pertenecen
a un modelo específico, también denominadas variables dependientes, varia-
bles respuesta o variable pre-decida. El uso apropiado de cada denominación
depende del tipo de estudio que se esté realizando, por ejemplo:

En un planteamiento que contemple “educación y nivel de ingresos”: podría-
mos indicar que “a mayor educación, más probable es obtener mayores
ingresos”. Así también, “a mayor nivel de ingresos, más probable que se
tenga niveles de educación superior”.

Variables exógenas. - son aquellas variables que no pertenecen a un modelo
especifico o están fuera de su alcance, también se denominan variables inde-
pendientes, variables predictores o variables explicativas, estas están
asociadas directamente con las variables endógenas.

Las variables estadísticas se usan para desarrollar los trabajos de investiga-
ción ubicados en los niveles de investigación científica. Los cuales se listan a
continuación:

- Nivel investigativo exploratorio
- Nivel investigativo descriptivo
- Nivel investigativo correlacional
- Nivel investigativo explicativo

Sin embargo en algunos trabajos se está aplicando la siguiente estructura:

- Nivel investigativo exploratorio
- Nivel investigativo descriptivo
- Nivel investigativo relacional
- Nivel investigativo explicativo
- Nivel investigativo predictivo
- Nivel investigativo aplicativo

Así mismo es importante precisar que las variables cambian de denominación
de acuerdo al nivel investigativo donde se desarrollan los estudios, también
se especifica en número de variables según el nivel investigativo. A continua-
ción, un breve resumen.

Estadística Descriptiva Básica ~ 21 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

- En el nivel investigativo descriptivo
Se denomina variable de interés o de caracterización (se aplica en distribucio-
nes unidimensionales – se analiza solo una variable). Identificando la
frecuencia de los datos en la variable, se basa en un proceso descriptivo -
observacional acompañado con la frecuencia de ocurrencia.
- En el nivel investigativo relacional(correlacional)
El análisis es bivariado (se aplica en distribuciones bidimensionales) se com-
para de 2 en 2 variables, no se busca la dependencia por tanto no existe
definición de variable dependiente como de independiente. A no ser que la
prueba de hipótesis sea de independencia. El análisis bivariado busca deter-
minar el grado de asociación entre las variables, denominado analíticamente
como: el contraste entre la variable de supervisión. Ejemplo: La inseguridad
ciudadana y las variables asociadas son inversión en cámaras de seguridad,
número de inmigrantes por mes, falta de un planes de seguridad por distritos,
el número de serenos en las calles del distrito, número de efectivos policiales
en las calles, etc. La analogía del estudio es siempre de 2 en 2 variables.
- En el nivel investigativo explicativo
Se denomina variable independiente (factor fijo categórico) - variable depen-
diente, estas se asocian a estudios de causalidad por lo que, su propósito es
identificar la causa del efecto, en este nivel se realiza el análisis experimental,
el cual se asocia a múltiples diseños estadísticos denominados “Diseños Ex-
perimentales”, los cuales cambian de denominación de acuerdo al número de
variables que se incluyen en el estudio.

Estadística Descriptiva Básica ~ 22 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

A continuación, algunos ejemplos en cada nivel investigativo:

01 variable independiente Unidad experi- 01 variable dependiente
mental Aleatoria / categorica

Diseño unidimensional/unifactorial - univariante

02 variable independientes Unidad experi- 01 variable dependiente
mental

Diseño bidimensional/factorial - univariante

k variables independientes Unidad experi- 01 variable dependiente
mental

Diseño multidimensional/factorial - univariante

01 variable independiente Unidad experi- 02 variables dependientes
mental

Diseño unidimensional/unifactorial - multivariante

k variables independientes Unidad experi- 02 variables dependientes
mental

Diseño multidimensional/factorial - multivariante

k variables independientes Unidad experi- k variables dependientes
mental

Diseño multidimensional/factorial - multivariante

Estadística Descriptiva Básica ~ 23 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Además, se asocian variables numéricas aleatorias (covariables), variables
bloques, entre otras. Los cuales generan nuevos diseños experimentales
como los diseños con bloque completamente al azar, diseños cuadrados lati-
nos y diseños cuadrados grecolatinos.
- En el nivel investigativo predictivo
El propósito en este nivel investigativo es construir un modelo matemático que
permita realizar una predicción adecuada, las variables en este nivel se las
denominan:
Predictor (Variable Independiente) - variable respuesta / predecida
- En el nivel investigativo aplicativo
Está orientado a solucionar el problema, aquí denominamos a la variable de
estudio como variable de control o evaluativa, con la cual se busca determinar
la mejora del estudio en contra posición de otros estudios.
Nota: El desarrollo de la estadística no se contiene en el nivel investigativo
exploratorio (investigación cualitativa), por otro lado se contiene y aplica en
todos los demás niveles investigativos (investigación cuantitativa) según el
propósito y naturaleza de las variables involucradas al estudio. También es
importante precisar, que una gran proporción de las técnicas estadísticas se
aplican y asocian en determinados niveles de investigación científica.
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
Las tablas de distribución de frecuencias estructuran en forma ordenada los
datos cuantitativos, permitiendo organizar los datos con el propósito de una
adecuada interpretación textual y gráfica, Las tablas de frecuencias de datos
las podemos presentar como tablas discretas y continuas.

Estadística Descriptiva Básica ~ 24 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Distribuciones discretas
Las tablas de frecuencias de datos discretas contienen valores discretos en la
variable las cuales se presentan a continuación.

Xi Frecuencia
10 3
12 2
14 8
16 3
18 4

20

Distribuciones continuas

Las tablas de frecuencias de datos continuos contienen valores continuos (in-
tervalos) en la variable las cuales se presentan a continuación.

Intervalos Frecuencia
[ 02 ; 04 > 3
[ 04 ; 06 > 2
[ 06 ; 08 > 8
[ 08 ; 10 > 3
[ 10 ; 12 > 4

20

Para generar las tablas de frecuencia, se requiere previamente determinar las
frecuencias absolutas, frecuencias absolutas acumuladas, frecuencias relati-
vas, frecuencias relativas acumuladas, marca central de clase, límite Inferior
del primer intervalo de clase, límite superior del primer intervalo de clase.

Frecuencia absoluta de los datos (fi)

La frecuencia absoluta se representa por el número de veces que aparece un
valor en la variable, además la sumatoria de las frecuencias absolutas es igual
al total de datos (n).

Estadística Descriptiva Básica ~ 25 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

k

i)  fi  n
i 1

Frecuencia absoluta acumulada de los datos (Fi)
La frecuencia absoluta acumulada se representa por el número de veces que
aparece un valor en la variable acumulado secuencialmente, además se cum-
ple que Fk=n
ii) Facumulada = f1 + (f1+f2) + (f1+f2+f3) + (f1+f2+f3+f4) + … + (f1+f2+f3+f4+fk)
ii) Fk = n
Donde:
Fk = es la k-esima frecuencia absoluta acumulada
n = el total de datos de la distribución

Frecuencia relativa de los datos (hi)

La frecuencia relativa está dada por la división entre la frecuencia absoluta y
el total de datos, se usa para interpretar los datos porcentualmente, por tanto
se cumple:

hifi ; %hi fi ; k
 n  n (100)
hi  1

i 1

Frecuencia relativa de los datos acumulados (Hi)

La frecuencia relativa acumulada está dada por la suma acumulativa de las
frecuencias relativas, se usa para interpretar los datos acumulados porcen-
tualmente, por tanto se cumple:

i) Hacumulada = h1+(h1+h2)+(h1+h2+h3)+(h1+h2+h3+h4)+… +(h1+h2+h3+h4+hk)

ii) Hk = 1

Donde:

Hk = es la k-esima frecuencia relativa acumulada

Estadística Descriptiva Básica ~ 26 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Marcas central de clase (Xi)
La marca central de clase está dada por la suma del límite inferir más el

Límite inferior dividido entre dos. Representa el punto central de cada clase.

Xi  Limite inferior  Limite sup erior
2

Rango (R)

Está representado por la resta entre el valor más alto de la variable en la dis-
tribución menos en valor más bajo de la variable en la distribución.

R  Max(X)  Min(X)

Numero de clases (K)

El número de clase se determina con la regla de Sturges, regla propuesta por
Herbert Sturges en 1926, esta es una regla que permite determinar el número
de clases a considerar para la elaboración de una distribución de frecuencias
y su respectivo histograma. Por tanto para determinar el número de clases, se
hace uso de la regla de Sturges.

K  1 3.3log(n)

Donde:

K: número de clases

n: número de datos

Amplitud (A)

La amplitud intervalica es la distancia entre el límite superior de una clase
menos el limite inferior de la misma clase, La amplitud intervalica no siem-
pre será constante.

A  R
K

Estadística Descriptiva Básica ~ 27 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Límite Inferior del primer intervalo de clase ( Y0' )

Es posible determinar Y0' siempre que en la distribución la amplitud (A) de

los datos sea constante, Y0' es el límite inferior del primer intervalo de
clase.

Y0'  X1  A
2

Intervalos Frecuencia

[ Y0' ; 04 > 3

[ 04 ; 06 > 2
[ 06 ; 08 > 8
[ 08 ; 10 > 3
[ 10 ; 12 > 4

20

Límite superior del primer intervalo de clase ( Y1' )

Es posible determinar Y1' siempre que en la distribución la amplitud (A) de los
datos sea constante, Y1' es el límite superior del primer intervalo de clase.

Y1'  X2  A
2

Intervalos Frecuencia
3
[ 02 ; Y1' >
2
[ Y1' ; 06 >
8
[ 06 ; 08 > 3
[ 08 ; 10 > 4
[ 10 ; 12 >

20

Tipos de gráficos. - los gráficos permiten ilustrar el comportamiento de la
distribución de los datos, estos contrastan la interpretación de los resultados,
nos dan un enfoque más atractivo el cual contribuye documentalmente.

Estadística Descriptiva Básica ~ 28 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Gráfico de sectores
Son representaciones gráficas, aplicables a cualquier tipo de variables, prefe-
rentemente las categóricas. Se construyen dividiendo un círculo en tantos
sectores como categorías se vayan a representar. Cada sector abarca un án-
gulo proporcional a la frecuencia que se desea representar. El diagrama de
sectores de la variable se presenta a continuación en 2D y 3D:

Gráfico de sectores 2D

Afectado
30%

No
Afectado

70%

Estadística Descriptiva Básica ~ 29 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

frecuencia absoluta(fi)La estadística y sus fundamentos básicos

Frecuencia acumulada relativa(Hi)Diagramas de barras:
Son representaciones que ilustran las tablas de frecuencias de datos, se pue-
den aplicar tanto a datos cualitativos como cuantitativos. El eje de las abscisas
contiene a los valores de la variable Xi, el eje de las ordenadas contiene la
altura de la barra a graficar, con el valor de la frecuencia absoluta (fi), acumu-
lada (Fi), relativa (hi) y relativa acumulada (Hi). Según el tipo de gráfico.

Diagrama de barras
6
5
4
3
2
1
0

17-19 19-21 21-23 23-25 25-27

Edades de los estudiantes

Diagrama de barras

1.2
1

0.8
0.6
0.4
0.2

0
17-19 19-21 21-23 23-25 25-27

Edades de los estudiantes

Estadística Descriptiva Básica ~ 30 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Pictogramas.- Los pictogramas son signos icónicos dibujados que representa
figurativamente de forma más o menos realista un objeto real, o un significado,
estos se distinguen de los ideogramas en que estos son más esquemáticos y
ilustrativos; los pictogramas son más concretos. Con su nombre se suelen
denominar los signos de los sistemas no alfabéticos basados en dibujos sig-
nificativos de una realidad.
Elementos y características de un pictograma.- Los pictogramas se carac-
terizan por :
Referente: ilustra a lo que hace referencia el pictograma.
Ítems gráficos: formas gráficas que combinadas representan el objeto tomado
como referente.
Comprensión: debe ser comprendido por el mayor número de personas, inde-
pendientemente de la formación, idioma o religión.
Legibilidad: el pictograma se debe construir siguiendo un patrón de reglas que
permitan mantener la coherencia visual.

Estadística Descriptiva Básica ~ 31 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

La estadística y sus fundamentos básicos

Sencillez: tiene que representar únicamente los elementos más importantes,
evitando así posible información irrelevante.

Estadística Descriptiva Básica ~ 32 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

CAPÍTULO II

MEDIDAS DE TENDENCIA CENTRAL

Medidas de tendencia central. - Las medidas de tendencia central nos per-
miten obtener los promedios de los diferentes tipos de datos cuantitativos,

como por ejemplo: el promedio simple de secuencia de valores numéricos, el
promedio de valores que tienen crecimiento exponencial, el promedio de va-

lores negativos, el valor que tiene mayor presencia en la distribución de datos

y el promedio de valores representados en distancias y velocidades.

Entre las principales tenemos:

- La media aritmética
- La media ponderada
- La mediana
- Cuartiles
- Deciles
- Percentiles
- La moda
- La media geométrica
- La media cuadrática
- La media armónica

Media aritmética: Es la suma de todos los valores de la variable dividida entre
el número total de elementos.

n
xi
X
 x1  x2  x 3  ....x n1  x n  i 1
n
n

Si el valor xi de la variable X se repite n veces, la expresión de la media
aritmética queda de la forma siguiente:

Estadística Descriptiva Básica ~ 33 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Medidas de tendencia central

X  xi fi … (I)
n

Donde fi será la frecuencia absoluta, de otro lado con la frecuencia relativa

hi  fi la expresión para determinar la media aritmética quedará modifi-
n

cada de la siguiente forma

n

X  xihi … (II)
i1

Es importante precisar que (I) y (II) llevan al mismo resultado.

Propiedades de la media aritmética

La media aritmética es única en una distribución

La sumatoria de las desviaciones de los valores de la variable con respecto a
la media aritmética es 0, por tanto veamos que resulta al operar la siguiente

n

expresión: (xi  x)
i 1

Tendremos que:

n  x) fi 1 x fi 1
fi fi fi
    (xi

i 1
 (xi fi  x fi )  xi fi 

        1 1  xi fi n  1
xi fi  x fi fi  xi fi  xn fi   xi fi  n .  fi

 (0)( 1 )  0
fi

La media aritmética es sensible al cambio de sus valores en los extremos de
la distribución de datos

Si a todos los valores de la variable se le suma una misma cantidad, la media
aritmética queda incrementada en dicha cantidad:

Estadística Descriptiva Básica ~ 34 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Medidas de tendencia central

Supongamos que tenemos una variable x de la que conocemos su media,
ahora supongamos que tenemos otra variable, que se calcula a partir de la
anterior de la siguiente forma: yi  xi  k . Si ahora queremos calcular la me-

dia de esta segunda variable:

n
 yi fi
   y  kf
i 1   xi  k  fi   xi fi  kfi   xi fi  i
n n
n n

     xifi k fi  xi fi  k fi  xi fi  kn  xi fi  k
n n n n n n
n

Como: xi fi  X si sustituimos tendremos Y  X k que es lo que se
n

demuestra.

Si todos los valores de la variable se multiplican o dividen por una misma
constante, la media aritmética queda multiplicada o dividida por dicha cons-
tante. La demostración se realizaría de manera análoga a la anterior.

De las dos propiedades anteriores se deduce que la resta y la división se rea-
lizarían de igual manera

En referencia a la media ponderada: En un conjunto de valores se pueden
obtener 2 ó más subconjuntos disjuntos, la media aritmética del conjunto se
relaciona con la media aritmética de cada uno de los subconjuntos disjuntos
de la siguiente forma:

N
 xi Ni
X I 1

n

Siendo  xi la media de cada subconjunto y Ni el núm. de elementos de
cada subconjunto.

Veamos la demostración de la propiedad: Sea la distribución x1, x2, x3, x4,
…… xn, xn+1, xn+2 ……….xk, observando que habrían como dos subconjun-
tos de n y k-n elementos cada uno. Si consideramos la media aritmética de

Estadística Descriptiva Básica ~ 35 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Medidas de tendencia central

la distribución: X  xi fi y calculamos los sumatorios para los dos sub-
n

conjuntos, la expresión de la media quedaría:

nk n k
   xj f j  xr fr xj fj
xr fr
X  j1 r n1 j 1
  r n1
n n
n

Si multiplicamos numerador y denominador de cada una de las fracciones por
una misma cantidad el resultado no varía, por tanto, multiplicaremos la pri-
mera por N1 que es su número de elementos del primer subconjunto y la
segunda por N2 que es el correspondiente, la expresión quedará:

 n   k 
   X   xr fr 
 xj fj  
  
n N1  j 1   N2  r n1 

N1 x j f j k N1  N2

j 1 N2 xr fr  n

 N1n  r n1  n

N2n

n k
xj fj
j 1  xr fr
como  x1 y r n1  x2 son la media del primer y
N1
N2

segundo subconjunto, la expresión la podemos expresar de la siguiente ma-

nera: X  X1 N1  X2 N2  X1N1  X 2 N2
n n n

Donde n: es la sumatoria de N1 + N2.

Media aritmética ponderada: En ocasiones no todos los valores de la varia-
ble tienen el mismo peso o tamaño, esto debido a la naturaleza de los datos.
Cuando se tenga varios promedios parciales con sub grupos y se busque de-
terminar el promedio general, es recomendable aplicar la media ponderada.

Para poder calcularla se tendrá que tener en cuenta los promedios parciales
de todos los sub grupos y el tamaño de cada sub grupo que se tenga en la
variable de interés.

Estadística Descriptiva Básica ~ 36 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Medidas de tendencia central

Se representar como: X p  (xi )(ni )
ni

Siendo ni tamaño o peso de cada sub grupo de la Variable X y xi el promedio

parcial de cada grupo.

Mediana (med).- La mediana representa el punto central de la distribución de
datos, para su cálculo se hacen uso de tres casos.

Caso I: cuando n es impar, requiere que los datos estén ordenados previa-
mente

Med  n 1 ; Donde n: es el total de datos y Med la posición de la Mediana
2

en la distribución (resultado).

Caso II: cuando n es par, requiere que los datos estén ordenados previamente

n  n 1 n
2 2 ; Donde n: es el total de datos, 2
Med  = posición del primer valor,
2

n  1 = posición del segundo valor y Med la posición de la Mediana en la dis-
2
tribución (resultado).

Caso III: cuando la tabla de distribución de datos es continúa (no se considera
si n es par o impar) – “cuando ya se tiene la distribución tabular se sobre
entiende que la tabla de frecuencias ya está ordenada”

 n  FK 1   1  H K 1 
. 2  . 2 
Med  Linf  A   Med  Linf  A  
FK  FK 1  H K  H K 1 

ó

Dónde:

Linf = Límite inferior de la clase que contiene a la Med (mediana)
n = representa al número total de datos

Fk = Frecuencia absoluta acumulada que contiene al Med

Estadística Descriptiva Básica ~ 37 ~ Huanca S., Jhon R & Auquitias C., Gladys M.

Medidas de tendencia central

Fk1 = Frecuencia absoluta acumulada anterior a la clase que contiene a la
Med

A = Amplitud de la clase que contiene al Med

H k = Frecuencia relativa acumulada que contiene a Med

H k 1 = Frecuencia relativa acumulada anterior a la case que contiene a Med

Nota: Las dos fórmulas del caso III, llegan al mismo resultado.

Algunas propiedades de la mediana

- La mediana es inmune al cambio simultaneo de valores de la variable en
los extremos de la distribución de datos ordenados.

- La mediana se ubica en la misma posición del cuartil 2, decil 5 y percentil
50

- Es única, solo existe una mediana para un conjunto de datos puede ob-
tenerse para datos con atributos de razón, de intervalo y valores ordinales
(excepto para nominales).

Ejemplos: Dada las siguientes distribuciones de datos, determinar la me-
diana.

Caso I (impar)

Ejemplo 01. Dada la siguiente distribución no tabulada, determinar la me-
diana.

2, 9, 6, 8, 6, 4, 8, 7, 1, 9, 3

Solución

Previamente ordenamos los datos, quedando de la siguiente manera:

1, 2, 3, 4, 6, 6, 7, 8, 8, 9, 9 (n = 11).

Med  n 1  11  1  6to
2 2

1, 2, 3, 4, 6, 6, 7, 8, 8, 9, 9 (n = 11).

Med  6 , coincidentemente nos dio 6 también.

Estadística Descriptiva Básica ~ 38 ~ Huanca S., Jhon R & Auquitias C., Gladys M.


Click to View FlipBook Version