Matemática
Paralelepípedo: está formado por 6 caras perpendiculares. Las parejas de caras opuestas son paralelas y
congruentes entre sí.
altura (h)
ancho (a)
largo (I)
En la figura superior, el área del rectángulo anterior (posterior) es (l • h); el área del rectángulo del lado
izquierdo (derecho) es (a • h); y el área del rectángulo superior (inferior) es (l • a). Luego, el área total es
2 • (l • a + l • h + a • h).
El volumen del paralelepípedo se puede determinar como el área de la base multiplicada por la altura.
Como la base es un rectángulo de área (l • a), el volumen es (l • a • h)
Ejemplo: dado un paralelepípedo de largo 3 cm, ancho 4 cm y altura 5 cm, determinar el área total y el volumen
del paralelepípedo.
Dados el largo, ancho y la altura del paralelepípedo, se pude determinar el área y el volumen.
Área = 2 • (l • a + l • h + a • h) = 2 (3 cm • 4 cm + 3 cm • 5 cm + 4 cm • 5 cm) = 94 cm2
Volumen = l • a • h = 3 cm • 4 cm • 5 cm = 60 cm3
La diagonal de un paralelepípedo se puede determinar aplicando el teorema de Pitágoras. Es equivalente al
cálculo de distancia entre dos puntos en el espacio.
Diagonal = �l2 + a2 + h2
Ejemplo: si consideramos el paralelepípedo del ejemplo anterior, la medida de la diagonal es igual a:
Diagonal = �l2 + a2 + h2 = �32 + 42 + 52 = �9 + 16 + 25 = �50 = 5�2 cm
CPECH
149
Capítulo3 Geometría
Prisma: poliedro formado por dos polígonos paralelos y congruentes, llamados bases (o caras basales), y
paralelogramos que unen las bases, denominados caras laterales. La altura corresponde a la distancia entre
las bases.
base
altura Área = 2 • Área basal + Área lateral
Volumen = Área basal • Altura
cara
lateral
base
Ejemplo: dado un prisma recto que tiene una altura de 9 cm y cuyas bases son triángulos equiláteros de lado 6 cm,
determinar su área y volumen.
Este prisma está formado por dos triángulos equiláteros de lado 6 cm como bases y tres rectángulos
de 9 cm de largo por 6 cm de ancho como caras laterales. El área de este prisma será dos veces el
área de una de sus bases más el triple del área de una de sus caras laterales, es decir,
( ) ( )A =
2• 62 • �3 + 3 • (6 • 9) cm2 = 18�3 + 162 cm2
4
El volumen será igual al producto entre el área del triángulo equilátero y la altura del prisma:
( )V =
62 • �3 •9 cm3 = 81�3 cm3
4
Pirámide: poliedro formado por un polígono llamado base (o cara basal), y triángulos que concurren al vértice,
denominados caras laterales. La altura corresponde a la distancia entre el vértice y la base.
vértice
Área = Área basal + Área lateral altura cara
lateral
Volumen = 1 • Área basal • Altura
3 base
CPECH
150
Matemática
Ejemplo: dada una pirámide recta de altura 6 cm y cuya base es un cuadrado de lado 16 cm, determinar su área
y volumen.
La pirámide de base cuadrada tiene una cara basal de lado
16 cm y cuatro caras laterales que corresponde a triángulos
isósceles congruentes de base 16 cm y altura 10 cm. El área
de la pirámide (A) es el área de su base más el cuádruple del
área de una de sus caras, es decir,
( )A = 6 cm
10 • 16
162 + 4 • 2 cm2 = (256 + 320) cm2 = 576 cm2 10 cm
El volumen (V) será igual a un tercio del producto entre el 8 cm
área del cuadrado y la altura de la pirámide:
V= 1 (162 • 6) cm3 = 512 cm3
3
3.5.2. Cuerpos redondos
Son aquellos cuerpos que tienen al menos una cara curva (o manto). El cilindro, el cono y la esfera son ejemplos
de cuerpos redondos. Una característica en común de estos cuerpos redondos es que se pueden obtener
como rotación de una figura plana con respecto a un eje de rotación.
Cilindro: está formado por dos bases circulares congruentes y un manto o área lateral.
Base h En función del radio (r) de las caras circulares y
Manto r de la altura (h), se pueden determinar el área y el
volumen del cilindro.
Base
Área = 2π • r2 + 2πr • h
Área lateral = 2πr • h
Volumen = π • r2 • h
CPECH
151
Capítulo3 Geometría
CPECH Dado que las caras circulares son congruentes, el área de cada base es (π • r2). El área del manto se
puede determinar de la siguiente manera. Al extender el manto, se forma un rectángulo:
2πr
h El área del manto es (2πrh)
Luego, el área del cilindro es la suma (2πr2 + 2πrh).
El volumen del cilindro es igual al área de la base circular (πr2) por la altura (h). Luego, el volumen
del cilindro es (πr2 • h).
Ejemplo: dado un cilindro de radio 2 cm y altura 3 cm, determina su área y volumen.
Dados el radio y la altura del cilindro, el área y el volumen serán, respectivamente:
Área = 2π • r2 + 2πr • h = 2π (2 cm)2 + 2π • 2 cm • 3 cm = 8π cm2 + 12π cm2 = 20π cm2
Volumen = π • r2 • h = π • (2 cm)2 • 3 cm = π • 4 cm2 • 3 cm = 12π cm3
El cilindro se puede obtener mediante rotación indefinida de un rectángulo con respecto a uno de sus
lados.
DC
Al rotar indefinidamente el rectángulo ABCD con
respecto al lado AD se forma un cilindro, donde:
radio (r)= AB
altura (h) = AD
AB
152
Matemática
Ejemplo: al rotar indefinidamente el rectángulo ABCD de la figura en torno al lado AD, se cumple que, el área y
volumen del cuerpo generado obtenido son:
DC Dado que el rectángulo ABCD rota en torno al lado AD, se
6 genera un cilindro cuyo radio es AB y cuya altura es AD.
Luego,
A 4B
radio = 4 ; altura = 6
Por lo tanto, el área y volumen son:
Área = 2π • r2 + 2πr • h = 2π • 42 + 2π • 4 • 6 = 32π + 48π = 80π
Volumen = π • r2 • h = π • 42 • 6 = 96π
Cono: está formado por una base circular y un manto. Su único vértice se denomina cúspide.
Área h g Los elementos de un cono son:
lateral
Radio (r): el radio del cono es el radio de la cara circular basal.
r
Base Altura (h): es la perpendicular trazada desde el centro de la base hasta
la cúspide del cono.
Generatriz (g): es el segmento recto que une el vértice con un punto
de la circunferencia basal.
El radio, la altura y la generatriz del cono forman un triángulo
rectángulo, siendo la generatriz la hipotenusa del triángulo. Luego, se
puede aplicar el teorema de Pitágoras:
r2 + h2 = g2
CPECH
153
3 Geometría
Capítulo En función del radio (r), la altura (h) y la generatriz (g), se pueden determinar el
área y el volumen del cono.
Área = πr2 + πrg
Área lateral = πrg
Volumen = 1 • πr2 h
3
Ejemplo: dado un cono de radio 5 y altura 12, el área y el volumen es:
Dado el radio y la altura, es posible determinar el volumen del cono.
Volumen = 1 • πr2 h = 1 • π • 52 • 12 = 100π
3 3
Para determinar el área, primero se debe hallar el valor de la generatriz. Por teorema de Pitágoras,
r2 + h2 = g2 ⇒ 52 + 122 = g2 ⇒ g = 13
Dado el radio, la altura y la generatriz, es posible determinar el área del cono.
Área = πr2 + πrg = π • 52 + π • 5 • 13 = 90π
El cono se puede obtener mediante rotación indefinida de un triángulo rectángulo en torno a uno de sus
catetos.
C
Al rotar indefinidamente el triángulo ABC en torno al
lado AC se forma un cono, donde:
Radio (r) = AB
Altura (h) = AC
Generatriz (g) = CB
AB
CPECH
154
Matemática
Ejemplo: el triángulo ABC rectángulo en A de la figura, se rota indefinidamente con respecto al lado AC . El área
y el volumen del cuerpo generado son, respectivamente:
C Dado que el triángulo rectángulo ABC de la figura rota indefinidamente
en torno al cateto AC, se genera un cono cuyo radio es AB y cuya altura
es AC. Luego,
radio = 2 ; altura = 4
Por lo tanto, el volumen es:
Volumen = 1 • πr2 h = 1 • π• 22 • 4= 16 π
3 3 3
Para determinar el área, primero debemos hallar el valor de la
generatriz. Por teorema de Pitágoras,
4
A2 B r2 + h2 = g2 ⇒ 22 + 42 = g2 ⇒ g = 2�5
Dado el radio, la altura y la generatriz, es posible determinar el área
del cono.
Área = πr2 + πrg = π • 22 + π • 2 • 2�5 = (4 + 4�5 )π
Esfera: una esfera está formada por todos los puntos en el espacio que están a la misma distancia de un centro
O.
En función del radio de la esfera, se pueden
determinar el área y el volumen de esta.
Or Área = 4 πr2
Volumen = 4 πr3
3
CPECH
155
3 Geometría
Capítulo Ejemplo: dada una esfera de radio 5 cm, el área y el volumen de la esfera son iguales a:
Dado el radio de la esfera, el área y el volumen son, respectivamente:
Área = 4πr2 = 4π • (5 cm)2 = 100π cm2
Volumen = 4 πr3 = 4 π (5 cm)3 = 500 π cm3
3 3 3
A
Or La esfera se puede obtener mediante la rotación indefinida
de un semicírculo en 360° en torno a su diámetro.
Al rotar indefinidamente el semicírculo en torno al diámetro
AB , se forma una esfera, tal que el radio del semicírculo
también es el radio de la esfera.
B
Ejemplo: dado el semicírculo de centro O de la figura adjunta. Si se rota indefinidamente en torno al diámetro
AB , el área y el volumen del cuerpo generado son:
A
Dado el radio de la esfera, el área y el volumen son:
O4 Área = 4πr2 = 4π • 42 = 64π
Volumen = 4 πr3 = 4 π • 43 = 256 π
3 3 3
B
CPECH
156
Matemática
Pregunta tipo PSU
En la figura adjunta, la pirámide recta con base hexágono regular GHIJKL, cúspide M y altura h1, está
contenida dentro de otra pirámide recta con base hexágono regular ABCDEF, cúspide M y altura h2, de
manera que G pertenece a AM, H pertenece a BM y así sucesivamente con el resto de los vértices. Si AB = a
y GH = b, la razón entre las alturas de las pirámides descritas, en términos de a y b, para que el volumen de
la pirámide de altura h1 sea la mitad del volumen de la pirámide de altura h2, es
A) h2 = b2 – b2
h1 a2
h2 M
h1
B) = a2 – b2
a2
C) h2 = b2 L K
h1 2a2 G J
h2 2a2 H I
h1 b2 F E
A
D) = D
B
h2 2b2 C
h1 a2
E) =
Resolución
Hay que recordar que todo hexágono regular de lado x puede ser dividido en seis triángulos equiláteros
de lado x, por lo que es posible determinar de forma indirecta su área mediante el área de un triángulo
equilátero
Área hexágono regular = 6 • Área triángulo equilátero = 6 • x2�3 = 3�3x2
4 2
En base a lo anterior, el área del hexágono ABCDEF es 3�3a2 y el área del hexágono GHIJKL es 3�3 b2 ,
ambas en unidades cuadradas. 2 2
Para determinar el volumen de una pirámide recta es necesario conocer el área basal (recordar que esta
área varía dependiendo del polígono) y la altura.
Volumen pirámide recta = 1 • Área basal • Altura de la pirámide
3
En el caso de la pirámide que tiene como base al hexágono regular ABCDEF, su volumen es
1 • 3�3a2 • h2 = �3a2h2 y en el caso de la pirámide que tiene como base al hexágono regular GHIJKL,
3 2 2
su volumen es 1 • 3�3b2 • h1 = �3b2h1 , ambos valores en unidades cúbicas. CPECH
3 2 2
157
3 Geometría
Capítulo Con los resultados obtenidos, es necesario plantear una identidad que permita darle solución al
problema. En este caso, “la razón entre las alturas de las pirámides descritas, en términos de a y b, para
que el volumen de la pirámide de altura h1 sea la mitad del volumen de la pirámide de altura h2” puede
ser interpretado algebraicamente como
Volumen pirámide de base GHIJKL = 1 • Volumen pirámide de base ABCDEF
2
Reemplazando en los resultados obtenidos en la ecuación anterior y despejando, se tiene
�3b2h1 = 1 • �3a2h2 (Amplificando por 4)
2 2 2
2�3b2h1 = �3a2h2 (Simplificando raíces)
2b2h1 = a2h2
2b2 = h2
a2 h1
Para corroborar esta respuesta, es posible asignar valores Alternativa correcta:
numéricos que cumplan la igualdad obtenida y realizar el mismo
procedimiento anterior, pero de forma numérica. Si bien este es un E
paso que en algunas ocasiones añade más tiempo a la resolución
de un problema, tiene la ventaja de que asegura que la respuesta
obtenida sea la correcta.
CPECH
158
Matemática
Pregunta tipo PSU
Al rectángulo ABCD de la figura adjunta se le recortaron dos semicircunferencias de radio 3 centímetros,
de manera que la menor distancia entre las semicircunferencias es de 1 centímetro. Si se traza una
recta que pase por el punto medio del segmento AD y por el punto medio del segmento BC y la
figura ennegrecida se rota indefinidamente en torno a esta recta, entonces el volumen generado, en
centímetros cúbicos, es
A) 27π AD
B) 36π BC
C) 45π
D) 99π
E) 180π
Resolución
Al tratarse de semicircunferencias, se tiene que los segmentos AD y BC corresponden a diámetros; como
el radio mide 3 centímetros, entonces el valor del diámetro es 6 centímetros.
La recta que se traza por los puntos medios de los segmentos AD y BC contiene a los radios de ambas
circunferencias (3 centímetros) y la distancia menor que hay entre ellas (1 centímetro), por lo que la
medida de esta recta es igual a la medida de los lados AB y CD, por ser paralelas y congruentes, cuyo valor
es 7 centímetros.
No existe una fórmula directa para calcular el volumen del cuerpo de revolución generado, sin embargo,
es posible calcular su volumen como la diferencia entre el volumen del cilindro generado y el volumen
de las semiesferas generadas. Luego
Volumen cilindro: r2 • h • π = 32 • 7 • π = 63π
Volumen semiesfera: 1 • 4 • r3 • π= 2 • 33 •π = 18π
2 3 3
Entonces, el volumen del cuerpo de revolución viene dado por:
Volumen cuerpo revolución = Volumen cilindro – 2 Volumen semiesfera Alternativa correcta:
= 63π – 2 • 18π A
= 63π – 36π
= 27π
CPECH
159
160 CPECH
Capítulo 4
Datos y Azar
Aprendizajes Esperados
Interpretar y producir información, en contextos diversos, mediante gráficos que se
obtienen desde tablas de frecuencia, cuyos datos están agrupados en intervalos.
Resolver problemas utilizando medidas de tendencia central, de posición y de
dispersión.
Aplicar propiedades de la suma y producto de probabilidades en la resolución de
problemas. Aplicar el concepto de probabilidad condicional en diversas situaciones
que involucren el cálculo de probabilidades.
Comprender el concepto de variable aleatoria y aplicarlo en diversas situaciones.
Relacionar y aplicar los conceptos de variable aleatoria discreta, función de
probabilidad y distribución de probabilidad, en diversas situaciones.
Capítulo4 Datos y Azar
CPECH4. Datos y azar
4.1. Conceptos básicos en estadística
4.1.1. Población y muestra estadística
La estadística es la ciencia dedicada tanto a la recolección, organización, representación y análisis de
datos (estadística descriptiva) como a la generación de inferencias y predicciones a partir de dichos datos
(estadística inferencial), entre otras aplicaciones.
La población estadística corresponde a todo el conjunto sobre el cual se van a asumir las conclusiones del
estudio estadístico, pero por razones prácticas (tiempo, costo, etc.) se utiliza una muestra estadística, que es
un subconjunto de la población. Una muestra será tanto más adecuada dependiendo de su aleatoriedad y de
su tamaño (entre otros factores), y si es lo suficientemente representativa sus resultados se pueden considerar
para toda la población. La inadecuada representatividad de una muestra con respecto a la población se conoce
como sesgo muestral, e impide que sus conclusiones se apliquen para toda la población.
Por ejemplo, tres estudiantes desean realizar un estudio estadístico acerca de la práctica de deporte de los
jóvenes de 17 a 23 años que viven en Chile, que corresponden aproximadamente a dos millones de personas
(población estadística). Para esto, cada uno de ellos ello realiza una encuesta a personas en ese rango de edad
(muestra estadística):
■ El primero de ellos encuesta a 1.000 personas durante un torneo deportivo, obteniendo que el 90% de los
encuestados practica deporte.
■ El segundo de ellos encuesta a 20 personas al azar, obteniendo que el 10% de los encuestados practica
deporte.
■ El tercero de ellos encuesta a 500 personas al azar, obteniendo que el 30% de los encuestados practica
deporte.
Si bien los tres resultados son válidos dentro de cada muestra, el primer y segundo caso tienen problemas
de sesgo muestral (por su aleatoriedad y su tamaño, respectivamente), por lo cual las conclusiones no se
pueden asumir para toda la población. Sin embargo, en el tercer caso es posible aceptar que la muestra es
representativa, por lo cual se puede asumir que el 30% de los jóvenes de 17 a 23 años que viven en Chile
practican deporte.
4.1.2. Datos y variable estadística
En un estudio estadístico, la propiedad que se va a analizar se denomina variable estadística, y cada uno
de los valores que se obtienen al realizar dicho estudio se llama dato estadístico. Una variable estadística se
denomina:
■ Cuantitativa discreta, si representa una propiedad numérica que solo puede tomar ciertos valores,
habiendo separaciones entre ellos. Por ejemplo, cantidad de personas que viven en una casa (1; 2; 3; 4; etc.)
162
Matemática
■ Cuantitativa continua, si representa una propiedad numérica que puede tomar cualquier valor dentro
de un intervalo, sin que haya separaciones entre ellos. Por ejemplo, el peso de una persona en kilos
(38,67 ; 45,19 ; 56,32 ; 73,81 ; etc.).
■ Cualitativa ordinal, si representa una propiedad no numérica, pero que se puede ordenar según niveles.
Por ejemplo, concordancia con una afirmación (muy en desacuerdo; en desacuerdo; ni en desacuerdo ni de
acuerdo; de acuerdo; muy de acuerdo).
■ Cualitativa nominal, si representa una propiedad no numérica que no se puede ordenar. Por ejemplo,
color favorito (rojo; azul; amarillo; verde; etc.).
La frecuencia absoluta (o simplemente frecuencia) de un dato corresponde a la cantidad de veces que
aparece el dato dentro de la muestra; la frecuencia relativa corresponde a la proporción del dato dentro
del total de la muestra; y la frecuencia porcentual es la frecuencia relativa escrita en forma de porcentaje.
Por ejemplo, si de una muestra de 40 personas, 12 de ellas tienen los ojos cafés, entonces para la variable
( ) ( )porcentual de
“color de ojos”, el dato “café” tiene una frecuencia de 12, una frecuencia relativa de 12 = 0,3 y una frecuencia
40
12
40 • 100 % = 30%.
Sabías que...
Para variables estadísticas continuas (y para algunas variables estadísticas discretas) lo más práctico es
que los valores de los datos se encuentren agrupados en clases o intervalos. En este caso, la frecuencia
del intervalo indicará la cantidad de datos que se encuentran dentro de él, sin conocer necesariamente
el valor preciso de cada uno. La marca de clase de un intervalo corresponde a un valor representativo de
él, que se calcula como el promedio entre el límite inferior y el límite superior del intervalo. Por ejemplo,
para la variable “edad”, en años, la clase “[63, 66[” incluye a todas las personas que tienen una edad mayor
( )o igual que 63 años y menor que 66 años, y su marca de clase es
63 + 66 = 64,5 años.
2
4.1.3. Representación de datos en tablas y gráficos
La recopilación de datos de un estudio estadístico se presenta mediante una tabla (o gráfico) de distribución
de frecuencias. En ellas se representan los valores de los datos asociados a su frecuencia, frecuencia relativa
o frecuencia porcentual.
Por ejemplo, la tabla adjunta representa la distribución de frecuencias de las edades de los participantes en el
taller de música de un colegio.
Edad (años) Frecuencia CPECH
14 4
15 7
16 6
17 8
163
4 Datos y Azar
Capítulo Sumando los valores de la columna de frecuencias se obtiene la cantidad total de datos (número de alumnos
que participan en el taller), que son (4 + 7 + 6 + 8) = 25 alumnos. Luego, es posible determinar las columnas de
frecuencia relativa y de frecuencia porcentual:
Edad Frecuencia Frecuencia Frecuencia
(años) relativa porcentual
4 0,16
14 7 0,28 16%
15 6 0,24 28%
16 8 0,32 24%
17 32%
Además, se pueden determinar las frecuencias acumuladas de cada valor, que corresponde a la suma de
frecuencias desde el primer valor de la muestra hasta el valor indicado:
Edad Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
(años) acumulada relativa relativa porcentual porcentual
acumulada
14 44 0,16 acumulada 16%
15 7 11 0,28 28% 16%
16 6 17 0,24 0,16 24%
17 8 25 0,32 32% 44%
0,44
68%
0,68
100%
1
Gráficamente, existen varias representaciones de distribuciones de frecuencias. Considerando el caso de los
alumnos del taller de música, es posible representar la información como:
Gráfico de barras
Frecuencia
CPECH 8 Edad (años)
7
6
5
4
3
2
1
0
14 15 16 17
164
Matemática
Polígono de frecuencias
Frecuencia
8 Edad (años)
7
6
5
4
3
2
1
0
14 15 16 17
Gráfico circular
14 años
17 años 16% Ojo con
32% El área de cada sector es proporcional a la
frecuencia relativa o porcentual del valor
15 años que representa.
28%
16 años
24%
En el caso de que los valores estén agrupados, es posible construir los mismos gráficos. En el gráfico de barras
se representan los límites de cada intervalo, por lo cual las barras están necesariamente unidas. Todos los
intervalos contienen al límite inferior, pero no al límite superior, excepto el último que incluye a ambos.
Por ejemplo:
Frecuencia
La clase 1 corresponde al intervalo [p, q[
La clase 2 corresponde al intervalo [q, r[
La clase 3 corresponde al intervalo [r, s]
Clases CPECH
pqr s
165
4 Datos y Azar
Capítulo Pregunta tipo PSU
La tabla adjunta muestra el resultado de una encuesta sobre las horas semanales de estudio que dedican
los estudiantes de un curso en un determinado establecimiento, agrupadas en intervalos. Respecto a la
tabla, ¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?
I) El número total de encuestados fue 40. Nº de Frecuencia
II) Un 25% de los encuestados estudia como máximo 3 horas horas
a la semana. [0, 3[ 10
III) Al menos un estudiante estudia 15 horas a la semana. [3, 6[ 13
[6, 9[ 9
A) Solo I [9, 12[ 5
B) Solo I y II [12, 15] 3
C) Solo I y III
D) Solo II y III
E) I, II y III
Resolución
Para este tipo de preguntas, siempre es recomendable realizar una columna con la frecuencia acumulada
para cada dato.
Nº de horas Frecuencia F. Ac.
[0, 3[ 10 10
[3, 6[ 13 23
[6, 9[ 9 32
[9, 12[ 5 37
[12, 15] 3 40
I) Verdadera, ya que al sumar todas las frecuencia, esta da como Alternativa correcta:
resultado 40.
A
II) Falsa, ya que el primer intervalo agrupa al 25% de los datos, pero
estos son menores que 3 horas, sin considerar este valor.
III) Falsa, ya que no es posible determinar el número de veces que
aparece un determinado elemento en un intervalo. Por ejemplo,
el intervalo [12, 15] tiene frecuencia 3, pero existe la posibilidad
de que los 3 elementos sean el mismo y no necesariamente el
mayor del intervalo.
CPECH
166
Matemática
4.2. Medidas de tendencia central en tablas y gráficos
4.2.1. Medidas de tendencia central en datos no agrupados
Las medidas de tendencia central son parámetros estadísticos que pretenden resumir toda la muestra en
un solo valor, dependiendo de algún criterio. Corresponden a la moda, la mediana y el promedio (o media
aritmética), el primero de los cuales se puede determinar para cualquier tipo de variable estadística, mientras
que los otros dos solo se pueden calcular para variables estadísticas cuantitativas.
La moda corresponde al valor que más se repite dentro de la muestra, es decir, el que tiene la mayor frecuencia. Si
dos o más valores tienen la mayor frecuencia, entonces todos ellos son la moda (muestra bimodal, multimodal,
etc.), pero si todos los valores tienen igual frecuencia, entonces la muestra no tiene moda (amodal).
Por ejemplo, en la tabla adjunta, la moda de las edades es 17 años y la frecuencia de la moda es 8.
Edad Frecuencia
(años)
4
14 7
15 6
16 8
17
La mediana corresponde al valor que ocupa la posición central cuando los datos están ordenados de menor
a mayor. Para una muestra de N datos, con N un número impar, la mediana corresponderá al valor del dato
N + 1
que ocupe la posición 2 . Para una muestra de N datos, con N un número par, la mediana corresponderá
al promedio entre los N N
valores de los datos ocupen las posiciones 2 y 2 + 1. Luego, utilizando la tabla de
distribución de frecuencias, la mediana es el valor que le corresponde a la menor frecuencia acumulada que
iguala o sobrepasa la posición buscada.
Por ejemplo, en la tabla adjunta, el número de datos es 25, por lo cual la mediana corresponde al valor del
25 + 1
dato que ocupa la posición 2 = 13. La menor frecuencia acumulada que iguala o sobrepasa la posición
buscada es 17, a la cual le corresponde el valor 16. Luego, la mediana de las edades es 16 años.
Edad Frecuencia Frecuencia
(años) acumulada
4
14 7 4
15 6 11
16 8 17
17 25
El promedio (o media aritmética) corresponde a la suma de los valores de todos los datos, dividida por la CPECH
cantidad total de datos. La suma de todos los datos de un mismo valor se obtiene multiplicando el valor del
dato por su frecuencia.
167
4 Datos y Azar
Capítulo Por ejemplo, en la tabla adjunta, el promedio (o media aritmética) de las edades es 393 = 15,72 años.
25
Edad Frecuencia Suma
(años)
4 14 • 4 = 56
14 7 15 • 7 = 105
15 6 16 • 6 = 96
16 8 17 • 8 = 136
17 25
Total 393
4.2.2. Medidas de tendencia central en datos agrupados
En las distribuciones de frecuencias con datos agrupados no es posible obtener valores precisos para las
medidas de tendencia central, dado que no se conocen los valores exactos de los datos. Sin embargo, se
pueden obtener algunos resultados asociados a las clases.
El intervalo modal (o clase modal) corresponde al intervalo que tiene la mayor frecuencia. Esto no significa
necesariamente que en dicho intervalo se encuentre la moda de la muestra.
Por ejemplo, en la tabla adjunta, el intervalo modal (o clase modal) de los puntajes obtenidos por un curso de
cálculo en una prueba es [21, 40].
Puntajes Frecuencia
[1, 20] 14
[21, 40] 28
[41, 60] 16
[61, 80] 12
[81, 100] 10
El intervalo donde se encuentra la mediana se determina de la misma forma que en datos no agrupados.
Por ejemplo, en la tabla adjunta, el número de datos es 80, por lo cual la mediana corresponde al promedio de
80 80
los valores de los datos que ocupen las posiciones 2 = 40 y 2 +1 = 41. La menor frecuencia acumulada que
iguala o sobrepasa las posiciones buscadas es 42, y si bien no se conocen sus valores, sí se sabe que están en el
intervalo [21, 40]. Luego, el intervalo donde se encuentra la mediana de los puntajes es [21, 40].
CPECH Puntajes Frecuencia Frecuencia
acumulada
[1, 20] 14
[21, 40] 28 14
[41, 60] 16 42
[61, 80] 12 58
[81, 100] 10 70
80
168
Matemática
El promedio (o media aritmética) obtenido a partir de la marca de clase se determina de la misma forma
que en datos no agrupados, pero tomando la marca de clase como si fuera el valor de todos los datos del
intervalo.
Por ejemplo, en la tabla adjunta, el promedio (o media aritmética) obtenido a partir de la marca de clase de los
3.560
puntajes es 80 = 44,5 puntos.
Puntajes Marca de clase Frecuencia Suma
[1, 20] 10,5 14 10,5 • 14 = 147
[21, 40] 30,5 28 30,5 • 28 = 854
[41, 60] 50,5 16 50,5 • 16 = 808
[61, 80] 70,5 12 70,5 • 12 = 846
[81, 100] 90,5 10 90,5 • 10 = 905
Total 80
3.560
Pregunta tipo PSU
En el gráfico adjunto se registró la distancia, en kilómetros, que f
recorren los habitantes de una villa hasta el lugar de trabajo de 18
cada uno de estos, agrupados en intervalos de la forma [a, b[ y el 15
último de la forman [c, d]. Respecto a esta información, ¿cuál de
las siguientes afirmaciones es FALSA? 9
6
A) La distancia promedio que recorren, a partir de la marca de 2
clase, es 6,04 kilómetros.
0 2 4 6 8 10 km
B) La mediana se encuentra en el intervalo [6, 8[.
C) En total se les consultó a 50 habitantes.
D) La moda se encuentra en el intervalo [6, 8[.
E) 27 habitantes de la villa recorren como mínimo 6 kilómetros.
Resolución
A) Verdadera, ya que a partir de la marca de clase se obtiene:
x = 1 • 2 + 3 • 6 + 5 •15 + 7 • 18 + 9 • 9 = 2 + 18 + 75 + 126 + 81 = 302 = 6,04
50 50 50
B) Verdadera, ya que al ser 50 datos, los términos centrales ocuparán las posiciones 25 y 26. Al realizar una
tabla de frecuencia acumulada, se concluye que ambos datos se encuentran en el cuarto intervalo.
C) Verdadera, ya que al sumar todas las alturas de las barras en el gráfico adjunto, da un total de 50 datos.
CPECH
169
4 Datos y Azar
Capítulo D) Falsa, ya que no necesariamente el dato que más se repite está Alternativa correcta:
en el intervalo modal.
D
E) Verdadera, ya que según el gráfico, son 18 las personas que
recorren entre 6 y 8 kilómetos, considerando solo el primer valor
de estos, mientras que son 9 las personas que recorren entre
entre 8 y 10 kilómetros, considerando ambos valores. Es decir,
(18 + 9) personas recorren como mínimo 6 kilómetros y como
máximo 10 kilómetros.
4.3. Medidas de posición
4.3.1. Cuantiles
Un cuantil es un valor bajo el cual se encuentra un cierto porcentaje de los datos, cuando estos se ordenan
de menor a mayor. Existen los percentiles, deciles, quintiles y cuartiles, y se pueden calcular solo en variables
estadísticas cuantitativas.
En los percentiles, el total de datos se divide en 100 partes iguales, cada una de las cuales corresponde al 1%
de la muestra, es decir, el percentil M es el valor bajo el cual se encuentra el M% de los datos. Por ejemplo, el
percentil 65 corresponde al valor bajo el cual se encuentra el 65% de los datos.
En los deciles, el total de datos se divide en 10 partes iguales, cada una de las cuales corresponde al 10% de la
muestra, es decir, el decil M es el valor bajo el cual se encuentra el 10 • M% de los datos. Por ejemplo, el decil
3 corresponde al valor bajo el cual se encuentra el 30% de los datos.
En los quintiles, el total de datos se divide en 5 partes iguales, cada una de las cuales corresponde al 20% de
la muestra, es decir, el quintil M es el valor bajo el cual se encuentra el 20 • M% de los datos. Por ejemplo, el
quintil 4 corresponde al valor bajo el cual se encuentra el 80% de los datos.
En los cuartiles, el total de datos se divide en 4 partes iguales, cada una de las cuales corresponde al 25% de
la muestra, es decir, el cuartil M es el valor bajo el cual se encuentra el 25 • M% de los datos. Por ejemplo, el
cuartil 1 corresponde al valor bajo el cual se encuentra el 25% de los datos.
CPECH
170
Matemática
4.3.2. Medidas de posición en tablas y gráficos
La forma más práctica de obtener los cuantiles es utilizar la tabla de distribución de frecuencias y encontrar el
valor que le corresponde a la menor frecuencia porcentual acumulada que iguala o sobrepasa el porcentaje
buscado. Por ejemplo, en la tabla adjunta:
Edad Frecuencia Frecuencia Frecuencia
(años) porcentual porcentual
4 acumulada
14 7 16%
15 6 28% 16%
16 8 24%
17 32% 44%
68%
100%
El percentil 73 corresponde al valor bajo el cual se encuentra el 73% de los datos, y la menor frecuencia
porcentual acumulada que iguala o sobrepasa dicho porcentaje es 100%. Luego, el percentil 73 es 17 años.
El quintil 2 corresponde al valor bajo el cual se encuentra el 40% de los datos, y la menor frecuencia porcentual
acumulada que iguala o sobrepasa dicho porcentaje es 44%. Luego, el quintil 2 es 15 años.
En caso de datos agrupados, solo se puede determinar el intervalo en el que se encuentra un determinado
cuantil. Por ejemplo, en la tabla adjunta:
Puntajes Frecuencia Frecuencia Frecuencia
porcentual porcentual
[1, 20] 14 acumulada
[21, 40] 28 17,5%
[41, 60] 16 35% 17,5%
[61, 80] 12 20%
[81, 100] 10 15% 52,5%
12,5%
72,5%
87,5%
100%
El decil 7 corresponde al valor bajo el cual se encuentra el 70% de los datos, y la menor frecuencia porcentual
acumulada que iguala o sobrepasa dicho porcentaje es 72,5%. Luego, el decil 7 se encuentra en el intervalo
[41, 60].
El cuartil 3 corresponde al valor bajo el cual se encuentra el 75% de los datos, y la menor frecuencia porcentual
acumulada que iguala o sobrepasa dicho porcentaje es 87,5%. Luego, el cuartil 3 se encuentra en el intervalo
[61, 80].
CPECH
171
4 Datos y Azar
Capítulo Sabías que...
Una forma de visualizar gráficamente la dispersión de los datos a partir de medidas de posición es a través
del diagrama de caja (o cajón con bigotes). Consiste en una caja rectangular dividida por un segmento
paralelo a un par de lados de este, que corresponde al segundo cuartil de la muestra, es decir, a la mediana,
mientras que los lados del rectángulo paralelos a este segmento corresponden al primer y tercer cuartil.
Desde los lados del rectángulo que señalan a los cuartiles uno y tres, se extienden dos líneas (bigotes),
donde los extremos de estas corresponden al valor mínimo y al valor máximo, respectivamente.
La diferencia entre el tercer cuartil y el primer cuartil se conoce como rango intercuartil, y gráficamente
corresponde al largo del rectángulo.
En la figura se muestra un diagrama de cajas, donde: 13
Valor mínimo = 3 11
Cuartil 1 = 4
Cuartil 2 (Me) = 8 8
Cuartil 3 = 11
Valor máximo = 13 4
Rango intercuartil = 11 – 4 = 7 3
Pregunta tipo PSU
Según los datos agrupados en la tabla adjunta, ¿cuál(es) de los siguientes cuantiles está(n) en el mismo
intervalo?
I) El tercer quintil con el tercer cuartil. Intervalo Frecuencia
II) El primer cuartil con el tercer decil. A 17
III) El percentil 15 con el primer quintil. B 22
C 13
A) Solo I D 20
B) Solo I y II E 18
C) Solo I y III
D) Solo II y III
E) I, II y III
CPECH
172
Matemática
Resolución
Para este tipo de preguntas, siempre es recomendable Intervalo Frecuencia F. Ac.
realizar una columna con la frecuencia acumulada para A 17 17
cada dato. B 22 39
I) Verdadera, ya que el tercer quintil corresponde al C 13 52
valor bajo el cual se encuentra el 60% de los datos D 20 72
de la población, mientras que el tercer cuartil es el E 18 90
valor bajo el cual está el 75% de los datos. Como el
60% de 90 es 54, entonces bajo el dato que ocupa
la posición 54 estará el 60% de la población, es decir, el tercer quintil está en el intervalo D. Por otra
parte, como el 75% de 90 es 67,5, entonces bajo el dato que ocupa la posición 68 estará el 75% de la
población, es decir, el tercer cuartil también se encontrará en el intervalo D.
II) Verdadera, ya que el primer cuartil corresponde al valor bajo el cual se encuentra el 25% de los datos
de la población, mientras que el tercer decil es el valor bajo el cual está el 30% de los datos. Como el
25% de 90 es 22,5, entonces bajo el dato que ocupa la posición 23 estará el 25% de la población, es
decir, el primer cuartil está en el intervalo B. Por otra parte, como el 30% de 90 es 27, entonces bajo
el dato que ocupa la posición 27 estará el 30% de la población, es decir, el tercer decil también se
encontrará en el intervalo B.
III) Falsa, ya que el percentil 15 corresponde al valor bajo el cual se Alternativa correcta:
encuentra el 15% de los datos de la población, mientras que el
primer quintil es el valor bajo el cual está el 20% de los datos. B
Como el 15% de 90 es 13,5, entonces bajo el dato que ocupa la
posición 14 estará el 15% de la población, es decir, el percentil
15 está en el intervalo A. Por otra parte, como el 20% de 90 es
18, entonces bajo el dato que ocupa la posición 18 estará el 20%
de la población, es decir, el primer quintil se encontrará en el
intervalo B
CPECH
173
4 Datos y Azar
Capítulo 4.4. Medidas de dispersión
Las medidas de dispersión son parámetros estadísticos que indican la variabilidad de los datos de una muestra
o población, en otras palabras, indican cuan similar es el valor de todos los datos. Corresponden al rango, la
desviación estándar y la varianza. Estos parámetros son válidos solo para variables estadísticas cuantitativas.
4.4.1. Rango
El rango corresponde a la diferencia entre el valor máximo y el valor mínimo de un conjunto. Por ejemplo, en
la tabla adjunta, el valor máximo de la muestra es 17 años y el valor mínimo es 14 años. Luego, el rango de la
muestra es 3 años.
Edad Frecuencia
(años)
4
14 7
15 6
16 8
17
En datos agrupados, el rango corresponde a la diferencia entre el límite superior del último intervalo y el límite
inferior del primer intervalo. Por ejemplo, en la tabla adjunta, el límite superior del último intervalo es 100
puntos y el límite inferior del primer intervalo es 1 punto. Luego, el rango es 99 puntos.
Puntajes Frecuencia
[1, 20] 14
[21, 40] 28
[41, 60] 16
[61, 80] 12
[81, 100] 10
4.4.2. Varianza
La varianza (σ2) de un conjunto de números corresponde al promedio entre los cuadrados de las diferencias
entre cada dato y el promedio del conjunto.
σ2 = (x– x1)2 + (x– x2)2+ (x– x3)2 + ... + (x– xn)2
n
Donde x corresponde al promedio de la muestra y n corresponde al número total de datos.
Por ejemplo, el conjunto {2, 5, 8, 9} tiene como promedio 2+5+8+9 = 6, entonces los cuadrados de las
4
diferencias entre cada dato y el promedio son:
(2 – 6)2 = (– 4)2 = 16, (5 – 6)2 = (– 1)2 = 1, (8 – 6)2 = (2)2 = 4 y (9 – 6)2 = (3)2 = 9, y el promedio entre esos resultados
CPECH es 16 + 1 + 4 + 9 = 7,5. Luego, la varianza del conjunto {2, 5, 8, 9} es 7,5.
4
174
Matemática
En datos tabulados se calcula de la misma forma, determinando los promedios de la manera en que se mostró
para este caso. Por ejemplo, en la distribución de frecuencias de la tabla adjunta el promedio de los datos es
15,72 años (calculado previamente en 4.2.1).
Edad Frecuencia
(años)
4
14 7
15 6
16 8
17
Entonces, los cuadrados de las diferencias entre cada dato (xi) y el promedio del conjunto (x) son:
Edad (xi – x )2
(años)
(14 – 15,72)2 = (– 1,72)2 = 2,9584
14 (15 – 15,72)2 = (– 0,72)2 = 0,5184
(16 – 15,72)2 = (0,28)2 = 0,0784
15 (17 – 15,72)2 = (1,28)2 = 1,6384
16
17
El promedio de los cuadrados se obtiene como la suma de todos ellos dividida por el total de datos. Como
se vio anteriormente, la suma los cuadrados de un mismo dato se obtiene multiplicando el valor de dicho
cuadrado por la frecuencia del dato:
Edad Frecuencia (xi – x )2 Suma
(años)
4 2,9584 4 • 2,9584 = 11,8336
14 7 0,5184 7 • 0,5184 = 3,6288
15 6 0,0784 6 • 0,0784 = 0,4704
16 8 1,6384 8 • 1,6384 = 13,1072
17 25
Total 29,04
Luego, el promedio entre los cuadrados de las diferencias entre cada dato y el promedio del conjunto es
29,04 = 1,1616. Por lo tanto, la varianza del conjunto de edades es 1,1616.
25
CPECH
175
Capítulo4 Datos y Azar
CPECH 4.4.3. Desviación estándar
La desviación estándar o desviación típica (σ) es una medida de la homogeneidad de un conjunto, es decir,
permite determinar qué tan dispersos se encuentran los elementos de un conjunto con respecto al promedio
del mismo y compararlo con otros conjuntos. Se calcula como la raíz cuadrada de la varianza. Por ejemplo, la
varianza del conjunto {2, 5, 8, 9} es 7,5 (calculada previamente), luego la desviación estándar de dicho conjunto
es �7,5 ≈ 2,74.
Para apreciar la utilidad de la desviación estándar en comparación con el rango y el promedio, es posible
observar estos tres conjuntos:
◆ El conjunto {2, 5, 8, 9} tiene rango 7, promedio 6 y desviación estándar 2,74 (aprox.)
◆ El conjunto {2, 4, 9, 9} tiene rango 7, promedio 6 y desviación estándar 3,08 (aprox.)
◆ El conjunto {2, 6, 7, 9} tiene rango 7, promedio 6 y desviación estándar 2,55 (aprox.)
Si bien los tres conjuntos tienen igual rango y promedio, el segundo conjunto tiene los datos más alejados
del promedio con respecto al primer conjunto, por lo cual tiene mayor desviación estándar que él, es decir, es
más heterogéneo. Por otro lado, el tercer conjunto tiene sus datos más cercanos al promedio con respecto
al primer conjunto, por lo cual tiene menor desviación estándar que él, es decir, es más homogéneo. Así, la
desviación estándar es la medida de la dispersión de los datos de un conjunto con respecto a su promedio.
Conceptos
fundamentales
La desviación estándar de un conjunto es cero solo si todos los elementos del conjunto tienen el mismo
valor, y va aumentando en la medida que aumenta la diferencia entre los valores de los datos. Además, si
un conjunto tiene una desviación estándar σ, entonces se cumple que:
◆ Si a todos los datos del conjunto se les suma o se les resta la misma cantidad, entonces la desviación
estándar del conjunto continúa siendo σ.
◆ Si todos los datos del conjunto se multiplican por un factor k, entonces la desviación estándar del
conjunto cambia a (k • σ).
Pregunta tipo PSU
Sea S un conjunto tal que S = {n – 4, n – 2, n, n + 2, n + 4}. Respecto a S, ¿cuál de las siguientes afirmaciones
es siempre verdadera?
A) El rango depende del valor de n.
B) Tiene menor desviación estándar que el conjunto {n, n + 2, n + 4, n + 6, n + 8}.
C) La varianza es el cuádruple de la varianza del conjunto {n – 2, n – 1, n, n + 1, n + 2}.
D) La desviación estándar es mayor que la varianza.
E) El valor del rango es distinto al valor de la varianza.
176
Matemática
Resolución
Calculando la media del conjunto S: x = (n – 4) + (n – 2) + n+ (n + 2) + (n + 4) = 5n = n
5 5
Luego, determinando la varianza de S:
σ2 = ((n – 4) – n)2 + ((n – 2) – n)2 + (n – n)2 + ((n + 2) – n)2 + ((n + 4) – n)2
5
= (– 4)2 + (– 2)2 + 02 + 22 + 42
5
= 16 + 4 + 0 + 4 +16
5
= 40
5
= 8
Por lo tanto, la desviación estándar será σ = �σ2 = �8 = 2�2.
A) Falsa, ya que al restar al elemento de mayor valor el elemento más pequeño, se obtiene
(n + 4) – (n – 4) = n + 4 – n + 4 = 8.
B) Falsa, ya que la diferencia entre cada uno de los elementos del conjunto S es igual a la diferencia
que hay entre cada uno de los elementos del conjunto propuesto en la afirmación, por lo que ambas
desviaciones son iguales.
C) Verdadera, ya que la diferencia entre cada uno de los elementos Alternativa correcta:
del conjunto propuesto en la afirmación es el doble de la diferencia
que hay entre cada uno de los elementos del conjunto S, es decir, C
la desviación estándar de este nuevo conjunto es el doble de la
desviación del conjunto S. Como la varianza es el cuadrado de la
desviación estándar, entonces la varianza será el cuádruple que la
del conjunto S.
D) Falsa, ya que la varianza es 8, por lo que la desviación estándar será �8.
E) Falsa, ya que el rango es 8, al igual que la varianza.
4.5 Muestreo aleatorio simple
El muestreo aleatorio simple es una técnica de selección de muestras en el que cada elemento de la población
tiene exactamente la misma probabilidad de ser escogida al azar. Mediante las muestras es posible realizar
inferencias respecto al comportamiento de una determinada población estadística.
CPECH
177
4 Datos y Azar
Capítulo 4.5.1 Número de muestras
Para determinar el número de muestras posibles de un determinado tamaño que se pueden extraer de una
población, es necesario manejar las distintas técnicas combinatorias, conceptos a tratar en las próximas
secciones de este capítulo.
Supongamos que una población está compuesta por n elementos en total. Si se desea conocer el número de
muestras que contengan k elementos, sin orden y sin reposición, entonces se deberá realizar una combinación
de n sobre k. Es decir:
( )Número de muestras de tamaño k =n = (n n! • k!
k – k)!
Donde n! se conoce como el factorial de n, y corresponde al producto entre n y todos los números enteros
positivos anteriores a este valor. Por ejemplo 6! es igual a 6 • 5 • 4 • 3 • 2 • 1 = 720.
4.5.2 Análisis de muestras
A partir de una población es posible extraer conclusiones sobre las distintas muestras que se pueden extraer,
por ejemplo determinar la muestra con mayor o menor promedio (o media muestral). Pero también es posible
realizar conclusiones respecto al comportamiento de una población a partir de muestra, lo que se conoce
como inferencia estadística.
Por ejemplo, mediante la toma de muestras se puede inferir respecto a la media de una población (media
poblacional). Si se toma una muestra de manera aleatoria desde una población de un tamaño considerable,
entonces esta podría indicarnos un intervalo en el que podría estar la media de la población con un cierto
porcentaje de precisión (contenido a ver en las próximas secciones de este capítulo). Entre más grande es el
tamaño de la muestra, se espera que el valor de la media muestral se aproxime a la media poblacional. No
necesariamente la media de una muestra será exactamente igual a la media de la población.
Por otra parte, si de una población se extraen todas las muestras posibles de igual tamaño, el promedio
entre todas estas medias muestrales será igual a la media poblacional.
Pregunta tipo PSUCPECH
Una población está compuesta por todos los múltiplos positivos de 3 menores que 20 y todos los
divisores positivos de 24, sin que se repita ninguno de los elementos. Respecto a esta población, ¿cuál(es)
de las siguientes afirmaciones es (son) verdadera(s)?
I) Se pueden extraer 55 muestras, sin orden y sin reposición, de tamaño 9.
II) Al extraer muestras de tamaño 3, sin orden y sin reposición, la mayor de las medias muestrales es 19.
III) El promedio de la muestra {6, 8, 9, 12, 15} es mayor que la media poblacional.
A) Solo II
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III
178
Matemática
Resolución
El conjunto de todos los múltiplos positivos de 3 menores que 20 es {3, 6, 9, 12, 15, 18}, mientras que el
conjunto de todos los divisores positivos de 24 son {1, 2, 3, 4, 6, 8, 12, 24}. Por lo tanto, la población es el
conjunto {1, 2, 3, 4, 6, 8, 9, 12, 15, 18, 24}. Luego:
I) Verdadera, ya que al tomar muestras de tamaño 9, sin orden y sin reposición, de una población con
11 elementos, se realiza una combinación de 11 sobre 9, es decir,
( )11 = 11! = 11! = 11 • 10 • 9! = 110 = 55
9 (11 – 9)! • 9! 2! • 9! 2! • 9! 2
II) Verdadera, ya que la mayor de las medias muestrales se obtiene a partir del promedio entre los
elementos de mayor valor de la población, según el tamaño de la muestra. Como la muestra es de
tamaño 3, entonces se obtendrá a partir del conjunto {15, 18, 24}.
x= 15 + 18 + 24 = 57 = 19
3 3
III) Verdadera, ya que la media población es:
μ= 1 + 2 + 3 + 4 + 6 + 8 + 9 + 12 + 15 + 18 + 24 = 102 = 9,27
11 11
Por otra parte, el promedio de la muestra de la afirmación es: Alternativa correcta:
x= 6 + 8 + 9 + 12 + 15 = 50 = 10 E
5 5
Luego, μ < x
4.6 Probabilidad clásica y tipos de probabilidades
4.6.1. Técnicas combinatorias
La combinatoria estudia las cantidades de casos en que se cumplen ciertas condiciones dentro de un conjunto.
El factorial es una operación matemática muy usada en combinatoria, su simbología es n! (con n un número
entero positivo o cero) y significa la multiplicación de todos los números enteros desde 1 hasta n, es decir:
n! = 1 • 2 • 3 • … • (n – 2) • (n – 1) • n, excepto para 0! = 1.
Por ejemplo, 5! = 1 • 2 • 3 • 4 • 5 = 120.
( )Otro uso del factorial es la coeficiente binomial, cuya notación es n (se lee “n sobre k”) y es igual a
k
n!( )(n 6 6! 6! = 1•2•3 • 4•5•6
– k)! • k! . Por ejemplo, 2 = (6 – 2)! • 2! = 4! • 2! 1•2•3 • 4•1•2 = 15.
CPECH
179
4 Datos y Azar
Capítulo Específicamente, la combinatoria permite calcular la cantidad de formas distintas en que puede darse un
ordenamiento o selección. Dentro de los casos más recurrentes dentro de la combinatoria se encuentra la
permutación, la combinación y la variación (o arreglo).
La permutación con elementos distintos consiste en ordenar los n elementos de un conjunto, siendo todos
distintos entre sí. La cantidad de formas distintas en que se puede realizar es Pn = n!. Por ejemplo, la cantidad de
formas distintas en que pueden ordenarse 7 niños en una fila es P7 = 7! = 1 • 2 • 3 • 4 • 5 • 6 • 7 = 5.040.
La permutación con elementos repetidos consiste en ordenar los n elementos de un conjunto, habiendo
a de un tipo, b de otro tipo, c de otro tipo, etc. La cantidad de formas distintas en que se puede realizar es
PR n = a! • n! • c! . Por ejemplo, la cantidad de formas distintas en que pueden ordenarse las letras de la
a,b,c... b!
palabra PATATA es PR 6 = 1! • 6! • 2! ... = 1•2•3•4•5•6 = 720 = 60 (son 6 letras: hay una P, tres A y dos T).
1,3,2 3! 1•1•2•3•1•2 12
La combinación sin repetición consiste en seleccionar k elementos distintos de un total de n elementos de
un conjunto, sin importar el orden en que se dispondrán. La cantidad de formas distintas en que se puede
( )realizar es C n = n = n! • k! . Por ejemplo, la cantidad de formas distintas en que se puede seleccionar 3
k k (n – k)!
personas de un grupo de 8 es C 8 = 8! = 8! = 1•2•3•4•5•6•7•8 = 40.320 = 56. Otro ejemplo
3 (8 –3)! • 3! 5! • 3! 1•2•3•4•5•1•2•3 720
es el número de muestras de un determinado tamaño en una población. Si una población se compone de 7
elementos, entonces el número de muestras de tamaño 4, sin reposición, es
( )C 7 = 7 = (7 7! = 7! = 1 • 2 • 3 • 4 • 5 • 6 • 7 = 35
4 4 – 4)! • 4! 3! • 4! 1 • 2 • 3 • 1 • 2 • 3 • 4
La combinación con repetición consiste en seleccionar k elementos, que pueden repetirse, de un conjunto
( )de elementos de n tipos distintos, sin importar el orden en que se dispondrán. La cantidad de formas distintas
en que se puede realizar es CR n = n+k–1 = (n + k – 1)! . Por ejemplo, la cantidad de formas distintas en que
k k (n – 1)! • k!
se puede seleccionar cuatro tarjetas si hay blancas, negras, rojas, azules, verdes y amarillas es:
CR 6 = (6 + 4 – 1!) = 9! = 1•2•3•4•5•6•7•8•9 = 362.880 = 126.
4 (6 – 1)! • 4! 5! • 4! 1•2•3•4•5•1•2•3•4 2.880
La variación (o arreglo) sin repetición consiste en seleccionar k elementos distintos de un total de n
elementos de un conjunto, siendo importante el orden en que se dispondrán. La cantidad de formas distintas
en que se puede realizar es V n = (n n! . Por ejemplo, la cantidad de formas distintas en que puede definirse el
k – k)!
primer, segundo y tercer lugar en una competencia de 9 personas es:
V 9 = 9! = 9! = 1•2•3•4•5•6•7•8•9 = 362.880 = 504.
3 (9 –3)! 6! 1•2•3•4•5•6 720
Otra forma de resolver este caso es mediante el principio multiplicativo, que consiste en escribir lasCPECH
posibilidades que existen hasta completar la cantidad de elementos a seleccionar, y luego multiplicarlas. En
el ejemplo anterior, el primer lugar puede ser ocupado por 9 personas distintas, luego el segundo lugar por
8 personas distintas (ya hay una en el primer lugar) y el tercer lugar por 7 personas distintas (ya hay dos en el
180
Matemática
primer y segundo lugar). Luego, la cantidad de formas distintas en que puede definirse el primer, segundo y
tercer lugar en una competencia de 9 personas es 9 • 8 • 7 = 504.
La variación (o arreglo) con repetición consiste en seleccionar k elementos, que pueden repetirse, de un
conjunto de elementos de n tipos distintos, siendo importante el orden en que se dispondrán. La cantidad de
formas distintas en que se puede realizar es VR n = nk. Por ejemplo, la cantidad de números distintos de tres
k
cifras que se pueden formar, de manera que todas sus cifras sean impares, es VR 5 = 53= 125 (hay cinco dígitos
3
impares: 1, 3, 5, 7 y 9).
Pregunta tipo PSU
Una tómbola contiene cinco bolitas azules y cuatro bolitas rojas. ¿De cuántas formas se pueden escoger
tres bolitas azules y dos bolitas rojas?
A) 60
B) 120
C) 12
D) 126
E) 10
Resolución
Como el problema implica una selección, no es necesario considerar el orden en el que se toma cada
elemento, por lo que se debe realizar una combinación. Por otra parte, como se desean escoger tres bolitas
azules y dos rojas, será necesario aplicar el principio multiplicativo, es decir, determinar el número de formas
posibles en que se puede escoger cada color y estos valores multiplicarlos.
Se desea escoger tres bolitas azules de un total de cinco, por lo tanto, el número de selecciones será:
( )5 = (5 – 5! • 3! = 5 • 4• 3! = 5•4 = 10
3)! 2! • 3! 2
3
Respecto a las bolitas rojas, se desea tomar solo dos de un total de
cuatro bolitas, por lo tanto, el número de selecciones será: Alternativa correcta:
( )4 = (4 4! = 4•3• 2•1 = 24 =6 A
– 2)! • 2! 2! • 2! 4
2
Como las bolitas azules se pueden escoger de 10 maneras distintas y
las bolitas rojas se pueden seleccionar de 6 formas distintas, entonces
el número de selecciones posibles en el que se pueden tomar 3 bolitas
y 2 bolitas rojas será (10 • 6), es decir, 60 formas distintas.
CPECH
181
4 Datos y Azar
Capítulo 4.6.2. Regla de Laplace
En probabilidad se define un experimento aleatorio como aquel cuyos resultados no se pueden predecir
a pesar de que se manejen todas las condiciones. El espacio muestral de un experimento aleatorio es el
conjunto de todos los posibles resultados distintos del experimento. Por ejemplo, “lanzar un dado común” es
un experimento aleatorio, cuyo espacio muestral es E = {1, 2, 3, 4, 5, 6}.
Dentro de un experimento aleatorio, un evento o suceso es un subconjunto del espacio muestral que cumple
con alguna condición. Por ejemplo, para el experimento “lanzar un dado común”, el evento “que salga un
divisor de 6” es A = {1, 2, 3, 6}. Un evento que no tiene elementos se llama evento imposible, y un evento que
es igual al espacio muestral se llama evento seguro.
Si dentro de un experimento se tiene dos eventos que no tienen elementos en común se llaman eventos
mutuamente excluyentes, esto significa que no pueden ocurrir simultáneamente ya que su intersección es
vacía. Por el contrario, si tienen elementos en común se llaman eventos no excluyentes. Por otro lado, si la
ocurrencia de uno de ellos no afecta la probabilidad de ocurrencia del otro, se llaman eventos independientes.
Si se afectan, se trata de eventos dependientes.
Según la regla de Laplace, la probabilidad de que ocurra un evento dentro de un experimento aleatorio
corresponde a la razón entre la cantidad de elementos del evento (casos favorables) y la cantidad de elementos
del espacio muestral (casos posibles), es decir, P(evento) = Casos favorables . Por ejemplo, al lanzar un dado
Casos posibles
común (6 casos posibles) la probabilidad de que salga un divisor de 6 (4 casos favorables) es
P(divisor de 6) = Casos favorables = 4 = 2 .
Casos posibles 6 3
Sabías que...
La probabilidad del evento contrario (que no ocurra un evento) es igual a P(no evento) = 1 – P(evento).
Por ejemplo, en el caso anterior, al lanzar un dado común, la probabilidad de que NO salga un divisor de
6 es P(NO divisor de 6) = 1 – 2 = 1 .
3 3
El valor de una probabilidad se encuentra entre 0 (para eventos imposibles) y 1 (para eventos seguros). La
forma más usual de representar una probabilidad es mediante una fracción, pero también puede expresarse
como número decimal o como porcentaje.
Ojo conCPECH
Una probabilidad es el grado de posibilidad de que algo ocurra, y no la garantía de que va a ocurrir en
un número definido de casos. Por ejemplo, al lanzar una moneda, tanto la probabilidad de que salga cara
como la probabilidad de que salga sello es 50% en cada lanzamiento. Esto no significa que si se lanza una
moneda varias veces, la mitad de ellas salga cara y la otra mitad salga sello, o que si sale un resultado una
cierta cantidad de veces, esto afecte la posibilidad de los resultados posteriores.
182
Matemática
Pregunta tipo PSU
Se tienen en una caja n fichas, con n un número entero positivo mayor que cuatro, todas de igual forma y
tamaño, donde a fichas son de color verde y el resto son de color amarillo, con a un número entero mayor
que tres. Si a la caja se le agregan (a + 5) fichas verdes y (a – 3) fichas amarillas, idénticas a las anteriores,
entonces ¿cuál es la probabilidad de escoger una ficha amarilla?
A) a–3
n+a+2
B) 2a + 5
n + 2a + 2
C) n–3
n + 2a + 2
D) n –3
n + 2a
E) n–a
n + 2a + 2
Resolución
Como en la caja solo hay fichas verdes y amarillas, entonces el total de fichas amarillas será igual al total de
fichas menos la cantidad de fichas verdes que hay, es decir, (n – a) fichas amarillas.
Al agregar (a + 5) fichas verdes y (a – 3) fichas amarillas, en total se agregaron (2a + 2) fichas al número que
había inicialmente, es decir, el nuevo total de fichas será (n + 2a + 2). Por otra parte, el nuevo número de
fichas amarillas serán las (n – a) que habían inicialmente más las (a – 3) que se agregaron posteriormente,
es decir, (n – 3) fichas amarillas.
Luego, aplicando el teorema de Laplace, considerando los casos Alternativa correcta:
totales como la cantidad final de fichas que hay en total en la caja y
los casos posibles como la cantidad de fichas amarillas que hay, se C
obtiene:
P(amarillas) = fichas amarillas = n n–3 2
fichas en total + 2a +
CPECH
183
4 Datos y Azar
Capítulo 4.6.3. Producto de probabilidades
Si A y B son dos eventos independientes, entonces la probabilidad de que ocurran ambos simultáneamente
(o sea, que ocurra A y B) es igual al producto de las probabilidades de que ocurra cada uno de ellos, es decir,
lPlaa(nApzr∩aobuBan)ba=imliPd(oaAnd)e•ddPea(Bqla)u. pPerosorablegajeabmiulindpal3ode, dsnieesqel dulaaendszoaalyguasnesledlolalodenoeslcao12mm.oúLnnueeldagaope,rsosibPsa(e3blyailnisdzeaalldno)du=enPqd(ua3de) •osPac(losgemallúoun)n=y3u61ensa• 61m21,oy=nse1i1d2sae,.
Si A y B son dos eventos dependientes, es decir, si la probabilidad que ocurra B depende del evento A,
entonces la probabilidad que ocurran ambos simultáneamente (o sea, que ocurra A y B) es igual al producto
entre la probabilidad que ocurra A y la probabilidad que ocurra B dado A, o sea, P(A ∩ B) = P(A) • P(B/A), donde
P(B/A) corresponde a una probabilidad condicionada, de la cual se hablará más adelante. Por ejemplo, si se
escogen al azar números del 1 al 10, sin reposición, la probabilidad que el primero sea par es 5 = 1 , mientras
10 2
que la probabilidad que el segundo sea un 3, dado que ya se obtuvo un número par, es 1 (ya que no se
9
tienen diez elementos como inicialmente). Luego la probabilidad de extraer un número par seguido de un 3
es P(Par y 3) = 1 • 1 = 1 .
2 9 18
Pregunta tipo PSU
Una bolsa contiene galletas de tres sabores distintos: 8 de chocolate, 9 de frambuesa y 13 de manzana,
todas de igual peso y tamaño. Si una persona saca galletas al azar, una a una, y luego se come la galleta
extraída, ¿cuál es la probabilidad de que las primeras dos galletas sean de manzana y la tercera sea de
chocolate?
A) 13 • 13 • 8
30 30 30
B) 13 + 12 + 8
30 29 28
( )C) 13 + 12 • 8
30 29 28
D) 13 • 12 • 8
30 29 28
E) 13 + 13 + 8
30 30 30
CPECH
184
Matemática
Resolución
Inicialmente, la bolsa contiene 30 galletas en total, pero al ir sacando una a una las galletas y comérselas,
implica que el tamaño del espacio muestral disminuirá, ya que el ejercicio es sin reposición. Por otra parte,
el número de casos a favor al extraer la segunda galleta se verá afectado por la primera extracción, ya que
al ser del mismo tipo que la primera, este disminuye en una unidad.
P(1ª Manzana) = 13 P(2ª Manzana) = 12 P(3ª Chocolate) = 8
30 29 28
Como se desea conocer la probabilidad de que la primera sea de Alternativa correcta:
manzana “y” la segunda de manzana “y” la tercera de chocolate,
entonces: D
P(1ª Manzana y 2ª Manzana y 3ª Chocolate) = 13 • 12 • 8
30 29 28
4.6.4. Suma de probabilidades
Si A y B son dos eventos mutuamente excluyentes, entonces la probabilidad de que ocurra alguno de ellos
(o sea, que ocurra A o B) es igual a la suma de las probabilidades de que ocurra cada uno de ellos, es decir,
P(A ∪ B) = P(A) + P(B). Por ejemplo, si se lanza un dado común la probabilidad de que salga un número mayor
que 4 es 2 , y la probabilidad de que salga un 2 es 1 . Luego, si se lanza un dado común, la probabilidad de
6 6
que salga un número mayor que 4 o que salga un 2 es:
P(> 4 y 2) = P(> 4) + P(2) = 2 + 1 = 3 = 1 .
6 6 6 2
Si A y B son dos eventos no excluyentes, entonces la probabilidad de que ocurra alguno de ellos (o sea, que
ocurra A o B) es igual a la suma de las probabilidades de que ocurra cada uno de ellos, menos la probabilidad
de que ocurran ambos simultáneamente, es decir, P(A ∪ B) = P(A) + P(B) – P(A ∩ B). Por ejemplo, si se lanza un
dimadpoarceosm63únyllaapprroobbaabbiilliiddaaddddeeqquueessaalglgaauunnnnúúmmeerorommeennoorrqquuee55eqs u64e , la probabilidad de que salga un número
sea impar es 4 • 3 = 12 = 2 . Luego, si
6 6 36 6
se lanza un dado común la probabilidad de que salga un número menor que 5 o que salga un número impar es:
P(< 5 o impar) = P(< 5) + P(impar) – P(< 5 e impar) = 4 + 3 – 2 = 5 .
6 6 6 6
CPECH
185
4 Datos y Azar
Capítulo Pregunta tipo PSU
Se tiene una caja A que contiene cuatro tarjetas rojas y cinco azules, y una caja B que contiene tres tarjetas
rojas y seis azules, todas las tarjetas de igual forma y tamaño. Si desde cada caja se extrae una tarjeta al
azar, ¿cuál es la probabilidad de que sean de distinto color?
A) 13
27
B) 8
28
C) 10
27
D) 5
27
E) 14
27
Resolución
Como se desean que ambas tarjetas sean de distinto color, existen dos casos posibles: que de la caja A se
saque una tarjeta roja “y” de la caja B una azul, “o” que de la caja A se saque una tarjeta azul “y” de la caja B
se saque una roja. Es decir, se tiene un caso de suma y producto de probabilidades.
Caso 1: Sacar una tarjeta roja desde la caja A y una tarjeta azul desde la caja B.
P(Roja A y Azul B) = 4 • 6 = 24 = 8
9 9 81 27
Caso 2: Sacar una tarjeta azul desde la caja A y una tarjeta roja desde la caja B.
P(Azul A y Roja B) = 5 • 3 = 15 = 5
9 9 81 27
Como puede ser el caso 1 “o” el caso 2, entonces se suman las Alternativa correcta:
probabilidades:
A
8 5 13
P(Caso 1 o Caso 2) = 27 + 27 = 27
CPECH
186
Matemática
4.6.5 Diagrama de árbol y triángulo de Pascal
En probabilidad, es posible resolver problemas de forma gráfica, como es mediante el uso de un diagrama de
árbol y del triángulo de Pascal.
Gracias a la construcción de un diagrama de árbol es posible determinar todos los resultados posibles de un
experimento aleatorio, es decir, es una forma gráfica de representar al espacio muestral de un experimento.
Para su construcción se comienza poniendo una rama para cada una de las posibilidades, acompañada de su
probabilidad.
1 CC 1 • 1 = 1
2 2 2 4
1 1 CS 1 • 1 = 1
2 2 2 2 4
1
Experimento 2 SC 1 • 1 = 1
2 2 4
1 1
2 2
SS 1 • 1 = 1
2 2 4
La suma de todas las probabilidades de las ramas finales debe ser igual a 1. En este caso,
1 + 1 + 1 + 1 = 4 = 1.
4 4 4 4 4
Por otra parte, el triángulo de Pascal se utiliza como una técnica de conteo en la resolución de problemas
de iteración de experimentos sencillos, cuando el objeto considerado tiene solo dos resultados posibles,
(experimento binario). Por ejemplo, una moneda o el sexo de un hijo por nacer. Es un conjunto de números
enteros positivos ordenados en forma de triángulo que expresan coeficientes binomiales.
Este se construye comenzando y terminando cada fila con un 1, y rellenando cada espacio del interior con la
suma de los dos números que están encima del espacio.
La suma de todos los valores de cada fila corresponde a la cantidad de todos los posibles resultados de dicho
experimento y cada valor se interpreta como una combinación específica de resultados. Por ejemplo, si se
realiza el experimento de lanzar una moneda 6 veces, se debe analizar la sexta fila del triángulo, que es 1–6–
15–20–15–6–1, y se interpreta:
Hay 1 combinación donde se obtienen 6 caras y 0 sello. 11 CPECH
Hay 6 combinaciones donde se obtienen 5 caras y 1 sello. 121
Hay 15 combinaciones donde se obtienen 4 caras y 2 sellos. 1331
Hay 20 combinaciones donde se obtienen 3 caras y 3 sellos. 14641
Hay 15 combinaciones donde se obtienen 2 caras y 4 sellos. 1 5 10 10 5 1
Hay 6 combinaciones donde se obtienen 1 cara y 5 sellos. 1 6 15 20 15 6 1
Hay 1 combinación donde se obtienen 0 cara y 6 sellos.
187
4 Datos y Azar
Capítulo Pregunta tipo PSU
Si se contestan al azar cinco preguntas de Verdadero o Falso, ¿cuál es la probabilidad de obtener por lo
menos cuatro respuestas correctas?
A) 27
32
B) 3
16
C) 5
32
D) 1
2
E) 5
16
Resolución
Como la probabilidad de acertar una pregunta de Verdadero o Falso respondiendo al azar es del 50%,
entonces una estrategia útil es realizar un triángulo de Pascal para así determinar los casos favorables.
Al ser cinco preguntas, se realiza el triángulo hasta que el segundo coeficiente sea cinco. De este esquema
se puede extraer la siguiente información:
- Son 32 los casos posibles, ya que corresponde a la suma de los 11
coeficientes. 121
1331
- En uno de los casos se obtienen cinco respuestas correctas. 14641
- En cinco de los casos se obtienen solo cuatro respuestas correctas. 1 5 10 10 5 1
- En diez de los casos se obtienen solo tres respuestas correctas.
- En diez de los casos se obtienen solo dos respuestas correctas.
- En cinco de los casos se obtiene solo una respuesta correcta.
- En uno de los casos no se obtienen respuestas correctas.
Como se pide la probabilidad de que se obtenga por lo menos cuatro Alternativa correcta:
respuestas correctas, entonces se debe considerar cuando se obtiene
exactamente cuatro “o” cuando tiene las cinco respuestas correctas: B
P(4 correctas o 5 correctas) = 5 + 1 = 6 = 3
32 32 32 16
CPECH
188
Matemática
4.6.6. Probabilidad condicional y teorema de Bayes
La probabilidad condicional (o condicionada) se refiere a la probabilidad de que ocurra un evento A dado
que ocurrió otro evento B, y se denota P(A/B). Para que tenga sentido es necesario que los eventos sean
dependientes, ya que si son independientes entonces la ocurrencia de B no influiría en la ocurrencia de A, o
sea, P(A/B) = P(A).
La probabilidad condicional de eventos dependientes se calcula según el teorema de Bayes mediante la
expresión P(A/B) = P(A ∩ B) = P(A) • P(B/A) , que se explica a continuación con un ejemplo práctico.
P(B) P(B)
plLpaarroodpbberaatoebbbciialltiiebddniaalidd(dfaaddldeesoqdqpuueeoessullaiotfrispvirmaoud)éneedszaiccdcaoei?esr3lt1a0ade.enStfieeucrtnmeanepdeeasrdsdoeensa19d0feu,e81yas.liCmnuoéadnlaidcpooayudnleeacdep,eeltarespcotrnaoarbopanbaldialiedecanedfeedrsmetaqeedunaefdelo,r¿mscmuedáéladedics,ollaas
◆ P(A) es la probabilidad de sufrir la enfermedad. Luego, P(A) = 1 .
8
◆ P(B/A) es la probabilidad de que se le detecte la enfermedad a una persona que la padece.
Luego, P(B/A) = 9 .
10
( ) ( )◆ P(B) es la probabilidad de que se le detecte la enfermedad a una persona cualquiera, es decir, a quien la91179117
padece 10 • 8 o a quien no la padece 30 • 8 . Entonces, P(B) = 10 • 8 + 30 • 8 .
Luego, si P(A/B) es la probabilidad de que padezca la enfermedad una persona a la cual se le detectó, entonces
P(A) • P(B/A) 1 • 9 27
P(B) 8 10 34
P(A/B) = = = .
9 1 1 7
10 • 8 + 30 • 8
Pregunta tipo PSU CPECH
El pronóstico del tiempo para un cierto pueblo indica que existe un 75% de probabilidad de que llueva.
En la carretera que atraviesa este pueblo existe una curva peligrosa, en la que la probabilidad de que
ocurra un accidente cuando está lloviendo es de un 10%, mientras que la probabilidad de que ocurra
un accidente cuando no llueve es de un 2%. Si ese día ocurrió un accidente en dicha curva, ¿cuál es la
probabilidad de que no haya estado lloviendo?
A) 5%
B) 15%
C) 6,25%
D) 8%
E) 7,25%
189
4 Datos y Azar
Capítulo Resolución
Se pueden definir los eventos A y B de modo que:
A = que esté lloviendo
B = que ocurra un accidente
Por lo tanto: P(A) = 75% P(no A) = 25%
P(B/A) = 10% P(B/no A) = 2%
P(no B/A) = 90% P(no B/no A) = 98%
Como preguntan respecto a la probabilidad que no esté lloviendo sabiendo que hubo un accidente,
entonces se debe determinar el valor P(no A/B).
P(no A/B) = P(no A ∩ B)
P(B)
P(no A ∩ B) corresponde a la probabilidad de que no esté lloviendo y que ocurra un accidente, por lo
que P(no A ∩ B) = P(no A) • P(B/no A). Por otra parte, P(B) corresponde a la probabilidad de que ocurra un
accidente, pero este puede ocurrir en dos caso: cuando esté lloviendo y cuando no. Por lo tanto,
P(B) = P(no A) • P(B/no A) + P(A) • P(B/A). Es decir,
P(A/B) = P(no P(no A) • P(B/no A) P(B/A) (Reemplazando)
A) • P(B/no A) + P(A) • (Reemplazando)
(Calculando)
= 25% • 2%
25% • 2% + 75% • 10%
= 50 50
+ 750
= 50
800
= 1 Alternativa correcta:
16
C
= 0,0625
= 6,25%
CPECH
190
Matemática
4.6.7. Ley de los grandes números
En una distribución estadística, la probabilidad de que un dato escogido al azar tenga un cierto valor es igual a
la frecuencia relativa de dicho dato, es decir, a la frecuencia del dato dividida por el total de datos. Por ejemplo,
la tabla adjunta representa la distribución de frecuencias de las edades de los participantes en el taller de
música de un colegio.
Edad Frecuencia Frecuencia Frecuencia
(años) relativa porcentual
4 0,16
14 7 0,28 16%
15 6 0,24 28%
16 8 0,32 24%
17 32%
Al escoger al azar un alumno del taller, la probabilidad de que este tenga 16 años es 0,24 = 24%, o bien,
24 = 6 .
100 25
En el proceso inverso, cuando se realiza un experimento aleatorio es esperable que los resultados cumplan con
una cierta proporción estadística. Esta coincidencia se conoce como la ley de los grandes números, y dice
que si un experimento se realiza una gran cantidad de veces, la frecuencia relativa de cada resultado tenderá
al valor de su probabilidad teórica. Por ejemplo, si se lanza un dado la probabilidad teórica de que salga cada
número es 1 , pero si se lanza seis veces muy difícilmente saldrá cada número una vez. Sin embargo, si el
6
dado se lanza 6.000 veces, teóricamente cada número tendrá una frecuencia muy cercana a 1.000, o sea una
frecuencia relativa muy cercana a 1 .
6
Pregunta tipo PSU
Un experimento consiste en lanzar dos dados comunes y registrar la suma de los resultados obtenidos. CPECH
Si el experimento se realiza 720.000 veces, cumpliéndose la ley de los grandes números, entonces se
puede afirmar que
I) aproximadamente, en 120.000 de los resultados obtenidos las caras sumarán 7.
II) el número de veces que se obtiene como resultado de la suma un cuatro es igual al número de
veces en el que la suma es diez.
III) en cerca de 200.000 resultados, la suma de las caras es menor que seis.
Es (son) verdadera(s)
A) solo I.
B) solo II.
C) solo I y III.
D) solo II y III.
E) I, II y III.
191
4 Datos y Azar
Capítulo Resolución
Como el experimento consiste en lanzar dos dados +12 3456
comunes y luego sumar los resultados obtenidos, 123 4567
entonces los posibles resultados para este experimento 234 5678
serán los que muestra el diagrama. Luego, 345 6789
I) Verdadera, ya que la probabilidad de que la suma 4 5 6 7 8 9 10
de las caras sea siete es igual a 6 = 1 . Por lo 5 6 7 8 9 10 11
36 6 6 7 8 9 10 11 12
tanto, mediante la ley de los grandes números,
en aproximadamente un sexto de los resultados corresponde a la suma igual siete, es decir, en
aproximadamente 120.000 resultados.
II) Falsa, ya que la ley de los grandes números nos dice que entre más veces se realice un experimento,
más cercano es a la probabilidad teórica, pero no necesariamente de manera exacta. Si bien la
probabilidad de obtener como resultado de la suma un 4 y la probabilidad de obtener 10 son iguales,
no necesariamente se obtendrá la misma cantidad de estos resultados.
III) Verdadera, ya que en 10 de los 36 posibles
resultados se obtiene como resultado de la suma
un dos, un tres, un cuatro o un cinco. Por lo tanto,
mediante la ley de los grandes números se puede
afirmar que en un valor cercano a Alternativa correcta:
10 • 720.000 = 200.000 resultados se obtendrá C
36
una suma menor a seis.
4.7 Análisis de variable aleatoria discretaCPECH
4.7.1. Variable aleatoria discreta, función de probabilidad y función de distribución
Una variable aleatoria asigna valores a eventos, dentro de un experimento aleatorio. Si esta variable solo
considera ciertos valores, sin tomar en cuenta intervalos, entonces corresponde a una variable aleatoria
discreta. Por ejemplo, una urna contiene cuatro bolitas numeradas del 1 al 4, se escogen al azar dos bolitas
una tras otra con reposición, y se define la variable aleatoria X como “la suma de los números obtenidos”. El
valor de X para cada evento del espacio muestral es:
Evento 1 y 1 1 y 2 1 y 3 1 y 4 2 y 1 2 y 2 2 y 3 2 y 4 3 y 1 3 y 2 3 y 3 3 y 4 4 y 1 4 y 2 4 y 3 4 y 4
X 2 3 4 5 345 6456 7 567 8
El recorrido de X corresponde a todos los valores que puede tomar esta variable aleatoria. En el caso anterior, el
recorrido de X es {2, 3, 4, 5, 6, 7, 8}. En general, una variable aleatoria puede tomar valores discretos o continuos,
los que pueden estar dados por experimentos aleatorios o simplemente definidos dentro de un conjunto.
192
Matemática
Cada valor dentro del recorrido de una variable aleatoria tiene asociada la probabilidad de que la variable
tome dicho valor. A esta relación se le conoce como función de probabilidad, y su dominio corresponde al
recorrido de la variable aleatoria. Existen varias formas de definir una función de probabilidad:
■ Mediante una situación en que ocurre un evento aleatorio. Por ejemplo, una caja contiene una bolita
con el número 3, dos bolitas con el número 5 y cuatro bolitas con el número 8, todas de igual peso y
tamaño. Se escoge una bolita al azar de la caja, se define la variable aleatoria X como el número obtenido y
P(X = a) como la probabilidad de que X tome el valor a, por lo cual el dominio de P es igual a {3, 5, 8}. Dado
que hay siete bolitas en la caja, la probabilidad de que X tome el valor 3 (una bvoalloitra)8e(csu71at,rolabporolitbaasb) eilisda47d.
de que X tome el valor 5 (dos bolitas) es 2 y la probabilidad de que X tome el
7
Luego, P(X = 3) = 1 , P(X = 5) = 2 y P(X = 8) = 4 .
7 7 7
■ Mediante una expresión algebraica. Por ejemplo, sea X una variable aleatoria cuya función de
probabilidad es P(X = a) = a2 , con a en el conjunto {1, 2, 3, 4}. Entonces:
30
P(X = 1) = 12 = 1 , P(X = 2) = 22 = 4 , P(X = 3) = 32 = 9 y P(X = 4) = 42 = 16 .
30 30 30 30 30 30 30 30
■ Mediante un gráfico y/o tabla. Por ejemplo, el gráfico adjunto representa a la función de probabilidad
asociada a una variable aleatoria X, representada en la tabla:
P(X = x)
0,45 X 2 3 5
0,35 P(X = x) 0,35 0,45 0,2
0,2
235 X
■ Mediante los valores de sus imágenes. Por ejemplo, sea X una variable aleatoria con función de
probabilidad P tal que
1 , si a = 6
3
P(X = a) = 4 , si a = 7
15
2 , si a = 9
5
Cualquiera sea el caso, dado que se trata de probabilidades, la suma de las imágenes de una función de
probabilidad siempre debe ser igual a 1. En el ejemplo anterior, P(X = 6) + P(X = 7) + P(X = 9) = 1 + 4 + 2 =1
3 15 5
CPECH
193
4 Datos y Azar
Capítulo Una función de distribución corresponde a la función de probabilidad acumulada de la variable aleatoria, es
decir, a la suma de las imágenes de la función de probabilidad desde la primera hasta la indicada. O sea, si X es una
variable aleatoria en el conjunto {x1, x2, x3,…, xk,…, xn}, con función de probabilidad P y función de distribución F,
entonces F(xk) = P(X ≤ Xk) = P(X = x1) + P(X = x2) + P(X = x3) +…+ P(X = xk). Siempre se cumple que F(x1) = P(X = x1)
para la primera imagen y F(xn) = 1 para la última imagen.
Por ejemplo, tomando uno de los casos dados anteriormente, si X es una variable aleatoria cuya función de
probabilidad es P(X = a) = a2 , con a en el conjunto {1, 2, 3, 4}, entonces:
30
P(X = 1) = 1 , P(X = 2) = 4 , P(X = 3) = 9 y P(X = 4) = 16 . Luego, la función de probabilidad acumulada F
30 30 30 30
tiene como imágenes:
F(1) = P(X = 1) = 1
30
F(2) = P(X = 1) + P(X = 2) = 1 + 4 = 5
30 30 30
F(3) = P(X = 1) + P(X = 2) + P(X = 3) = 1 + 4 = 9 = 14
30 30 30 30
F(4) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) = 1 + 4 + 9 + 16 =1
30 30 30 30
Dada una función de distribución, es posible obtener los valores de la función de probabilidad asociada
calculando la diferencia entre imágenes sucesivas, de modo que P(X = xk) = F(xk) – F(xk – 1). Por ejemplo, sea
X una variable aleatoria de función de probabilidad P y función de distribución F(a) = 2a – 1 , con a en el
a+2
conjunto {1, 2, 3}. Entonces, F(1) = 2•1–1 = 1 , F(2) = 2•2–1 = 3 y F(3) = 3•2–1 = 5 . Luego,
1+2 3 2+2 4 3+2 5
P(X = 1) = F(1) = 1 , P(X = 2) = F(2) – F(1) = 3 – 1 = 5 y P(X = 3) = F(3) – F(2) = 1– 3 = 1 .
3 4 3 12 4 4
CPECH
194
Matemática
Pregunta tipo PSU
Se tiene en una tómbola cuatro bolitas azules y tres bolitas rojas, todas de igual peso y tamaño. Un
experimento consiste en extraer tres bolitas al azar, una a una y sin reposición, y se define la variable
aleatoria X como el número de bolitas azules extraídas. Si f es la función de probabilidad asociada a X
y F es la función de distribución de probabilidad de esta variable, entonces ¿cuál(es) de las siguientes
afirmaciones es (son) verdadera(s)?
I) El recorrido de X es el conjunto {0, 1, 2, 3}.
II) f(2) = 18
35
III) F(2) = 31
35
A) Solo I
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III
Resolución
I) Verdadera, ya que al tener cuatro bolitas azules de un total de siete, y al extraer tres de estas
bolitas, se pueden obtener cero bolitas azules, una bolita azul, dos bolitas azules y hasta tres
bolitas azules, es decir, que los valores que puede tomar la variable aleatoria son aquellos que
están en el conjunto {0, 1, 2, 3}.
II) Verdadera, ya que f(2) = P(X = 2), es decir, la probabilidad de que al sacar estas tres bolitas, solo dos
sean azules. Para esto, existen tres casos:
Caso 1: La primera extraída sea azul, la segunda también y la tercera roja.
Caso 2: La primera azul, la segunda roja y la tercera azul nuevamente.
Caso 3: La primera roja, la segunda azul y la tercera también.
CPECH
195
4 Datos y Azar
Capítulo Es decir, f(2) = P(X = 2) =
P(1ª azul y 2ª azul y 3ª roja) + P(1ª azul y 2ª roja y 3ª azul) + P(1ª roja y 2ª azul y 3ª azul) =
4 • 3 • 3 + 4 • 3 • 3 + 3 • 4 • 3 = (Reemplazando)
7 6 5 7 6 5 7 6 5
36 + 36 + 36 = (Desarrollando)
210 210 210
108 =
210
18 (Simplificando por 6)
35
Luego, f(2) = 18
35
III) Verdadera, ya que F(2) = P(X ≤ 2), es decir, la probabilidad de Alternativa correcta:
que se obtenga como máximo dos bolitas azules. Como la
variable aleatoria toma como máximo valor tres, y la suma de E
todas las imágenes en la función de probabilidad es igual a 1,
entonces F(3) = 1 y F(2) = F(3) – f(3) = 1 – f(3). Calculando f(3), es
decir, la probabilidad de obtener tres azules:
P(1ª azul y 2ª azul y 3ª azul) = 4 • 3 • 2 = 24 = 4
7 6 5 210 35
Luego, F(2) = 1 – f(3) = 1 – 4 = 35 – 4 = 31
35 35 35
4.7.2 Valor esperado (Esperanza matemática)
Sea X una variable aleatoria que toma los valores reales {x1, x2, x3, …, xk}. La esperanza matemática o valor
esperado, E(X), corresponde a la suma de los productos entre cada valor que toma la variable y la probabilidad
que esto ocurra. Es decir:
E(X) = x1 • P(X = x1) + x2 • P(X = x2) + x3 • P(X = x3) + … + xk • P(X = xk) , donde P(X = xi) es la probabilidad que la
variable aleatoria X tome el valor xi , o la imagen de xi en la función de probabilidad.
Por ejemplo: en una caja hay cuatro bolitas azules y dos bolitas rojas, todas de igual peso y tamaño. Un
experimento consiste en extraer al azar dos bolitas, una tras otra y sin reposición, y se define la variable
aleatoria X como el número de bolitas azules que se extraen. Entonces, ¿cuál es el valor esperado de X?
CPECH
196
Matemática
En la caja hay 6 bolitas, de las cuales 4 son azules. Como se extraen dos bolitas, entonces los valores que puede
tomar X son 0, 1 y 2. Luego
P(X = 0) = 2 • 1 = 2 (Probabilidad de extraer ninguna azul)
6 5 30
P(X = 1) = 4 • 2 + 2 • 4 = 16 (Probabilidad de extraer solo una azul)
6 5 6 5 30
P(X = 2) = 4 • 3 = 12 (Probabilidad de extraer dos azules)
6 5 30
Por lo tanto, E(X) = 0 • P(X = 0) + 1 • P(X = 1) + 2 • P(X = 2) = 0 • 2 + 1• 16 +2• 12 = 4 = 1,3
30 30 30 3
Pregunta tipo PSU
En una bolsa hay cuatro tarjetas marcadas con la letra A y seis tarjetas marcadas con la letra B, todas de
igual forma y tamaño. Un juego consiste en sacar dos tarjetas al azar, una a una y con reposición, donde
si ambas corresponden al tipo A, entonces se gana $1.000; si ambas tarjetas son distintas, se gana $200;
y si ambas tarjetas tienen la letra B, entonces se pierde $1.500. Si se desea participar del juego, entonces
se estima, a partir del cálculo de esperanza, que el resultado del juego será
A) perder $256.
B) perder $284.
C) ganar $100.
D) ganar $256.
E) ni ganar ni perder.
Resolución
Como el juego consiste en extraer dos tarjetas, una a una y con reposición, entonces los posibles
resultados serán {AA, AB, BA, BB}, donde a cada posible resultado se le asigna un monto monetario, que
corresponderá al recorrido de la variable aleatoria. Es decir, la variable aleatoria puede tomar los montos,
en pesos, {– 1.500, 200, 1.000}.
El monto esperado se determina a partir de la fórmula:
E = x1 • P(X = x1) + x2 • P(X = x2) + x3 • P(X = x3) (Reemplazando)
= – 1.500 • P(X = – 1.500) + 200 • P(X = 200) + 1.000 • P(X = 1.000)
P(X = – 1.500) es igual a la probabilidad de perder $1.500, y esto ocurre cuando la primera y la segunda
tarjeta son del tipo B. Luego,
P(X = – 1.500) = P(1ª B y 2ª B) = 6 • 6 = 36 = 9
10 10 100 25
CPECH
197
4 Datos y Azar
Capítulo P(X = 200) es igual a la probabilidad de ganar $200, y esto ocurre cuando la primera es del tipo A y la
segunda es B, o viceversa. Luego,
P(X = 200) = P(1ª A y 2ª B) + P(1ª B y 2ª A) = 4 • 6 + 6 • 4 = 24 + 24 = 48 = 12
10 10 10 10 100 100 100 25
P(X = 1.000) es igual a la probabilidad de ganar $1.000, y esto ocurre cuando la primera y la segunda
tarjeta son del tipo A. Luego,
P(X = 1.000) = P(1ª A y 2ª A) = 4 • 4 = 16 = 4
10 10 100 25
Por lo tanto,
– 1.500 • P(X = – 1.500) + 200 • P(X = 200) + 1.000 • P(X = 1.000) =
– 1.500 • 9 + 200 • 12 + 1.000 • 4 = (Reemplazando)
25 25 25
– 540 + 96 + 160 = (Calculando) Alternativa correcta:
– 284
B
Luego, se espera que en el juego se pierda $284.
4.7.3. Distribución binomial
Sabemos que una variable aleatoria discreta es aquella que solo toma ciertos valores puntuales. Si solo
puede tomar dos valores posibles, se llama dicotómica. Ejemplos de experimentos dicotómicos son lanzar
una moneda, el género de un bebé, contestar al azar verdadero o falso, y en general cualquier experimento
que tenga solo dos resultados posibles.
En general, la cantidad de resultados distintos que arroja una cierta combinación, puede calcularse como una
( )combinación
sin repetición C n = n = (n n! • k! , donde n es la cantidad de veces que se repite el experimento
k k –k)!
y k la cantidad de resultados de un tipo. Por ejemplo, si se lanza una moneda 6 veces (n = 6), la cantidad de
combinaciones en que se obtienen 4 caras (k = 4) es C 6 = 6! = 6! = 1•2•3•4•5•6 = 720 = 15.
4 (6 –4)! • 4! 2! • 4! 1•2•1•2•3•4 48
Es decir, si se lanza una moneda 6 veces, hay 15 combinaciones donde se obtienen 4 caras y 2 sellos.
En particular, si el experimento no se repite muchas veces, es posible obtener el resultado anterior mediante
el triángulo de Pascal.
Para determinar la probabilidad de una cierta combinación de resultados cuando un experimento dicotómicoCPECH
(o experimento de Bernoulli) se repite muchas veces, se utiliza la distribución binomial. Un experimento sigue
el modelo de una distribución binomial si: en cada prueba del experimento solo son posibles dos resultados
198