168 Capítulo 7 Concepción o elección del diseño de investigación
niños y otras cuestiones similares. Posteriormente, analizará los de Educación del Estado de Querétaro, México. Se evaluarán seis
usos y las gratificaciones de la televisión en niños de diferentes grupos escolares que serán asignados a tres grupos experimenta-
niveles socioeconómicos, edades, géneros y otras variables (se les. El primer grupo (n = 49 niños) será evaluado al terminar un
relacionarán nivel socioeconómico y uso de la televisión, entre programa de prevención del abuso sexual infantil (PPASI); el se-
otras asociaciones). gundo será medido después de un año de haber concluido el
mismo programa (PPASI) (seguimiento, n = 22 niños); y el terce-
Un caso de un estudio experimental sobre la televisión y el ro, un grupo de control que no será expuesto a algún PPASI parti-
niño, consistiría en exponer durante determinado tiempo a un cular (n = 79 niños). A todos los integrantes de los grupos se les
grupo de niños a tres horas diarias de televisión, otro a dos horas aplicarán tanto las escalas conductuales como la cognitiva. Las
diarias, un tercero a una hora, y por último, un cuarto que no se condiciones de recolección de datos seguirán el protocolo esta-
expondría a la televisión. Todo ello para conocer el efecto que blecido por cada escala, en un espacio físico similar y de manera
tiene la cantidad de horas expuestas ante contenidos televisivos individual. La persona que evaluará será la misma en todos los
(variable independiente) sobre diferentes variables dependien- casos, para evitar sesgos entre los observadores. Claramente se
tes (por ejemplo, autoestima, creatividad, socialización). trata de un diseño experimental:
La pareja y relación ideales G1 X1 (evaluación inmediata al terminar el PPASI) 01
G2 X2 (evaluación a un año de concluir el PPASI) 02
Este estudio se fundamentará en un diseño no experimental
transversal correlacional, ya que analizará diferencias por género G3 — (sin PPASI) 03
respecto de los factores, atributos y calificativos que describen a 01, 02 y 03 son mediciones conductuales y cognitiva.
la pareja y la relación ideales.
Estímulo (PPASI) por medio del taller: “Porque me quiero, me
La investigación realmente no podría ser experimental. Ima- cuido”, se basará principalmente en la mejora de la autoestima,
ginemos que intentamos manipular ciertos atributos de la pareja el manejo y expresión de sentimientos, la apropiación de su
y la relación ideales. En principio, no sería ética tal manipulación, cuerpo, la discriminación entre contactos apropiados e inapropia-
pues no podemos intentar incidir en los sentimientos humanos dos, la asertividad, el esclarecimiento de redes de apoyo y prác-
profundos, como es el caso de los vinculados al “amor románti- ticas para pedir ayuda denunciando el abuso. Las técnicas usadas
co”. Adicionalmente, la complejidad de los papeles no se podría en dicho taller principalmente serán: modelado, ensayo, cuento,
traducir en estímulos experimentales; y las percepciones son realimentación, actuación y dibujo. El programa se llevará a cabo
muy variadas y en parte se determinan cultural y socialmente. a lo largo del ciclo escolar, con sesiones de 40 minutos una vez
por semana. La conducción del taller estará a cargo de una facili-
El abuso sexual infantil tadora entrenada en ese programa con la integración de los pa-
dres y madres de familia por medio de actividades.
Se trata de un diseño experimental. Los datos se obtendrán de
150 preescolares de tres centros de desarrollo infantil con una
población similar, hijos de madres que laboran para la Secretaría
Los investigadores opinan M. A. IDALIA LÓPEZ RIVERA
Profesor de tiempo completo titular A
El alumno debe ser investigador desde que inicia sus estudios, Facultad de Ciencias de la Administración
pues está obligado a aprender a detectar problemas dentro de su
comunidad o institución educativa; tal acción le permitirá iniciar Universidad Autónoma de Chiapas
múltiples proyectos. Para llevar a cabo una buena investigación Chiapas, México
es necesario ejercer el rigor científico, es decir, seguir un método
científico.
El éxito de cualquier investigación científica depende, en gran correcta interpretación de los resultados con base en los conoci-
medida, de que el especialista decida indagar acerca de un pro- mientos que sirvieron de sustento a la investigación.
blema formulado adecuadamente; por el contrario, el fracaso se
producirá si hay un problema mal formulado. En este sentido, Respecto de las pruebas estadísticas, éstas permiten signifi-
diversos autores afirman que comenzar con un “buen” problema car los resultados; por tanto, son indispensables en todas las dis-
de investigación es tener casi 50% del camino andado. ciplinas, incluidas las ciencias del comportamiento, que se carac-
terizan por trabajar con datos muy diversos. Sin embargo, tales
Además de un problema bien planteado y sustentado de ma- pruebas, por variadas y sofisticadas que sean, no permiten supe-
nera sólida en la teoría y los resultados empíricos previos, se re- rar las debilidades de una investigación teórica o metodológica-
quiere también la utilización adecuada de técnicas de recolección mente mal proyectada. Los estudiantes pueden proyectar de for-
de datos y de análisis estadísticos pertinentes, lo mismo que la ma adecuada su investigación, si la ubican dentro de una línea de
www.elosopanda.com | jamespoetrodriguez.com
Los investigadores opinan 169
investigación iniciada. Lo anterior no sólo facilita el trabajo de DRA. ZULEYMA SANTALLA PEÑALOSA
seleccionar correctamente un problema —lo cual es una de las Profesor agregado de Metodología de la investigación, Psicología
actividades más difíciles e importantes—; también permite que
la construcción del conocimiento, en determinada área, avance experimental y Psicología general II
de manera sólida. Facultad de Humanidades y Educación/
Escuela de Psicología
Universidad Católica Andres Bello
Caracas, Venezuela
Dada la crisis económica de los países latinoamericanos, es nece- sus propios países, regiones o ciudades, y que lo hagan de mane-
sario orientar a los estudiantes hacia la investigación que ayude ra creativa y sin ninguna restricción.
a resolver problemas como la pobreza y el hambre, así como
hacia la generación de conocimiento con la finalidad de ser me- MIGUEL BENITES GUTIÉRREZ
nos dependientes de los países desarrollados. Profesor
Existen investigadores capaces; lo que hace falta es ligar más los Facultad de Ingeniería
proyectos con nuestra realidad social, cultural, económica y técnica. Escuela Industrial
De acuerdo con lo anterior, se requiere que los estudiantes Universidad Nacional de Trujillo
que inician un proyecto de investigación aborden problemas de Trujillo, Perú
www.elosopanda.com | jamespoetrodriguez.com
170 Capítulo 8 Selección de la muestra
capítulo Selección de la muestra
8
Toda investigación debe ser transparente, así como estar sujeta a
crítica y réplica, y este ejercicio solamente es posible si el investiga-
dor delimita con claridad la población estudiada y hace explícito el
proceso de selección de su muestra.
Roberto Hernández-Sampieri
Proceso de investigación Paso 7 Seleccionar una muestra apropiada
cuantitativa para la investigación
• Definir los casos (participantes u otros seres vivos, objetos,
fenómenos, procesos, sucesos o comunidades) sobre los
cuales se habrán de recolectar los datos.
• Delimitar la población.
• Elegir el método de selección de la muestra: probabilístico o
no probabilístico.
• Precisar el tamaño de la muestra requerido.
• Aplicar el procedimiento de selección.
• Obtener la muestra.
Objetivos de aprendizaje
Al terminar este capítulo, el alumno será capaz de:
1. Definir los conceptos de muestra, población o universo y procedimiento de selección de
la muestra.
2. Identificar los diferentes tipos de muestras en la investigación cuantitativa, sus procedimientos
de selección y características, las situaciones en que es conveniente utilizar cada uno y sus
aplicaciones.
3. Determinar el tamaño adecuado de la muestra en distintas situaciones de investigación.
4. Obtener muestras representativas de la población estudiada cuando hay interés por
generalizar los resultados de una investigación a un universo más amplio.
Síntesis
En el capítulo se analizan los conceptos de muestra, población o universo, tamaño de la mues-
tra, representatividad de la muestra y procedimiento de selección. También se presenta una
tipología de muestras: probabilísticas y no probabilísticas. Se explica cómo definir las unidades
de muestreo (participantes, otros seres, objetos, procesos, colectividades o sucesos), de las
cuales se habrán de recolectar los datos.
Asimismo, se explica cómo determinar el tamaño adecuado de una muestra cuando pre-
tendemos generalizar los resultados a una población y cómo proceder para obtener la mues-
tra, dependiendo del tipo de selección elegido.
www.elosopanda.com | jamespoetrodriguez.com
¿Qué etapas comprende el desarrollo de la perspectiva teórica? 171
Muestra Clases Probabilística Requiere precisar el Listado o marco
tamaño de la muestra muestral
(es un subgrupo de la No probabilística
población o universo) o dirigida Seleccionar unidades o Procedimientos
elementos muestrales por
• Se utiliza por medio de: • Tómbolas
economía de • Tablas de números
tiempo y recursos Sus tipos son:
• Muestra aleatoria simple aleatorios
• Implica definir la • Muestra estratificada • STATS®
unidad de muestreo • Muestra por racimos • Selección sistemática
y de análisis
o clusters
• Requiere delimitar
la población para • Selecciona casos o
generalizar unidades por uno o
resultados y varios propósitos
establecer
parámetros • No pretende que los
casos sean
estadísticamente
representativos de la
población
Nota: Los procedimientos para calcular el tamaño de muestra mediante fórmulas, así como la selección de los casos de la muestra a través
de tablas de números aleatorios o random, se han excluido de este capítulo, debido a que el programa STATS® realiza tal cálculo y elección
de manera mucho más sencilla y rápida. Sin embargo, el lector que prefiera los cálculos manuales y el uso de una tabla de números aleato-
rios, podrá encontrar esta parte en el centro de recursos en línea en: Material complementario S Documentos S Documento 1 “Cálculo de
muestra”. Las tablas de números también están en el apéndice 5 de ese sitio web.
www.elosopanda.com | jamespoetrodriguez.com
172 Capítulo 8 Selección de la muestra
¿En una investigación siempre tenemos una muestra?
No siempre, pero en la mayoría de las situaciones sí realizamos el estudio en una muestra. Sólo cuan-
do queremos efectuar un censo debemos incluir todos los casos (personas, animales, plantas, objetos)
del universo o la población. Por ejemplo, los estudios motivacionales en empresas suelen abarcar a
todos sus empleados para evitar que los excluidos piensen que su opinión no se toma en cuenta. Las
muestras se utilizan por economía de tiempo y recursos.
Lo primero: ¿sobre qué o quiénes se recolectarán datos?
Aquí el interés se centra en “qué o quiénes”, es decir, en los participantes, objetos,
Unidades de muestreo Se les sucesos o colectividades de estudio (las unidades de muestreo), lo cual depende del
denomina también casos o elementos. planteamiento y los alcances de la investigación.1 Así, en la situación en que el objeti-
vo sea describir el uso que hacen los niños de la televisión, lo más factible sería inte-
rrogar a un grupo de niños. También serviría entrevistar a los padres de los niños. Escoger entre los
niños o sus padres, o ambos, dependería no sólo del objetivo de la investigación, sino del diseño de
ésta. En el caso de la investigación que hemos ejemplificado a lo largo del libro, en la que el propósi-
to básico del estudio es describir la relación entre los niños y la televisión, se podría determinar que
los participantes seleccionados para el estudio fueran niños que respondieran sobre sus conductas y
percepciones relacionadas con este medio de comunicación.
En otro estudio de Greenberg, Ericson y Vlahos (1972), el objetivo de análisis era investigar las
discrepancias o semejanzas en las opiniones de madres e hijos con respecto a la costumbre de mirar la
televisión de estos últimos. La finalidad del estudio supuso la selección de mamás y niños, para entre-
vistarlos por separado, correlacionando posteriormente la respuesta de cada par de madre e hijo.
Lo anterior quizá parezca obvio, pues los objetivos de los dos ejemplos mencionados son claros.
Sin embargo, en la práctica no es tan simple para muchos estudiantes, que en propuestas de investi-
gación y de tesis no logran una coherencia entre los objetivos de la investigación y la unidad de mues-
treo/análisis. Algunos errores comunes se encuentran en la tabla 8.1.
Tabla 8.1 Quiénes van a ser medidos: errores y soluciones
Pregunta de investigación Unidad de análisis errónea Unidad de análisis correcta
¿Discriminan a las mujeres en Mujeres que aparecen en los anuncios de Mujeres y hombres que aparecen en
los anuncios de la televisión? televisión. los anuncios de televisión, para
comparar si ambos son presentados
Error: no hay grupo de comparación. con la misma frecuencia e igualdad de
papeles desempeñados y atributos.
¿Están los obreros del área Computar el número de conflictos Muestra de obreros que trabajan en el
metropolitana de la ciudad de sindicales registrados en la Junta Local de área metropolitana de Guadalajara,
Guadalajara satisfechos con su Conciliación y Arbitraje del Ministerio del cada uno de los cuales contestará a
trabajo? Trabajo durante los últimos cinco años. las preguntas de un cuestionario
sobre satisfacción laboral.
Error: la pregunta propone indagar sobre
actitudes individuales y esta unidad de (continúa)
muestreo/análisis denota datos agregados
en una estadística laboral y macrosocial.
1 La unidad de muestreo es el tipo de caso que se escoge para estudiar. Normalmente es la misma que la unidad de análisis, pero en ocasiones
es distinta (Thompson, 2012; Lepkowski, 2008a; y Selltiz et al., 1980). Por ejemplo, si pretendo investigar las razones por las que ciertos ase-
sinos seriales jóvenes (de 18 a 22 años) fueron capaces de privar de la vida a otros seres humanos. La unidad de muestreo (el caso) sería el
asesino (lo que selecciono), pero la unidad de análisis podría ser el asesinato (pudiera haber asesinos que hubieran matado a más de una
persona y cada crimen se analizaría en lo particular). O bien, si un investigador pretende evaluar el grado de violencia presente en las series
televisivas que se transmiten de 21 a 23 horas en determinada ciudad y durante cierto tiempo, la unidad de muestreo podría ser el capítulo y
la unidad de análisis el segmento de un minuto, tres minutos o lo que considere apropiado. La diferencia es sutil, pero varios lectores han soli-
citado esta aclaración. En este capítulo me refiero a la unidad de muestreo/análisis, aunque debe tomarse en cuenta la distinción entre ambas.
www.elosopanda.com | jamespoetrodriguez.com
Lo primero: ¿sobre qué o quiénes se recolectarán datos? 173
Tabla 8.1 (continuación) Unidad de análisis errónea Unidad de análisis correcta
Pregunta de investigación
¿En qué medida contribuye la Pacientes de enfisema pulmonar en estado Pacientes de enfisema pulmonar y los
satisfacción de la comunicación terminal. médicos responsables de su tratamiento.
que tienen los pacientes de Error: la comunicación es un proceso entre
enfisema pulmonar con sus dos actores: médicos y pacientes. Personas físicas (contribuyentes que no
médicos en el apego al son empresas de todo tipo: profesiona-
tratamiento? Contadores públicos y contralores de las les independientes, trabajadores,
empresas del Departamento de Medellín. empleados, comerciantes, asesores,
¿Qué tan arraigada se Error: ¿y el resto de los contribuyentes? consultores) y representantes de
encuentra la cultura fiscal de empresas (contribuyentes morales).
los contribuyentes de Medellín?
Modelos curriculares de las escuelas del
¿En qué grado se aplica el Alumnos de las escuelas del distrito escolar. distrito escolar (análisis de la
modelo por competencias en las documentación disponible), directores y
escuelas de un distrito escolar? Error: se obtendría una respuesta maestros de las escuelas (entrevistas), y
incompleta a la pregunta de investigación y eventos de enseñanza-aprendizaje
puede ser que algunos alumnos ni siquiera (observación de clases y tareas en cada
sepan bien lo que es el modelo por escuela).
competencias de la educación.
Por tanto, para seleccionar una muestra, lo primero que hay que hacer es definir la unidad de 1
muestreo/análisis (si se trata de individuos, organizaciones, periodos, comunidades, situaciones, pie-
zas producidas, eventos, etc.). Una vez definida la unidad de muestreo/análisis se delimita la pobla-
ción.
Para el proceso cuantitativo, la muestra es un subgrupo de la población de interés Muestra Subgrupo del universo o
sobre el cual se recolectarán datos, y que tiene que definirse y delimitarse de antemano población del cual se recolectan los
con precisión, además de que debe ser representativo de la población. El investigador datos y que debe ser representativo
pretende que los resultados encontrados en la muestra se generalicen o extrapolen a la de ésta.
población (en el sentido de la validez externa que se comentó al hablar de experimen-
tos). El interés es que la muestra sea estadísticamente representativa. La esencia del
muestreo cuantitativo podría esquematizarse como se presenta en la figura 8.1.
Figura 8.1 Esencia del muestreo cuantitativo.
Objetivo central:
Seleccionar casos representativos para la generalización
Generalizar:
• Características
• Hipótesis
Con la finalidad de construir y/o probar teorías que expliquen
a la población o fenómeno
Mediante una técnica adecuada
www.elosopanda.com | jamespoetrodriguez.com
174 Capítulo 8 Selección de la muestra
¿Cómo se delimita una población?
Una vez que se ha definido cuál será la unidad de muestreo/análisis, se procede a deli-
mitar la población que va a ser estudiada y sobre la cual se pretende generalizar los
Población o universo Conjunto de resultados. Así, una población es el conjunto de todos los casos que concuerdan con
todos los casos que concuerdan con una serie de especificaciones (Lepkowski, 2008b).
determinadas especificaciones. Una deficiencia que se presenta en algunos trabajos de investigación es que no
describen lo suficiente las características de la población o consideran que la muestra
la representa de manera automática. Suele ocurrir que algunos estudios que sólo se basan en muestras
de estudiantes universitarios (porque es fácil aplicar en ellos el instrumento de medición, pues están
a la mano) hagan generalizaciones temerarias sobre jóvenes que tal vez posean otras características
sociales. Es preferible, entonces, establecer con claridad las características de la población, con la fina-
lidad de delimitar cuáles serán los parámetros muestrales.
Lo anterior puede ilustrarse con el ejemplo de la investigación sobre el uso de la televisión entre
los niños. Está claro que en dicha investigación la unidad de muestreo/análisis son los niños. Pero, ¿de
qué población se trata? ¿De todos los niños del mundo? ¿De todos los niños de la República Mexicana?
Sería muy ambicioso y prácticamente imposible referirnos a poblaciones tan grandes. Así, en nuestro
ejemplo, la población se delimitaría con base en la figura 8.2.
Figura 8.2 Ejemplo de delimitación de la muestra.
Límites de población
Todos los niños del área
metropolitana de la Ciudad de
México, que cursen 4º, 5º y 6º de
primaria en escuelas privadas y
públicas del turno matutino.
Esta definición elimina, por tanto, a niños mexicanos que no vivan en la zona metropolitana de
la Ciudad de México, a los que no van a la escuela, a los que asisten a clases por la tarde (turno ves-
pertino) y a los más pequeños. Por otra parte, permite hacer una investigación costeable, con cuestio-
narios que serán respondidos por niños que ya saben escribir y con un control sobre la inclusión de
niños de todas las zonas de la metrópoli, al utilizar la ubicación de las escuelas como puntos de refe-
rencia y de selección. En éste y otros casos, la delimitación de las características de la población no
sólo depende de los objetivos de la investigación, sino de otras razones prácticas. Un estudio no será
mejor por tener una población más grande; la calidad de un trabajo investigativo estriba en delimitar
claramente la población con base en el planteamiento del problema.
Las poblaciones deben situarse claramente por sus características de contenido, lugar y tiempo.
Por ejemplo, si decidiéramos efectuar un estudio sobre los directivos de empresas manufactureras en
México, con base en ciertas consideraciones teóricas que describen el comportamiento gerencial de
los individuos y la relación de éste con otras variables de tipo organizacional, podríamos proceder a
definir la población de la siguiente manera:
Nuestra población comprende a todos aquellos directores generales de empresas de manufactura ubi-
cadas en México, que en 2014 tienen un capital social superior a 15 millones de pesos, con ventas
mayores a los 40 millones de pesos y con más de 250 personas empleadas (Mendoza, Hernández-Sampie-
ri y Méndez, 2015).
En este ejemplo se delimita la población al excluir a quienes no son directores generales y a las
empresas que no pertenezcan a la industria manufacturera. Se establece también, con base en criterios
de capital y de recursos humanos, que se trata de empresas grandes. Por último, se indica que estos
criterios operan en 2014, en México.
www.elosopanda.com | jamespoetrodriguez.com
¿Cómo seleccionar la muestra? 175
Al seleccionar la muestra debemos evitar tres errores que pueden presentarse: 1) desestimar o no
elegir casos que deberían ser parte de la muestra (participantes que deberían estar y no fueron selec-
cionados), 2) incluir casos que no deberían estar porque no forman parte de la población y 3) selec-
cionar casos que son verdaderamente inelegibles (Mertens, 2010); por ejemplo, en una encuesta o
sondeo sobre preferencias electorales entrevistar a individuos que son menores de edad y no pueden
votar legalmente (no deben ser agregados a la muestra, pero sus respuestas se incluyeron, lo que es un
error). Asimismo, imaginemos que realizamos una investigación para determinar el perfil de los clien-
tes de una tienda departamental y generamos una serie de estadísticas sobre ellos en una muestra
obtenida de la base de datos. Podría ocurrir que la base de datos no estuviera actualizada y varias
personas ya no fueran clientes de la tienda y, sin embargo, se eligieran para el estudio (por ejemplo,
que algunas se hayan mudado a otra ciudad, otras hayan fallecido, unas más ya no utilizan su mem-
bresía y hasta hubiera personas que se hayan hecho clientes de la competencia).
El primer paso para evitar tales errores es una adecuada delimitación del universo o población.
Los criterios que cada investigador cumpla dependen de sus objetivos de estudio, y es importante
establecerlos de manera muy específica.
¿Cómo seleccionar la muestra?
Hasta este momento hemos visto que se debe definir cuál será la unidad de muestreo/análisis y cuáles
son las características de la población. En este inciso comentaremos sobre la muestra, o mejor dicho,
los tipos de muestra, con la finalidad de poder elegir la más conveniente para un estudio.
La muestra es, en esencia, un subgrupo de la población. Digamos que es un subconjunto de ele-
mentos que pertenecen a ese conjunto definido en sus características al que llamamos población. Esto
se representa en la figura 8.3. Con frecuencia leemos y escuchamos hablar de muestra representativa,
muestra al azar, muestra aleatoria, como si con los simples términos se pudiera dar más seriedad a los
resultados. En realidad, pocas veces es posible medir a toda la población, por lo que obtenemos o selec-
cionamos una muestra y, desde luego, se pretende que este subconjunto sea un reflejo fiel del conjunto
de la población. Todas las muestras (en el enfoque cuantitativo) deben ser representativas; por tanto, el
uso de los términos al azar y aleatorio sólo denota un tipo de procedimiento mecánico relacionado con
la probabilidad y con la selección de elementos o unidades, pero no aclara el tipo de muestra ni el
procedimiento de muestreo. Hablemos entonces de estos conceptos en los siguientes apartados.
Figura 8.3 Representación de una muestra como subgrupo.
Población
Elementos o unidades
de muestreo/análisis
Muestra
Tipos de muestra 2
Básicamente, categorizamos las muestras en dos grandes ramas: las muestras no proba- Muestra probabilística Subgrupo de
bilísticas y las muestras probabilísticas. En las muestras probabilísticas, todos los ele- la población en el que todos los
mentos de la población tienen la misma posibilidad de ser escogidos para la muestra y elementos tienen la misma
se obtienen definiendo las características de la población y el tamaño de la muestra, y posibilidad de ser elegidos.
por medio de una selección aleatoria o mecánica de las unidades de muestreo/análisis.
www.elosopanda.com | jamespoetrodriguez.com
176 Capítulo 8 Selección de la muestra
Imagínese el procedimiento para obtener el número premiado en un sorteo de lotería. Este número
se va formando en el momento del sorteo. En las loterías tradicionales, a partir de las esferas con un
dígito que se extraen (después de revolverlas mecánicamente) hasta formar el número, de manera que
todos los números tienen la misma probabilidad de ser elegidos.
Muestra no probabilística o dirigida En las muestras no probabilísticas, la elección de los elementos no depende de
Subgrupo de la población en la que la la probabilidad, sino de causas relacionadas con las características de la investigación
elección de los elementos no depende o los propósitos del investigador (Johnson, 2014, Hernández-Sampieri et al., 2013 y
de la probabilidad, sino de las Battaglia, 2008b). Aquí el procedimiento no es mecánico ni se basa en fórmulas de
características de la investigación.
probabilidad, sino que depende del proceso de toma de decisiones de un investigador
o de un grupo de investigadores y, desde luego, las muestras seleccionadas obedecen a
otros criterios de investigación. Elegir entre una muestra probabilística o una no probabilística depende
del planteamiento del estudio, del diseño de investigación y de la contribución que se piensa hacer con
ella. Para ilustrar lo anterior mencionaremos tres ejemplos que toman en cuenta dichas consideraciones.
Ejemplo
En un primer ejemplo tenemos una investigación sobre el suicidio en prisiones de Estados Unidos (Suto y Arn-
aut, 2010). Dado que el suicidio es una causa frecuente de muerte en las cárceles estadounidenses y que la
mayoría de los trabajos previos se centraban en cuestiones demográficas y más bien superficiales, los investi-
gadores diseñaron un estudio con el objetivo de explorar los motivos por los cuales los reclusos intentan suici-
darse. Para cumplir dicho propósito se seleccionó una muestra no probabilística de prisioneros que accedieran
voluntariamente a participar. De esta manera, se realizaron entrevistas exhaustivas a 24 individuos de seis
cárceles de Ohio, quienes se expresaron con franqueza sobre sus experiencias.
Comentario: en este caso es adecuada una muestra no probabilística, pues se trata de un estudio explo-
ratorio y un enfoque fundamentalmente cualitativo; es decir, no resulta concluyente, sino que su finalidad es
documentar ciertas experiencias. Este tipo de estudios pretende generar datos e hipótesis que constituyan la
materia prima para investigaciones más precisas. Asimismo, es complicado tener acceso a las prisiones y a los
participantes.2
Ejemplo
Como segundo caso mencionaremos una investigación para saber cuántos niños han sido vacunados contra
ciertas enfermedades y cuántos no en un país, y las variables asociadas (nivel socioeconómico, lugar donde
viven, educación, etc.) y sus motivaciones. Se conforma una muestra probabilística nacional de —digamos por
ahora— 1 600 lactantes, y de los datos obtenidos se toman decisiones para formular estrategias de vacunación,
así como mensajes dirigidos a persuadir a la población para que vacunen oportunamente a los niños.
Comentario: este tipo de estudio, en el que se hace una asociación entre variables y cuyos resultados
servirán de base para tomar decisiones políticas que afectarán a una población, se logra mediante una inves-
tigación por encuestas y, definitivamente, por medio de una muestra probabilística, diseñada de tal manera
que los datos lleguen a ser generalizados a la población con una estimación precisa del error que pudiera come-
terse al realizar tales generalizaciones.
Ejemplo
Se diseñó un experimento para determinar si los contenidos violentos de la televisión generan conductas
antisociales en los niños. Para lograr tal objetivo, se seleccionan en un colegio 60 niños de cinco años de edad,
de igual nivel socioeconómico e intelectual, y se asignan aleatoriamente a dos grupos o condiciones. Así, 30
niños verían caricaturas sin violencia y otros 30, caricaturas muy violentas. Inmediatamente después de la
exposición, los niños serían observados en grupos y se medirían sus conductas violentas y no violentas.
2 En el capítulo 13 profundizaremos en las muestras cualitativas.
www.elosopanda.com | jamespoetrodriguez.com
¿Cómo se selecciona una muestra probabilística? 177
Comentario: ésta es una muestra no probabilística. Aunque se asignen los niños de manera aleatoria a las
dos condiciones experimentales, para generalizar a la población se necesitarían experimentos repetidos. Un
estudio así es valioso en cuanto a que el nivel causa-efecto es más preciso al aislar otras variables; sin embar-
go, no es posible generalizar los datos a todos los niños, pues sólo se aporta información sobre individuos con
las mencionadas características. Se trata de una muestra dirigida y “clásica” de un estudio de este tipo. La
selección de la muestra no es al azar, aunque la asignación de los niños a los grupos sí lo es.
¿Cómo se selecciona una muestra probabilística?
Resumiremos diciendo que la elección entre la muestra probabilística y la no probabilística se hace
según el planteamiento del problema, las hipótesis, el diseño de investigación y el alcance de sus con-
tribuciones. Las muestras probabilísticas tienen muchas ventajas; quizá la principal sea que puede
medirse el tamaño del error en nuestras predicciones. Se ha dicho incluso que el principal objetivo del
diseño de una muestra probabilística es reducir al mínimo este error, al que se le llama error estándar
(Johnson, 2014; Brown, 2006; Kalton y Heeringa, 2003; y Kish, 1995).
Las muestras probabilísticas son esenciales en los diseños de investigación transeccionales, tanto
descriptivos como correlacionales-causales (las encuestas de opinión o sondeos, por ejemplo), donde
se pretende hacer estimaciones de variables en la población. Estas variables se miden y se analizan con
pruebas estadísticas en una muestra, de la que se presupone que ésta es probabilística y que todos los
elementos de la población tienen una misma probabilidad de ser elegidos. Las unidades o elementos
muestrales tendrán valores muy parecidos a los de la población, de manera que las mediciones en el
subconjunto nos darán estimados precisos del conjunto mayor. La precisión de dichos estimados
depende del error en el muestreo, que es posible calcular. Esto se representa en la figura 8.4.
Figura 8.4 Esquema de la generalización de la muestra a la población.
Población
Muestra La generalización de las
características o valores de la
muestra depende del error de
muestreo
Hay otros errores que dependen de la medición, pero serán tratados en el siguiente capítulo. ®
Para hacer una muestra probabilística son necesarios dos procedimientos:
1. Calcular un tamaño de muestra que sea representativo de la población.
2. Seleccionar los elementos muestrales (casos) de manera que al inicio todos tengan la misma posi-
bilidad de ser elegidos.
Para lo primero, se recomienda utilizar el programa STATS® que puede descargar de la página
web de este libro (en Software o Programas, con el subprograma Tamaño de la muestra [Sample Size
Determination]). También se puede calcular el tamaño de muestra mediante las fórmulas clásicas que
se han desarrollado, pero es más tardado y el resultado es el mismo o muy similar al que proporciona
dicho programa.3 Quien así lo desee, puede revisar este procedimiento manual en el centro de recur-
sos en: Material complementario S Documentos S Documento 1 “Cálculo de muestra”. Para lo
3 Algunos escépticos del programa STATS® han querido comparar los resultados que éste genera con los que se obtienen mediante las fórmu-
las, y han encontrado en múltiples cálculos resultados muy parecidos (normalmente con una diferencia de menos de un caso, por cuestiones
de redondeo).
www.elosopanda.com | jamespoetrodriguez.com
178 Capítulo 8 Selección de la muestra
segundo (seleccionar los elementos muestrales),
requerimos un marco de selección adecuado y un
procedimiento que permita la aleatoriedad en la
selección. Hablaremos de ambas cuestiones en los
siguientes apartados.
Cálculo del tamaño de muestra
3 Cuando se elabora una muestra probabilísti-
ca, uno debe preguntarse: dado que una población
es de N tamaño,4 ¿cuál es el menor número de uni-
dades muestrales (personas, casos, organizaciones,
capítulos de telenovelas, etc.) que necesito para con-
formar una muestra (n) que me asegure un determi-
nado nivel de error estándar, digamos menor de 0.01?
La respuesta consiste en encontrar una muestra
que sea representativa del universo o población con
cierta posibilidad de error (se pretende minimizar)
y nivel de confianza (maximizar), así como probabi-
lidad.
® Imaginemos que pretendemos rea-
lizar un estudio de la siguiente población: las empre-
sas de mi ciudad. Entonces, lo primero es conocer el
tamaño de la población (número de empresas en la
ciudad). Supongamos que hay 2 200. Al abrir el
subprograma Tamaño de la muestra (Sample Size
Determination) en STATS®,5 el programa va a pedir
los siguientes datos:
Universe size (tamaño del universo):
Maximum Acceptable Percentage Points of Error
(error máximo aceptable):
Estimated Percentage Level (porcentaje estima-
do de la muestra):
Desired Confidence Level (nivel deseado de con-
fianza):
El tamaño del universo o población ya dijimos
que es de 2 200. Debemos conocer este dato o uno
aproximado, sin olvidar que por encima de 99 999
casos da casi lo mismo cualquier tamaño del universo
(un millón, 200 mil, 54 millones, etc.), por lo que si
tecleamos un número mayor a 99 999 el programa
pondrá esta cifra de manera automática, pero si es
menor la respeta.
® También pide que definamos el error estándar máximo aceptable (maximum aceptable percentage
points of error) (probabilidad), el porcentaje estimado de la muestra (estimated percentage level) y el
nivel de confianza (desired confidence level) (términos que se explican en el capítulo 10, “Análisis de los
datos cuantitativos”, en el paso 5, sugerido para el análisis: “analizar mediante pruebas estadísticas las
hipótesis planteadas”). Por ahora diremos que el error máximo aceptable se refiere a un porcentaje de
4 En muestreo, cuando se utiliza una letra mayúscula se habla de la población y una letra minúscula, de la muestra (N = tamaño de población,
n = tamaño de muestra).
5 Obviamente primero debe instalar el programa en la computadora.
www.elosopanda.com | jamespoetrodriguez.com
¿Cómo se selecciona una muestra probabilística? 179
®
error potencial que admitimos como tolerancia de que nuestra muestra no sea representativa de la
población (de equivocarnos). Los niveles de error pueden ir de 20 a 1% en STATS®. Los más comu-
nes son 1 y 5% (uno implica tolerar muy poco error, 1 en 100, por así decirlo; mientras que 5% es
aceptar en 100 cinco posibilidades de equivocarnos).
Se explicará esto con un ejemplo cotidiano. Si fuera a apostar en las carreras de caballos y tuviera
95% de probabilidades de atinarle al ganador, contra sólo 5% de perder, ¿apostaría? Obviamente sí,
siempre y cuando le aseguraran ese 95% a favor. O bien, si le dieran 95 boletos de 100 para la rifa de
un automóvil, ¿sentiría confianza en que va a estrenar vehículo? Por supuesto que sí. No tendría la
certeza total; ésta no existe en el universo, al menos para los seres humanos.
Pues bien, algo similar hace el investigador al definir un posible nivel de error en la representati-
vidad estadística de su muestra. Los niveles de error más comunes que suelen fijarse en la investiga-
ción son de 5 y 1% (en ciencias sociales el más usual es el primero).
El porcentaje estimado de la muestra es la probabilidad de ocurrencia del fenómeno (representa-
tividad de la muestra o no representatividad, la cual se estima sobre marcos de muestreo previos o se
define. La certeza total siempre es igual a uno, las posibilidades a partir de esto son “p” de que sí ocu-
rra y “q” de que no ocurra (p + q = 1). Cuando no tenemos marcos de muestreo previos, usamos un
porcentaje estimado de 50% (que es la opción automática que brinda STATS®, es decir, asumimos
que “p” y “q” serán de 50% —igual probabilidad— o 0.50 —en términos de proporciones—, y que
resulta lo más común, particularmente cuando seleccionamos por vez primera una muestra en una
población).
Finalmente, el nivel deseado de confianza es el complemento del error máximo aceptable (por-
centaje de “acertar en la representatividad de la muestra”). Si el error elegido fue de 5%, el nivel
deseado de confianza será de 95%. Una vez más, los niveles más comunes son de 95 y 99%. En forma
automática, STATS® coloca el primero, pero podemos modificarlo.
Ya con todos los campos llenos, con sólo presionar el botón de Calcular, se obtiene el tamaño de
muestra representativo para el universo, en términos de probabilidad. En el ejemplo podría ser:
Tamaño del universo: 2 200
Error máximo aceptable: 5%
Porcentaje estimado de la muestra: 50%
Nivel deseado de confianza: 95%
El resultado que nos proporciona STATS® es:
Tamaño de la muestra: 327 (número de empresas que necesitamos para tener representadas a las
2 200 de la ciudad, con 95% de confianza y 5% de error máximo).6
6 Las versiones más actualizadas de STATS® redondean automáticamente, a diferencia de las anteriores. Si tuviera otra versión más antigua,
el resultado hubiera sido de 327.1776.
www.elosopanda.com | jamespoetrodriguez.com
180 Capítulo 8 Selección de la muestra
Ejemplo
Problema de investigación
Supongamos que el gobierno de un estado, provincia o departamento ha emitido una ley que impide (prohi-
bición expresa) a las estaciones de radio transmitir comerciales que utilicen un lenguaje procaz (groserías,
malas palabras). Dicho gobierno nos solicita analizar en qué medida los anuncios radiofónicos transmitidos en
el estado utilizan en su contenido este lenguaje, digamos, durante el último mes.
Población (N):
Comerciales transmitidos por las estaciones radiofónicas del estado durante el último mes.
Tamaño de muestra (n):
Lo primero es determinar o conocer N (recordemos que significa población o universo). En este caso
N = 20 000 (20 mil comerciales transmitidos). Lo segundo es establecer el error máximo aceptable, el porcen-
taje estimado de la muestra y el nivel de confianza.
Tecleamos los datos (Inputs) que STATS® nos pide:7
Tamaño de la población (Universe Size): 20 000
Error máximo aceptable (Maximum Acceptable Percentage Points of Error): 5%
Porcentaje estimado de la muestra (Estimated Percentage Level): 50%
Nivel de confianza deseado (Desired Confidence Level): 95%
El programa calcula automáticamente el tamaño de muestra necesario o requerido (Results. The Sample
Size should be…): n = 377, que es el número de comerciales radiofónicos que necesitamos para representar al
universo de 20 000, con un error de 0.05 (5%) y un nivel de confianza de 95%.
Si cambiamos el nivel de error tolerado y el nivel de confianza (1% de error y 99% de confianza, el tama-
ño de la muestra será mucho mayor, en este caso de 9 083 comerciales).
Como puede apreciarse, el tamaño de la muestra es sensible al error y nivel de confianza que definamos.
A menor error y mayor nivel de confianza, mayor tamaño de muestra requerido para representar a la población
o universo.
Ejemplo
Problema de investigación
Analizar la motivación intrínseca que tienen los empleados de la cadena de restaurantes “Lucy y Laura Bunny”.
Población:
N = 600 empleados (cocineros, meseros, ayudantes, etcétera).
Tamaño de muestra:
Con un error de 5% y un nivel de confianza de 95%, el tamaño requerido para que la muestra sea repre-
sentativa es de 234 empleados.
Conforme disminuye el tamaño de la población aumenta la proporción de casos que necesitamos en la
muestra.
Previamente se señaló que para obtener una muestra probabilística eran necesarios dos procedi-
mientos. El primero es el que acabamos de mencionar: calcular un tamaño de muestra que sea repre-
sentativo de la población. El segundo consiste en seleccionar los elementos muestrales de manera que
al inicio todos tengan la misma posibilidad de ser elegidos. Es decir, cómo y de dónde vamos a elegir
los casos. Esto se comentará más adelante.
® A los ejemplos de las muestras obtenidas por STATS® se les conoce como muestras aleatorias
simples (MAS). Su característica esencial, como dijimos, es que todos los casos del universo tienen al
inicio la misma probabilidad de ser seleccionados.
Muestra probabilística estratificada
En ocasiones, el interés del investigador es comparar sus resultados entre segmentos, grupos o nichos
de la población, porque así lo señala el planteamiento del problema. Por ejemplo, efectuar compara-
7 Se incluyen los términos en inglés por si la versión disponible se encuentra en este idioma.
www.elosopanda.com | jamespoetrodriguez.com
¿Cómo se selecciona una muestra probabilística? 181
ciones por género (entre hombres y mujeres), si la selección de la muestra es aleatoria, tendremos
unidades o elementos de ambos géneros, no hay problema, la muestra reflejará a la población.
Ahora bien, en ocasiones nos interesan grupos que constituyen minorías de la población o uni-
verso, y entonces, si la muestra es aleatoria simple, resultará muy difícil determinar qué elementos o
casos de tales grupos serán seleccionados. Imaginemos que nos interesan personas de todas las reli-
giones para contrastar ciertos datos, pero en la ciudad donde se efectuará el estudio la mayoría es
—por ejemplo— predominantemente católica. Con MAS es casi seguro que no elijamos individuos
de diversas religiones o sólo unos cuantos. No podríamos efectuar las comparaciones. Quizá tenga-
mos 300 católicos y cinco o seis de otras religiones. Entonces es cuando preferimos Muestra probabilística estratifica-
obtener una muestra probabilística estratificada (el nombre nos dice que será pro- da Muestreo en el que la población
babilística y que se considerarán segmentos o grupos de la población, o lo que es se divide en segmentos y se
igual: estratos). selecciona una muestra para cada
segmento.
Ejemplos de estratos en la variable religión serían: católicos, cristianos, protestan-
tes, judíos, mahometanos, budistas, etc. Y de la variable grado o nivel de estudios:
preescolar, primaria, secundaria, bachillerato, universidad (o equivalente) y posgrado.
Podemos tener estratos por diferentes tamaños de empresas, tipos de enfermedades,
altura de edificios, etcétera. ®
Los ejemplos anteriores del uso de STATS® corresponden a muestras probabilísticas simples.
Ahora supongamos que pretendemos realizar un estudio con directores de recursos humanos para
determinar su ideología y políticas de trato a los colaboradores de sus empresas. Imaginemos que
nuestro universo es de 1 176 organizaciones con directores de recursos humanos. Usando STATS®
determinamos que el tamaño de la muestra necesaria para representar a la población sería de n = 298
directivos. Pero supongamos que la situación se complica y que debemos estratificar este n con la
finalidad de que los elementos muestrales o las unidades posean determinado atributo. En nuestro
ejemplo, este atributo podría ser el giro de la empresa. Es decir, cuando no basta que cada uno de los
elementos muestrales tengan la misma probabilidad de ser escogidos, sino que además es necesario
segmentar la muestra en relación con estratos o categorías que se presentan en la población, y que
además son relevantes para los objetivos del estudio, se diseña una muestra probabilística estratificada.
Lo que aquí se hace es dividir a la población en subpoblaciones o estratos, y se selecciona una muestra
para cada estrato.
La estratificación aumenta la precisión de la muestra e implica el uso deliberado de diferentes
tamaños de muestra para cada estrato, a fin de lograr reducir la varianza de cada unidad de la media
muestral (Kalton y Heeringa, 2003). Kish (1995) y Kalsbeek (2008) afirman que, en un número
determinado de elementos muestrales n = ∑ nh, la varianza de la media muestral y puede reducirse al
mínimo, si el tamaño de la muestra para cada estrato es proporcional a la desviación estándar dentro
del estrato.
Esto es,
Σ f h = n = ksh
N
En donde la muestra n será igual a la suma de los elementos muestrales nh. Es decir, el tamaño
de n y la varianza de y pueden minimizarse, si calculamos “submuestras” proporcionales a la desvia-
ción estándar de cada estrato. Esto es:
f h = nh = ksh
Nh
En donde nh y Nh son muestra y población de cada estrato, y sh es la desviación estándar de cada
elemento en un determinado estrato. Entonces tenemos que:
ksh = nh
Nh
www.elosopanda.com | jamespoetrodriguez.com
182 Capítulo 8 Selección de la muestra
Siguiendo con nuestro ejemplo, la población es de 1 176 directores de recursos humanos y el
tamaño de muestra es n = 298. ¿Qué muestra necesitaremos para cada estrato?
ksh = nh = 298 = 0.2534
Nh 1 176
De manera que el total de la subpoblación se multiplicará por esta fracción constante para obte-
ner el tamaño de la muestra para el estrato. Al sustituirse, tenemos que:
(Nh) (fh) = nh (véase la tabla 8.2)
Tabla 8.2 Muestra probabilística estratificada de directores de recursos humanos
Estrato Directores de recursos humanos del giro Total población Muestra
por giro (fh) = 0.2534
Nh (fh) = nh
1 Extractivo y siderúrgico 53 13
2 Metal-mecánico 109 28
3 Alimentos, bebidas y tabaco 215 55
4 Papel y artes gráficas 87 22
5 Textil 98 25
6 Eléctrico y electrónico 110 28
7 Automotriz 81 20
8 Químico-farmacéutico 221 56
9 Otras empresas de transformación 151 38
10 Comerciales 51 13
N = 1 176 n = 298
Por ejemplo:
Nh = 53 directores de recursos humanos corresponden a la población total del giro extractivo y siderúrgico.
fh = 0.2534 es la fracción constante.
nh = 13 es el número redondeado de directores de RRHH del giro extractivo y siderúrgico que tendrá que entrevistarse.
Muestreo probabilístico por racimos
En algunos casos en que el investigador se ve limitado por recursos financieros, tiempo, distancias
geográficas y otros obstáculos, se recurre al muestreo por racimos o clusters. En este tipo de mues-
treo se reducen costos, tiempo y energía, al considerar que a veces las unidades de muestreo/análisis
se encuentran encapsuladas o encerradas en determinados lugares físicos o geográficos,
Racimos Son sinónimos de clusters o a los que se denomina racimos. En la tabla 8.3 se dan algunos ejemplos. En la prime-
conglomerados. ra columna se encuentran unidades de muestreo/análisis que frecuentemente vamos a
estudiar. En la segunda columna sugerimos posibles racimos donde se encuentran
dichos elementos.
Tabla 8.3 Ejemplo de racimos o clusters Posibles racimos
Unidad de muestreo/análisis Preparatorias
Industrias o fábricas
Adolescentes Mercados/supermercados/centros comerciales
Obreros Parques o zonas industriales
Amas de casa Colegios
Empresas
Niños
www.elosopanda.com | jamespoetrodriguez.com
¿Cómo se lleva a cabo el procedimiento de selección de la muestra? 183
Muestrear por racimos implica diferenciar entre la unidad de análisis y la unidad Muestra probabilística por raci-
muestral. La unidad de análisis indica quiénes van a ser medidos, es decir, los participan- mos Muestreo en el que las
tes o casos a quienes en última instancia vamos a aplicar el instrumento de medición. La unidades se encuentran encapsuladas
unidad muestral (en este tipo de muestra) se refiere al racimo por medio del cual se logra en determinados lugares físicos.
el acceso a la unidad de análisis. El muestreo por racimos supone una selección en dos
o más etapas, todas con procedimientos probabilísticos. En la primera, se seleccionan
los racimos siguiendo los pasos ya señalados de una muestra probabilística simple o estratificada. En las
fases subsecuentes, y dentro de estos racimos, se seleccionan los casos que van a medirse. Para ello se
hace una selección que asegure que todos los elementos del racimo tienen la misma probabilidad de ser
elegidos.
Por ejemplo, en una muestra nacional de ciudadanos de un país por clusters o racimos, podríamos
primero elegir al azar una muestra de estados, provincias o departamentos (primera etapa). Luego,
cada estado o provincia se convierte en un universo y se seleccionan al azar municipios (segunda eta-
pa); cada municipio se considera un universo o población y se eligen al azar comunidades o colonias
(tercera etapa); cada una de éstas se concibe como universo y de nuevo, al azar, se eligen manzanas o
cuadras (cuarta etapa). Por último, se escogen al azar viviendas u hogares e individuos (quinta etapa).
En ocasiones se combinan tipos de muestreo, por ejemplo: una muestra probabilística estratifica-
da y por racimos, pero siempre se utiliza una selección aleatoria que garantiza que al inicio del proce-
dimiento todos los elementos de la población tienen la misma probabilidad de ser elegidos para
integrar la muestra. En el centro de recursos en línea del libro: Material complementario S
Documentos S Documento 1 “Cálculo de muestra” se proporciona un ejemplo que comprende
varios de los procedimientos descritos hasta ahora y que ilustra la manera como frecuentemente se
hace una muestra probabilística estratificada.
¿Cómo se lleva a cabo el procedimiento
de selección de la muestra?
Cuando iniciamos nuestra exposición sobre la muestra probabilística, señalamos que los tipos de
muestra dependen de dos características: el tamaño de la muestra y el procedimiento de selección.
De lo primero ya hemos hablado. Ahora nos ocuparemos del procedimiento de selección. Se
determina el tamaño de la muestra n, pero ¿cómo seleccionar los elementos muestrales? (ya sean casos
o racimos). Las unidades de análisis o los elementos muestrales se eligen siempre aleatoriamente para
asegurarnos de que cada elemento tenga la misma probabilidad de ser elegido. Se utilizan básicamen-
te tres procedimientos de selección, de los cuales a continuación se comentan dos y el tercero se
expone en el centro de recursos en línea: Material complementario S Documentos S Documento
1 “Cálculo de muestra”.
Tómbola
Muy simple pero muy rápido, consiste en numerar todos los elementos muestrales de la población,
del uno al número N. Después se hacen fichas o papeles, uno por cada elemento, se revuelven en una
caja y se van sacando n número de fichas, según el tamaño de la muestra. Los números elegidos al azar
conformarán la muestra.
Cuando nuestro muestreo es estratificado, se sigue el procedimiento anterior, pero por cada estra-
to. Por ejemplo, en la tabla 8.2, tenemos que, de una población N = 53 empresas extractivas y side-
rúrgicas, se necesita una muestra n = 13 de directivos de recursos humanos de tales empresas. En una
lista se numeran cada una de estas organizaciones. En fichas aparte se sortean los 53 números, hasta
obtener los 13 necesarios (pueden ser las 13 primeras fichas que se extraigan). Los números obtenidos
se verifican con los nombres y las direcciones de nuestra lista, para precisar los directivos que partici-
parán en el estudio.
www.elosopanda.com | jamespoetrodriguez.com
184 Capítulo 8 Selección de la muestra
Números aleatorios (random numbers)
Éste es el procedimiento que se encuentra en el centro de recursos en línea: Documento 1 “Cálculo
de muestra”.
STATS®
® Una excelente alternativa para generar números aleatorios se encuentra en el programa STATS®, que
contiene un subprograma para ello (Random Number Generator) y evita el uso de la tabla de núme-
ros aleatorios. Es hasta ahora la mejor forma que hemos encontrado para hacerlo.
El programa pide que le indiquemos cuántos números aleatorios requerimos. Entonces, teclea-
mos el tamaño de muestra. Elegimos la opción: } “Establecer límite superior e inferior” y nos solici-
ta que establezcamos el límite inferior (que siempre será uno, el primer caso de la población, pues la
muestra se extrae de ésta) y el límite superior (el último número de la población, que es el tamaño de
la muestra). Tecleamos Calcular (Calculate) y genera automáticamente los números. Vemos contra
nuestro listado a quién o a qué corresponde cada número y éstos son los casos que pasarían a integrar
la muestra.
Veámoslo con un ejemplo. Imaginemos que una investigadora busca conocer en una escuela o
facultad de una universidad quiénes son el joven y la joven más populares. Entonces decide realizar
una encuesta, para lo cual debe obtener una muestra. Supongamos que la escuela tiene una población
de 1 000 alumnos. Si obtuviera una muestra aleatoria simple, su procedimiento sería el que se mues-
tra en la figura 8.5.
Figura 8.5 Ejemplo del procedimiento para elegir los casos de una muestra aleatoria simple usando STATS®.
Determina el tamaño de muestra: con Obtiene la base de datos de los alumnos de la escuela o elabora
STATS®, para una población de 1 000 casos, una con las listas de los grupos de los diferentes años.
se requiere una muestra de 278 estudiantes Numera la base de datos o el listado del 1 al 1 000.
(95% de confianza, 0.05 o 5% de error y
porcentaje estimado de la muestra o p = 0.5).
Tiene una muestra Sigue con el segundo y tercer Selecciona los 278 jóvenes
probabilística para su números que arrojó el programa: mediante la generación de números
estudio. 534-Laura Mejía aleatorios a través de STATS®.
15-Carlos Franco El primer número que nos arroja el
y así sucesivamente... programa es el 706, ve en su base
Elige a 278 estudiantes cuyos o listado quién es el alumno o la
números fueron proporcionados al alumna con ese número.
azar por STATS® Por ejemplo: Lucía Phillips.
Éste es el primer caso que entra a
la muestra.
Nota: Cada vez que le pedimos al
programa un conjunto de números
aleatorios, éste es diferente. Por
tanto, si usted lo hace, obtendrá
otra secuencia de números.
Con estratos o conglomerados repetimos el procedimiento para cada uno.
Selección sistemática de elementos muestrales
Este procedimiento de selección es muy útil e implica elegir dentro de una población N un número
n de elementos a partir de un intervalo K. Este último (K ) es un intervalo que se determina por el
tamaño de la población y el tamaño de la muestra. Así, tenemos que K = N/n, en donde K = un inter-
valo de selección sistemática, N = la población y n = la muestra.
www.elosopanda.com | jamespoetrodriguez.com
Listados y otros marcos muestrales 185
Ilustremos los conceptos anteriores con un ejemplo. Supongamos que se quiere hacer un estudio
que pretende medir la calidad de la atención en los servicios proporcionados por los médicos y las
enfermeras de un hospital. Para tal efecto consideremos que los investigadores consiguen grabaciones
de todos los servicios efectuados durante un periodo determinado.8 Supongamos que se hayan filma-
do 1 548 servicios (N ). Con este dato se procede a determinar qué número de servicios necesitamos
analizar para generalizar a toda la población nuestros resultados. Con STATS® determinamos que se
necesitan 308 servicios para evaluar (con un error máximo de 5%, nivel de confianza de 95% y un
porcentaje estimado de 50% para la muestra, p = 0.5).
Si necesitamos una muestra de n = 308 episodios de servicio filmados, se utiliza para la selección
el intervalo K, donde:
K = N = 1 548 = 5.0259, redondeado = 5
n 308
El intervalo 1/K = 5 indica que cada quinto servicio 1/K se seleccionará hasta completar n = 308.
Se puede recurrir a la selección sistemática de elementos muestrales 1/K para elegir los elementos
de n de cada estrato o de cada racimo. La regla de probabilidad, según la cual cada elemento de la
población debe tener idéntica posibilidad de ser elegido, se cumple al empezar la selección de 1/K al
azar (Daniel, 2012 y Buskirk, 2008). Siguiendo nuestro ejemplo, no comenzamos a elegir de los
1 548 episodios, el 1, 6, 11, 16…, sino que procuramos que el inicio sea determinado por el azar. Así,
en este caso, podemos tirar unos dados y si en sus caras muestran 1, 6, 9, iniciaremos en el servicio
169, y seguiremos 174, 179, 184, 189… 1/K… y volveremos a empezar por los primeros si es nece-
sario. Este procedimiento de selección es poco complicado y tiene varias ventajas: cualquier tipo de
estrato en una población X se verá reflejado en la muestra. Asimismo, la selección sistemática logra
una muestra proporcionada, ya que, por ejemplo, tenemos que el procedimiento de selección 1/K nos
dará una muestra con nombres que inician con las letras del abecedario, en forma proporcional a la
letra inicial de los nombres de la población (Lohr, 2010 y Lynn, 2003).
Listados y otros marcos muestrales
Las muestras probabilísticas requieren la determinación del tamaño de la muestra y de un proceso de
selección aleatoria que asegure que todos los elementos de la población tengan la misma probabilidad
de ser elegidos. Todo esto lo hemos visto, aunque falta exponer algo esencial que pre-
cede a la selección de una muestra: el marco muestral. Éste constituye un marco de Marco muestral Es un marco de
referencia que nos permite identificar físicamente los elementos de la población, la referencia que nos permite identificar
posibilidad de enumerarlos y, por ende, de proceder a la selección de las unidades físicamente los elementos de la
muestrales (los casos de la muestra) (Morgan, 2008 y Sudman, 1976). Normalmente población, así como la posibilidad de
se trata de un listado existente o una lista que es necesario confeccionar ad hoc, con los enumerarlos y seleccionar las
unidades muestrales.
casos de la población.
Los listados existentes de una población son variados: guías telefónicas, listas de
miembros de las asociaciones, directorios especializados, listas oficiales de escuelas de la zona, bases de
datos de los alumnos de una universidad o de los clientes de una empresa, registros médicos, catastros,
nóminas de una organización, padrones de exportadores, inventarios de productos y almacén, etc. En
todo caso hay que tener en cuenta lo completo de una lista, su exactitud, su veracidad, su fiabilidad y
su nivel de cobertura en relación con el problema que se investiga y la población que va a medirse, ya
que todos estos aspectos influyen en la selección de la muestra (Ryan, 2013 y Schroeder, 2008).
Por ejemplo, para algunas encuestas se considera que el directorio telefónico (o guía telefónica)
es muy útil. Sin embargo, hay que tomar en cuenta que muchos números no aparecen porque son
privados, además de que hay hogares que no tienen teléfono. La lista de socios de una agrupación
8 Se sabe que el número de servicios en un hospital es muy variable y depende de diversos factores, como el número de camas, de médicos
y paramédicos; el tipo y nivel de atención (desde consultas simples hasta cirugía compleja), la época, el número de habitantes en la zona
donde se encuentra ubicado o el número de derechohabientes, etc. El ejemplo trata de ser accesible para lectores de diversos campos.
www.elosopanda.com | jamespoetrodriguez.com
186 Capítulo 8 Selección de la muestra
como la Cámara Nacional de la Industria de la Transformación (México), la Confederación Española
de la Pequeña y Mediana Empresa, la Asociación Dominicana de Exportadores o la Cámara Nacional
de Comercio, Servicios y Turismo de Chile nos serviría si el propósito del estudio fuera, por ejemplo,
conocer la opinión de los asociados con respecto a una medida gubernamental. Pero si el objetivo de
la investigación es analizar la opinión del sector patronal o empresarial del país, el listado de una sola
asociación no sería adecuado por varias razones: hay otras sociedades empresariales,9 las asociaciones
son voluntarias y no toda empresa pertenece a ellas. En esta situación, lo correcto sería formar una
nueva base de datos, fundamentada en los listados existentes de las asociaciones patronales, eliminan-
do de dicha lista los casos duplicados, si una o más empresas pertenecieran a dos agrupaciones al
mismo tiempo.
Hay listas que proporcionan una gran ayuda al investigador. Por ejemplo: bases de datos locales
especializadas en las empresas, como Industridata en México; bases de datos internacionales de natu-
raleza empresarial como Kompass;10 directorios por calles o los programas y sistemas que tienen a
nivel regional o mundial tales directorios (como los sistemas de posicionamiento global o GPS); guías
de medios de comunicación (que enlistan casas productoras, estaciones de radio y televisión, periódi-
cos y revistas). Estos marcos de referencia reunidos por profesionales resultan convenientes para el
investigador, pues representan una compilación (de personas, empresas, instituciones, etc.), resultado
de horas de trabajo e inversión de recursos. También en internet descubriremos muchos directorios a
los cuales podemos acceder mediante un motor de búsqueda. Se recomienda, pues, utilizarlos cuando
sea pertinente, tomando en cuenta las consideraciones que estos directorios o bases de información
hacen en su introducción y que revelan el año a que pertenecen los datos, cómo se obtuvieron éstos
(exhaustivamente, por cuestionarios, por voluntarios) y muy importante, quiénes quedan excluidos
del directorio y por qué.
Con frecuencia es necesario preparar listas ad hoc a partir de las cuales se elegirán los elementos
que constituirán las unidades de muestreo/análisis de una investigación. Esto se ilustra mediante el
ejemplo de la televisión y los niños al final del capítulo, con una muestra probabilística estratificada
por racimos.
Desde luego, no siempre existen listas que permitan identificar a nuestra población. Entonces,
será necesario recurrir a otros marcos de referencia que contengan descripciones del material, las
organizaciones o los casos que serán seleccionados como unidades de análisis. Algunos de estos mar-
cos son los archivos (físicos, electrónicos, en la web, etc.) y los mapas. De estas instancias daremos
algunos ejemplos con más detalles y recomendaremos soluciones para algunos problemas comunes en
el muestreo.
Archivos
Un gerente de reclutamiento y selección de una empresa quiere precisar si ciertos datos que se presen-
tan en una solicitud de trabajo están correlacionados con el absentismo del empleado. Es decir, si a
partir de información como edad, género, estado civil, nivel educativo y duración en otros trabajos,
es factible predecir la conducta de absentismo. Para establecer correlaciones se considerará como
población a todas las personas contratadas durante los últimos 10 años. Se relacionan los datos en las
solicitudes de empleo con los registros de faltas.
Como no hay una lista elaborada de estos individuos, el investigador decide acudir a los archivos
de las solicitudes de empleo. Tales archivos constituyen su marco muestral a partir del cual se obten-
drá la muestra. Determina el tamaño de la población, obtiene el tamaño de la muestra y selecciona
sistemáticamente cada elemento 1/K (solicitud que será analizada). Obviamente, en el archivo habrá
solicitudes de gente que no fue contratada y, por tanto, no debe considerarse en el estudio.
9 En México, la Canacintra representa sólo al sector de la industria de la transformación, en España la Cepyme no agrupa a grandes consorcios
empresariales, en República Dominicana la Adoexpo no es la única asociación del Consejo Nacional de la Empresa Privada y en Chile la CNC
no incluye a la industria de la construcción y la minería, por ejemplo.
10 Estas bases permiten localizar y consultar información de empresas por giro, tamaño, localización geográfica, etcétera.
www.elosopanda.com | jamespoetrodriguez.com
Tamaño óptimo de una muestra 187
Mapas
Los mapas son muy útiles como marco de referencia en muestras de racimos. Por ejemplo, un investi-
gador quiere saber qué motiva a los compradores a preferir ciertas tiendas de autoservicio. A partir de
una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad, todas las tiendas
de autoservicio, las cuales constituyen una población de racimos, pues en cada tienda seleccionada
entrevistará a un número de clientes. El mapa le permite ver la población (tiendas de autoservicio) y su
localización geográfica, de manera que elige zonas donde coexistan diferentes tiendas competidoras,
para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas. En la actualidad
hay mapas de todo tipo: mercadológicos, socioculturales, étnicos, marítimos, entre otros. El Global
Positioning System (GPS) o sistema de posicionamiento global puede ser muy útil para esta clase de
muestreo.
Tamaño óptimo de una muestra
Tal como se mencionó, las muestras probabilísticas requieren dos procedimientos básicos: 1) la deter- 4
minación del tamaño de la muestra y 2) la selección aleatoria de los elementos muestrales. Para lo
primero, al lector le será muy útil comparar qué tamaño de muestra han empleado o sugieren diversos
metodólogos e investigadores. Por ello, se muestran algunos ejemplos y se reproducen varias tablas
(8.4 a 8.7), que indican los tamaños de muestra más utilizados o propuestos por diversos autores,
según sus poblaciones (nacionales o regionales) y los subgrupos que quieren estudiarse, así como de
acuerdo con los análisis que se lleven a cabo.
Las muestras nacionales, es decir, las que representan a la población de un país, por lo común son
de más de 1 000 sujetos. La muestra del estudio “¿Cómo somos los mexicanos?” (Hernández Medina,
Narro y Rodríguez, 1987), constó de 1 737 participantes repartidos de la siguiente manera:
Frontera y norte 696
Centro (sin la capital nacional
426
o Distrito Federal) 316
Sur-sureste 299
Distrito Federal
1 737
La muestra de los barómetros de opinión en España es nacional,11 incluye personas de ambos
géneros, de 18 años o más y su tamaño es alrededor de 2 500 casos (Centro de Investigaciones
Sociológicas, 2013). Su elección es por estratos y racimos. Primero, se eligen municipios, luego sec-
ciones y finalmente individuos. Por ejemplo, los puntos de muestreo en abril de 2013 fueron 236
municipios y 46 provincias (esto varía, pero el tamaño se ha mantenido en los últimos años).
Los estratos se forman por el cruce de las 17 comunidades autónomas con el tamaño de hábitat, divi-
dido en 7 categorías: a) menor o igual a 2 000 habitantes; b) de 2 001 a 10 000; c) de 10 001 a 50 000;
d ) de 50 001 a 100 000; e) de 100 001 a 400 000; f ) de 400 001 a 1 000 000 y g) más de un millón de
habitantes (Centro de Investigaciones Sociológicas, 2013, p. 1).
En cambio, el Barómetro del Real Instituto Elcano (BRIE) en España comprende a 1 200 indi-
viduos (Real Instituto Elcano, 2012).
El Eurobarómetro es otra encuesta que abarca diversos países de la Unión Europea (UE) y su
muestra es de aproximadamente 1 000 personas por país, excepto en Alemania donde se consulta al
doble y a Reino Unido, donde la n es igual a 1 300 (300 encuestas se efectúan en Irlanda) (Berganza
y García, 2005).12 Sus temas son diversos, desde salud hasta trabajo y percepciones sociales, etcétera.
11 Los barómetros son encuestas (surveys) de alcance nacional o continental e incluyen cuestiones políticas, económicas, sociales y de actua-
lidad.
12 Para validar lo actual de esta información, se consultaron diversos reportes del Eurobarómetro; los datos siguen vigentes al 2013 (véase
Comisión Europea 2010, 2012 y 2013).
www.elosopanda.com | jamespoetrodriguez.com
188 Capítulo 8 Selección de la muestra
En la tabla 8.4 observamos la importancia que tiene en el tamaño, la decisión de que sean mues-
tras nacionales o regionales en cualquier tipo de estudio.
Las muestras regionales (por ejemplo, las que representen al área metropolitana de la Ciudad de
México u otra gran urbe con más de tres millones de habitantes) o de algún estado, departamento o
provincia de un país o algún municipio o región, son más pequeñas, con rangos de 400 a 700 individuos.
Tabla 8.4 Muestras utilizadas con frecuencia en investigaciones nacionales y regionales según área de estudio13
Tipos de estudio Nacionales Regionales
Económicos 1000+ 100
Médicos 1000+ 500
Conductas 1000+ 700-300
Actitudes 1000+ 700-400
Experimentos de laboratorio – – – 100
El tamaño de una muestra depende también del número de subgrupos que nos interesan en una
población. Por ejemplo, podemos subdividirla en hombres y mujeres de cuatro grupos de edad o, aún
más, en hombres y mujeres de cuatro grupos de edad en cada uno de cinco niveles socioeconómicos.
En este caso estaríamos hablando de 40 subgrupos y, por ende, de una muestra mayor. En la tabla 8.5
se describen muestras típicas de acuerdo con los subgrupos del estudio, según su cobertura (estudios
nacionales o estudios especiales o regionales) y según su unidad de análisis; es decir, se trata de indi-
viduos o de organizaciones. En esta última instancia el número de la muestra se reduce, ya que casi
siempre representa una gran fracción de la población total.
Tabla 8.5 Muestras típicas de estudios sobre poblaciones humanas y organizaciones14
Número Población de individuos Población
de subgrupos u hogares de organizaciones
Ninguno (un único grupo) - pocos Nacionales Regionales Nacionales Regionales
(menos de 5)
Promedio (5 a 10) 1 000-1 500 200-500 200-500 50-200
Más de 10 1 500-2 500 500-1 000 500-1 000 200-500
2500 + 1 000 + 1 000 + 500 +
Otra tabla que nos ayuda a comprender el tema que estamos analizando es la 8.6, la cual se basa
en Mertens (2010) y Borg y Gall (1989), de acuerdo con el propósito del estudio. Aquí cada número
es el mínimo sugerido.
Tabla 8.6 Tamaños de muestra mínimos en estudios cuantitativos
Tipo de estudio Tamaño mínimo de muestra
Transeccional descriptivo o correlacional 30 casos por grupo o segmento del universo.
Encuesta a gran escala 100 casos para el grupo o segmento más importante del
universo y de 20 a 50 casos para grupos menos importantes.
Causal 15 casos por variable independiente.
Experimental o cuasiexperimental 15 por grupo.
13 Adaptada de Sudman (1976).
14 Adaptada de Sudman (1976) y Mertens (2010).
www.elosopanda.com | jamespoetrodriguez.com
¿Cómo y cuáles son las muestras no probabilísticas? 189
Hesse-Biber (2010a) y Onwuegbuzie y Collins (2007) recomiendan los siguientes tamaños míni-
mos de muestra, dependiendo del análisis estadístico inferencial que se pretende, los cuales se apre-
cian en la tabla 8.7.15
Tabla 8.7 Tamaños mínimos de muestra por tipo de análisis estadístico
Tipo de análisis Número de casos
Análisis de correlación 64 casos para hipótesis estadísticas/pruebas de una cola y 82
para dos colas.
Análisis causales o comparativos (diferencias 51 casos por grupo para hipótesis estadísticas/pruebas de una
significativas entre grupos) cola y 64 para dos colas.
Análisis comparativos en diseños experimentales 21 casos por grupo para hipótesis estadísticas/pruebas de una
cola. En pruebas de dos o más colas 27 por grupo.
Asimismo, debemos recordar que en el caso de los experimentos, la muestra representa el balance
entre un mayor número de casos y el número que podamos manejar. Recordemos que la mayoría de
las pruebas estadísticas exigen 15 casos como mínimo por grupo de comparación (Hernández-
Sampieri et al., 2013 y Mertens, 2010).
Además, resulta obvio que en ciertos fenómenos el tamaño de la muestra varía en función de qué
tan homogéneo o heterogéneo es el universo considerado. Por ejemplo, para tomar una muestra de
sangre en niños solamente se requiere entre 1 y 5% del volumen total de sangre del paciente (Howie,
2011), unos cuantos mililitros, dependiendo del tipo de análisis. Algo similar ocurre con materiales
pétreos y otras muestras.
Recordemos que lo óptimo de una muestra depende de cuánto se aproxima su distribución a la
distribución de las características de la población. Esta aproximación mejora al incrementarse el tama-
ño de la muestra. Cuando las muestras están constituidas por 100 o más elementos tienden a presen-
tar distribuciones normales y esto sirve para el propósito de hacer estadística inferencial
(generalizar de la muestra al universo). A lo anterior se le llama teorema central del Teorema central del límite Señala
límite (Kish, 1995), el cual se explica en el capítulo 11, “Análisis de los datos cuanti- que una muestra de más de cien
tativos”. Por ahora, lo que debe comprenderse es que el tamaño de muestra y que se casos será una muestra con una
trate de una muestra probabilística son cuestiones relacionadas con la posibilidad de distribución normal en sus caracterís-
poder efectuar pruebas de estadística inferencial. ticas, lo cual sirve para el propósito
de hacer estadística inferencial.
¿Cómo y cuáles son las muestras no probabilísticas?
Las muestras no probabilísticas, también llamadas muestras dirigidas, suponen un procedimiento
de selección orientado por las características de la investigación, más que por un criterio estadístico de
generalización. Se utilizan en diversas investigaciones cuantitativas y cualitativas. No las revisare-
mos ahora, sino en el capítulo 13, “Muestreo cualitativo”. Por el momento comentaremos que selec-
cionan individuos o casos “típicos” sin intentar que sean estadísticamente representativos de una
población determinada. Por ello, para fines deductivos-cuantitativos, cuando la generalización o
extrapolación de resultados hacia la población es una finalidad en sí misma, las muestras dirigidas
implican algunas desventajas. La primera es que, al no ser probabilísticas, no es posible calcular con
precisión el error estándar, es decir, no podemos determinar con qué nivel de confianza hacemos
una estimación. Esto es un inconveniente si consideramos que la estadística inferencial se basa en la
15 El criterio se fundamenta en un tamaño del efecto mediano, de acuerdo con el criterio de Cohen (1988), que ha sido aceptado por diversos
autores y que implica un tamaño mediano del efecto y una diferencia o correlación estadísticamente significativa con un poder de .80 al nivel
de significancia o significación del .05 (Collins, 2010, Hesse-Biber, 2010a y Onwuegbuzie y Collins, 2007). Esta tabla se comprenderá mejor
después de estudiar el capítulo 10, “Análisis de los datos cuantitativos”.
www.elosopanda.com | jamespoetrodriguez.com
190 Capítulo 8 Selección de la muestra
teoría de la probabilidad, por lo que las pruebas estadísticas en muestras no probabilísticas tienen un
valor limitado a la muestra en sí, mas no a la población. Es decir, los datos no pueden generalizarse a
ésta. En las muestras de este tipo, la elección de los casos no depende de que todos tengan la misma
posibilidad de ser elegidos, sino de la decisión de un investigador o grupo de personas que recolectan
los datos.
La ventaja de una muestra no probabilística —desde la visión cuantitativa— es su utilidad para
determinados diseños de estudio que requieren no tanto una “representatividad” de elementos de una
población, sino una cuidadosa y controlada elección de casos con ciertas características especificadas
previamente en el planteamiento del problema.
Para el enfoque cualitativo, al no interesar tanto la posibilidad de generalizar los resultados, las
muestras no probabilísticas o dirigidas son de gran valor, pues logran obtener los casos (personas,
objetos, contextos, situaciones) que interesan al investigador y que llegan a ofrecer una gran riqueza
para la recolección y el análisis de los datos.
Ejemplo
Un claro ejemplo de una muestra no probabilística es el estudio descriptivo de la revista Rolling Stone comen-
tado en el capítulo cinco, el cual se basó en dos encuestas para determinar los 500 mejores discos de la histo-
ria del rock en todas sus expresiones. La primera muestra fue de 271 músicos, productores, ejecutivos y
periodistas, y la segunda de 100. En ambas muestras la selección no obedeció a cuestiones de probabilidad,
sino que los jueces fueron elegidos por ser considerados expertos.16
En ocasiones se mezclan muestreo probabilístico y no probabilístico. Por ejemplo, en el estudio
de Lee y Guerin (2009) sobre el efecto de la satisfacción de la calidad del diseño ambiental del interior
del área de trabajo u oficina sobre la satisfacción general del espacio de trabajo y el desempeño laboral,
primero se eligieron de manera dirigida 15 edificios de Estados Unidos con certificado de Liderazgo
en Energía y Diseño Ambiental (LEED) (los investigadores pudieron consultar los certificados) y se
seleccionaron probabilísticamente 3 769 empleados.
Muestreo al azar por marcado telefónico (Random Digit Dialing)
Ésta es una técnica que los investigadores utilizan para seleccionar muestras telefónicas. Involucra
identificar áreas geográficas —para ser muestreadas al azar— y sus correspondientes códigos telefóni-
cos e intercambios (los primeros dígitos del número telefónico que las identifican). Luego, los demás
dígitos del número que se va a marcar pueden ser generados al azar de acuerdo con los casos que
requerimos para la muestra (n). Es posible reconocer qué intercambios son usados de forma primaria
para teléfonos residenciales y enfocar el muestreo en ese subgrupo (Kreuter, 2013). Asimismo, es muy
útil para incluir en muestras a teléfonos celulares o móviles y aparatos con GPS (Hernández-Sampieri
et al., 2013).
Para mayores referencias de esta técnica recomendamos a Link, Town y Mokdad (2007); Brick
(2008); y Ornstein (2013). En Williams, Van Dyke y O’Leary (2006) se encuentra un excelente
ejemplo para ver cómo se conforma una muestra mediante este método.
Una máxima del muestreo y el alcance del estudio
Ya sea que se trate de un tipo de muestreo u otro, lo importante es elegir a los casos adecuados, de
acuerdo con el planteamiento del problema y lograr el acceso a ellos.
Los estudios exploratorios regularmente emplean muestras dirigidas, aunque podrían usarse
muestras probabilísticas. La mayor parte de las veces, las investigaciones experimentales utilizan
16 Por cierto, entre los 500 mejores discos ubicados por las dos muestras de jueces se encuentran 10 de los Beatles, 10 de Bob Dylan, 10 de
los Rolling Stones, 8 de Bruce Springsteen y 7 de The Who (Rolling Stone, 2012). Para mi sorpresa y desacuerdo no apareció Yes.
www.elosopanda.com | jamespoetrodriguez.com
Conceptos básicos 191
muestras dirigidas, porque como se comentó, es difícil manejar grupos grandes o múltiples casos
(debido a ello se ha insistido que, en los experimentos, la validez externa se consolida mediante la
repetición o reproducción del estudio). Las investigaciones no experimentales descriptivas o correla-
cionales-causales deben emplear muestras probabilísticas si quieren que sus resultados sean generali-
zados a la población.
Asimismo, en ocasiones la muestra puede ser en varias etapas (polietápica). Por ejemplo, primero
elegir universidades, luego, escuelas o facultades, después, salones o grupos y finalmente, estudiantes.
Resumen sión de la muestra e implica el uso deliberado de submues-
tras para cada estrato o categoría que sea relevante en la
• En el capítulo se definió el concepto de muestra. población. Muestrear por racimos o conglomerados implica
• Se explicó cómo seleccionar una muestra en el proceso cuan- diferencias entre la unidad de análisis y la unidad muestral.
En este tipo de muestreo hay una selección en varias etapas,
titativo. Lo primero que se debe plantear es sobre qué o quié- todas con procedimientos probabilísticos. En la primera se se-
nes se van a recolectar los datos, lo cual corresponde a preci- leccionan los racimos y dentro de los racimos, a los casos que
sar la unidad de muestreo/análisis. Después, se procede a van a ser medidos.
delimitar claramente la población, con base en los objetivos • ® Los casos de una muestra probabilística siempre
del estudio y en cuanto a características de contenido, lugar y se eligen aleatoriamente para asegurarnos de que cada ele-
tiempo. mento tenga la misma posibilidad de ser seleccionado. Es
• La muestra es un subgrupo de la población y puede ser pro- posible utilizar cuatro procedimientos de selección: 1) tómbo-
babilística o no probabilística. la, 2) números aleatorios, 3) uso del subprograma de núme-
• Elegir qué tipo de muestra se requiere depende del enfoque ros aleatorios del STATS® y 4) selección sistemática. Todo pro-
y alcances de la investigación, los objetivos del estudio y el cedimiento de selección depende de listados o bases de
diseño. datos, ya sea existentes o construidas ad hoc. Los listados
• En el enfoque cuantitativo las muestras probabilísticas son pueden ser: la guía telefónica, listas de asociaciones, listas de
esenciales en diseños de investigación por encuestas, en los escuelas oficiales, etc. Cuando no existen listas de elementos
que se pretende generalizar los resultados a una población. de la población, se recurre a otros marcos de referencia que
La característica de este tipo de muestras es que todos los contengan descripciones del material, organizaciones o parti-
elementos de la población al inicio tienen la misma probabi- cipantes seleccionados como unidades de análisis. Algunos
lidad de ser elegidos. Así, los elementos muestrales tendrán de éstos pueden ser archivos, hemerotecas y mapas, así
valores muy aproximados a los valores de la población, ya como internet, incluyendo la tecnología GPS.
que las mediciones y análisis del subconjunto serán estima- • Las muestras no probabilísticas pueden también llamarse
ciones muy precisas del conjunto mayor. Tal precisión depen- muestras dirigidas, pues la elección de casos depende del
de del error de muestreo, llamado también error estándar. criterio del investigador.
• Para una muestra probabilística necesitamos dos acciones: • En el teorema del límite central se señala que una muestra de
determinar el tamaño adecuado de la muestra y seleccionar más de cien casos será una muestra con una distribución nor-
los elementos muestrales en forma aleatoria. mal en sus características.
• ® El tamaño de la muestra se calcula mediante fór-
mulas o por medio del programa STATS®.
• Las muestras probabilísticas son: simples, estratificadas, sis-
temáticas y por racimos. La estratificación aumenta la preci-
Conceptos básicos • Representatividad
• Selección aleatoria
• Base de datos • Selección sistemática
• Elementos muestrales • Sistema de Posicionamiento Global (GPS)
• Error estándar • Tamaño de muestra
• Muestra • Teorema central del límite o del límite central
• Muestra no probabilística o dirigida • Unidad de análisis
• Muestra probabilística • Unidad muestral
• Nivel deseado de confianza
• Población
www.elosopanda.com | jamespoetrodriguez.com
192 Capítulo 8 Selección de la muestra
Ejercicios
1. Se forman grupos de tres o cuatro personas. Cada grupo dis- Cliente Necesidad Tipo de
pone de 15 minutos para formular una pregunta de investiga- muestra
ción. El problema puede ser de cualquier área de estudio. Lo
que conviene aquí es que sea sobre un tema que realmente 4.2 Empresa en Definir cuáles son nuestros
inquiete a los estudiantes, algo que ellos consideren un fenó- el giro empleados y obreros, anteriores
meno importante. Las preguntas de investigación se van ano- químico y presentes, que tienen menos
tando en el pizarrón. Después y junto a cada una de estas absentismo, es decir, ¿hay un
preguntas se define quiénes van a ser medidos. Discutir por 4.3 Empresa de perfil del absentismo?
qué son correctas o no las respuestas de los estudiantes. cosmetología
¿Qué nociones tienen las jóvenes
2. Como secuencia del ejercicio anterior se proponen los siguien- 4.4 Grupo que (de 15 a 20 años) sobre su
tes temas de investigación. Supongamos que, en otro curso, defiende los arreglo personal y el cuidado de
estudiantes de un taller de investigación sugirieron los si- derechos del su cutis? ¿Funcionaría crear una
guientes temas para investigar. En cada caso, señalar quiénes consumidor línea de productos exclusiva-
van a ser medidos para lograr resultados en las investigacio- mente para ellas?
nes propuestas. 4.5 Partidos
políticos ¿Qué quejas tienen los niños
Tema 1. ¿Qué efecto tienen los anuncios de bebidas sobre los juguetes del mercado?
alcohólicas sobre los jóvenes? ¿Se rompen? ¿Son peligrosos?
¿Son aburridos? ¿Cuánto duran?,
Tema 2. Hace tres meses que se implantó en una fábrica de etcétera.
motores un programa de círculos de calidad. ¿Ha
tenido éxito dicho programa? ¿Por cuál candidato a goberna-
dor votarán los ciudadanos de
Tema 3. ¿Los niños que cursaron la primaria en escuelas determinado estado o provincia?
laicas y mixtas tienen o no un mejor desempeño
académico en la universidad que los que provienen 5. Supongamos que una asociación iberoamericana de profesio-
de escuelas religiosas de un solo género? nales cuenta con 5 000 miembros. La junta directiva ha deci-
dido hacer una encuesta (por teléfono o por correo electróni-
Tema 4. ¿Qué diferencias existen entre los comerciales de co) a los asociados para indagar, entre otras cosas, lugar de
champú de la televisión española, la argentina y la trabajo, puesto que ocupan, salario aproximado, licenciatura
venezolana? cursada, generación, estudios posteriores, oportunidades de
avance percibidas, etc. En resumen, se piensa publicar un per-
3. Seleccione dos estudios de alguna publicación fil profesional actualizado con el propósito de realimentar a
científica (véase en el centro de recursos en los asociados. Como sería muy costoso llegar a los 5000 miem-
bros repartidos en España, América Latina y Estados Unidos,
línea del libro Material complementario S Apéndices S ¿qué tamaño de muestra se necesita si queremos un error
Apéndice 1) o dos tesis. Analice los siguientes aspectos: a) estándar no mayor de 0.015?
¿cuál es el problema de investigación?, b) ¿cuál es la mues- Una vez definido el tamaño de la muestra, ¿cómo sería el
tra?, c) ¿cómo fue elegida? d ) ¿son adecuadas la muestra y proceso de selección a fin de que los resultados obtenidos con
el procedimiento de muestreo para el problema que se in- base en la muestra sean generalizables a toda la población?
vestigó?, e) ¿cuáles son los principales resultados o conclu- Es decir, se pretende trazar un perfil acertado de los 5000 so-
siones?, f ) ¿dichos resultados son generalizables a una po- cios de la asociación profesional.
blación mayor?, y g) con base en la muestra, ¿pueden
tomarse como serias dichas generalizaciones? Evalúe la soli- 6. Seleccione un tamaño de muestra adecuado para su institu-
dez de los cuatro estudios, tomando como criterios los as- ción, mediante el STATS®.
pectos a), b), c), d ), e), f ) y g).
4. Supongamos que trabaja en un despacho que realiza investi- 7. Con respecto al ejemplo de estudio que ha venido desarro-
gaciones y que diversos clientes le solicitan que los asesore llando en el proceso cuantitativo, piense cómo seleccionaría la
en estudios de diferente índole. ¿Qué tipo de muestra sugeri- muestra apropiada de acuerdo con su planteamiento, alcance,
ría para cada uno? Fundamente su sugerencia. hipótesis y diseño. ¿Cuál sería el universo o población, la uni-
dad de muestreo/análisis y el procedimiento de selección?
Cliente Necesidad Tipo de ¿Qué tamaño tendría la muestra?
muestra
Consulte las respuestas a los ejercicios en
4.1 Clínica de Pacientes con cáncer que siguen el centro de recursos en línea: Material com-
terapias la terapia reaccionan mejor a los plementario S Apéndices S Apéndice 3.
psicoemocio- tratamientos médicos usuales
nales que los enfermos de cáncer que
no toman la terapia.
www.elosopanda.com | jamespoetrodriguez.com
Ejemplos desarrollados 193
Ejemplos desarrollados
La relación entre la personalidad y las enfermedades mente, de cada escuela se eligieron los niños para confor-
mar la muestra final.
La población definida por Yousfi et al. (2004) fueron adultos entre
los 40 y 65 años de la ciudad de Heidelberg, Alemania. Los inves- Una vez hechos los cálculos, se determinó que de cada estra-
tigadores realizaron un muestreo aleatorio simple (basado en un to se seleccionaran cuatro escuelas, es decir n es igual a 32 es-
listado con nombres y direcciones proporcionado por el ayunta- cuelas ubicadas en diversas colonias que incluyeron a todas las
miento). A las personas elegidas les pagaron 15 euros como es- delegaciones (municipalidades). En la segunda etapa se seleccio-
tímulo por su participación. Desde luego, la unidad de muestreo/ naron por muestreo aleatorio simple los niños de cada escuela:
análisis es el individuo. Primero, a 15 000 personas se les envió 264 infantes por estrato o escuela de 4º, 5º y 6º grados (88 por
una carta y luego a 10 250 se les llamó por teléfono. Finalmente, cada uno). Una muestra total de 2 112 (264 por ocho estratos),
la muestra quedó constituida por 5 133 hombres y mujeres, quie- que implicó ajustes y reemplazos.
nes acudieron a la cita a contestar los instrumentos o respondie-
ron por correo. Declinaron participar 1 316 residentes. La muestra La pareja y relación ideales
es representativa al nivel de 99%.
Para conocer el tamaño del universo, se obtuvo información pro-
La televisión y el niño porcionada por la Asociación Nacional de Universidades e Institu-
ciones de Educación Superior, Federación de Instituciones Mexica-
Para el estudio, primero se realizó un análisis exploratorio y una nas Particulares de Educación Superior y el gobierno de Guanajuato.
prueba piloto con 60 niños de diversos estratos socioeconómicos. Asimismo, se acudió a fuentes electrónicas (páginas web de las
Con base en ello se corrigió el cuestionario para proceder al estu- instituciones) y se solicitó directamente el dato a las organizacio-
dio definitivo. nes educativas involucradas. El tamaño de la población total era,
en el año del estudio, de aproximadamente 13 000 estudiantes.17
1. Límites de población: Utilizando el STATS®, tendríamos que un tamaño de muestra
Todos los niños del área metropolitana de la Ciudad de adecuado para esta población (95% de confianza, 5% de error y
p = 0.5 o 50%) es de 373 casos. Sin embargo, se prefirió segmen-
México que cursaban 4o., 5o. y 6o. de primaria en escuelas tar al universo en: 1) instituciones con matrícula de más de 2 000
privadas y públicas del turno matutino. alumnos y 2) universidades con matrícula de 1000 a 1 500 estu-
diantes. En el primer estrato estuvieron dos organizaciones (que
2. Proceso de selección: representa un total de 6 000 universitarios) y en el segundo siete
Se estableció una muestra probabilística estratificada por (7 000 alumnos). Cada estrato fue concebido como una población
y entonces se calculó el tamaño de muestra mediante STATS®, el
racimo. En la primera etapa se seleccionaron escuelas para, resultado fue: estrato 1 (n = 361) y estrato 2 (n = 364). Así, para
en última instancia, llegar a los niños. La muestra se obtuvo el estrato 1 se consideró entrevistar en una institución a 180 uni-
de una base de datos de la Secretaría de Educación Pública, versitarios y en la otra a 181. En el caso del estrato 2, se adminis-
que contenía listadas e identificadas con un código a todas tró el instrumento de medición en cada una de las siete universi-
las escuelas primarias de la zona metropolitana de la Ciudad dades o institutos a 52 estudiantes.
de México (nombre, ubicación y régimen de propiedad —pú-
blica o privada—). El abuso sexual infantil
Se excluyó a escuelas del turno vespertino y las diseñadas El estudio es un experimento y la muestra es dirigida. Se recluta-
para niños con capacidades diferentes o habilidades especia- ron preescolares de tres centros de desarrollo infantil con una
les. La selección también estratificó el nivel socioeconómico en población similar, hijos de madres que laboran para la Secretaría
cuatro categorías: A, B, C y D (de acuerdo con los criterios del de Educación Pública del Estado de Querétaro. Se evaluaron seis
mapa mercadológico de la Ciudad de México, A = ingresos fa- grupos escolares que fueron asignados a tres grupos experimen-
miliares elevados, B = medios, C = medios bajos y D = bajos). tales (n1 = 49 niños, n2 = 22 niños y n3 = 79 niños).
Por tanto, se eligieron las escuelas de los siguientes estratos:
Al inicio del proceso se consiguió el permiso de las autorida-
1) escuelas públicas clase A des escolares de los centros. En general, se hicieron reuniones
2) escuelas privadas clase A previas con los padres de familia para informarles del programa.
3) escuelas públicas clase B Se efectuó una sesión de acercamiento en la cual la persona que
4) escuelas privadas clase B aplicó las escalas se presentó con los niños, realizó actividades
5) escuelas públicas clase C lúdicas para ganarse la confianza y cercanía de los grupos y les
6) escuelas privadas clase C explicó de forma general el proceso. Su participación fue de ca-
7) escuelas públicas clase D rácter voluntario (tenían la posibilidad de negarse). Antes de
8) escuelas privadas clase D cada evaluación, se recabó el consentimiento de todos los niños
y sus tutores.
Cada lista representó un estrato de la población y de
cada una de ellas se seleccionó una muestra de escuelas: A,
B, C, D, que representan niveles socioeconómicos. Posterior-
17 No se proporciona la matrícula de cada institución en particular, porque cuatro universidades solicitaron expresamente que no se difundie-
ra el dato. También, cabe mencionar que el tamaño del universo es aproximado debido a que hasta el final del semestre se tiene información
precisa de las bajas escolares.
www.elosopanda.com | jamespoetrodriguez.com
194 Capítulo 8 Selección de la muestra
Los investigadores opinan
La lógica del proceso cuantitativo de investigación y entonces pensar, si el proceso de indagación no fuera lógico,
¿cómo se podrían responder preguntas de investigación (que se
Normalmente cuando un alumno se inicia en la investigación co- encuentran en el planteamiento), sin haber revisado qué han en-
mienza ya sea con miedo o con desconfianza sobre cómo llevarla contrado otros en sus estudios (revisión de la literatura)?
a cabo. Una técnica que puede utilizarse en clases de licenciatura
e incluso de posgrado es la siguiente: se comienza por decretar Ya que se han definido esas respuestas tentativas a las pre-
que la investigación no es complicada, que se trata de un proceso guntas de investigación o en su defecto, debido al alcance del
lógico y que, si se hubiera hecho un ejercicio antes de ver cuáles estudio, se ha determinado responder dichos cuestionamientos
son los pasos para llevar a cabo un estudio bajo el enfoque cuan- directamente, ¿qué seguiría por lógica? Creo que todos, o al me-
titativo, básicamente se habría llegado al mismo proceso, aunque nos la mayoría, coincidirían en que es necesario un plan que nos
posiblemente, se habría nombrado a cada etapa de distinta ma- ayude a poner a prueba las respuestas que se han dado inicial-
nera o se hubiera integrado un par o hasta tres de los pasos que mente o responderlas como ya se dijo, de forma directa; esto es
se describen en este libro en uno solo, pero que se tendrían que el diseño de la investigación.
llevar a cabo las actividades que ya se han relatado.
Realizado lo anterior, ¿qué se haría según nuestra lógica?
La explicación debe partir de una idea, ésta como en las cari- ¿Acaso no se tendría que definir quiénes serían los sujetos u ob-
caturas o dibujos animados, se puede imaginar encerrada en una jetos sobre los que se recolectarían los datos? A esto se le conoce
nube y, por tanto, es efímera, no se puede trabajar directamente como la muestra, o más específicamente unidad de muestreo/
con ella. Es por eso que el siguiente paso es “jalarla” hacia abajo, análisis, población-universo y muestra.
es decir, tomarla y volverla realidad; eso lo hacemos a través del
planteamiento del problema de investigación. En esta etapa, como Ya que se tiene el plan para recabar los datos que se necesi-
ya se vio, se incluyen los objetivos, las preguntas, la justificación y tan y además se han definido sobre qué o quién se recolectará,
la viabilidad del estudio, formalizando así aquello que antes solo ¿cuál sería el siguiente paso lógico? Seguramente levantar los
fue una idea. En el siguiente paso (la revisión de la literatura y la datos requeridos, ¿no? Y se reflexiona nuevamente, ¿cómo se
construcción del marco teórico) se trata de averiguar qué han he- pudiera haber comenzado a conseguir datos sin tener un plan
cho otros en torno al tema que nos interesa, cómo lo hicieron, en para ello y sin saber exactamente a qué o quiénes se deben to-
dónde, cuáles fueron sus principales resultados, etc. En ese mo- mar en cuenta para el estudio?
mento, se puede hacer una pausa y reflexionar con los alumnos
acerca de la siguiente pregunta: ¿cómo sabrían qué buscar (revi- De nada serviría recolectar datos sin la intención de analizar-
sión de la literatura) sin antes haber definido qué se quiere encon- los, lo que sería el próximo paso lógico para, finalmente, reportar
trar (idea-planteamiento)?: la lógica del proceso. Se continúa con lo encontrado en la investigación, ¿acaso no es necesario, des-
base en lo que se encontró en el tercer paso, se define a partir de pués de todo el esfuerzo realizado llegar a conclusiones?
dónde comienza el estudio del tema y hasta dónde se podría lle-
gar con los recursos con los que se cuenta (alcance de investiga- De esta manera es que se intenta que los estudiantes pierdan
ción). Esto a su vez da la oportunidad de reflexionar si, con base el miedo a la investigación, se acerquen e identifiquen con ella,
en la información obtenida anteriormente, se puede dar una res- pero sobre todo se dispongan a vivirla y disfrutarla por su propia
puesta tentativa a la o las preguntas de investigación (hipótesis) cuenta.
DOCTOR SERGIO MÉNDEZ VALENCIA
Universidad de Celaya
(México)
www.elosopanda.com | jamespoetrodriguez.com
www.elosopanda.com | jamespoetrodriguez.com
196 Capítulo 9 Recolección de datos cuantitativos
capítulo Recolección de datos cuantitativos
9
El momento de aplicar los instrumentos de medición y recolectar los
datos representa la oportunidad para el investigador de confrontar el
trabajo conceptual y de planeación con los hechos.
Roberto Hernández-Sampieri
Proceso de investigación Paso 8 Recolectar los datos
cuantitativa
• Definir la forma idónea de recolectar los datos de acuerdo
con el planteamiento del problema y las etapas previas de
la investigación.
• Seleccionar o elaborar uno o varios instrumentos o métodos
para recolectar los datos requeridos.
• Aplicar los instrumentos o métodos.
• Obtener los datos.
• Codificar los datos.
• Archivar los datos y prepararlos para su análisis por compu-
tadora.
Objetivos de aprendizaje
Al terminar este capítulo, el alumno será capaz de:
1. Visualizar diferentes métodos para recolectar datos cuantitativos.
2. Entender el significado de “medir” y su importancia en el proceso cuantitativo.
3. Comprender los requisitos que toda recolección de datos debe incluir.
4. Conocer los principales instrumentos para recolectar datos cuantitativos.
5. Elaborar y aplicar los diferentes instrumentos de recolección de datos cuantitativos.
6. Preparar los datos para su análisis cuantitativo.
Síntesis
En el capítulo se analizan los requisitos que un instrumento de medición debe cubrir para re-
colectar apropiadamente datos cuantitativos: confiabilidad, validez y objetividad. Asimismo,
se define el concepto de medición y los errores que pueden cometerse al recolectar datos.
También se explica el proceso para elaborar un instrumento de medición y las principales
alternativas para recolectar datos: cuestionarios y escalas de actitudes. Por último, se examina
el procedimiento de codificación de datos cuantitativos y la forma de prepararlos para su
análisis. Otros temas relacionados con la recolección de los datos se incluyen en el capítulo 5
del centro de recursos en línea.
www.elosopanda.com | jamespoetrodriguez.com
¿Qué significa medir? 197
Fases de construcción de un instrumento: 6. Prueba piloto Procedimientos para
7. Elaboración de la versión final del instrumento o determinar la confiabilidad:
1. Redefiniciones fundamentales • Medida de estabilidad
2. Revisión enfocada de la literatura en instrumentos sistema y su procedimiento de aplicación • Método de formas
8. Entrenamiento del personal que administrará el
pertinentes alternativas o paralelas
3. Identificación del dominio de las variables a medir y instrumento, codificará respuestas e interpretará • Método de mitades partidas
resultados • Medidas de consistencia
sus indicadores 9. Obtener autorizaciones para aplicar el instrumento
4. Toma de decisiones clave 10. Administración del instrumento interna
5. Construcción del instrumento
De ella derivan distintos tipos
Recolección Instrumento(s) de Confiabilidad de evidencia:
de datos medición Grado en que • Validez de contenido
un instrumento • Validez de criterio
cuantitativos Debe(n) representar produce resultados • Validez de constructo
verdaderamente consistentes y
se realiza la(s) variable(s) de la coherentes
mediante investigación
Validez
sus requisitos Grado en que un
son: instrumento mide la
variable que pretende
medir
Objetividad
Grado en que el Validez total es la
instrumento es consideración de los tipos
Cuyas respuestas se obtienen, codifican Tipos permeable a los de evidencia
y transfieren a una matriz o base de sesgos y tendencias
datos y se preparan para su análisis
mediante un paquete estadístico para del investigador que
computadora
lo administra, califica
e interpreta
Cuestionarios Escalas de medición de actitudes que Otros tipos son (los encontrará en el
pueden ser: centro de recursos en línea)
• Se basan en preguntas que pueden
ser cerradas o abiertas • Escalamiento tipo Likert • Analisis de contenido cuantitativo
• Diferencial semántico • Observación
• Sus contextos pueden ser: • Escalograma de Guttman (en el • Pruebas estandarizadas e inventarios
autoadministrados, entrevista • Datos secundarios (recolectados por
personal o telefónica, vía internet centro de recursos en línea)
otros investigadores)
• Aparatos y equipos
• Indicadores
Nota: El capítulo se termina de integrar con otro que puede descargarse del centro de recursos en línea en: Material complementario S
Capítulos S Capítulo 7, “Recolección de los datos cuantitativos: segunda parte”, que contiene alternativas de instrumentos para recolectar
datos como el análisis de contenido y los sistemas de observación, además de pruebas e inventarios, escalograma de Guttman (escala de
actitudes), datos secundarios e indicadores.
www.elosopanda.com | jamespoetrodriguez.com
198 Capítulo 9 Recolección de datos cuantitativos
¿Qué implica la etapa de recolección de datos?
1 Una vez que seleccionamos el diseño de investigación apropiado y la muestra adecuada de acuerdo
con nuestro problema de estudio e hipótesis (si es que se establecieron), la siguiente etapa consiste en
recolectar los datos pertinentes sobre los atributos, conceptos o variables de las unidades de muestreo/
análisis o casos (participantes, grupos, fenómenos, procesos, organizaciones, etcétera).
Recolectar los datos implica elaborar un plan detallado de procedimientos que nos conduzcan
a reunir datos con un propósito específico. Este plan incluye determinar:
a) ¿Cuáles son las fuentes de las que se obtendrán los datos? Es decir, los datos van a ser proporcio-
nados por personas, se producirán de observaciones y registros o se encuentran en documentos,
archivos, bases de datos, etcétera.
b) ¿En dónde se localizan tales fuentes? Regularmente en la muestra seleccionada, pero es indispen-
sable definir con precisión.
c) ¿A través de qué medio o método vamos a recolectar los datos? Esta fase implica elegir uno o
varios medios y definir los procedimientos que utilizaremos en la recolección de los datos. El
método o métodos deben ser confiables, válidos y “objetivos”.
d) Una vez recolectados, ¿de qué forma vamos a prepararlos para que puedan analizarse y responda-
mos al planteamiento del problema?
El plan se nutre de diversos elementos:
1. Las variables, conceptos o atributos a medir (contenidos en el planteamiento e hipótesis o directri-
ces del estudio).
2. Las definiciones operacionales. La manera como hemos operacionalizado las variables es crucial
para determinar el método para medirlas, lo cual a su vez, resulta fundamental para realizar las
inferencias de los datos.
3. La muestra.
4. Los recursos disponibles (de tiempo, apoyo institucional, económicos, etcétera).
El plan se implementa para obtener los datos requeridos, no olvidemos que todos los atributos, cua-
lidades y variables deben ser medibles. En la figura 9.1 se encuentra un ejemplo de un plan de este tipo.
Figura 9.1 Ejemplo de plan para la obtención de datos.
Planteamiento
Objetivo: analizar la relación entre la satisfacción de las recompensas, el grado de responsabilidad, el desarrollo personal
y la confianza en sí mismo en los trabajadores de la industria farmacéutica
Pregunta: ¿cuál es la relación entre la satisfacción de las recompensas, el grado de responsabilidad, el desarrollo personal y la
confianza en sí mismo en los trabajadores de la industria farmacéutica?
PLAN
¿Cuáles son las fuentes? ¿Dónde se localizan?
En las ciudades de Vilecha y León
Trabajadores de laboratorios farmacéuticos de la
provincia de León
¿A través de qué método vamos a recolectar los datos? ¿De qué forma vamos a prepararlos para que puedan
analizarse?
Entrevista, utilizando un cuestionario que será aplicado
por entrevistadores calificados Matriz de datos
1. Las variables a medir son: satisfacción de las recompensas, grado de responsabilidad, desarrollo personal y confianza en sí mismo
2. Las definiciones operacionales: escalas de un cuestionario que mide las variables de interés, denominado “Encuesta del clima
organizacional CPMT” (Hernández-Sampieri et al., 2013)
3. La muestra: 300 trabajadores
4. Recursos disponibles: económicos, suficientes. Tiempo: un mes
www.elosopanda.com | jamespoetrodriguez.com
¿Qué significa medir? 199
Con la finalidad de recolectar datos disponemos de una gran variedad de instrumentos o técnicas,
tanto cuantitativas como cualitativas, es por ello que en un mismo estudio podemos utilizar ambos
tipos. Incluso, hay instrumentos como la Prueba de Propósito Vital (PIL) (que evalúa el propósito de
vida de una persona) de Crumbaugh y Maholick (1969) que contiene una parte cuantitativa y una
cualitativa (Thoits, 2012; Marsh, Smith, Piek y Saunders, 2003; y Brown, Ashcroft y Miller, 1998).
Esto se revisará en el capítulo 17: “Los métodos mixtos”.
Por ahora, nos concentraremos en la recolección de los datos cuantitativos y sus conceptos esen-
ciales.
¿Qué significa medir?
En la vida diaria medimos constantemente. Por ejemplo, al levantarnos por las mañanas, miramos el 2
reloj despertador y “medimos” la hora; al bañarnos, ajustamos la temperatura del agua en la tina o la
regadera, calculamos la cantidad de café que habremos de servir en la cafetera; nos asomamos por
la ventana y estimamos cómo será el día para decidir la ropa que nos pondremos. Al ver el tráfico
evaluamos e inferimos a qué hora llegaremos a la universidad o al trabajo, así como la velocidad a la
que transitamos (o bien observamos el velocímetro); en ocasiones contamos cuántos anuncios espec-
taculares observamos en el trayecto u otras cuestiones, incluso deducimos, a partir de ciertos signos,
acerca del operador del autobús y de otros conductores: ¿qué tan alegres o enojados están? Como esas,
hacemos muchas otras actividades. Medir es parte de nuestras vidas (Bostwick y Kyte, 2005).
En concordancia con la definición clásica del término, ampliamente difundida,
medir significa “asignar números, símbolos o valores a las propiedades de objetos o Medición Proceso que vincula
eventos de acuerdo con reglas” (Stevens, 1951). Desde luego, no se asignan a los obje- conceptos abstractos con indicadores
tos, sino a sus propiedades (Bostwick y Kyte, 2005). Sin embargo, como señalan empíricos.
Carmines y Zeller (1991), esta definición es más apropiada para las ciencias físicas que
para las ciencias sociales, ya que varios de los fenómenos que son medidos en éstas no pueden carac-
terizarse como objetos o eventos, son demasiado abstractos para ello. La disonancia cognitiva, la
pareja ideal, el clima organizacional, la cultura fiscal y la credibilidad son conceptos tan abstractos que
no deben ser considerados “cosas que pueden verse o tocarse” (definición de objeto) ni solamente
como “resultado, consecuencia o producto” (definición de evento) (Carmines y Zeller, 1991). Este
razonamiento nos lleva a proponer que es más adecuado definir la medición como “el proceso de
vincular conceptos abstractos con indicadores empíricos”, el cual se realiza mediante un plan explíci-
to y organizado para clasificar (y con frecuencia cuantificar) los datos disponibles (los indicadores), en
términos del concepto que el investigador tiene en mente (Carmines y Zeller, 1991). En este proceso,
el instrumento de medición o de recolección de datos tiene un papel central. Sin él, no hay observa-
ciones clasificadas.
La definición sugerida incluye dos consideraciones: la primera es desde el punto de vista empíri-
co y se resume en que el centro de atención es la respuesta observable (sea una alternativa de respues-
ta marcada en un cuestionario, una conducta registrada mediante observación, un valor de un
instrumento y su interpretación o una respuesta dada a un entrevistador). La segunda es desde una
perspectiva teórica y se refiere a que el interés se sitúa en el concepto subyacente no observable que se
representa por medio de la respuesta. Así, los registros del instrumento de medición
representan valores visibles de conceptos abstractos. Un instrumento de medición Instrumento de medición Recurso
adecuado es aquel que registra datos observables que representan verdaderamente los que utiliza el investigador para
conceptos o las variables que el investigador tiene en mente (Grinnell, Williams y registrar información o datos sobre
Unrau, 2009). En términos cuantitativos: capturo verdaderamente la “realidad” que las variables que tiene en mente.
deseo capturar. Bostwick y Kyte (2005) lo señalan de la siguiente forma: la función de
la medición es establecer una correspondencia entre el “mundo real” y el “mundo conceptual”. El
primero provee evidencia empírica, el segundo proporciona modelos teóricos para encontrar sentido
a ese segmento del mundo real que estamos tratando de describir.
En toda investigación cuantitativa aplicamos un instrumento para medir las variables contenidas
en las hipótesis (y cuando no hay hipótesis simplemente para medir las variables de interés). Esa
www.elosopanda.com | jamespoetrodriguez.com
200 Capítulo 9 Recolección de datos cuantitativos
medición es eficaz cuando el instrumento de recolección de datos en realidad representa las variables
que tenemos en mente. Si no es así, nuestra medición es deficiente; por tanto, la investigación no es
digna de tomarse en cuenta. Desde luego, no hay medición perfecta. Es casi imposible que represen-
temos con fidelidad variables como la inteligencia emocional, la motivación, el nivel socioeconómico,
el liderazgo democrático, el abuso sexual infantil y otras más; pero es un hecho que debemos acercar-
nos lo más posible a la representación fiel de las variables que se van a observar mediante el instru-
mento de medición que desarrollemos. Se trata de un precepto básico del enfoque cuantitativo. Al
medir estandarizamos y cuantificamos los datos (Babbie, 2014 y Bostwick y Kyte, 2005).
¿Qué requisitos debe cubrir un instrumento
de medición?
3 Toda medición o instrumento de recolección de datos debe reunir tres requisitos esenciales: confiabi-
lidad, validez y objetividad.
Confiabilidad
Confiabilidad Grado en que un La confiabilidad de un instrumento de medición se refiere al grado en que su aplica-
instrumento produce resultados ción repetida al mismo individuo u objeto produce resultados iguales (Hernández-
consistentes y coherentes. Sampieri et al., 2013; Kellstedt y Whitten, 2013; y Ward y Street, 2009). Por ejemplo,
si se midiera en este momento la temperatura ambiental usando un termómetro y éste
indicara que hay 22°C, y un minuto más tarde se consultara otra vez y señalara 5°C,
tres minutos después se observara nuevamente y éste indicara 40°C, dicho termómetro no sería con-
fiable, ya que su aplicación repetida produce resultados distintos. Asimismo, si una prueba de inteli-
gencia (Intelligence Quotient, IQ) se aplica hoy a un grupo de personas y da ciertos valores de
inteligencia, se aplica un mes después y proporciona valores diferentes, al igual que en subsecuentes
mediciones, tal prueba no sería confiable (analice los valores de la tabla 9.1, suponiendo que los coefi-
cientes de inteligencia oscilaran entre 100 y 135). Los resultados no son coherentes, pues no se puede
“confiar” en ellos.
Tabla 9.1 Ejemplo de resultados proporcionados por un instrumento de medición sin confiabilidad
Primera aplicación Segunda aplicación Tercera aplicación
Mariana 135 Sergio 131 Guadalupe 127
Viridiana 125 Laura 130 Guadalupe 127
Sergio 118 Chester 125 Mariana 118
Laura 110 Guadalupe 112 Laura 115
Guadalupe 108 Mariana 110 Chester 112
Chester 106 Viridiana 105 Viridiana 108
Agustín 100 Agustín 101 Sergio 105
La confiabilidad de un instrumento de medición se determina mediante diversas técnicas, las
cuales se comentarán brevemente después de revisar los conceptos de validez y objetividad.
Validez Grado en que un instrumento Validez
en verdad mide la variable que se
busca medir. La validez, en términos generales, se refiere al grado en que un instrumento mide
realmente la variable que pretende medir. Por ejemplo, un instrumento válido para
medir la inteligencia debe medir la inteligencia y no la memoria. Un método para medir
el rendimiento bursátil tiene que medir precisamente esto y no la imagen de una empre-
sa. Un ejemplo —aunque muy obvio— de completa invalidez sería intentar medir el
peso de los objetos con una cinta métrica en lugar de con una báscula.
www.elosopanda.com | jamespoetrodriguez.com
¿Qué requisitos debe cubrir un instrumento de medición? 201
En apariencia es sencillo lograr la validez. Después de todo, como dijo un estudiante: “pensamos
en la variable y vemos cómo hacer preguntas o imaginar indicadores sobre esa variable”. Esto resulta-
ría factible en unos cuantos casos (como lo sería el género al que pertenece una persona). Sin embar-
go, la situación no es tan simple cuando se trata de variables como la motivación, la calidad del
servicio a los clientes, la actitud hacia un candidato político y menos aún con sentimientos y emocio-
nes, así como de otras variables con las que trabajamos en todas las ciencias. La validez es una cuestión
más compleja que debe alcanzarse en todo instrumento de medición que se aplica. Kerlinger (1979,
p. 138) plantea la siguiente pregunta respecto de la validez: ¿está midiendo lo que cree que está
midiendo? Si es así, su medida es válida; si no, evidentemente carece de validez.
La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia (Babbie, 2014;
Hays, 2013; Kellstedt y Whitten, 2013; The SAGE Glossary of the Social and Behavioral Sciences,
2009a; Streiner y Norman, 2008; Wiersma y Jurs, 2008; Gallestey, 2007; Rupp y Pant, 2006;
Carmines y Woods, 2003a; y Gronlund, 1990): 1) evidencia relacionada con el contenido, 2) evidencia
relacionada con el criterio y 3) evidencia relacionada con el constructo. A continuación analizaremos
cada una de ellas.
1. Evidencia relacionada con el contenido
La validez de contenido se refiere al grado en que un instrumento refleja un dominio Validez de contenido Grado en que
específico de contenido de lo que se mide. Es el grado en el que la medición represen- un instrumento refleja un dominio
ta al concepto o variable medida (The SAGE Glossary of the Social and Behavioral específico de contenido de lo que se
Sciences, 2009b y Bohrnstedt, 1976). Por ejemplo, una prueba de operaciones arit- mide.
méticas no tendrá validez de contenido si incluyera sólo problemas de resta y excluye-
ra problemas de suma, multiplicación o división. O bien, una prueba de conocimientos sobre las
canciones de Los Beatles no deberá basarse solamente en sus álbumes Let it Be y Abbey Road, sino que
debe incluir canciones de todos sus discos. O una prueba de conocimientos de líderes históricos de
América Latina que omita a Simón Bolívar, Salvador Allende, Túpac Amaru II, Ernesto el Che
Guevara, José de San Martín o Benito Juárez.
Un instrumento de medición requiere tener representados a todos o la mayoría de los componen-
tes del dominio de contenido de las variables que se van a medir. Este hecho se ilustra en la figura 9.2.
Figura 9.2 Ejemplo de un instrumento de medición con validez de contenido frente a otro que carece de ella.
Instrumento con validez de Dominio de la variable
contenido
LR Ñ
LR EA
EA NM
NM AZ
AZ UG
UG
Instrumento sin
validez de contenido
LE
El dominio de contenido de una variable normalmente está definido o establecido por la litera-
tura (teoría y trabajos antecedentes). En indagaciones exploratorias en las que las fuentes previas son
escasas, el investigador comienza a adentrarse en el problema de estudio y a proponer cómo puede
estar constituido tal dominio. De cualquier manera, en cada investigación uno debe probar que el
instrumento utilizado es válido. Un ejemplo del intento por establecer el dominio de contenido de
una variable es el siguiente:
www.elosopanda.com | jamespoetrodriguez.com
202 Capítulo 9 Recolección de datos cuantitativos
Ejemplo
Hernández-Sampieri (2005), para establecer el dominio de la variable clima organizacional, revisó 20 estudios
clásicos sobre el concepto, comprendidos entre 1964 y 1977, así como más de 100 investigaciones publicadas
en revistas científicas entre 1975 y 2005. Por otro lado, consideró diversos libros sobre el tema, tres metaaná-
lisis y otras tantas revisiones del estado del conocimiento sobre dicho clima. También evaluó 15 estudios
efectuados en el contexto en el que habría de llevar a cabo su propia investigación. Encontró que en la litera-
tura se han considerado decenas de dimensiones o componentes del clima organizacional, por lo que realizó
un análisis para determinar cuáles habían sido los más frecuentes, éstos fueron: 1) moral, 2) apoyo de la
dirección, 3) innovación, 4) identificación con la empresa, 5) comunicación, 6) percepción del desempeño, 7)
motivación intrínseca, 8) autonomía, 9) satisfacción general, 10) liderazgo, 11) visión y 12) recompensas o
retribución. Dejó a un lado otros, como confianza en sí mismo y estándares de excelencia o conformidad. Con
lo anterior generó su instrumento de medición.
Si el dominio de un instrumento es demasiado estrecho con respecto al dominio de la variable, el
primero no la representará. La pregunta que se responde con la validez de contenido es: ¿el instrumen-
to mide adecuadamente las principales dimensiones de la variable en cuestión? En un cuestionario, por
ejemplo, cabría interrogar: ¿qué tan bien representan las preguntas a todas las que pudieran hacerse?
2. Evidencia relacionada con el criterio
Validez de criterio Validez que se La validez de criterio de un instrumento de medición se establece al comparar sus
establece al correlacionar las puntuacio- resultados con los de algún criterio externo que pretende medir lo mismo. Supongamos
nes resultantes de aplicar el instrumen- que Fernando trata de “medir” el grado en que es aceptado por Laura. Entonces deci-
to con las puntuaciones obtenidas de de que va a tomarla de la mano y observará su reacción. Supuestamente, si ella no
otro criterio externo que pretende
medir lo mismo. retira la mano, esto indicaría cierta aceptación. Pero para asegurarse de que su medi-
ción es válida, decide utilizar otra forma de medición adicional, por ejemplo, mirarla
fijamente sin apartar la vista de sus ojos. En apariencia, si Laura le sostiene la mirada,
esto sería otro indicador de aceptación. Así, su medición de aceptación se valida mediante dos méto-
dos al comparar dos criterios. El ejemplo tal vez sea simple, pero describe la esencia de la validez
relativa al criterio.
Este criterio es un estándar con el que se juzga la validez del instrumento (Jackson, 2011 y The
SAGE Glossary of the Social and Behavioral Sciences, 2009c). Cuanto más se relacionen los resulta-
dos del instrumento de medición con los del criterio, la validez será mayor. Por ejemplo, un investi-
gador valida un examen sobre manejo de aviones al mostrar la exactitud con la que el examen predice
qué tan bien un grupo de pilotos es capaz de operar un aeroplano.
Si el criterio se fija en el presente de manera paralela, se habla de validez concurrente (Kaplan y
Saccuzzo, 2013) (los resultados del instrumento se correlacionan con el criterio en el mismo momen-
to o punto de tiempo). Por ejemplo, Núñez (2001) desarrolló una herramienta para medir el sentido
de vida de acuerdo con las ideas de Viktor Frankl, el test Celaya. Para aportar evidencia de validez en
relación con su instrumento, lo aplicó y a su vez administró otros instrumentos que miden conceptos
muy similares, tal como la PIL (Prueba de Propósito Vital) de Crumbaugh y Maholick (1969) y el
Logo Test de Lukas (1984). Luego comparó las puntuaciones de los participantes en las tres pruebas,
demostró que las correlaciones entre las puntuaciones eran significativamente elevadas. De esta mane-
ra fue como aportó validez concurrente para su instrumento.
Si el criterio se fija en el futuro, se habla de validez predictiva (The SAGE Glossary of the Social
and Behavioral Sciences, 2009d). Por ejemplo, una prueba para determinar la capacidad gerencial de
candidatos a ocupar altos puestos ejecutivos se validaría comparando sus resultados con el desempeño
posterior de los ejecutivos en su trabajo regular. Un cuestionario para detectar las preferencias del
electorado por los distintos partidos contendientes y por sus candidatos en la época de las campañas,
puede validarse comparando sus resultados con los resultados finales y definitivos de la elección.
El principio de la validez de criterio es sencillo: si diferentes instrumentos o criterios miden el
mismo concepto o variable, deben arrojar resultados similares. Bostwick y Kyte (2005) lo expresan de
la siguiente forma:
www.elosopanda.com | jamespoetrodriguez.com
¿Qué requisitos debe cubrir un instrumento de medición? 203
Si hay validez de criterio, las puntuaciones obtenidas por ciertos casos en un instrumento deben estar
correlacionadas y predecir las puntuaciones de estos mismos casos logradas en otro criterio.
La pregunta que se responde con la validez de criterio es: ¿en qué grado el instrumento compara-
do con otros criterios externos mide lo mismo?
3. Evidencia relacionada con el constructo
La validez de constructo es probablemente la más importante, sobre todo desde una Validez de constructo Debe explicar
perspectiva científica, y se refiere a qué tan bien un instrumento representa y mide un cómo las mediciones del concepto o
concepto teórico (Babbie, 2014; Grinnell, Williams y Unrau, 2009; The SAGE variable se vinculan de manera
Glossary of the Social and Behavioral Sciences, 2009d; y Sawilowsky, 2006). A esta congruente con las mediciones de
validez le concierne en particular el significado del instrumento, esto es, qué está otros conceptos correlacionados teóri-
midiendo y cómo opera para medirlo. Integra la evidencia que soporta la interpreta- camente.
ción del sentido que poseen las puntuaciones del instrumento (Messick, 1995).
Constructo o construcción Variable
Parte del grado en el que las mediciones del concepto proporcionadas por el ins- medida que tiene lugar dentro de
trumento se relacionan de manera consistente con mediciones de otros conceptos o una hipótesis, teoría o modelo
variables vinculadas empírica y teóricamente (por la teoría, modelos e hipótesis pre- teórico.
vias o investigaciones antecedentes). A tales conceptos se les denomina “constructos”.
Un constructo es una variable medida y tiene lugar dentro de una hipótesis, teoría o
modelo teórico. Es un atributo que no existe aislado sino en relación con otros y debe
ser inferido de la evidencia que tenemos en nuestras manos y que proviene de las pun-
tuaciones del instrumento aplicado.
La validez de constructo incluye tres etapas (Carmines y Zeller, 1991):
1. Sobre la base de la revisión de la literatura, se establece y especifica la relación entre el concepto
o variable medida por el instrumento y los demás conceptos incluidos en la teoría, modelo teóri-
co o hipótesis.
2. Se asocian estadísticamente los conceptos y se analizan cuidadosamente las correlaciones.
3. Se interpreta la evidencia empírica de acuerdo con el nivel en el que se clarifica la validez de
constructo de una medición en particular.
El proceso de validación de un constructo está vinculado con la teoría. No es conveniente llevar a
cabo tal validación, a menos que exista un marco teórico que soporte la variable en relación con otras
variables. Desde luego, no es necesaria una teoría muy desarrollada, pero sí investigaciones que hayan
demostrado que los conceptos se asocian. Cuanto más elaborada y comprobada se encuentre la teoría
que apoya la hipótesis, la validación del constructo arrojará mayor luz sobre la validez general de un
instrumento de medición. Tenemos más confianza en la validez de constructo de una medición cuan-
do sus resultados se correlacionan significativamente con un mayor número de mediciones de varia-
bles que, en teoría y de acuerdo con estudios antecedentes, están relacionadas. Veamos la validez de
constructo con el ejemplo ya comentado sobre el clima organizacional.
Ejemplo
En el caso de Hernández-Sampieri (2005), que como recordamos, desarrolló un instrumento para evaluar al
clima organizacional considerando 12 variables: moral, apoyo de la dirección, innovación, etc., la pregunta
obvia es: ¿tal instrumento realmente mide el clima organizacional? ¿Verdaderamente lo representa? En cuanto
a contenido se demostró que sí reflejaba las principales dimensiones del clima organizacional. Pero esto no es
suficiente, necesita demostrar que su instrumento concuerda con la teoría. Ésta, basada en diversos estudios,
indica que tales dimensiones se encuentran fuertemente vinculadas y que se unen o “funden” entre sí para
formar un constructo multidimensional denominado clima organizacional, y que además se asocian con el
involucramiento en el trabajo y el compromiso organizacional. Entonces, para aportar validez de constructo, se
correlacionaron todas las dimensiones entre sí y luego la escala de clima con dicho involucramiento y compro-
miso. Tales vínculos se encontraron mediante análisis estadístico y los resultados coincidieron con la teoría y
se obtuvo evidencia sobre la validez de constructo del instrumento.
www.elosopanda.com | jamespoetrodriguez.com
204 Capítulo 9 Recolección de datos cuantitativos
Las preguntas que se responden con la validez de constructo son: ¿el concepto teórico está real-
mente reflejado en el instrumento? ¿Qué significan las puntuaciones del instrumento? ¿El instrumen-
to mide el constructo y sus dimensiones? ¿Por qué? ¿Cómo opera el instrumento?
Otro tipo de validez que algunos autores consideran es la validez de expertos o
Validez de expertos Grado en que un face validity, la cual se refiere al grado en que aparentemente un instrumento mide
instrumento realmente mide la variable la variable en cuestión, de acuerdo con “voces calificadas”. Se encuentra vinculada a
de interés, de acuerdo con expertos en la validez de contenido y, de hecho, se consideró por muchos años como parte de ésta.
el tema.
Hoy se concibe como un tipo adicional de evidencia (Gravetter y Forzano, 2011;
Streiner y Norman, 2008; y Mostert, 2006). Regularmente se establece mediante la
evaluación del instrumento ante expertos. Por ejemplo, Hernández-Sampieri (2005) sometió el ins-
trumento a revisión por parte de asesores en desarrollo organizacional, académicos y gerentes de
recursos humanos. Asimismo, más recientemente se ha hablado de la validez consecuente, que se refie-
re a las secuelas sociales del uso e interpretación de una prueba (Mertens, 2010).
Validez total
La validez de un instrumento de medición se evalúa sobre la base de todos los tipos de evidencia.
Cuanta mayor evidencia de validez de contenido, de validez de criterio y de validez de constructo
tenga un instrumento de medición, éste se acercará más a representar las variables que pretende medir.
Validez total = validez de contenido + validez de criterio + validez de constructo
Relación entre la confiabilidad y la validez
Un instrumento de medición puede ser confiable, pero no necesariamente válido (un aparato, por
ejemplo, quizá sea consistente en los resultados que produce, pero puede no medir lo que pretende).
Por ello es requisito que el instrumento de medición demuestre ser confiable y válido.
La validez y la confiabilidad no se De no ser así, los resultados de la investigación no deben tomarse en serio.
asumen, se prueban. Para ampliar este comentario, recurriremos a la analogía de Bostwick y Kyte
(2005, pp. 108-109). Supongamos que vamos a probar un arma con tres tiradores.
Cada uno debe realizar cinco disparos, entonces:
Tirador 1 Sus disparos no impactan en el centro del blanco y se encuentran diseminados por
todo el blanco.
Tirador 2 Tampoco impacta en el centro del blanco, aunque sus disparos se encuentran cercanos
entre sí, fue consistente, mantuvo un patrón.
Tirador 3 Los disparos se encuentran cercanos entre sí e impactaron en el centro del blanco.
Sus resultados podrían visualizarse como en la figura 9.3, en la cual se vinculan la confiabilidad y
la validez.
Figura 9.3 Representación de la confiabilidad y la validez.
Tirador 1 Tirador 2 Tirador 3
Ni confiabilidad ni validez Confiabilidad, pero no validez Confiabilidad y validez
www.elosopanda.com | jamespoetrodriguez.com
¿Qué requisitos debe cubrir un instrumento de medición? 205
Factores que pueden afectar la confiabilidad y la validez
Hay diversos factores que llegan a afectar la confiabilidad y la validez de los instrumentos de recolec-
ción de los datos e introducen errores en la medición.1 A continuación se mencionarán los más
comunes.
La improvisación. Algunas personas creen que elegir un instrumento de medición o desarrollar-
lo es algo que puede tomarse a la ligera. Incluso, ciertos profesores piden a los alumnos que constru-
yan instrumentos de medición de un día para otro o, lo que es igual, de una semana a otra, lo cual
habla del poco o nulo conocimiento del proceso de elaboración de instrumentos de recolección de los
datos. Esta improvisación genera casi siempre instrumentos poco válidos o confiables.
Aun a los investigadores experimentados les toma tiempo desarrollar un instrumento de medi-
ción. Además, para construirlo se requiere conocer muy bien la variable que se pretende medir, así
como la teoría y la práctica que la sustentan.
Cuando las mediciones se refieren a seres humanos hay otros factores:
a) Utilizar instrumentos desarrollados en el extranjero que no han sido validados en nuestro contexto:
cultura y tiempo. Traducir un instrumento, aun cuando adaptemos los términos a nuestro len-
guaje y los contextualicemos, no es ni remotamente una validación. Constituye un primer y
necesario paso, aunque sólo es el principio. En el caso de traducciones, es importante verificar
que los términos centrales tengan referentes con el mismo significado —o alguno muy pareci-
do— en la cultura en la que se va a utilizar dicho instrumento (vincular términos entre la cultu-
ra de origen y la cultura destinataria). A veces se traduce, se obtiene una versión y ésta, a su vez,
se vuelve a traducir al idioma original (traducción inversa).
Por otra parte, existen instrumentos que fueron validados en nuestro contexto, pero hace
mucho tiempo. Hay instrumentos en los que hasta el lenguaje “nos suena anticuado”. Las cultu-
ras, los grupos y las personas cambian; y esto debemos tomarlo en cuenta al elegir o desarrollar
un instrumento de medición.
b) Usar instrumentos inadecuados para las personas a quienes se les aplica: no son empáticos. Utilizar
un lenguaje muy elevado para los sujetos respondientes, no tomar en cuenta diferencias de géne-
ro, edad, conocimientos, memoria, nivel ocupacional y educativo, motivación para contestar,
capacidades de conceptualización y otras diferencias en los participantes, son errores que llegan a
afectar la validez y la confiabilidad. Este error ocurre a menudo cuando los instrumentos deben
administrarse a niños. Asimismo, hay grupos de la población que requieren instrumentos apro-
piados para ellos, tal es el caso de las personas con capacidades distintas. En la actualidad se han
desarrollado diversas pruebas que las toman en cuenta (por ejemplo, pruebas en sistema Braille
para individuos con capacidades visuales distintas o pruebas orales para personas que no pueden
escribir). Otro ejemplo son los indígenas o inmigrantes de otras culturas, pues en ocasiones se les
aplican instrumentos en un idioma o contexto que no es el suyo.
Quien realiza una investigación debe adaptarse siempre a los participantes y no al revés, ya
que es necesario brindarles todo tipo de facilidades. Si éste es el caso, se sugiere consultar a
Mertens y McLaughlen (2004), en cuyo libro hay un capítulo dedicado a la recolección de infor-
mación de personas con capacidades diferentes o de culturas especiales, y a Eckhardt y Anastas
(2007). Asimismo, es recomendable revisar la página web de alguna asociación internacional
como la American Psychological Association.
c) Cuestiones vinculadas con los estilos personales de los participantes (Bostwick y Kyte, 2005) como:
deseabilidad social (tratar de dar una impresión muy favorable a través de las respuestas), tenden-
cia a asentir con respecto a todo lo que se pregunta, dar respuestas inusuales o contestar siempre
negativamente.
1 Se ha omitido intencionalmente la exposición de los errores sistemáticos y no sistemáticos que afectan la confiabilidad y la validez, con
objeto de simplificar al lector las explicaciones. Un comentario se incluye en el centro de recursos en línea en: Material complementario S
Capítulos S Capítulo 7 “Recolección de los datos cuantitativos: segunda parte”.
www.elosopanda.com | jamespoetrodriguez.com
206 Capítulo 9 Recolección de datos cuantitativos
d) Condiciones en las que se aplica el instrumento de medición. El ruido, la inadecuada iluminación,
el frío (por ejemplo, en una encuesta de casa en casa), un instrumento demasiado largo o tedioso,
una encuesta telefónica después de que algunas compañías han utilizado el mercadeo telefónico
en exceso y a destiempo (promocionar servicios a las 7 a.m. de un domingo o después de las 11
p.m. entre semana) son cuestiones que llegan a afectar negativamente la validez y la confiabilidad,
al igual que si el tiempo que se brinda para responder al instrumento es inapropiado. Por lo
común en los experimentos se cuenta con instrumentos de medición más largos y complejos que
en los diseños no experimentales. Por ejemplo, en una encuesta pública sería muy difícil aplicar
una prueba larga o compleja.
Otro factor que se encuentra en todo tipo de instrumentos en cualquier campo de conocimiento
es la falta de estandarización: que las instrucciones no sean las mismas para todos los participantes, que
el orden de las preguntas sea distinto para algunos individuos, que los instrumentos de observación
no resulten equivalentes, que el procedimiento para administrar la medición no sea exactamente el
mismo para todos los casos (por ejemplo, al medir la presión arterial, que a unos pacientes se les tome
después de un tiempo de relajación y a otros, no; o bien, que al pesar ciertas piezas no se utilice la
misma báscula). Este elemento también se vincula con la objetividad.
Aspectos mecánicos como que si el instrumento es escrito, que no sean legibles las instrucciones,
falten páginas, no haya espacio adecuado para contestar o no se comprendan las instrucciones, tam-
bién influyen de manera desfavorable. Lo mismo pasaría con un aparato mal calibrado.
Con respecto a la validez de constructo dos factores pueden afectarla significativamente:
a) La estrechez del contenido, es decir, que se excluyan dimensiones importantes de la variable o las
variables medidas.
b) La amplitud exagerada, donde el riesgo es que el instrumento contenga excesiva intrusión de
otros constructos similares.
Muchos de los errores se pueden evitar mediante una adecuada revisión de la literatura, que nos
permite seleccionar las dimensiones apropiadas de las variables del estudio, otros criterios para compa-
rar los resultados de nuestro instrumento, teorías de respaldo, instrumentos de dónde elegir, etcétera.
Objetividad
Es difícil lograr la objetividad, particularmente en el caso de las ciencias sociales. En ciertas ocasiones
se alcanza mediante el consenso o mediciones múltiples. Al tratarse de cuestiones físicas las percepcio-
nes suelen compartirse (por ejemplo, la mayoría de las personas estarían de acuerdo en que el agua de
mar contiene sal o los rayos del Sol queman), pero en temas que tienen que ver con la conducta
humana como los valores, las atribuciones y las emociones, el consenso es más complejo. Imaginemos
que 10 observadores deben ver una película y calificarla como “muy violenta”, “violenta”, “neutral”,
“poco violenta” y “nada violenta”. Tres personas indican que es muy violenta, tres que es violenta y
cuatro la evalúan como neutral; es difícil responder qué tan violenta es la película. O bien, ¿quién fue
mejor compositor: Mozart, Beethoven o Bach? Todo es relativo. Sin embargo, la objetividad aumenta
al reducirse la incertidumbre (Unrau, Grinnell y Williams, 2011). Desde luego, la certidumbre total
no existe en ninguna ciencia; el conocimiento es aceptado como verdadero, hasta que
nueva evidencia demuestra lo contrario.
Objetividad del instrumento Grado en En un instrumento de medición, la objetividad se refiere al grado en que éste es
que el instrumento es o no permeable a o no permeable a la influencia de los sesgos y tendencias del investigador o investiga-
la influencia de los sesgos y tendencias dores que lo administran, califican e interpretan (Mertens, 2010). Investigadores
de los investigadores que lo adminis- racistas o machistas quizás influyan negativamente por su sesgo contra un grupo étni-
tran, califican e interpretan. co o el género femenino. Lo mismo podría suceder con las tendencias ideológicas,
políticas, religiosas o la orientación sexual. En este sentido, los aparatos y sistemas calibrados (por
ejemplo, una pistola láser para medir la velocidad de un automóvil) son más objetivos que otros siste-
mas que requieren cierta interpretación (como un detector de mentiras) y éstos, a su vez, más objetivos
que las pruebas estandarizadas, las cuales son menos subjetivas que las pruebas proyectivas.
www.elosopanda.com | jamespoetrodriguez.com
¿Cómo se sabe si un instrumento de medición es confiable y válido? 207
La objetividad se refuerza mediante la estandarización en la aplicación del instrumento (mismas
instrucciones y condiciones para todos los participantes) y en la evaluación de los resultados; así como
al emplear personal capacitado y experimentado en el instrumento. Por ejemplo, si se utilizan obser-
vadores, su proceder en todos los casos debe ser lo más similar posible y su entrenamiento tendrá que
ser profundo y adecuado.
Los estudios cuantitativos buscan que la influencia de las características y las tendencias del inves-
tigador se reduzca al mínimo posible, lo que insistimos es un ideal, pues la investigación siempre es
realizada por seres humanos.
La validez, la confiabilidad y la objetividad no deben tratarse de forma separada. Sin alguna de las
tres, el instrumento no es útil para llevar a cabo un estudio.
¿Cómo se sabe si un instrumento de medición
es confiable y válido?
En la práctica es casi imposible que una medición sea perfecta y generalmente se tiene un grado de error.
Desde luego, se trata de que este error sea el mínimo posible, por lo cual la medición de cualquier
fenómeno se conceptualiza con la siguiente fórmula básica:
X=t+e
Donde X representa los valores observados (resultados disponibles); t, los valores verdaderos; y e,
el grado de error en la medición. Si no hay error de medición (e es igual a cero), el valor observado y el
verdadero son equivalentes. Esto puede verse claramente así:
X=t+0
X=t
Esta situación representa el ideal de la medición. Cuanto mayor sea el error al medir, el valor que
observamos (en el cual nos basamos) se alejará más del valor real o verdadero. Por ejemplo, si medi-
mos la motivación de un individuo y la medición está contaminada por un grado de error considera-
ble, la motivación registrada por el instrumento será bastante diferente de la motivación real de esa
persona. Por ello, es importante que el error se reduzca lo más posible. Pero, ¿cómo sabemos el grado
de error que tenemos en una medición? Al calcular la confiabilidad y la validez.
Cálculo de la confiabilidad o fiabilidad
Hay diversos procedimientos para calcular la confiabilidad de un instrumento de medición. Todos
utilizan procedimientos y fórmulas que producen coeficientes de fiabilidad. La mayoría oscilan entre
cero y uno, donde un coeficiente de cero significa nula confiabilidad y uno representa un máximo de
confiabilidad (fiabilidad total, perfecta). Cuanto más se acerque el coeficiente a cero, mayor error
habrá en la medición. Esto se ilustra en la figura 9.4.
Figura 9.4 Interpretación de un coeficiente de confiabilidad. Elevada Total o perfecta
Nula Muy baja Baja Regular Aceptable 1
0 100% de confiabilidad
0% de (no hay error)
confiabilidad
en la medición
(está contaminada
de error)
www.elosopanda.com | jamespoetrodriguez.com
208 Capítulo 9 Recolección de datos cuantitativos
Los procedimientos más utilizados para determinar la confiabilidad mediante un coeficiente son:
1) medida de estabilidad (confiabilidad por test-retest), 2) método de formas alternativas o paralelas, 3)
método de mitades partidas (split-halves) y 4) medidas de consistencia interna. Estos procedimientos no
se detallan en esta sección, sino que se explican en el capítulo 10, “Análisis de los datos cuantitativos”,
debido a que requieren conocimientos de ciertos conceptos estadísticos.2 Simplemente se comentará
su interpretación con la medida de congruencia interna denominada “coeficiente alfa Cronbach”, que
tal vez es la más utilizada.
En el caso de mediciones sociales, supongamos que una investigadora desarrolló un instrumento
para medir el grado de “amor romántico” entre parejas de jóvenes universitarios, el cual se fundamen-
tó en cuatro de las herramientas tal vez más conocidas para ello: la medida de Rubin sobre el amar y
el vincularse con los demás, la escala sobre actitudes hacia el amor, la medida sobre el amor apasiona-
do y la escala del amor triangular (Graham y Christiansen, 2009). Para estimar la confiabilidad de su
instrumento lo debe aplicar a su muestra y sobre la base de los resultados calcular tal coeficiente.
Imaginemos que obtiene un valor alfa Cronbach de 0.96, que es muy elevado, lo que significa que su
medida del “amor romántico” es sumamente confiable, esto se representa en la figura 9.5.
Figura 9.5 Interpretación de un coeficiente de confiabilidad sobre un instrumento que mide el “amor
romántico”.
Nula Muy baja Baja Regular Aceptable Elevada Perfecta
0 0.96 1
Sumamente
confiable
La confiabilidad varía de acuerdo con el número de indicadores específicos o ítems3 que incluya
el instrumento de medición. Cuantos más ítems haya, mayor tenderá a ser ésta, lo cual resulta lógico.
Veámoslo con un ejemplo cotidiano: si se desea probar qué tan confiable o constante es la lealtad de
un amigo hacia nuestra persona, cuantas más pruebas le pongamos, su fiabilidad será mayor. Claro
está que demasiados ítems provocarán cansancio en los participantes.
Cada vez que se administra un instrumento de medición debe calcularse la confiabilidad, al igual
que evaluarse la evidencia sobre la validez.
Cálculo de la validez
Con respecto a la validez de contenido, primero es necesario revisar cómo han medido la variable
otros investigadores. Y, con base en dicha revisión, elaborar un universo de ítems o reactivos posibles
para medir la variable y sus dimensiones (el universo debe ser lo más exhaustivo posible). Después, se
consulta a investigadores familiarizados con la variable para ver si el universo es verdaderamente
exhaustivo. Se seleccionan los ítems bajo una cuidadosa evaluación, uno por uno. Y si la variable está
compuesta por diversas dimensiones o facetas, se extrae una muestra probabilística de reactivos, ya sea
al azar o estratificada (cada dimensión constituiría un estrato). Se administran los ítems, se correlacio-
nan las puntuaciones de éstos entre sí (tiene que haber correlaciones altas, en especial entre ítems que
miden una misma dimensión, pero teniendo cuidado que sean capaces de discriminar entre partici-
pantes o casos) (Punch, 2009); y se hacen estimaciones estadísticas para ver si la muestra es representa-
tiva. Para calcular la validez de contenido son necesarios varios coeficientes. Éste sería un procedimiento
2 Tales procedimientos se aplican a instrumentos o sistemas constituidos por escalas con varios reactivos, indicadores o mediciones (medicio-
nes compuestas).
3 Un ítem es la unidad mínima que compone una medición; es un reactivo que estimula una respuesta en un sujeto (por ejemplo, una pre-
gunta, una frase, una lámina, una fotografía o un objeto de descripción).
www.elosopanda.com | jamespoetrodriguez.com
¿Qué procedimiento se sigue para construir un instrumento de medición? 209
ideal. Pero, como veremos más adelante, a veces no se calculan estos coeficientes, sino que se seleccio-
nan los ítems mediante un proceso que asegura la representatividad (no de manera estadística sino
conceptual).
La validez de criterio se estima al correlacionar la medición con el criterio externo (puntuaciones
del instrumento frente a las puntuaciones en el criterio), y este coeficiente se toma como coeficiente
de validez (Bohrnstedt, 1976). Que podría representarse con el ejemplo de la figura 9.6.4
Figura 9.6 Ejemplo para la estimación de la validez de criterio.
Medición Criterio
Instrumento para medir la Correlación Persistencia en la tarea
motivación intrínseca (horas extra sin recompensa
extrínseca)
La validez de constructo suele determinarse mediante procedimientos de análisis estadístico mul- 5
tivariado (“análisis de factores”, “análisis discriminante”, “regresiones múltiples”, etc.), los cuales
podrá bajar del centro de recursos en línea en: Material complementario S Capítulos S Capítulo 8:
“Análisis estadístico: segunda parte”.
¿Qué procedimiento se sigue para construir un instrumento
de medición?
Existen diversos tipos de instrumentos de medición, cada uno con características diferentes. Sin
embargo, el procedimiento general para construirlos y aplicarlos es semejante. Éste se resume median-
te etapas en el diagrama de la figura 9.7 y corresponde a la parte del plan de recolección que contesta
a la pregunta: ¿a través de qué método vamos a recolectar los datos? Y cabe señalar que cada etapa o
fase no se detalla en este capítulo, sino en el centro de recursos en línea en: Material complementario
S Capítulos S Capítulo 7: “Recolección de los datos cuantitativos: segunda parte”.
Figura 9.7 Proceso para construir un instrumento de medición.
FASE 1 FASE 2 FASE 3
Redefiniciones fundamentales Revisión enfocada Identificación del dominio de las variables a
de la literatura medir y sus indicadores
En esta etapa se deberán reevaluar
las variables de la investigación (ver Este paso debe servir para encontrar mediante Se trata de identificar y señalar con precisión
si se mantienen o modifican), el lugar la revisión de la literatura, los instrumentos los componentes, dimensiones o factores que
específico donde se recabarán los datos, o sistemas de medición utilizados en otros teóricamente integran la variable. De igual
el propósito de tal recolección, quiénes y estudios anteriores para medir las variables manera se deben establecer los indicadores
cuándo (momento) van a ser medidos, las de interés, lo cual ayudará a identificar qué de cada dimensión.
definiciones operacionales y el tipo de datos herramientas pueden ser de utilidad.
que se quieren obtener (respuestas verbales,
respuestas escritas, conductas observables,
valores de una escala, etcétera).
(continúa)
4 Las pruebas de correlación se presentan en el siguiente capítulo: “Análisis de los datos cuantitativos”.
www.elosopanda.com | jamespoetrodriguez.com
210 Capítulo 9 Recolección de datos cuantitativos
Figura 9.7 (continuación)
FASE 6 FASE 5 FASE 4
Prueba piloto Construcción del instrumento Toma de decisiones clave
Esta fase consiste en administrar el La etapa implica la generación de todos En esta parte se deberán tomar tres decisiones importantes
instrumento a una pequeña muestra los ítems o reactivos, indicadores y/o que tienen que ver con el instrumento o sistema de
de casos para probar su pertinencia y categorías del instrumento, así como medición:
eficacia (incluyendo instrucciones), así determinar sus niveles de medición,
como las condiciones de la aplicación codificación e interpretación. 1. Utilizar un instrumento de medición ya elaborado, adap-
y los procedimientos involucrados. A tarlo o desarrollar uno nuevo.
partir de esta prueba se calculan la
confiabilidad y la validez iniciales del 2. Si se trata de uno nuevo, decidir de qué tipo (cuestiona-
instrumento. rio, escala de actitudes, hoja de observación, aparato,
etc.) y cuál será su formato (por ejemplo, en cuestionarios:
tamaño, colores, tipo de fuente, etcétera).
3. Determinar el contexto de administración (autoaplicado,
cara a cara en hogares o lugares públicos, internet, obser-
vación en cámara de Gesell, laboratorio clínico, línea de
producción, etcétera).
FASE 7 FASE 8 FASE 9
Elaboración de la versión final del Entrenamiento del personal que va a Obtener autorizaciones para aplicar el
instrumento o sistema y su procedimiento de administrar el instrumento y calificarlo instrumento
aplicación e interpretación Esta etapa consiste en capacitar y motivar a En esta fase es fundamental conseguir los
las personas que habrán de aplicar y codificar permisos y accesos necesarios para aplicar
Implica la revisión del instrumento o sistema respuestas o valores producidos por el el instrumento o sistema de medición (por
de medición y su forma de administración instrumento o sistema de medición. parte de personas o representantes de
para implementar cambios necesarios (quitar organizaciones que estén implicadas en el
o agregar ítems, ajustar instrucciones, tiempo estudio, incluyendo participantes, si es el
para responder, etc.) y posteriormente caso).
construir la versión definitiva incluyendo un
diseño atractivo.
ANÁLISIS FASE 11 FASE 10
Preparación de los datos para el Administración del instrumento
análisis:
Aplicar el instrumento o sistema
a) Codificarlos. de medición a los participantes o
b) Limpiarlos. casos de la investigación.
c) Insertarlos en una base de datos
(matriz).
Las fases 1 a 7 del diagrama se refieren propiamente al desarrollo del instrumento o sistema de
medición, mientras que las etapas 8 a 11 representan su administración y la preparación de los datos
para su análisis.
Tres cuestiones fundamentales para un instrumento
o sistema de medición
Existen tres cuestiones básicas respecto a las variables que deben considerarse al momento de cons-
truir un instrumento: a) la operacionalización, b) la codificación y c) establecer los niveles de medición.
www.elosopanda.com | jamespoetrodriguez.com
Tres cuestiones fundamentales para un instrumento o sistema de medición 211
La operacionalización: el tránsito de la variable al ítem o valor
El paso de una variable teórica a indicadores empíricos verificables y medibles e ítems o equivalentes
se le denomina operacionalización (Solís, 2013). La operacionalización se fundamenta en la definición
conceptual y operacional de la variable. Su proceso se amplía en el capítulo 7 adicional que se puede
descargar del centro de recursos en línea. Por ahora, se comentará que cuando se construye un instru-
mento, el proceso más lógico para hacerlo es transitar de la variable a sus dimensiones o componentes,
luego a los indicadores y finalmente a los ítems o reactivos y sus categorías. En la tabla 9.2 se dan
ejemplos de este tránsito.
Tabla 9.2 Ejemplo de desarrollo de ítems
Estudio de las preferencias de los jóvenes para divertirse (ejemplo sencillo)5
Variable Dimensión Indicadores Ítems
Preferencia de Actividad nocturna Jerarquía de preferencias de De lunes a jueves, ¿cuál sería tu actividad
actividad para preferida entre actividades de lunes a jueves preferida nocturna para salir con el chico o
salir con semana (aunque algunos comienzan chica que más te gusta? (marcar la que más te
alguien del el fin de semana desde el agrade).
género Actividad nocturna jueves).
opuesto preferida en fin de 1. Salir a cenar a un restaurante.
semana Jerarquía de preferencias de
actividades en viernes y 2. Ir al cine.
sábado.
3. Ir a un bar, “antro”, grill, taberna, pub o
cervecería.
4. Acudir a una cafetería, heladería o a algún
establecimiento en el que sirvan bebidas
no alcohólicas.
5. Ir a bailar a una discoteca, disco o “antro”.
6. Ir a una fiesta privada.
7. Acudir al teatro.
8. Acudir a un concierto.
9. Pasear por un parque, jardín o avenida.
10. Otra (especificar).
Mismas categorías u opciones de respuesta.
Actividad nocturna Jerarquía de preferencias de Mismas categorías u opciones de respuesta.
preferida en actividades en domingo
domingo
Clima Moral Grado en que los miembros • Mis compañeros de trabajo son mis amigos.
de una organización o 5. Totalmente de acuerdo.
organizacional departamento perciben que 4. De acuerdo.
colaboran y cooperan entre 3. Ni de acuerdo ni en desacuerdo.
sí, se apoyan mutuamente y 2. En desacuerdo.
mantienen relaciones de 1. Totalmente en desacuerdo.
amistad y compañerismo.
• En mi trabajo hay mucho compañerismo (mis-
mas opciones de respuesta que el ítem
anterior).
• Siempre que lo necesito mis compañeros de
trabajo me brindan apoyo (mismas opciones
de respuesta).
(continúa)
5 En los ejemplos de la tabla sólo se incluyen unos cuantos ítems o reactivos por cuestiones de espacio, son ejemplos muy resumidos.
www.elosopanda.com | jamespoetrodriguez.com
212 Capítulo 9 Recolección de datos cuantitativos
Tabla 9.2 (continuación)
Investigación sobre el clima organizacional
Variable Dimensión Indicadores Ítems
Autonomía Grado de libertad percibida • En el departamento donde trabajo nos
para tomar decisiones y mantenemos unidos (mismas opciones de
Atribución del realizar el trabajo. respuesta.
desempeño
• La mayoría de las veces en mi departamen-
to compartimos la información más que
guardarla para nosotros (mismas opciones
de respuesta).
• ¿Qué tanto apoyo le brindan sus compañe-
ros cuando usted lo necesita?
5. Total.
4. Bastante.
3. Aceptablemente.
2. Poco.
1. Ninguno.
• En esta empresa tengo libertad para tomar
decisiones que tienen que ver con mi
trabajo.
5. Totalmente de acuerdo.
4. De acuerdo.
3. Ni de acuerdo ni en desacuerdo.
2. En desacuerdo.
1. Totalmente en desacuerdo.
• Mi jefe me da libertad para tomar decisio-
nes que tienen que ver con mi trabajo
(mismas opciones de respuesta que el ítem
anterior.)
Grado de conciencia • En esta empresa todos tratamos de hacer
compartida por desempe- bien nuestro trabajo (mismas opciones de
ñarse con calidad en las respuesta que el ítem anterior.)
tareas laborales, sobre la
base de la cooperación. • En esta empresa todos queremos dar lo
mejor de nosotros en el trabajo (mismas
opciones.)
En ocasiones tenemos menos elementos, por ejemplo, sólo variable, dimensiones e ítems; incluso,
únicamente variable y categorías de un único ítem o escala. Tal sería el caso del género —variable—,
integrada por un ítem solitario —pregunta u observación— y dos categorías: masculino y femenino; o
bien, temperatura —variable— y la lectura de un valor o categoría. Algunas variables son sencillas (un
ítem) y otras compuestas (varias dimensiones, indicadores, ítems y categorías). En el siguiente capítulo
“Análisis de los datos cuantitativos” (en el apartado “Apunte 1”), se discuten las implicaciones de lo
anterior para el análisis estadístico. En el ejemplo de Lee y Guerin (2009) tratado en esta obra, la varia-
ble “satisfacción respecto a la calidad del diseño ambiental del interior del área de trabajo u oficina”,
incluyó la dimensión “satisfacción con respecto al diseño de la oficina”, compuesta por tres indicadores:
a) satisfacción sobre el espacio aprovechable para el trabajo individual y para guardar o almacenar, b)
satisfacción en torno al nivel de privacidad visual y c) satisfacción en relación con la facilidad para
interactuar con compañeros de trabajo; cada uno con uno o varios ítems. Ésta y otras variables fueron
correlacionadas con la variable tipo de oficina, integrada por un ítem con las siguientes categorías:
1. Despacho u oficina privada cerrada.
2. Oficina cerrada compartida con otras personas.
3. Cubículo con paneles altos de metro y medio o más.
4. Cubículo con paneles bajos de menos de metro y medio.
5. Espacio de trabajo en una oficina abierta sin divisiones.
6. Otros.
www.elosopanda.com | jamespoetrodriguez.com
Tres cuestiones fundamentales para un instrumento o sistema de medición 213
Codificación Codificación Significa asignar a los
datos un valor numérico o símbolo
Codificar los datos significa asignarles un valor numérico o símbolo que los represen- que los represente, ya que es
te. Es decir, a las categorías (opciones de respuesta o valores) de cada ítem o variable se necesario para analizarlos cuantitati-
les asignan valores numéricos o signos que tienen un significado. Por ejemplo, si tuvié- vamente.
ramos la variable “género” con sus respectivas categorías, masculino y femenino, a
cada categoría le determinaríamos un valor. Esto podría ser:
Categoría Codificación
(valor asignado)
• Masculino 1
• Femenino 2
Por tanto, Paola Yáñez en la variable género sería 2, Luis Gerardo Vera y Ramón Calderón serían
1, Mabel González Bencosme 2 y así sucesivamente.
Otro ejemplo sería la variable “horas de exposición diaria a la televisión”, que podría codificarse
como se muestra en la tabla 9.3.
Tabla 9.3 Ejemplo de codificación Codificación
(valor asignado)
Categoría
0
— No ve televisión 1
— Menos de una hora 2
— Una hora 3
— Más de una hora, pero menos de dos 4
— Dos horas 5
— Más de dos horas, pero menos de tres 6
— Tres horas 7
— Más de tres horas, pero menos de cuatro 8
— Cuatro horas 9
— Más de cuatro horas
En el primer ejemplo de la tabla 9.2, la respuesta a la pregunta: De lunes a jueves, ¿cuál sería tu
actividad nocturna preferida para salir con el chico o chica que más te gusta?, la codificación era con
números (1 = salir a cenar a un restaurante; 2 = ir al cine; 3 = ir a un bar, “antro”, grill, taberna, pub
o cervecería; 4 = acudir a una cafetería, heladería o establecimiento en el que sirvan bebidas no alco-
hólicas; 5 = ir a bailar a una discoteca, disco o “antro”; 6 = ir a una fiesta privada; 7 = acudir al teatro;
8 = acudir a un concierto; 9 = pasear por un parque, jardín, avenida, y 10 = otra).
Mientras que en el ítem: “En esta empresa tengo libertad para tomar decisiones que tienen que
ver con mi trabajo”, la codificación era:
5. Totalmente de acuerdo
4. De acuerdo
3. Ni de acuerdo ni en desacuerdo
2. En desacuerdo
1. Totalmente en desacuerdo
Es necesario insistir que cada ítem o variable sencilla deberá tener una codificación (códigos
numéricos o simbólicos) para sus categorías, a esto se le conoce como “precodificación”. Desde luego,
hay veces que un ítem no puede ser codificado a priori (precodificado), porque es muy difícil conocer
cuáles serán sus categorías. Por ejemplo, si en una investigación preguntáramos: ¿qué opina del pro-
grama económico que recientemente aplicó el Gobierno? Las categorías podrían ser muchas más de
www.elosopanda.com | jamespoetrodriguez.com
214 Capítulo 9 Recolección de datos cuantitativos
las que nos imaginemos y resultaría difícil predecir con precisión cuántas y cuáles serían. En tales
situaciones, la codificación se lleva a cabo una vez que se aplica el ítem (a posteriori). Éste es el caso de
algunos ítems que por ahora denominaremos “abiertos”.
La codificación es necesaria para analizar cuantitativamente los datos (aplicar análisis estadístico).
A veces se utilizan letras o símbolos en lugar de números (*, A, Z). La codificación puede o no incluir-
se en el instrumento de medición, veámoslo con un ejemplo de pregunta:
Pregunta precodificada Pregunta no precodificada
¿Tiene usted novia? ¿Tiene usted novia?
1 Sí Sí
0 No No
Asimismo, es muy importante indicar el nivel de medición de cada ítem y, por ende, el de las
variables, porque es parte de la codificación y dependiendo de dicho nivel se selecciona uno u otro
tipo de análisis estadístico (por ejemplo, la prueba estadística para correlacionar dos variables de inter-
valo es muy distinta de la prueba para correlacionar dos variables ordinales). De esta forma, es nece-
sario hacer una relación de variables, ítems y niveles de medición.
Niveles de medición
Existen cuatro niveles de medición ampliamente conocidos.6
1. Nivel de medición nominal. En este nivel hay dos o más categorías del ítem o la variable. Las cate-
gorías no tienen orden ni jerarquía. Lo que se mide (objeto, persona, etc.) se coloca en una u otra
categoría, lo cual indica tan sólo diferencias respecto de una o más características. Por ejemplo, la
variable “género” de la persona posee sólo dos categorías: masculino y femenino. Ninguna de las
categorías implica mayor jerarquía que la otra. Las categorías únicamente reflejan diferencias en
la variable. No hay orden de mayor a menor.
Masculino
Sexo
Femenino
Si les asignamos una etiqueta o un símbolo a cada categoría, esto identificará exclusivamente
a la categoría. Por ejemplo:
* = Masculino
z = Femenino
Si usamos numerales, es lo mismo:
1 = Masculino 2 = Masculino
es igual a
2 = Femenino 1 = Femenino
Los números utilizados en este nivel de medición tienen una función puramente de clasifi-
cación y no se pueden manipular de manera aritmética. Por ejemplo, la afiliación religiosa es una
variable nominal; si pretendiéramos operarla de forma aritmética se presentarían situaciones tan
ridículas como ésta:
6 Para ampliar este tema se sugiere Issel (2014), Wolf (2008), Stoutenborough (2008), Dykema, Blixt y Stevenson (2008); Scanlan (2008),
Gershkoff (2008) y Rasmussen (2006).
www.elosopanda.com | jamespoetrodriguez.com
Tres cuestiones fundamentales para un instrumento o sistema de medición 215
1 = Católico 1+2=3
2 = Judío
3 = Protestante ¿Un católico + un judío = un protestante?
4 = Musulmán (No tiene sentido)
5 = Otros
Las variables nominales pueden incluir dos categorías (dicotómicas), o bien, tres o más cate-
gorías (categóricas). Ejemplos de variables nominales dicotómicas serían el género, el veredicto
de un jurado (culpable-no culpable) y el tipo de escuela a la que se asiste (privada-pública); y
como ejemplos de variables nominales categóricas tendríamos la afiliación política (partido A,
partido B, etc.), la licenciatura estudiada, el grupo étnico, el departamento, la provincia o el
estado de nacimiento, la clase de material de construcción (“no” su resistencia, que sería otra
variable), tipo de medicamento administrado (“no” la dosis, que sería una variable distinta), blo-
ques de mercado (asiático, latinoamericano, comunidad europea, etc.) y el canal de televisión
preferido.
2. Nivel de medición ordinal. En este nivel hay varias categorías, pero además mantienen un orden
de mayor a menor. Las etiquetas o los símbolos de las categorías sí indican jerarquía. Por ejemplo,
el prestigio ocupacional en Estados Unidos se ha medido por diversas escalas que reordenan las
profesiones de acuerdo con su prestigio, por ejemplo:7
Valor en escala Profesión
90 Ingeniero químico
80 Científico de ciencias naturales (excluyendo la química)
60 Actor común
50 Operador de estaciones eléctricas de potencia
02 Manufacturero de tabaco
Los números (símbolos de categorías) definen posiciones, en el ejemplo: 90 es más que 80,
80 más que 60, 60 más que 50 y así sucesivamente. Sin embargo, las categorías no están ubicadas
a intervalos iguales (no hay un intervalo común). No podríamos decir con exactitud que entre un
actor (60) y un operador de estaciones eléctricas (50) existe la misma distancia en prestigio que
entre un científico de ciencias naturales (80) y un ingeniero químico (90). Al parecer, en ambos
casos la distancia es 10, pero no es una distancia real. Otra escala8 clasificó el prestigio de dichas
profesiones de la siguiente manera:
Valor en escala Profesión
98 Ingeniero químico
95 Científico de ciencias naturales (excluyendo la química)
84 Actor común
78 Operador de estaciones eléctricas de potencia
13 Manufacturero de tabaco
Aquí la distancia entre un actor (84) y un operador de estaciones (78) es de seis, y la distan-
cia entre un ingeniero químico (98) y un científico de ciencias naturales (95) es de tres. Otro
ejemplo sería la variable posición jerárquica en la empresa:
Presidente 10 Jefe 5
Vicepresidente 9 Empleado A 4
Director general 8 Empleado B 3
Gerente de área 7 Empleado C 2
Subgerente o superintendente 6 Intendencia 1
7 Duncan (1977). La escala incluye múltiples profesiones, se presentan sólo algunas.
8 Nam et al. (1965) y Nam (1983). Para escalas más complejas y actuales, véase Organización Internacional del Trabajo (2012).
www.elosopanda.com | jamespoetrodriguez.com
216 Capítulo 9 Recolección de datos cuantitativos
Sabemos que el presidente (10) es más que el vicepresidente (9); éste, más que el director
general (8); a su vez este último, más que el gerente (7) y así sucesivamente; pero no se precisa en
cada caso cuánto más. Tampoco pueden utilizarse las operaciones aritméticas básicas: no podría-
mos decir que 4 (empleado A) + 5 (jefe) = 9 (vicepresidente), ni que 10 (presidente) ÷ 5 (jefe) =
2 (empleado C). Sería absurdo, no tiene sentido. Otros ejemplos de este nivel serían: la medición
por rangos de las preferencias de marcas de bebidas refrescantes con gas (refrescos o sodas), auto-
percepción del grado de dolor de cabeza, percepción de sabores respecto a un platillo y jerarqui-
zación de valores (en primer lugar, en segundo lugar, en tercero).
3. Nivel de medición por intervalos. Además del orden o la jerarquía entre categorías, se establecen
intervalos iguales en la medición. Las distancias entre categorías son las mismas a lo largo de toda
la escala, por lo que hay un intervalo constante, una unidad de medida.
Figura 9.8 Escala con intervalos iguales entre categorías.
Intervalo constante
0 1 2 3 4 5 6 7 8 9 10
Por ejemplo, en una prueba de resolución de problemas matemáticos (30 problemas de igual
dificultad). Si Ana Cecilia resolvió 10, Laura resolvió 20 y Abigail, 30. La distancia entre Ana
Cecilia y Laura es igual a la distancia entre Laura y Abigail.
Sin embargo, en este nivel de medición el cero (0) es arbitrario, no es real, ya que se asigna
arbitrariamente a una categoría el valor de cero y a partir de ésta se construye la escala. Un ejem-
plo clásico en ciencias naturales es la temperatura, que puede medirse en grados centígrados y
Fahrenheit: el cero es arbitrario, pues no implica que en realidad haya cero (ninguna) temperatu-
ra (incluso en ambas escalas el cero es diferente).
Cabe agregar que diversas mediciones en el estudio del comportamiento humano no son
verdaderamente de intervalo (por ejemplo, escalas de actitudes, pruebas de inteligencia y de otros
tipos); pero para algunos autores se acercan a este nivel y se suele tratarlas como si fueran medi-
ciones de intervalo.9 Esto se hace porque este nivel de medición permite utilizar las operaciones
aritméticas básicas y diversos métodos estadísticos, que de otro modo no se utilizarían. Aunque
algunos investigadores no están de acuerdo con suponer tales mediciones como si fueran de
intervalo. El producto interno bruto o producto nacional bruto estaría en este estadio.
4. Nivel de medición de razón. En este nivel, además de tenerse todas las características del nivel de
intervalos (unidad de medida común, intervalos iguales entre las categorías y aplicación de ope-
raciones aritméticas básicas y sus derivaciones), el cero es real y absoluto (no es arbitrario). Cero
absoluto implica que hay un punto en la escala donde está ausente o no existe la propiedad medi-
da (véase la figura 9.9).
Figura 9.9 Ejemplo de escala para el nivel de medición de razón.
0 1 2 3 4 5 6 7 8 9 10
El cero es real
Ejemplos de estas mediciones serían la exposición a la televisión (en minutos), el número de
hijos, las ventas de un producto, los metros cuadrados de construcción, escala de temperatura de
Kelvin, ingresos en una unidad monetaria (alguien puede tener cero ingresos), consumo de un
medicamento específico, etcétera.
9 Este comentario nos remite a una polémica que se comentará más adelante en el tema de la escala de Likert.
www.elosopanda.com | jamespoetrodriguez.com
¿De qué tipos de instrumentos de medición o recolección de datos cuantitativos disponemos en la investigación? 217
¿De qué tipos de instrumentos de medición o recolección 4
de datos cuantitativos disponemos en la investigación?
En la investigación disponemos de múltiples tipos de instrumentos para medir las variables de interés
y en algunos casos llegan a combinarse varias técnicas de recolección de los datos. A continuación
describimos brevemente las más usuales.
Los instrumentos que serán revisados en este capítulo son: cuestionarios10 y escalas de actitudes,
mencionando a otros. En el capítulo adicional 7, “Recolección de los datos cuantitativos, segunda
parte”, que se puede descargar en el centro de recursos en línea, se comentan los siguientes: registros
del contenido (análisis de contenido) y observación cuantitativa, pruebas estandarizadas, recolección
de información factual e indicadores (análisis de datos secundarios de registros públicos y documen-
tación) y metaanálisis, así como otras clases de mediciones. Los metodólogos de cada ciencia y disci-
plina han desarrollado una gran diversidad de instrumentos y procedimientos, algunos de los cuales
puede buscarlos el lector en los manuales y ejemplos del centro de recursos (http://www.mhhe.com/
he/hmi6e).
La codificación y la preparación de los datos obtenidos se discutirán después de presentar los
principales instrumentos de medición.
Cuestionarios 4
En fenómenos sociales, tal vez el instrumento más utilizado para recolectar los datos
es el cuestionario. Un cuestionario consiste en un conjunto de preguntas respecto de Cuestionario Conjunto de preguntas
una o más variables a medir (Chasteauneuf, 2009). Debe ser congruente con el plan- respecto de una o más variables que
teamiento del problema e hipótesis (Brace, 2013). se van a medir.
Los cuestionarios se utilizan en encuestas de todo tipo (por ejemplo, para calificar
el desempeño de un gobierno, conocer las necesidades de hábitat de futuros compradores de viviendas
y evaluar la percepción ciudadana sobre ciertos problemas como la inseguridad). Pero también, se
implementan en otros campos. Por ejemplo, un ingeniero en minas usó un cuestionario como herra-
mienta para que expertos de diversas partes del mundo aportaran opiniones calificadas con el fin de
resolver ciertas problemáticas de producción.
Ahora, comentaremos primero sobre las preguntas y luego sobre las características deseables de
este tipo de instrumento, así como los contextos en los cuales se pueden administrar los cuestionarios.
¿Qué tipos de preguntas se pueden elaborar? 5
El contenido de las preguntas de un cuestionario es tan variado como los aspectos que mide.
Básicamente se consideran dos tipos de preguntas: cerradas y abiertas.
Preguntas cerradas Preguntas cerradas Son aquellas que
contienen opciones de respuesta
Las preguntas cerradas contienen categorías u opciones de respuesta que han sido previamente delimitadas. Resultan
previamente delimitadas. Es decir, se presentan las posibilidades de respuesta a los más fáciles de codificar y analizar.
participantes, quienes deben acotarse a éstas. Pueden ser dicotómicas (dos posibilida-
des de respuesta) o incluir varias opciones de respuesta. Ejemplos de preguntas cerra-
das dicotómicas serían:
¿Estudia usted ¿Durante la semana pasada vio la final de
actualmente? la Liga de Campeones de Europa?
( ) Sí ( ) Sí
( ) No ( ) No
10 Las entrevistas se plantean como un contexto en el cual pueden ser administrados los cuestionarios.
www.elosopanda.com | jamespoetrodriguez.com