The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.
Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by nnparrag, 2022-07-20 10:23:23

Ref MI Hernández, Fernández, Baptista

Ref MI Hernández, Fernández, Baptista

Escalas para medir las actitudes 259

Por ejemplo:

sabroso: _______:_______:_______:_______:_______:_______:_______: insípido
7654321

Pasos para integrar la versión final

Para integrar la versión final de la escala se deben llevar a cabo los siguientes pasos:

1. Generamos una lista de adjetivos bipolares exhaustiva y aplicable al objeto de actitud a medir. De ser
posible, resulta conveniente que se seleccionen adjetivos utilizados en investigaciones similares a
la nuestra (contextos parecidos).

2. Construimos una versión preliminar de la escala y la administramos a un grupo de participantes a
manera de prueba piloto.

3. Correlacionamos las respuestas de los intervinientes para cada par de adjetivos o ítems. Así, correlacio-
namos un ítem con todos los demás (cada par de adjetivos frente al resto).

4. Calculamos la confiabilidad y la validez de la escala total (todos los pares de adjetivos).
5. Seleccionamos los ítems que presenten correlaciones significativas y discriminen entre casos con los demás

ítems. Naturalmente, si hay confiabilidad y validez, estas correlaciones serán significativas.
6. Desarrollamos la versión final de la escala.

La escala definitiva se califica de igual manera que la de Likert: sumando las puntuaciones obteni-
das respecto de cada ítem o par de adjetivos. La figura 9.16 es un ejemplo de ello.

sabroso _________:_____X____:_________:_________:_________:_________:_________: insípido

rico _____X____:_________:_________:_________:_________:_________:_________: pobre

suave _________:_____X____:_________:_________:_________:_________:_________: áspero

balanceado _________:_____X____:_________:_________:_________:_________:_________: desbalanceado

Valor = 6 + 7 + 6 + 6 = 25
Figura 9.16 Ejemplo de cómo calificar un diferencial semántico.

Su interpretación depende del número de ítems o pares de adjetivos. Asimismo, en ocasiones se
califica el promedio obtenido en la escala total.

⎛ puntuación total ⎞
⎜ número de ítems ⎟
⎝ ⎠

Se pueden utilizar distintas escalas o diferenciales semánticos para medir actitudes hacia varios
objetos. Por ejemplo, es posible medir con cuatro pares de adjetivos la actitud hacia el candidato “A”,
con otros tres pares de adjetivos la actitud respecto de su plataforma ideológica, y con otros seis pares
de adjetivos la actitud hacia su partido político. Tenemos tres escalas, cada una con distintos pares de
adjetivos para medir la actitud en relación con tres diferentes conceptos (“objetos de actitud”).

El diferencial semántico es una escala de medición ordinal, aunque es común que se le trabaje
como si fuera de intervalo (Key, 1997), por las mismas razones de Likert.

www.FreeLibros.com

260 Capítulo 9 Recolección de los datos cuantitativos

Escalograma de Guttman

Escalograma de Guttman Técnica El escalograma de Guttman es otra técnica para medir las actitudes y al igual que Likert
para medir las actitudes que al igual se fundamenta en afirmaciones o juicios respecto del concepto u objeto de actitud, ante

que Likert se fundamenta en juicios, los cuales los participantes deben externar su opinión seleccionando uno de los puntos

ante los cuales los participantes deben o categorías de la escala respectiva. Una vez más, a cada categoría se le otorga un valor
externar su opinión seleccionando uno numérico. Así, el participante obtiene una puntuación respecto de la afirmación y al
de los puntos o categorías de la escala final su puntuación total, sumando las puntuaciones obtenidas en relación con todas las
respectiva.

afirmaciones.

La diferencia con el método de Likert es que las frases tienen diferentes intensidades (se escalan

por tal intensidad), por ejemplo, la siguiente afirmación en relación con el aborto (actitud evaluada):

“si en estos momentos me embarazara, jamás abortaría”; es más intensa que esta otra: “si una de mis

mejores amigas se embarazara, nunca le recomendaría abortar”, y a su vez, esta última resulta más

intensa que la afirmación: “si una compañera del salón de clases se embarazara, probablemente no le

recomendaría abortar”. Es decir, se basa en el principio de que algunos ítems indican en mayor medi-

da la fuerza o intensidad de la actitud.

Por cuestiones de espacio, el escalograma de Guttman no se comenta en la parte impresa de este

libro, sino en el CD anexo: Material complementario → Capítulos → Capítulo 7: “Recolección de los

datos cuantitativos: segunda parte”.

Otros métodos cuantitativos de recolección de los datos

¿Qué otras maneras existen para recolectar los datos
desde la perspectiva del proceso cuantitativo?

4 En la investigación disponemos de otros métodos para recolectar los datos, tan útiles y fructíferos como
los cuestionarios y las escalas de actitudes, los cuales solamente se enuncian en este capítulo, pero se
comentan con mayor profundidad en el CD anexo: Material complementario → Capítulos → Capítulo
7: “Recolección de los datos cuantitativos: segunda parte”. Entre tales técnicas se encuentran:

1. Análisis de contenido cuantitativo

Es una técnica para estudiar cualquier tipo de comunicación de una manera “objetiva” y sistemática, que
cuantifica los mensajes o contenidos en categorías y subcategorías, y los somete a análisis estadístico.

Sus usos son muy variados, por ejemplo: evaluar el grado de carga de contenido sexual de uno o
varios programas televisivos; estudiar las apelaciones y características de campañas publicitarias (diga-
mos, de perfumes femeninos de costo elevado) en los medios de comunicación colectiva (radio, tele-
visión, periódicos y revistas); comparar estrategias propagandísticas de partidos políticos en internet;
conocer discrepancias ideológicas entre varios periódicos al tratar un tema como el terrorismo interna-
cional; determinar la evolución de cierta clase de pacientes que asisten a psicoterapia al analizar sus
escritos y expresiones verbales; cotejar el vocabulario aprendido por pequeños que se exponen más al
uso de la computadora en comparación con niños que la utilizan menos; conocer y contrastar la posi-
ción de diversos presidentes latinoamericanos en cuanto al problema del desempleo; comparar estilos
de escritores que se señalan como parte de una misma corriente literaria; y/o analizar la calidad y pro-
fundidad de la información presente en internet sobre un virus.

Una investigación de este tipo es la de Guillaume y Bath (2008), quienes estudiaron la cobertura
y el tratamiento que se daba en la prensa británica a la información sobre las vacunas para el saram-
pión, las paperas y la rubéola durante un periodo de dos meses. Hall y Wright (2008) aplicaron el
análisis de contenido para examinar opiniones judiciales.

2. Observación

Este método de recolección de datos consiste en el registro sistemático, válido y confiable de compor-
tamientos y situaciones observables, a través de un conjunto de categorías y subcategorías. Útil, por

www.FreeLibros.com

Otros métodos cuantitativos de recolección de los datos 261

ejemplo, para analizar conflictos familiares, eventos masivos (como la violencia en los estadios de fút-
bol), la aceptación-rechazo de un producto en un supermercado, el comportamiento de personas con
capacidades mentales distintas, etc. Haynes (1978) menciona que es el método más utilizado por
quienes se orientan conductualmente.

Como muestras de este tipo de investigación podemos citar a Regina et al. (2008), quienes utili-
zando una técnica conocida como la lista de verificación de la conducta autista, compararon las obser-
vaciones de profesionales de la salud en torno a los comportamientos autistas de niños brasileños con
las observaciones de sus madres. Asimismo, Franco, Rodrigues y Balcells (2008) evaluaron la pedago-
gía de instructores de ejercicios físicos y aeróbicos en tres gimnasios de Portugal, al analizar por obser-
vación clases grabadas en video. Labus, Keefe y Jensen (2003) revisaron estudios para indagar sobre la
relación entre los autorreportes de intensidad del dolor y las observaciones directas de la conducta
producida por tal dolor.

3. Pruebas estandarizadas e inventarios

Estas pruebas o inventarios miden variables específicas, como la inteligencia, la personalidad en gene-
ral, la personalidad autoritaria, el razonamiento matemático, el sentido de vida, la satisfacción laboral,
el tipo de cultura organizacional, el estrés preoperatorio, la depresión posparto, la adaptación al cole-
gio, intereses vocacionales, la jerarquía de valores, el amor romántico, la calidad de vida, la lealtad a
una marca de algún producto, etc. Hay miles de ellas(os).

Asimismo, hay un tipo de pruebas que evalúan proyecciones de los participantes y determinan su
estado en una variable, con elementos cuantitativos y cualitativos: las pruebas proyectivas como el test
de Rorschach (que presenta manchas de tinta en tarjetas o láminas blancas numeradas a los intervinien-
tes y éstos relatan sus asociaciones e interpretaciones en relación con manchas).

4. Datos secundarios (recolectados por otros investigadores)

Implica la revisión de documentos, registros públicos y archivos físicos o electrónicos. Por ejemplo, si
nuestra hipótesis fuera: “la violencia manifiesta en la Ciudad de México es mayor que en la ciudad de
Caracas”; entonces acudiríamos a las alcaldías de las ciudades para solicitar datos relacionados con la
violencia, como número de asaltos, violaciones, robos a casa-habitación, asesinatos, etc. (datos gene-
rales, por distrito y habitante). También obtendríamos información de los archivos de los hospitales y
las diferentes procuradurías o cuerpos policiacos. Un caso de una investigación cuyo método de reco-
lección se fundamentó en datos secundarios fue el que a continuación se comenta.

EJEMPLO

Un grupo de investigadores efectuó —en 2008 y principios de 2009— un estudio para explorar el impac-
to que tienen las becas otorgadas y/o gestionadas por una institución de educación superior sobre el
desarrollo académico de los alumnos beneficiarios y su deserción escolar.24

Los investigadores solicitaron a las diferentes direcciones información de los estudiantes respecto a su
promedio general en la carrera, nivel socioeconómico, estatus respecto a la beca (becado-no becado), tipo
de beca (institucional, otorgada por el Ministerio de Educación, por organismo privado, con fondos del
gobierno estatal), monto de la beca, estatus académico del alumno (regular, irregular, desertor), semestre
que cursa, género y edad, entre otras cuestiones. Consideraron los últimos cinco años escolares. Con tal
información construyeron una base de datos (con más de medio millón de registros) y efectuaron análisis.
Entre otras cuestiones encontraron que el promedio de los becarios era muy superior al de los no becarios
y la deserción escolar era mínima entre los primeros, casi inexistente. Pero no encontraron una relación
entre el monto de la beca y el promedio general de la carrera (acumulado). Asimismo, descubrieron que
las mujeres tenían en general mejor promedio que sus compañeros.

24 No se menciona el nombre de la institución porque ésta solicitó el anonimato, tampoco el de todos los investigadores, entre los
que se encontraban dos de los autores de la presente obra.

www.FreeLibros.com

262 Capítulo 9 Recolección de los datos cuantitativos

Comparar indicadores económicos de países de la Comunidad Europea, analizar la relación
comercial entre dos naciones, cotejar el número y tipo de casos atendidos por diferentes hospitales,
contrastar la efectividad con que se insertan en el mundo laboral los egresados de una carrera de dis-
tintas universidades, evaluar las tendencias electorales en un país, antes y después de un suceso crítico
(como lo fueron los deplorables actos terroristas en Madrid en 2004), son ejemplos donde la recolec-
ción y análisis de datos secundarios son la base de la investigación.

5. Instrumentos mecánicos o electrónicos

Sistemas de medición por aparatos, como el detector de mentiras, o polígrafo, que considera la res-
puesta galvánica de la piel (en investigaciones sobre crímenes); la pistola láser, que mide la velocidad a
la que circula un automóvil desde un punto externo al vehículo (en estudios sobre el comportamiento
de conductores); instrumentos que captan la actividad cerebral (evaluaciones médicas y psicológicas);
el escáner, que mide con exactitud el cuerpo de un ser humano y ubica la talla ideal para confeccionar
toda su ropa o vestuario (en investigaciones para diseñar los uniformes de los soldados); la medición
eléctrica de distancias, etcétera.

6. Instrumentos específicos propios de cada disciplina

En todas las áreas de estudio se han generado valiosos métodos para recolectar datos sobre variables
específicas. Por ejemplo, en la comunicación organizacional se utilizan formatos para evaluar el uso
que hacen los ejecutivos de los medios de comunicación interna (teléfono, reuniones, etc.), así como
herramientas para conocer procesos de comunicación en la empresa (la auditoría en comunicación).
Para el análisis de grupos se usan los sistemas sociométricos y el análisis de redes, entre otros.

¿Puede utilizarse más de un tipo de instrumento de recolección de datos?

Cada día es más común ver estudios donde se utilizan diferentes métodos de recolección de datos. En
los estudios cuantitativos no resulta extraño que se incluyan varios tipos de cuestionarios al mismo
tiempo que pruebas estandarizadas y recopilación de contenidos para análisis estadístico u observa-
ción. Incluso, al utilizar diversos instrumentos se ayuda a establecer la validez de criterio. No solamen-
te se puede, sino que es conveniente, hasta donde lo permita el presupuesto para investigar.

¿Cómo se codifican las respuestas
de un instrumento de medición?

6 Una vez recolectados los datos, éstos deben codificarse. Ya hemos dicho que las categorías de un ítem
o pregunta requieren codificarse con símbolos o números; y esto debe hacerse, porque de lo contrario
no se efectuaría ningún análisis o sólo se contaría el número de respuestas en cada categoría (por ejem-
plo, 25 contestaron “sí” y 24 respondieron “no”).25 Comúnmente, el investigador se interesa en realizar
análisis más allá de un conteo de casos por categoría, y actualmente los análisis se llevan a cabo por
medio de la computadora u ordenador. Para ello es necesario transformar las respuestas en símbolos o
valores numéricos. Los datos deben resumirse, codificarse y prepararse para el análisis. También se
comentó que las categorías pueden ir o no precodificadas (incluir la codificación en el instrumento de
medición) y que las preguntas abiertas no suelen estar precodificadas.

Los valores perdidos y su codificación

Cuando las personas no responden a un ítem, contestan incorrectamente (por ejemplo, marcan dos
opciones, cuando las alternativas eran mutuamente excluyentes) o no puede registrarse la información,
se crean una o varias categorías de valores perdidos y se les asignan sus respectivos códigos.

25 En ediciones anteriores este apartado incluyó la codificación relacionada con el análisis de contenido y la observación, ahora tal
codificación se comenta al final de estos dos temas en el capítulo 7 del CD anexo: “Recolección de los datos cuantitativos: segunda
parte”.

www.FreeLibros.com

EJEMPLOS ¿Cómo se codifican las respuestas de un instrumento de medición? 263

Sí = 1 Sí = 1
No = 0 No = 0
No contestó = 3 Valor perdido por diversas razones = 9
Contestó incorrectamente = 4

Asimismo, tenemos el caso de preguntas que no aplican a ciertos participantes, en estas situacio-
nes debe considerarse y codificarse la categoría: “no aplica”. Por ejemplo, si un cuestionario adminis-
trado mediante entrevista a mujeres contuviera las siguientes dos preguntas: ¿durante el último mes
realizó alguna compra en la tienda de ropa femenina “Ensueños”?,26 y ¿me podría indicar qué artículos
o prendas compró?, y una respondiente nos contestara a la primera pregunta que “no” (no había com-
prado en la tienda), anotaríamos esta categoría, y obviamente no haríamos la segunda pregunta, sino
que marcaríamos la opción “no aplica” (la pregunta).

Los valores perdidos pueden reducirse con instrumentos que motiven al participante y no sean
muy largos, con instrucciones claras y capacitación a los entrevistadores. Un alto número de valores
perdidos (más de 10% indica que el instrumento tiene problemas). Lo adecuado es que no supere 5%
respecto del total de posibles datos o valores.

En la forma tradicional, la codificación de las respuestas a preguntas o afirmaciones implica cuatro
pasos que comentaremos brevemente sólo para que se refuercen algunos conceptos:

1. Establecer los códigos de las categorías o alternativas
de respuesta de los ítems o preguntas

Cuando todas las categorías fueron precodificadas y no se tienen preguntas abiertas, este primer paso
no es necesario, ya se efectuó. Si las categorías no fueron precodificadas y/o se tienen preguntas abier-
tas, deben asignarse los códigos o la codificación a todas las categorías de los ítems. Por ejemplo:

Pregunta no precodificada:

¿Practica usted algún deporte por lo menos una vez a la semana?

Sí No

Se codifica:
1 = Sí
0 = No

Frase no precodificada:

“Creo que estoy recibiendo un salario justo por mi trabajo”.

( ) Totalmente de acuerdo ( ) De acuerdo ( ) Ni de acuerdo ni en desacuerdo
( ) En desacuerdo
( ) Totalmente en desacuerdo

26 Nombre ficticio.

www.FreeLibros.com

264 Capítulo 9 Recolección de los datos cuantitativos

Se codifica:
5 = Totalmente de acuerdo
4 = De acuerdo
3 = Ni de acuerdo ni en desacuerdo
2 = En desacuerdo
1 = Totalmente en desacuerdo

El tema sobre la codificación de preguntas abiertas ya se expuso antes.

2. Elaborar el libro de códigos incluyendo todos los ítems, uno por uno
Una vez que están codificadas todas las categorías de los ítems, se procede a elaborar el “libro de códi-
gos”, el cual describe la localización de las variables y los códigos asignados a las categorías en una
matriz o base de datos. Los elementos comunes de un libro de códigos son: variables de la investigación,
preguntas o ítems, categorías, códigos (números o símbolos utilizados para asignarse a las categorías)
y número de columna en la matriz de datos a que corresponde cada ítem.

Supongamos que tenemos una escala Likert con tres ítems (frases):

1. “La Dirección General de Impuestos Nacionales informa oportunamente sobre cómo, dónde y
cuándo pagar los impuestos”.

(5) Muy de acuerdo
(4) De acuerdo
(3) Ni de acuerdo ni en desacuerdo
(2) En desacuerdo
(1) Muy en desacuerdo

2. “Los servicios que presta la Dirección General de Impuestos Nacionales son habitualmente muy
buenos”.

(5) Muy de acuerdo
(4) De acuerdo
(3) Ni de acuerdo ni en desacuerdo
(2) En desacuerdo
(1) Muy en desacuerdo

3. “La Dirección General de Impuestos Nacionales se caracteriza por la deshonestidad de sus funcio-
narios”.

(1) Muy de acuerdo
(2) De acuerdo
(3) Ni de acuerdo ni en desacuerdo
(4) En desacuerdo
(5) Muy en desacuerdo

El libro de códigos sería el que se muestra en la tabla 9.10.

Es decir, el libro de códigos es una especie de manual para interpretar la matriz de datos (la cual
como veremos más adelante es una matriz en Excel, SPSS —Paquete Estadístico para las Ciencias
Sociales—, Minitab o cualquier otro programa similar).

www.FreeLibros.com

¿Cómo se codifican las respuestas de un instrumento de medición? 265

Tabla 9.10 Ejemplo de un libro o documento de códigos con una escala de actitud tipo Likert (tres ítems)

Variable Ítem Categorías Códigos Columnas

Actitud hacia la Frase 1 (informa) — Muy de acuerdo 5 1
Dirección General de — De acuerdo 4 2
Impuestos Nacionales Frase 2 (servicios) — Ni de acuerdo ni en desacuerdo 3 3
— En desacuerdo 2
Frase 3 (deshones- — Muy en desacuerdo 1
tidad) — Muy de acuerdo 5
— De acuerdo 4
— Ni de acuerdo ni en desacuerdo 3
— En desacuerdo 2
— Muy en desacuerdo 1
— Muy de acuerdo 1
— De acuerdo 2
— Ni de acuerdo ni en desacuerdo 3
— En desacuerdo 4
— Muy en desacuerdo 5

3. Efectuar físicamente la codificación

El tercer paso del proceso es la codificación física de los datos, es decir, llenar la matriz de datos con los
valores implicados en las respuestas al instrumento de medición (transferir éstas a la matriz).

Veamos un ejemplo simplificado con la escala Likert de tres ítems aplicada a cuatro individuos
(figura 9. 17).

Persona 1

A continuación...
1. “La Dirección General de Impuestos Nacionales informa oportunamente sobre cómo, dónde y cuándo pagar los impuestos”.

(5) Muy de acuerdo (✕4) De acuerdo (3) Ni de acuerdo ni en desacuerdo (2) En desacuerdo (1) Muy en desacuerdo

2. “Los servicios que presta la Dirección General de Impuestos Nacionales son en general muy buenos”.
(✕5) Muy de acuerdo (4) De acuerdo (3) Ni de acuerdo ni en desacuerdo (2) En desacuerdo (1) Muy en desacuerdo

3. “La Dirección General de Impuestos Nacionales se caracteriza por la deshonestidad de sus funcionarios”.
(5) Muy de acuerdo (4) De acuerdo (✕3) Ni de acuerdo ni en desacuerdo (2) En desacuerdo (1) Muy en desacuerdo

El participante obtuvo: 4 (de acuerdo)
5 (muy de acuerdo)
Persona 2 3 (ni de acuerdo ni en desacuerdo)
Obtuvo respectivamente:
3 (ni de acuerdo ni en desacuerdo)
Persona 3 4 (de acuerdo)
Obtuvo respectivamente: 3 (ni de acuerdo ni en desacuerdo)

Persona 4 4
Obtuvo respectivamente: 4
4

5
4
3

Figura 9.17 Ejemplo de aplicación de tres ítems a cuatro sujetos.

www.FreeLibros.com

266 Capítulo 9 Recolección de los datos cuantitativos

De acuerdo con el libro de códigos de la tabla 9.10 y las respuestas a la escala, tendríamos la matriz
de la figura 9.18.

Ítems

Persona 1 Columna 1 Columna 2 Columna 3 Casos (en el ejemplo,
Persona 2 (frase 1) (frase 2) (frase 3) participantes)
Persona 3 (informa) (servicios) (deshonestidad)
Persona 4
4 5 3
3 4 3
4 4 4
5 4 3

Valores de los individuos en los ítems (en el ejemplo, frases)
(categorías en las que cayeron transformadas a sus valores

numéricos, es decir, codificadas)

Figura 9.18 Ejemplo de matriz de datos para el libro de códigos de la tabla 9.10.

4. Guardar los datos codificados (casos) en un archivo permanente

Dicho de otro modo, guardar la matriz como documento de SPSS®, Excel, Minitab o equivalente, y
por supuesto, darle un nombre que lo identifique.

6 Codificación utilizando un programa de análisis estadístico
S P S S®
Pero hoy en día los investigadores ya no lo hacen de la manera descrita, sino que la codificación la
efectúan directamente, transfiriendo los valores registrados en los instrumentos aplicados (cuestiona-
rios, escalas de actitudes o equivalentes) a un archivo/matriz de un programa computarizado de análi-
sis estadístico (SPSS®, Minitab o equivalente). O bien, si no se cuenta con el programa, los datos se
capturan en un documento de Excel (matriz) y luego se trasladan a un archivo del programa de análi-
sis. Veamos el proceso en SPSS®, pero antes es necesario hacer algunas aclaraciones:

• Se abre el programa SPSS®, como cualquier otro, y si se trata de un archivo existente con los
datos codificados (matriz completada), pues lo abrimos y hacemos los análisis pertinentes. Si
vamos a crear un nuevo archivo o base de datos, elegimos la opción: “teclear datos” y comenza-
mos a ejercer tal función.

• SPSS® y programas equivalentes tienen dos matrices o ventanas: a) vista de las variables (variable
view) y b) vista de los datos (data view). Ambas aparecen como pestañas (simulando carpetas o
fólders) ubicadas en la parte inferior de la pantalla hacia nuestro lado izquierdo.

• La “vista de variables” representa el sistema de codificación o libro/documento de códigos electró-
nico (constituye una matriz). Los renglones o filas significan ítems o reactivos, y las columnas
representan características, propiedades o atributos de cada ítem. A los ítems en estos programas
se les denomina “variables” de la matriz, a veces coinciden con el concepto de variable que se tiene
en la investigación (por ejemplo, género, es una variable de la investigación y un renglón o fila en
la “vista de variables”) y en otras ocasiones son simplemente un ítem de una variable del estudio).

www.FreeLibros.com

¿Cómo se codifican las respuestas de un instrumento de medición? 267

Nombre Tipo Anchura Decimales Etiqueta Valores Perdidos Columna Alineación Medida

Ítem 1 o
variable 1 de la
matriz

Ítem 2 o
variable 2 de la
matriz

Ítem k…

Como dijimos, las columnas son propiedades del ítem que debemos definir:

1. Nombre de cada ítem o variable de la matriz: lo asignamos nosotros (obviamente debe reflejar
al ítem o reactivo al que hace referencia). Por ejemplo: género, edad, p1 (pregunta uno), ingre-
sos, etcétera.

2. Tipo de variable de la matriz (numérica, no numérica o cadena —símbolos o números que
indican un nivel nominal, como una fecha—, etc.). Incluso la clase puede ser numérica, como
una cifra con decimales. Este tipo se vincula al nivel de medición. Asimismo, es necesario espe-
cificar el ancho (caracteres) de la variable y los decimales, si tiene (por ejemplo, si la variable
implica cantidades en moneda y centavos).

3. Anchura (en dígitos o caracteres). Esto depende de la comodidad de ancho con la cual desee-
mos trabajar y del ancho de las categorías (ejemplos: en un ítem actitudinal la calificación
ocupa un dígito —totalmente de acuerdo = 5, de acuerdo = 4, etc.—, ingresos puede ocupar
varios dígitos de acuerdo con el tipo de moneda —si no agrupamos y decidimos colocar la
cantidad completa—. El ancho debe coincidir con el especificado en tipo de variable.

4. Decimales (si es pertinente). Es necesario que coincidan con los expresados en tipo de variable.
5. Etiqueta (definición o párrafo que describe a la variable o ítem). Por ejemplo: antigüedad en

la empresa, ingresos acumulados en el año, pregunta uno de la prueba sobre inteligencia emo-
cional...
6. Valores. Los códigos de cada opción de respuesta o categoría. La codificación en sí. Incluye,
desde luego, valor (por ejemplo = 1) y su etiqueta (“mujer”). También de los valores perdidos.
7. Valores perdidos (se especifican los códigos de las categorías u opciones de los valores perdidos).
8. Columnas (una vez más el número de dígitos que ocupa la variable, contando decimales y el
punto decimal, si es pertinente). Debe coincidir con anchura.
9. Alineación (si queremos que los datos, cifras o valores en la matriz o vista de los datos se alineen
a la derecha, izquierda o al centro).
10. Medida (nivel de medición del ítem: escala —intervalo o razón—, ordinal o nominal).

En la figura 9.19 se muestra un ejemplo de la vista de las variables en SPSS®.

• La “vista de los datos” es la matriz de datos. Las columnas son ítems o variables de la matriz y los
renglones o filas representan casos (unidades, participantes, etc.); mientras que las celdas son los
datos o valores. Cada celda representa un valor de un caso en una variable o ítem.

En la figura 9.20 mostramos un ejemplo de la vista de los datos.

Errores de codificación

Al teclear los valores en la vista de los datos, se pueden cometer errores, es humano. Por ejemplo, que
en un ítem o variable de la matriz donde solamente se tenían dos categorías, aparezca en uno o más
casos una no contemplada (imaginemos que tenemos el ítem género con las opciones: 1 = masculino y
2 = femenino, y alguien teclea un “3” o un “8”, esto es un error de codificación; o bien que en una

www.FreeLibros.com

268 Capítulo 9 Recolección de los datos cuantitativos

Figura 9.19 Ejemplo de la vista de las variables en SPSS®.

Figura 9.20 Ejemplo de la vista de los datos en SPSS®.

escala con tres opciones: 1. en desacuerdo, 2. neutral y 3. de acuerdo, se presenten valores como: “w”,
“#”, ¿qué es eso?). Los errores de codificación tienen que corregirse. Esto puede hacerse: a) revisando
físicamente la vista de los datos y haciendo los cambios pertinentes, b) en SPSS® con la función “orde-
nar o clasificar casos” —sort— (en “Datos” o “Data”) y, de este modo, visualizar valores que no corres-
pondan a cada variable o ítem de la matriz, c) ejecutando el “análisis de frecuencias” en el menú
“Analizar” y “Estadísticos descriptivos”, y una vez obtenidos los resultados, se observará en qué variables
de la matriz (columnas) hay valores que no deberían estar, para efectuar las correcciones necesarias.27

27 Desde luego, como SPSS® se actualiza permanentemente los comandos pueden variar, mas no las funciones.

www.FreeLibros.com

¿Cómo se codifican las respuestas de un instrumento de medición? 269

Cabe señalar que los valores perdidos no son errores de codificación, porque al registrarlos como S P S S®
tales, le estamos informando al programa que son precisamente valores perdidos y si lo deseamos, se
excluyen del análisis de frecuencias, salvo que queramos saber cuántos no contestaron o lo hicieron
incorrectamente (pero por default no cuentan, por ejemplo, para calcular promedios y análisis inferen-
ciales).

En ambas vistas se muestran las opciones para ejecutar las funciones de SPSS® (más recientemen-
te denominado PASW Statistics Base), como por ejemplo: analizar datos y elaborar gráficas, las cuales
se comentarán en el siguiente capítulo, el 10: “Análisis de los datos cuantitativos” y con mayor profun-
didad en el CD anexo: Material complementario → Manuales → Manual “Introducción al SPSS®/
PASW”. Este manual lo llevará por el proceso. Además, hay cientos de páginas sobre este paquete y la
de la propia empresa a nivel mundial (https://www.spss.com/).28

En el mismo CD se encuentra un demo de este programa. Entonces, el proceso sería el que se
muestra en la figura 9.21.

Elaboración del sistema de
codificación o llenado de la vista de

las variables en SPSS®/PASW

Respuestas Registro o captura de los
valores en la matriz o vista de los

datos en SPSS®/PASW

Revisar en la matriz que no haya S P S S®
errores de codificación Análisis

Figura 9.21 Proceso de codificación y preparación de los datos para su análisis en SPSS®.

Si queremos capturar los datos en nuestra PC u ordenador personal y no disponemos de SPSS®/
PASW (solamente en nuestra universidad, centro de cómputo público o empresa), podemos hacerlo
en una matriz de Excel y luego copiarlos y pegarlos en la vista de los datos de SPSS®/PASW. Pues las
columnas (A, B, C, D, etc.) corresponden a las variables de la matriz, y los renglones o filas, son los
casos, al igual que en SPSS®/PASW.

Como todo archivo, debe guardarse y respaldarse, implica nuestros datos y el sistema de codifica-
ción.

Cuando se utilizan dispositivos electrónicos para capturar los datos (como palms, lectores ópticos,
cuestionarios electrónicos), obviamente no requerimos teclear los datos, éstos pasan directamente de
la fuente a la matriz o base de datos.

En este capítulo, por razones didácticas, se presentaron matrices pequeñas, pero en la investiga-
ción pueden tenerse de 500 o más columnas.

28 Asimismo, busque en su país o región al representante de SPSS® Inc.

www.FreeLibros.com

270 Capítulo 9 Recolección de los datos cuantitativos

Resumen

• Recolectar los datos implica: a) seleccionar uno • La evidencia sobre la validez de constructo se
o varios métodos o instrumentos disponibles, puede determinar mediante el análisis de facto-
adaptarlo(s) o desarrollarlo(s), esto depende del res y al verificar la teoría subyacente.
enfoque que tenga el estudio, así como del plan-
teamiento del problema y de los alcances de la • Los pasos genéricos para elaborar un instrumento
investigación; b) aplicar el (los) instrumento(s), y de medición son:
c) preparar las mediciones obtenidas o los datos
recolectados para analizarlos correctamente. 1. Redefiniciones fundamentales sobre propósi-
tos, definiciones operacionales y participantes.
• En el enfoque cuantitativo, recolectar los datos es
equivalente a medir. 2. Revisar la literatura, particularmente la enfo-
cada en los instrumentos utilizados para me-
• Medir es el proceso de vincular conceptos abs- dir las variables de interés.
tractos con indicadores empíricos, mediante cla-
sificación o cuantificación. 3. Identificar el conjunto o dominio de concep-
tos o variables a medir e indicadores de cada
• En toda investigación cuantitativa medimos las variable.
variables contenidas en la(s) hipótesis.
4. Tomar decisiones en cuanto a: tipo y formato;
• Cualquier instrumento de recolección de datos utilizar uno existente, adaptarlo o construir
debe cubrir dos requisitos: confiabilidad y validez. uno nuevo, así como el contexto de adminis-
tración.
• La confiabilidad se refiere al grado en que la apli-
cación repetida de un instrumento de medición, 5. Construir el instrumento.
a los mismos individuos u objetos, produce resul- 6. Aplicar la prueba piloto (para calcular la con-
tados iguales.
fiabilidad y validez iniciales).
• La validez se refiere al grado en que un instrumen- 7. Desarrollar su versión definitiva.
to de medición mide realmente la(s) variable(s) 8. Entrenar al personal que va a administrarlo.
que pretende medir. 9. Obtener autorizaciones para aplicarlo.
10. Administrar el instrumento.
• Se pueden aportar tres tipos principales de evi- 11. Preparar los datos para el análisis.
dencia para la validez cuantitativa: evidencia
relacionada con el contenido, evidencia relacio- • En la investigación social disponemos de diversos
nada con el criterio y evidencia relacionada con instrumentos de medición.
el constructo.
1. Principales escalas de actitudes: Likert, dife-
• Los factores que principalmente pueden afectar rencial semántico y escalograma de Guttman
la validez son: la improvisación, utilizar instru- (este último se encuentra comentado en el
mentos desarrollados en el extranjero y que no capítulo 7 del CD anexo).
han sido validados para nuestro contexto, poca o
nula empatía con los participantes y los factores 2. Cuestionarios (autoadministrado, por entrevis-
de aplicación. ta personal, por entrevista telefónica, internet
y por correo).
• No hay medición perfecta, pero el error de medi-
ción debe reducirse a límites tolerables. 3. Recolección de contenidos para análisis cuan-
titativo (capítulo 7 del CD anexo).
• La confiabilidad cuantitativa se determina al calcu-
lar el coeficiente de fiabilidad. 4. Observación cuantitativa (capítulo 7 del CD
anexo).
• Los coeficientes de fiabilidad cuantitativa varían
entre 0 y 1 (0 = nula confiabilidad, 1 = total con- 5. Pruebas estandarizadas (capítulo 7 del CD
fiabilidad). anexo).

• Los métodos más conocidos para calcular la 6. Archivos y otras formas de medición (capítulo
confiabilidad son: a) medida de estabilidad, b) 7 del CD anexo).
formas alternas, c) mitades partidas, d) consis-
tencia interna. • Las respuestas a un instrumento de medición se
codifican.
• La evidencia sobre la validez de contenido se obtie-
ne al contrastar el universo de ítems frente a los • Actualmente, la codificación se efectúa transfirien-
ítems presentes en el instrumento de medición. do los valores registrados en los instrumentos
aplicados (cuestionarios, escalas de actitudes o
• La evidencia sobre la validez de criterio se obtie- equivalentes) a un archivo/matriz de un programa
ne al comparar los resultados de aplicación del computarizado de análisis estadístico (SPSS®,
instrumento de medición frente a los resultados Minitab o equivalente).
de un criterio externo.
• Para resumir algunos de los instrumentos tratados
en el capítulo se agrega la tabla 9.11:

www.FreeLibros.com

Conceptos básicos 271

Tabla 9.11 Concentrado de instrumentos para la recolección de datos

Métodos Propósito general básico Ventajas Retos

Cuestionarios/ • Obtener de manera relati- • Puede ser anónimo. • Regularmente no se obtiene
Escalas de vamente rápida datos sobre retroalimentación detallada de
actitudes/ Pruebas las variables. • Poco costosa su aplicación indi- parte de los intervinientes.
estandarizadas vidual.
• Propios para actitudes, expec- • Se evalúan actitudes y proyec-
tativas, opiniones y variables • Relativamente fácil de responder. ciones, no comportamientos
que pueden medirse mediante (mediciones indirectas).
expresiones escritas o que • Relativamente fácil de analizar y
el mismo participante puede comparar. • El manejo del lenguaje puede ser
ubicarse en las categorías de una fuente de sesgos e influir en
las variables (autoubicación). • Puede administrarse a un conside- las respuestas.
rable número de personas.
• Son impersonales.
• Normalmente disponemos de • No nos proporcionan información
versiones previas para escoger o
basarnos en éstas. sobre el individuo, excepto en las
variables medidas.
Observación • Recolectar información no obs- • Se puede adaptar a los eventos tal
trusiva respecto a conductas y y como ocurren. • Dificultad para interpretar
procesos. conductas.
• Se evalúan hechos, comportamien-
tos y no mediciones indirectas. • Complejidad al categorizar las
conductas observadas.
Análisis de con- • Recolectar información no obs- • Se puede adaptar a los eventos tal
tenido trusiva respecto de mensajes. como ocurren. • Puede ser obstrusiva y provocar
sesgos si es “participante”.
• Se evalúan mediciones indirectas.
• Puede ser costosa.

• Dificultad para interpretar
mensajes.

• Complejidad al categorizar los
mensajes.

Conceptos básicos

Análisis cuantitativo de contenido (capítulo 7 del CD Evidencia relacionada con el criterio
anexo) Hojas de codificación
Instrumento de medición
Archivo de datos Matriz de datos
Categorías Medición
Codificación Medida de estabilidad
Codificador Método de formas alternas
Coeficiente alfa de Cronbach Método de mitades partidas
Coeficiente de confiabilidad Niveles de medición
Coeficiente KR-20 de Kuder-Richardson Observación cuantitativa (capítulo 7 del CD anexo)
Confiabilidad Pruebas estandarizadas (capítulo 7 del CD anexo)
Contexto de administración del instrumento Pruebas proyectivas (capítulo 7 del CD anexo)
Cuestionarios Recolección de datos
Diferencial semántico Registro de codificación (capítulo 7 del CD anexo)
Escala Likert Unidad de análisis
Escalas de actitudes Validez
Escalograma de Guttman (capítulo 7 del CD anexo) Vista de las variables
Entrevista Vista de los datos
Evidencia relacionada con el constructo
Evidencia relacionada con el contenido

www.FreeLibros.com

272 Capítulo 9 Recolección de los datos cuantitativos

Ejercicios

1. Busque una investigación cuantitativa en algún 7. ¿Cómo mediría la hostilidad mediante observa-
artículo de una revista científica, en la cual se ción y cómo por medio de una escala de actitu-
incluya información sobre la confiabilidad y la des? (Debe leer el apartado de observación en
validez del instrumento de medición. ¿El ins- el capítulo 7 del CD anexo.)
trumento es confiable?, ¿qué tan confiable?,
¿qué técnica se utilizó para determinar la con- 8. Genere un planteamiento del problema, donde
fiabilidad?, ¿es válido?, ¿cómo se determinó la utilice por lo menos dos tipos de instrumentos
validez? cuantitativos para recolectar datos.

2. Responda y explique con ejemplos la diferen- 9. ¿Cómo se podría aplicar el análisis cuantitativo
cia entre confiabilidad y validez. del contenido para la evaluación de un progra-
ma educativo a nivel superior? (Debe leer el
3. Defina ocho variables e indique su nivel de me- apartado de análisis de contenido en el capítu-
dición. lo 7 del CD anexo).

4. Defina una variable de cada nivel de medición. 10. Construya una matriz de datos sobre las siguien-
5. Suponga que alguien intenta evaluar la actitud tes variables: género, edad, deporte preferido
para practicar, deporte preferido para obser-
hacia el Presidente de la República, entonces var, escuela de procedencia (pública/privada),
construya un cuestionario tipo Likert con 20 tipo de música que más le agrada, si está o no
ítems para medir dicha actitud, e indique cómo en desacuerdo con la política económica del
se calificaría la escala total (10 ítems positivos gobierno actual, partido por el que votó en las
y 10 negativos). Por último, señale la dimensión últimas elecciones municipales y líder históri-
que cada ítem pretende medir de dicha actitud co que más admira. Que los participantes sean
(credibilidad, presencia física, etcétera). sus compañeros de clase (el ejercicio implica
6. Construya un cuestionario para medir la varia- levantar datos y codificarlos, desde luego).
ble que considere conveniente (con un mínimo
de 10 preguntas o ítems) e incluya pregun- 11. Elabore uno o varios instrumentos para el ejem-
tas demográficas adicionales. Aplíquelo a 20 plo de estudio que ha desarrollado hasta ahora
conocidos suyos; elabore el libro de códigos y en el proceso cuantitativo (incluya la codifica-
la matriz de datos, mínimo en Excel. ción).

Ejemplos desarrollados29

La televisión y el niño El cuestionario es descriptivo y fue explorado
y validado por 10 expertos en investigación sobre
Se aplicó un cuestionario en una muestra total de la relación niño-televisión. Se elaboró una versión
2 112 niños y niñas del Distrito Federal (capital piloto con 100 infantes (50 niñas y 50 niños), la
de México), de acuerdo con la estrategia de mues- cual se probó y ajustó. No hubo escalas con varios
treo planteado. Las variables medidas fueron: uso ítems, por lo que no se calcularon coeficientes de
de medios de comunicación colectiva, tiempo de confiabilidad.
exposición a la televisión, preferencia de conteni-
dos televisivos (programas), bloques de horarios de La pareja y relación ideales
exposición a la televisión (mañana, tarde y/o noche),
comparación de la televisión con otras fuentes de Se desarrolló un instrumento inicial para recolec-
entretenimiento, actividades que realiza mientras tar los datos con base en preguntas. Por ejemplo:
observa la televisión, condiciones de exposición a la “pensando en tu relación ideal, ¿cuáles serían las
televisión (solo-acompañado), autonomía en la elec- características que más te gustaría que tuviera esa
ción de los programas, control de los padres sobre la relación?” o bien: “¿qué cualidades te gustaría que
actividad de ver televisión, usos y gratificaciones de tuviera tu novio ideal?” Sin embargo, en la prue-
la televisión, datos demográficos. ba piloto con 100 estudiantes se observó que era
mejor sustituir las preguntas por afirmaciones que

29 Por cuestiones de espacio, se comentan brevemente. El primer ejemplo aborda un aspecto de la recolección: el procedimiento y las varia-
bles centrales; el segundo, el instrumento de medición; y el tercero, la consideración y comparación de instrumentos (escalas).

www.FreeLibros.com

Ejemplos desarrollados 273

fueran completadas por los participantes (por ejem- 1) _______________, 2) _______________,
plo: “pensando en tu relación ideal, las caracterís-
ticas que más te gustaría que tuviera esa relación 3) _______________, 4) _______________,
serían…” Resultaban más comprensibles para ellos
y fueron respondidas con mayor precisión. Así, se 5) _______________.
aplicó por entrevista el siguiente cuestionario:30
6. Pensando en tu relación pasada más importan-
Cuestionario sobre la pareja te, las características que más te gustaban de
y relación ideales la relación de pareja eran (no hablamos de tu
pareja, sino de la relación de noviazgo):
El objetivo de esta encuesta es conocer tu opinión
acerca de las relaciones y parejas sentimentales que Anota de la más importante 1) a la menos
has tenido, tienes y tendrás, así como de tu concep- importante 5).
ción de una pareja ideal, por lo cual te agradeceríamos
contestar lo que se te indica a continuación, pensan- 1) _______________, 2) _______________,
do y contestando según corresponda en cada caso.
3) _______________, 4) _______________,
Recuerda que tus respuestas son totalmente
confidenciales. 5) _______________.

Edad: _____ años Actualmente:
7. ¿Tienes novio(a)? 1) Sí ____ 2) No ____
Género: 1) Masculino _____ 2) Femenino_____
8. Las cualidades que más te gustan de tu novio(a)
Indica la carrera que estudias actualmente: son:
Anota de la más importante 1) a la menos
Psicología ( ) Turismo ( ) Comunicación ( ) importante 5).

Medicina ( ) Administración Mercadotecnia ( ) 1) _______________, 2) _______________,
()
3) _______________, 4) _______________,
Arquitectura ( ) Contaduría Derecho ( )
Pública ( ) 5) _______________.

Ing. Industrial ( ) Ing. en Sistemas Comercio 9. ¿Cuántos meses llevas con tu novio(a) ac-
Computacionales Internacional ( ) tual?_____
()
10. Pensando en tu relación actual, las característi-
Otra (mencionar) ________________________________ cas que más te gustan de la relación de pareja
(no hablamos de tu pareja, sino de la relación
1. Para ti ¿qué es un novio(a)? Un novio(a) es:___ de noviazgo) son:
_________________________________________ Anota de la más importante 1) a la menos
_________________________________________ importante 5).
________________________
1) _______________, 2) _______________,
2. Para ti ¿qué es una relación de noviazgo? Un
no-viazgo es:______________________________ 3) _______________, 4) _______________,
_________________________________________
______________________________________. 5) _______________.

Pasado: 11. ¿Qué tan importante es en tu vida tu pareja ac-
3. ¿Has tenido novio(a)? 1) Sí ____ 2) No ____ tual?

4. ¿Con cuántos(as) novios(as) has durado más de 1) Sumamente importante 2) Muy importante
un mes?______. 3) Importante 4) Poco importante 5) No tiene
importancia
5. Las cualidades que más te gustaban del novio(a)
más importante que has tenido en el pasado son: Ideal:
Anota de la más importante 1) a la menos 12. Piensa en tu novio(a) ideal y menciona las cua-
importante 5).
lidades que te gustaría que tuviera:
30 Las opciones de respuesta se han reducido, también por espa- Anota de la más importante 1) a la menos
cio (por ejemplo: carreras).
importante 5).

1) _______________, 2) _______________,

3) _______________, 4) _______________,

5) _______________.

13. Pensando en tu relación ideal, las característi-
cas que más te gustaría que tuviera esa relación

www.FreeLibros.com

274 Capítulo 9 Recolección de los datos cuantitativos

(no hablamos de tu pareja, sino de la relación casos (n = 150). Se obtuvo un alfa de 0.69, lo que
de noviazgo) serían: representa un nivel moderadamente aceptable.

Anota de la más importante 1) a la menos Escala conductual
importante 5). Después del estudio de diversas escalas, se deci-
dió partir del RPP para el desarrollo del instrumen-
1) _______________, 2) _______________, to conductual. Las razones para esta decisión se
basaron en que el RPP se ha aplicado a muestras
3) _______________, 4) _______________, grandes (n = 670). Por otro lado, evalúa en acción
los patrones seguidos por los agresores, así da la
5) _______________. oportunidad de analizar las reacciones de los niños y
sus habilidades de protección “en vivo”. Además, no
Futuro: aborda al niño o niña de manera burda o aterradora,
14. En tu futuro, ¿te gustaría o no tener una rela- se enfoca en los preámbulos del abuso, en donde se
censa la posibilidad. Por estas razones, este instru-
ción de pareja para toda la vida? mento nos parece de los más acertados por su eva-
luación conductual, su aproximación a lo que un(a)
1. Sí ____ 2. No ____ 3. No sé ____ niño(a) puede vivir en su cotidianidad en cuanto a
sus aproximaciones incómodas y evaluar sus recur-
15. ¿Por qué?________________________________. sos asertivos, seguridad emocional y habilidades de
autoprotección.
16. En tu futuro ¿qué tipo de relación de pareja
duradera a largo plazo te gustaría establecer, Uno de los inconvenientes de este protocolo es
tener o formar? que no se disponen de valores psicométricos que lo
avalen. Por lo que no hay comparativos para los resul-
1. Matrimonio civil. tados que de esta investigación se obtengan.

2. Matrimonio religioso. Partiendo del RPP original, se le hizo una adap-
tación mediante la traducción y adecuación al con-
3. Matrimonio religioso y civil. texto mexicano. A esta escala le llamaremos Role
Play-México. Uno de los inconvenientes que se le
4. Unión libre (vivir juntos sin estar casados). cuestiona al RPP es que sólo puede aplicarse uno
a uno. Es decir, no se puede aplicar a grupos de
5. Llevar una relación de pareja sin vivir juntos. infantes en conjunto. Sin embargo, en el caso de
preescolares esto no aplica, porque en general las
6. Otra: ___________________________. pruebas administradas a grupos, requieren del desa-
rrollo de las habilidades lectoescritoras, un estado
Gracias por tu colaboración. no dominado en la etapa preescolar. Por tanto, tal
inconveniente es intrascendente en el caso de estu-
El abuso sexual infantil dio. Otra desventaja que se le atribuye, es que la
escala no incluye elementos que evalúen la actitud
Escala cognitiva de los menores ante los contactos positivos, para
El instrumento Children’s Knowledge of Abuse Ques- determinar si los PPASI (programas de prevención
tionnaire-Revised (CKAQ-R), fue traducido al español de abuso sexual infantil) generan un efecto nocivo de
y adaptado para preescolares. En esta escala adap- suspicacia indiscriminada ante cualquier contacto.
tada, se eliminaron los elementos redundantes y los Por lo cual, se decidió incluir un par de reactivos
que evaluaban las actitudes ante los desconocidos, para evaluar esta posibilidad en el Role Play-México
bajo la tesis que quienes agreden sexualmente a los (RPMéxico). Estos reactivos incluyen por ejemplo,
menores son en su gran mayoría personas cercanas. abrazos por los padres o felicitaciones. Se desarro-
Además, se simplificaron las preguntas formuladas lló, también, una prueba paralela a dicha adapta-
negativamente, tales como “¿algunas veces está bien ción, a la que llamamos Evaluación de la Prevención
no hacer lo que nos pide un adulto?”, que tienden a del Abuso (EPA).
ser confusas para los preescolares. El CKAQ-Español
puede tener un puntaje máximo de 22, cada reac- En la escala RPP se tiene un puntaje máximo
tivo posee evaluación dicotómica, dando un punto de 14 puntos, evalúa la negación verbal y no verbal
por cada respuesta correcta. Sigue el mismo esque- de seis escenas “en vivo”. Es decir, donde el eva-
ma y protocolo que el CKAQ original. Cada pregunta luador actúa y se le pide al niño que responda a la
puede ser contestada como “sí”, “no”, o “no sé” y pregunta: ¿qué diría y haría? en una situación plan-
su evaluación es dicotómica (correcto o incorrecto). teada. Además, en los tres reactivos donde se abor-
Incluye cuestiones para medir el desarrollo cogniti-
vo y actitudes asertivas ante contactos positivos y
negativos, chantaje emocional, disociación de los
contactos con la afectividad y el pedir ayuda ante
el abuso.

El estudio de la confiabilidad interna se efectuó
con el modelo Kurder Richardson 20 (KR-20), bajo
la versión adaptada de Cronbanch para reactivos
dicotómicos. Tal estudio se realizó con el total de

www.FreeLibros.com

Los investigadores opinan 275

da el chantaje emocional y la coerción, se otorga tos inapropiados (seis máximo) y un punto por cada
un punto extra si el participante muestra intención persona a quien denunciarían, hasta un máximo de
de denunciar el evento. En el caso de la evaluación tres por cada escenario de contacto inapropiado (18
del RPMéxico y de la EPA se considera un total de puntos máximo).
ocho escenarios “en vivo”, seis de tipo abusivo y
dos de contactos no abusivos. El puntaje de ambas Se desarrolló el análisis de confiabilidad tan-
escalas (RPMéxico y EPA) tienen un máximo de 40 to temporal como interno. Se aplicó test-retest
puntos. Al igual que el RPP, evalúa la asertividad de acuerdo con un método de formas paralelas al
verbal y conductual, pero se amplía la evaluación administrarse el RPMéxico y el EPA. La correlación
con la intención de denuncia del evento abusivo, entre ambas pruebas alcanzó un buen nivel y fue
cubriendo la necesidad de mejorar el sistema de significativo (r = 0.75, p < 0.01), lo que avala la
medición con la persistencia de los infantes de pedir utilización de estos instrumentos de forma paralela.
ayuda hasta obtenerla. Mide además las siguientes El test-retest se aplicó en un subgrupo (n = 44) del
subescalas: 1) reconocimiento de contactos, tanto grupo control (n = 79). Este estudio confirma que
positivos como negativos, y las habilidades de aser- hay correlación entre test y retest entre cada instru-
tividad verbal (qué decir), no verbal (qué hacer) y mento RPP, RPMéxico y en todas las subescalas,
la persistencia en la intención de denuncia ante los índices van de 0.59 a 0.78, todas con p < 0.01.
algún incidente abusivo (denuncia). Los 40 puntos, El instrumento RPMéxico tiene una correlación
se derivan de la suma de un punto por cada acierto (r = 0.75) equivalente a la reportada en otros instru-
en la asertividad verbal (ocho máximo), un punto mentos similares (WIST, PSQ). Este índice muestra
por cada asertividad conductual (máximo ocho), un un grado de estabilidad temporal aceptable, dado el
punto por cada intención de denuncia de los contac- tamaño de la muestra.

Los investigadores opinan

Recolección de datos cuantitativos cuanto la generalización depende de la calidad y
cantidad de los datos que recolectamos. Por ello,
Dentro del modelo de investigación cuantitativa, la en estudios cuantitativos resulta importante deter-
etapa de recolección de los datos resulta de vital minar una muestra adecuada, que tenga representa-
importancia para el estudio, de ella dependen tanto tividad en el tamaño y que a la vez refleje la misma
la validez interna como externa. estructura existente en la población. Sin una buena
muestra de datos, no se puede generalizar; y si se
La validez interna de una investigación depende corre este riesgo, el investigador podría llevar sus
de una adecuada selección o construcción del ins- conclusiones más allá de la realidad, cuando lo que
trumento con el cual se va a recolectar la informa- se desea es reflejar la realidad.
ción deseada, la teoría que enmarca el estudio tiene
que conjugar perfectamente con las características Una idea clave, para no tropezar con asuntos
teóricas y empíricas del instrumento; si esto no ocu- insalvables en este momento de la investigación o
rre, se corre el riesgo de recolectar datos que a la para no tomar decisiones que conduzcan al error,
postre pueden ser imposibles de ser interpretados o es hacer un buen proyecto de investigación. En la
discutidos, la teoría y los datos pueden caminar por etapa de la planificación debe quedar claramente
distintas direcciones. Un ejemplo muy sencillo para establecido y justificado qué instrumento se va a
graficar este problema sería hacer hipótesis y teorizar utilizar; cómo, dónde y a quiénes se les aplicará;
en torno a la personalidad sobre la base de una de las qué instrucciones se les va a brindar a los sujetos o
teorías de los rasgos y usar un instrumento proyectivo participantes; qué datos son los que se someterán
para recolectar los datos. Lo correcto sería que la a tratamiento y cuáles otros no serán tomados en
misma teoría sustente los planteamientos hipotéti- cuenta; cómo se van a tratar los mismos y cómo se
cos y teóricos, así como fundamente el instrumento. llegará desde los datos a la teoría.
Si bien el ejemplo puede resultar un tanto simple
y grosero, en el nivel de las investigaciones de pre- EDWIN SALUSTIO SALAS BLAS
grado, este problema resulta bastante común y le es Universidad de Lima
muy difícil manejarlo al estudiante promedio. Perú

Del mismo modo, la recolección de los datos
se relaciona con la validez externa del estudio, por

www.FreeLibros.com

10Capítulo Análisis de los datos cuantitativos

Proceso de investigación Paso 9 Analizar los datos
cuantitativa
• Decidir el programa de análisis de datos que se
utilizará.

• Explorar los datos obtenidos en la recolección.
• Analizar descriptivamente los datos por variable.
• Visualizar los datos por variable.
• Evaluar la confiabilidad, validez y objetividad de

los instrumentos de medición utilizados.
• Analizar e interpretar mediante pruebas estadísti-

cas las hipótesis planteadas (análisis estadístico
inferencial).
• Realizar análisis adicionales.
• Preparar los resultados para presentarlos.

Objetivos del aprendizaje

Al terminar este capítulo, el alumno será capaz de:

1 Revisar el proceso para analizar los datos cuantitativos.
2 Reforzar los conocimientos estadísticos fundamentales.
3 Comprender las principales pruebas o métodos estadísticos desarrollados,

así como sus aplicaciones y la forma de interpretar sus resultados.
4 Analizar la interrelación entre distintas pruebas estadísticas.
5 Diferenciar la estadística descriptiva y la inferencial, la paramétrica

y la no paramétrica.

Síntesis

En el capítulo se presentan brevemente los principales programas compu-
tacionales de análisis estadístico que emplea la mayoría de los investiga-
dores, así como el proceso fundamental para efectuar análisis cuantitativo.
Asimismo, se comentan, analizan y ejemplifican las pruebas estadísticas más
utilizadas. Se muestra la secuencia de análisis más común, incluyendo esta-
dísticas descriptivas, análisis paramétricos, no paramétricos y multivariados.
En la mayoría de estos análisis, el enfoque del capítulo se centra en los usos
y la interpretación de los métodos, más que en los procedimientos de cálcu-
lo, debido a que en la actualidad los análisis se realizan con ayuda de una
computadora.

www.FreeLibros.com

Se realiza mediante programas Cuyo procedimineo es:
computacionales como:
• SPSS® Fases
• Minitab
• SAS 1. Seleccionar el programa estadístico para el análisis de datos
• STATS 2. Ejecutar el programa
3. Explorar los datos: analizarlos y visualizarlos por variable del estudio
Análisis de datos 4. Se evalúa la confiabilidad y validez del o de los instrumentos escogidos
cuantitativos 5. Se lleva a cabo análisis estadístico descriptivo de cada variable

del estudio
6. Se realizan análisis estadísticos inferenciales respecto a las

hipótesis planteadas
7. Se efectúan análisis adicionales
8. Se preparan los resultados para presentarlos

Distribución de frecuencias Media
Medida de tendencia central Mediana
Moda
El análisis se realizan tomando Descriptiva Medidas de variabilidad
en cuenta los niveles de Rango
medición de las variables y Desviación estándar
mediante la estadística, que Varianza
puede ser
Análisis paramétrico Gráficas
Inferencia Puntuaciones z (en CD anexo)
• Sirve para estimar Análisis no paramétrico
Analsis multivariados • Coeficientes de correlación
parámetros y probar (en CD anexo) • Regresión lineal
hipótesis • Prueba t
• Se basa en la • Prueba de la diferencia de proporciones
distribución muestral • Análisis de varianza
• Análisis de covarianza (en CD anexo)

Chi cuadrada
Coeficientes de Spearman y Kendall
Coeficientes para tabulaciones cruzadas

Nota: Este capítulo se complementa con uno del CD anexo: Material complementario → Capítulos → Capítulo 8 “Análisis estadístico:
segunda parte”. Asimismo, con el documento incluído en el CD: “Fórmulas estadísticas”, que contiene las fórmulas que estaban en la
parte impresa de ediciones anteriores y el apéndice 4 “Tablas anexas”.

www.FreeLibros.com

278 Capítulo 10 Análisis de los datos cuantitativos

¿Qué procedimiento se sigue para analizar
cuantitativamente los datos?

Una vez que los datos se han codificado, transferido a una matriz, guardado en un archivo y “limpia-
do” de errores, el investigador procede a analizarlos.

En la actualidad, el análisis cuantitativo de los datos se lleva a cabo por computadora u ordenador.
Ya casi nadie lo hace de forma manual ni aplicando fórmulas, en especial si hay un volumen conside-
rable de datos. Por otra parte, en la mayoría de las instituciones de educación media y superior, centros
de investigación, empresas y sindicatos se dispone de sistemas de cómputo para archivar y analizar
datos. De esta suposición parte el presente capítulo. Por ello, se centra en la interpretación de los resul-
tados de los métodos de análisis cuantitativo y no en los procedimientos de cálculo.
1 El análisis de los datos se efectúa sobre la matriz de datos utilizando un programa computacional. El
proceso de análisis se esquematiza en la figura 10.1. Posteriormente veremos paso a paso el proceso.

FASE 1 FASE 2 FASE 3
Seleccionar un programa Ejecutar el programa: SPSS, Explorar los datos:
estadístico en la computadora Minitab, Stats, SAS u otro a) Analizar descriptivamente
(ordenador) para analizar los datos por variable.
equivalente. b) Visualizar los datos por
los datos.
variable.

FASE 7 FASE 6 FASE 5 FASE 4
Preparar los resultados para Realizar análisis Analizar mediante pruebas Evaluar la confiabilidad y
presentarlos (tablas, gráficas, estadísticas las hipótesis validez logradas por el o los
adicionales. instrumentos de medición.
cuadros, etcétera). planteadas (análisis
estadístico inferencial).

Figura 10.1 Proceso para efectuar análisis estadístico.

Paso 1: seleccionar un programa de análisis

Existen diversos programas para analizar datos. En esencia su funcionamiento es muy similar, incluyen
dos partes o segmentos que se mencionaron en el capítulo anterior: una parte de definiciones de las
variables, que a su vez explican los datos (los elementos de la codificación ítem por ítem), indicador
por indicador en casos propios de las ingenierías y diversas disciplinas y la otra parte, la matriz de
datos. La primera parte es para que se comprenda la segunda. Las definiciones, desde luego, son efec-
tuadas por el investigador. Lo que éste hace, una vez recolectados los datos, es precisar los parámetros
de la matriz de datos en el programa (nombre de cada variable en la matriz —que equivale a un ítem,
reactivo, categoría o subcategoría de contenido u observación, indicador—, tipo de variable o ítem,
ancho en dígitos, etc.) e introducir los datos en la matriz, la cual es como cualquier hoja de cálculo.
Asimismo, recordemos que la matriz tiene columnas (variables o ítems), filas o renglones (casos) y
celdas (intersección entre una columna y un renglón). Cada celda contiene un dato (que significa un
valor de un caso en una variable). Supongamos que tenemos cuatro casos o personas y tres variables
(género, color de cabello y edad); la matriz se vería como se muestra en la tabla 10.1.

www.FreeLibros.com

Paso 1: seleccionar un programa de análisis 279

Tabla 10.1 Ejemplo de matriz de datos con tres variables y cuatro casos

Columna 1 Columna 2 Columna 3
(edad)
Caso (género) (color de pelo)
35
111 29
211 28
321 33
424

La codificación (especificada en la parte de las definiciones de las variables o columnas que corres-
ponden a ítems) sería:

• Género (1 = masculino y 2 = femenino).
• Color de cabello (1 = negro, 2 = castaño, 3 = pelirrojo, 4 = rubio).
• Edad (dato “bruto o crudo” en años).

De esta forma, si se lee por renglón o fila (caso), de izquierda a derecha, la primera celda indica un
hombre (1); la segunda, de cabello negro (1), y la tercera, de 35 años (35). En el segundo, un hombre
de cabello negro y 29 años. La tercera, una mujer de cabello color negro, con 28 años. La cuarta fila
(caso número cuatro) nos señala una mujer (2), rubia (4) y de 33 años (33). Pero, si leemos por colum-
na o variable de arriba hacia abajo, tendríamos en la primera (género) dos hombres y dos mujeres
(1, 1, 2, 2).

Por lo general, en la parte superior de la matriz de datos aparecen las opciones de los comandos
para operar el programa de análisis estadístico como cualquier otro programa (Archivo, Edición, etc.).
Una vez que estamos seguros que no hay errores en la matriz, procedemos a realizar el análisis de la
matriz, el análisis estadístico. En cada programa tales opciones varían, pero en cuestiones mínimas.

Ahora, comentaremos brevemente los programas más importantes y de dos de ellos señalaremos
sus comandos generales.

Statistical Package for the Social Sciences SPSS® o PASW Statistics S P S S®

El SPSS (Paquete Estadístico para las Ciencias Sociales) desarrollado en la Universidad de Chicago, es
uno de los más difundidos. Contiene todos los análisis estadísticos que se describirán en este capítulo.

En América Latina, algunas instituciones educativas tienen versiones antiguas del SPSS; otras,
versiones más recientes (PASW Statistics), ya sea en español o inglés. Existen versiones para Windows,
Macintosh y UNIX. Desde luego, éstas sólo pueden utilizarse en computadoras con la capacidad
necesaria para el paquete.

Como ocurre con todos los programas o software, SPSS® o PASW Statistics constantemente se
actualiza con versiones nuevas en varios idiomas.1 Asimismo, cada año surgen textos o manuales acor-
des con estas nuevas versiones. En el CD anexo el lector encontrará un manual que abarca las cuestio-
nes esenciales de este paquete de análisis. Lo mejor para mantenerse al día en materia de SPSS/PASW
es consultar su sitio en internet (www.spss.com/); o si éste llega a cambiar, con la palabra clave “SPSS”
podemos encontrarlo en un directorio o mediante un motor de búsqueda como Google, Altavista, o
cualquier otro. Para la actualización de manuales, las palabras claves serían: “SPSS manuals” (recorde-
mos que para cruzar palabras, éstas tienen que ir entre comillas “”).

Como ya se señaló, SPSS/PASW contiene las dos partes citadas que se denominan: a) vista de variables
(para definiciones de las variables y consecuentemente, de los datos) y b) vista de los datos (matriz de datos).

1 Actualmente SPSS cuenta con el programa básico (PASW) y múltiples derivaciones y aplicaciones. Por ejemplo: Quancept™ CATI
(sistema para procesar y analizar entrevistas telefónicas), Amos™ (modelar ecuaciones estructurales) y el PASW Advanced Statistics
(para estadística multivariada compleja). Para ver gran parte de las estadísticas avanzadas recomendamos: Sharpe, De Veaux y Velleman
(2010), así como Madarassy (2010). El lector interesado puede descargar una versión de prueba de SPSS en el sitio www.spss.com

www.FreeLibros.com

280 Capítulo 10 Análisis de los datos cuantitativos

En ambas vistas se observan los comandos para operar en la parte superior. También, en la página de SPSS
se puede “bajar” o “descargar” a la computadora una demostración del programa por un tiempo limitado.

El paquete SPSS/PASW trabaja de una manera muy sencilla: éste abre la matriz de datos y el
investigador usuario selecciona las opciones más apropiadas para su análisis, tal como se hace en otros
programas.

File (archivo): sirve para construir un nuevo archivo, localizar uno ya construido, guardar archivos,
especificar impresora, imprimir, cerrar, enviar archivos por correo electrónico, entre otras funciones.

Edit (edición): se emplea para modificar archivos, manipular la matriz, buscar datos, copiar,
cortar, eliminar y otras acciones de edición.

View (ver): como su nombre lo dice es para ver o visualizar la barra de estado, barra de herra-
mientas, fuentes, cuadrícula (matriz), etiquetas y variables.

Data (datos): se insertan variables, sopesan casos, insertan casos, ordenan casos para limpiar
archivos, fundir archivos (juntar varios archivos o matrices), segmentar archivos (por una variable
o criterio; por ejemplo, la variable género, en este caso se realiza el análisis por submuestra seg-
mentada, resultados para hombres y para mujeres), seleccionar casos, etcétera.

Transform (transformar): la función es de recodificar, conjuntar o unir y modificar variables y
datos; categorizar variables; asignar rangos a casos, entre otras.

Analyze (analizar): se solicitan análisis estadísticos que básicamente serían:

1. Informes (resúmenes de casos, información de columnas y reglones).
2. Estadísticos descriptivos (tablas de frecuencias, medidas de tendencia central y disper-

sión, razones, tablas de contingencia).
3. Comparar medias (prueba t y análisis de varianza —ANOVA— unidireccional).
4. Modelo lineal general (independiente o factor y dependiente, con covariable).
5. ANOVA (análisis de varianza factorial en varias direcciones).
6. Correlaciones (bivariada —dos— y multivariadas —tres o más—) para cualquier nivel

de medición de las variables.
7. Regresión (lineal, curvilineal y múltiple).
8. Clasificación (conglomerados y análisis discriminante).
9. Reducción de datos (análisis de factores).
10. Escalas (fiabilidad y escalamiento multidimensional).
11. Pruebas no paramétricas.
12. Respuestas múltiples (escalas).
13. Validación compleja.
14. Series de tiempos.
15. Ecuaciones estructurales y modelamiento matemático.

Add-ons (agregados): mediante esta función (que no está incluida en todas las versiones ni

variantes) se tiene acceso a análisis complejos como redes neurales, identificación de casos inusua-

les y varias pruebas estadísticas avanzadas).

El diagrama Q-Q Se utiliza para Graphs (gráficos): con esta función se solicitan gráficos (histogramas, de sectores o
verificar qué tanto la distribución de pastel, diagramas de dispersión, Pareto, Q-Q —solicitar normalización de distribucio-

nuestras variables es “normal”. nes—, P-P, curva COR, etcétera).

Utilities (utilidades o herramientas): se definen ambientes, conjuntos, información

sobre variables, etcétera.

S-plus: es para la adquisición, edición y transformación de datos, la línea de comandos, méto-

dos estadísticos básicos con S-Plus y R, gráficos estadísticos básicos con S-Plus y R, métodos

estadísticos multivariados avanzados y creación de funciones propias con S-Plus.

Window (ventana): sirve para moverse a través de archivos y hacia otros programas.

Help (ayuda): cuenta con contenidos de ayuda, cómo utilizar SPSS, comandos, guías, “asesor

estadístico” y demás elementos aplicados al paquete (con índice).

www.FreeLibros.com

Paso 1: seleccionar un programa de análisis 281

Minitab®

Es un paquete que goza de popularidad por su relativamente bajo costo. Incluye un considerable
número de pruebas estadísticas, y cuenta con un tutorial para aprender a utilizarlo y practicar; además,
es muy sencillo de manejar.

Minitab tiene un sitio web (http://www.minitab.com/) en la cual podemos acceder a un demo
gratuito del programa por tiempo limitado.

Para comenzar a utilizar Minitab, se abre una sesión (la cual es definida con nombre y fecha), y se
abre una matriz u hoja de trabajo (worksheet) (en la parte superior de la pantalla aparece la sesión y en
la parte inferior se presenta la matriz). Se definen las variables (C —columnas—): nombre, formato
(numérico, texto, fecha/tiempo), ancho (en dígitos), su descripción y orden de los valores. Los renglo-
nes o filas son casos. Los análisis realizados aparecen en la sesión (parte o pantalla superior) y las gráfi-
cas se reproducen en recuadros.

Sus comandos incluyen:

File (archivo): para construir un nuevo archivo, localizar uno ya construido, guardar o abrir
archivos, abrir una gráfica de Minitab, especificar impresora, imprimir, cerrar, entre otras funciones.

Edit (edición): útil para modificar archivos, buscar datos, copiar, cortar y eliminar celdas,
conectar Minitab con otras aplicaciones, etcétera.

Data (datos): funciones para asignar códigos a columnas, dividir la matriz, copiar columnas,
eliminar columnas y renglones o filas, establecer rangos, recodificar, cambiar el tipo de datos,
desplegar datos, mostrar los datos de la hoja de trabajo en la ventana de sesión, entre otros.

Calc (calcular): calcula las estadísticas de columnas y filas, distribuciones de probabilidad,
matrices, estandarizaciones, operaciones aritméticas.

Stat (estadísticas): de manera fundamental, ejecuta los siguientes tipos de estadísticas:

1. Básicas: descriptivas, correlación, covarianza, chi-cuadrada, prueba t, prueba de hipótesis
acerca de la media poblacional…

2. Regresión lineal y múltiple.
3. Análisis de varianza (ANOVA) unidireccional y factorial.
4. DOE (análisis para diseños experimentales, análisis de respuestas).
5. Diagramas (control charts) (de atributos, multivariados, de tiempo) individuales y grupales.
6. Diagramas de dispersión, Pareto, causa-efecto…
7. Confiabilidad.
8. Análisis multivariado: análisis de factores (validación), análisis discriminante, análisis de

conglomerados, de correspondencia simple o múltiple.
9. Series de tiempos: autocorrelación, correlación parcial, correlación cruzada, entre otras.
10. Tablas: tabulación cruzada, chi-cuadrada.
11. Estadística no paramétrica.
12. EDA (análisis exploratorio de datos, diagramas de caja, fotograma, etcétera).
13. Poder y tamaño de muestra (1-muestra z, 1-muestra-t, 2-muestra-t, ANOVA y otras. Sirve

para determinar si el tamaño de muestra es apropiado para varias pruebas estadísticas).

Graph (gráfica): solicitar gráficos (histogramas, barras de pastel, diagramas de dispersión,

Pareto, series de tiempos, etcétera).

Editor (editor): mover columnas, redefinir columnas, insertar columnas, buscar, ir a un caso,

entre otras acciones.

Tools (herramientas): definir ambientes, conjuntos, información sobre variables, conexión a

internet, consultas, etcétera.

Window (ventana): sirve para moverse a través de archivos y hacia otros programas, minimi-

zar ventanas y demás funciones similares en otros programas.

Help (ayuda): cuenta con contenidos de ayuda, cómo utilizar Minitab, comandos, guías y

demás elementos de Windows aplicados al paquete. En la figura 10.2 se muestra una vista de la

pantalla de Minitab. www.FreeLibros.com

282 Capítulo 10 Análisis de los datos cuantitativos

Figura 10.2 Pantalla de Minitab.

Otro programa de análisis sumamente difundido es el SAS (Sistema de Análisis Estadístico), que
fue diseñado en la Universidad de Carolina del Norte. Es muy poderoso y su utilización se ha incre-
mentado notablemente. Es un paquete muy completo para computadoras personales que contiene
una variedad considerable de pruebas estadísticas.

En el CD se incluye un programa (software) sencillo que hemos titulado STATS, con los análisis
bivariados más elementales para comenzar a practicar y comprender las pruebas básicas. Asimismo,
en internet existen diversos programas gratuitos de análisis estadístico para cualquier ciencia o disci-
plina.

Por lo general se elige el programa de análisis que está disponible en nuestra institución educativa,
centro de investigación u organización de trabajo, o el que podamos comprar u obtener en internet.
Todos los programas mencionados son excelentes opciones. Cualquiera nos sirve, solamente que debe-
mos seleccionar uno. Recomendamos que en el centro de cómputo de su institución soliciten infor-
mación respecto de los programas disponibles.

Paso 2: ejecutar el programa

En el caso de SPSS y Minitab, ambos paquetes son fáciles de usar, pues lo único que hay que hacer es
solicitar los análisis requeridos seleccionando las opciones apropiadas. Obviamente antes de tales aná-
lisis, se debe verificar que el programa “corra” o funcione en nuestra computadora. Comprobado esto,
comienza la ejecución del programa y la tarea analítica.

Paso 3: explorar los datos

En esta etapa, inmediata a la ejecución del programa, se inicia el análisis. Cabe señalar que si hemos
llevado a cabo la investigación reflexionando paso a paso, esta etapa es relativamente sencilla, porque:
1) formulamos la pregunta de investigación que pretendemos contestar, 2) visualizamos un alcance
(exploratorio, descriptivo, correlacional y/o explicativo), 3) establecimos nuestras hipótesis (o estamos

www.FreeLibros.com

Paso 3: explorar los datos 283

conscientes de que no las tenemos), 4) definimos las variables, 5) elaboramos un instrumento (cono- S P S S®
cemos qué ítems miden qué variables y qué nivel de medición tiene cada variable: nominal, ordinal,
de intervalos o razón) y 6) recolectamos los datos. Sabemos qué deseamos hacer, es decir, tenemos
claridad.

La exploración típica se muestra en la figura 10.3 (que se ilustra utilizando el programa SPSS, ya
que, insistimos, ésta puede variar de programa en programa en cuanto a comandos o instrucciones,
pero no en lo referente a las funciones implementadas). Algunos conceptos pueden, por ahora, no
significar algo para el lector que se inicia en los menesteres de la investigación, pero éstos se irán expli-
cando a lo largo del capítulo.

ETAPA 1 (en SPSS) ETAPA 2 (analítica) ETAPA 3 (en SPSS)

En “Analizar” o Analyze (y usando El investigador evalúa las En “Transformar” o Transform y
las opciones: “Informes” o Reports distribuciones y estadísticas “Calcular” o Compute, se indica al
y “Estadísticos Descriptivos” o de los ítems o columnas, programa cómo debe agrupar los
Descriptive Statistics: “Frecuencias” observa qué ítems tienen ítems en las variables de su estudio.
o Frequencies) se solicitan para una distribución lógica e
todos los ítems (variable de la ilógica y agrupa a los ítems o ETAPA 4 (en SPSS)
matriz por variable de la matriz): indicadores en las variables
– Informes de la matriz (resúmenes de su investigación (variables En “Analizar”, se solicitan para
compuestas), de acuerdo con todas las variables del estudio:
de casos, informes estadísticos de sus definiciones operacionales a) estadísticas descriptivas
filas o en columnas). Con objeto y la forma como desarrolló su (una tabla con los estadísticos
de visualizar resultados ítem por instrumento o instrumentos fundamentales de todas las
ítem y fila por fila. de medición. variables) y b) un análisis de
– Estadísticos descriptivos: frecuencias con estadísticas, tablas
a) Descriptivos (una tabla con las y gráficas. A veces únicamente
estadísticas fundamentales de se pide lo segundo, porque
todas las variables de la matriz, abarca lo primero. Debe notarse
columnas o ítems). que estos análisis ya no son con
b) Frecuencias (tabla de frecuencias ítems, sino con las variables de la
de las variables de la matriz). investigación.
c) Explorar (relaciones entre
variables de la matriz).
d) Generar tablas de contingencia.
e) Generar razones.
Al menos a) y b).

Figura 10.3 Secuencia más común para explorar datos en SPSS.

Veamos ahora los conceptos estadísticos que se aplican a la exploración de datos, pero antes de 2
proseguir es necesario realizar un par de apuntes, uno sobre las variables del estudio y las variables de la
matriz de datos, y el otro sobre los factores de los que depende el análisis.

Apunte 1

Desde el final del capítulo anterior, se introdujo el concepto de variable de la matriz Variables de la matriz de datos

de datos, que es distinto del concepto variable de la investigación. Las variables de Son columnas o ítems.

la matriz de datos son columnas o ítems. Las variables de la investigación son las Variables de la investigación Son las

propiedades medidas y que forman parte de las hipótesis o que se pretenden descri- propiedades medidas y que forman parte
bir (género, edad, actitud hacia el presidente municipal, inteligencia, duración de de las hipótesis o que se pretenden des-
un material, etc.). En ocasiones, las variables de la investigación requieren un único cribir.

ítem o indicador para ser medidas (como en la tabla 10.2 con la variable “tipo de escuela a la que

asiste”), pero en otras se necesitan varios ítems para tal finalidad. Cuando sólo se precisa de un ítem o

www.FreeLibros.com

284 Capítulo 10 Análisis de los datos cuantitativos

indicador, las variables de la investigación ocupan una columna de la matriz (una variable de la matriz).
Pero si están compuestas de varios ítems, ocuparán tantas columnas como ítems (o variables en la
matriz) las conformen. Esto se ejemplifica en la tabla 10.2 con los casos de la variable “satisfacción
respecto al superior” y “moral de los empleados”.

Tabla 10.2 Ejemplos de variables de investigación y formulación de ítems

Variable: tipo de escuela a la Variable: satisfacción respecto al superior Variable: moral de los empleados
que asiste (con un ítem) (con tres ítems) (con cinco ítems)

¿Asiste a una escuela 1. ¿En qué medida está usted satisfecho con 1. “En el departamento donde trabajo nos
pública o privada?
su superior inmediato? mantenemos unidos”

1 Escuela pública 1 Sumamente insatisfecho 5 Totalmente de acuerdo
2 Escuela privada 2 Más bien insatisfecho 4 De acuerdo
3 Ni insatisfecho ni satisfecho 3 Ni de acuerdo ni en desacuerdo
4 Más bien satisfecho 2 En desacuerdo
5 Sumamente satisfecho 1 Totalmente en desacuerdo

2. ¿Qué tan satisfecho está usted con el 2. “La mayoría de las veces en mi departa-
trato que recibe de parte de su superior mento compartimos la información más
inmediato? que guardarla para nosotros”.

1 Sumamente insatisfecho 5 Totalmente de acuerdo
2 Más bien insatisfecho 4 De acuerdo
3 Ni insatisfecho ni satisfecho 3 Ni de acuerdo ni en desacuerdo
4 Más bien satisfecho 2 En desacuerdo
5 Sumamente satisfecho 1 Totalmente en desacuerdo

3. ¿Qué tan satisfecho está con la orientación 3. “En mi departamento nos mantenemos en
que le proporciona su superior inmediato contacto permanentemente”.
para que usted realice su trabajo?
5 Totalmente de acuerdo
1 Sumamente insatisfecho 4 De acuerdo
2 Más bien insatisfecho 3 Ni de acuerdo ni en desacuerdo
3 Ni insatisfecho ni satisfecho 2 En desacuerdo
4 Más bien satisfecho 1 Totalmente en desacuerdo
5 Sumamente satisfecho
4. “En mi departamento nos reunimos con
frecuencia para hablar tanto de asuntos de
trabajo como de cuestiones personales”.

5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmente en desacuerdo

5. “En mi trabajo todos nos llevamos bien”.

Esta variable es medida Esta variable es medida por tres preguntas y 5 Totalmente de acuerdo
por una sola pregunta ocupa tres columnas o variables de la matriz. 4 De acuerdo
y ocupa una columna o 3 Ni de acuerdo ni en desacuerdo
variable de la matriz. 2 En desacuerdo
1 Totalmente en desacuerdo

Esta variable es medida por cinco preguntas
y ocupa cinco columnas o variables de la
matriz.

Y cuando las variables de la investigación se integran de varios ítems o variables en la matriz, las
columnas pueden ser continuas o no (estar ubicadas de manera seguida o en distintas partes de la
matriz). En el tercer ejemplo (variable “moral de los empleados”), las preguntas podrían ser las núme-

www.FreeLibros.com

Paso 3: explorar los datos 285

ros: 1, 2, 3, 4 y 5 del cuestionario, entonces las primeras cinco columnas de la matriz representarán a S P S S®
estos ítems. Pero pueden ubicarse en distintos segmentos del cuestionario (por ejemplo, ser las pregun-
tas 1, 5, 17, 22 y 38), entonces las columnas que las representen se ubicarán de forma discontinua
(serán las columnas o variables de la matriz 1, 5, 17, 22 y 38), porque regularmente la secuencia de las
columnas corresponde a la secuencia de los ítems en el instrumento de medición.

Esta explicación la hacemos porque hemos visto que varios estudiantes confunden las variables de
la matriz de datos con las variables del estudio. Son cuestiones vinculadas pero distintas.

Cuando una variable de la investigación está integrada por diversas variables de la matriz o ítems
suele denominársele variable compuesta y su puntuación total es el resultado de adicionar los valores de
los reactivos que la conforman. Tal vez el caso más claro lo es la escala Likert, donde se suman las
puntuaciones de cada ítem y se logra la calificación final. A veces la adición es una sumatoria, otras
ocasiones es multiplicativa o de otras formas, según se haya desarrollado el instrumento. Al ejecutar el
programa y durante la fase exploratoria, se toma en cuenta a todas las variables de la investigación e
ítems y se considera a las variables compuestas, entonces se indica en el programa cómo están constitui-
das, mediante algunas instrucciones (en cada programa son distintas en cuanto al nombre, pero su
función es similar). Por ejemplo, en SPSS se crean nuevas variables compuestas en la matriz de datos
con el comando “Transformar” y luego con el comando “Calcular” o “Computar”, de este modo, se
construye la variable compuesta mediante una expresión numérica. Revisemos un ejemplo.

En el caso de la variable “moral en el departamento de trabajo”, podríamos asignar las siguientes
columnas (en el supuesto de que fueran continuas) a los cinco ítems, tal como se muestra en la tabla 10.3.

Y tener la siguiente matriz:

EJEMPLO

fr1 fr2 fr3 fr4 fr5

112243
222222
K23223

Tabla 10.3 Ejemplo con la variable moral Variable de la matriz que Ubicación en la
corresponde a la variable de matriz
Variable de la investigación: moral
la investigación Columna 1
1. “En el departamento donde trabajo nos mantenemos unidos”.
Frase 1 (fr1)
5 Totalmente de acuerdo
4 De acuerdo Frase 2 (fr2) Columna 2
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmente en desacuerdo

2. “La mayoría de las veces en mi departamento compartimos la infor-
mación más que guardarla para nosotros”.

5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmente en desacuerdo

(continúa)

www.FreeLibros.com

286 Capítulo 10 Análisis de los datos cuantitativos

Tabla 10.3 Ejemplo con la variable moral (continuación) Variable de la matriz que Ubicación en la
corresponde a la variable de matriz
Variable de la investigación: moral
la investigación Columna 3
3. “En mi departamento nos mantenemos en contacto permanentemente”. Frase 3 (fr3)
5 Totalmente de acuerdo Columna 4
4 De acuerdo Frase 4 (fr4)
3 Ni de acuerdo ni en desacuerdo Columna 5
2 En desacuerdo Frase 5 (fr5)
1 Totalmente en desacuerdo

4. “En mi departamento nos reunimos con frecuencia para hablar tanto
de asuntos de trabajo como de cuestiones personales”.
5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmente en desacuerdo

5. “En mi trabajo todos nos llevamos muy bien”.
5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmente en desacuerdo

En las opciones “Transformar” y “Calcular” o “Computar” el programa nos pide que indiquemos
el nombre de la nueva variable (en este caso la compuesta por cinco frases): moral. Y nos solicita que
desarrollemos la expresión numérica que corresponda a esta variable compuesta: fr1+fr2+fr3+fr4+fr5
(automáticamente el programa realiza la operación y agrega la nueva variable compuesta “moral” a la
matriz de datos y realiza los cálculos, y ahora sí, la variable del estudio es una variable más de la matriz
de datos). La matriz se modificaría de la siguiente manera:

EJEMPLO
fr1 fr2 fr3 fr4 fr5 Moral

1 1 2 2 4 3 12
2 2 2 2 2 2 10
K 2 3 2 2 3 12

Desde luego, para mantener esta variable debemos demostrar que fue medida de forma confiable
y válida, así como evaluar si todos los ítems aportan favorablemente a ambos elementos o algunos no.
Y en lugar de una suma, la variable moral podría ser un promedio de las cinco frases o variables de la
matriz (como ya se mencionó en el tema de la escala Likert). Entonces, la expresión en “Calcular”
hubiera sido: (fr1+fr2+fr3+fr4+fr5)/5, y los valores en “moral” serían:

EJEMPLO
fr1 fr2 fr3 fr4 fr5 Moral

1 1 2 2 4 3 2.4
2 2 2 2 2 2 2.0
K 2 3 2 2 3 2.4

www.FreeLibros.com

Estadística descriptiva para cada variable 287

Por último, las variables de la investigación son las que nos interesan, ya sea que estén compuestas
por uno, dos, diez, 50 o más ítems. El primer análisis es sobre los ítems, únicamente para explorar; el
análisis descriptivo final es sobre las variables del estudio.

Apunte 2

Los análisis de los datos dependen de tres factores:

a) El nivel de medición de las variables.
b) La manera como se hayan formulado las hipótesis.
c) El interés del investigador.

Por ejemplo, los análisis que se aplican a una variable nominal son distintos a los de una variable
por intervalos. Se sugiere recordar los niveles de medición vistos en el capítulo anterior.

El investigador busca, en primer término, describir sus datos y posteriormente efectuar análisis
estadísticos para relacionar sus variables. Es decir, realiza análisis de estadística descriptiva para cada una
de las variables de la matriz (ítems) y luego para cada una de las variables del estudio, finalmente aplica
cálculos estadísticos para probar sus hipótesis. Los tipos o métodos de análisis cuantitativo o estadístico
son variados y se comentarán a continuación; pero cabe señalar que el análisis no es indiscriminado,
cada método tiene su razón de ser y un propósito específico; por ello, no deben hacerse más análisis de
los necesarios. La estadística no es un fin en sí misma, sino una herramienta para evaluar los datos.

Estadística descriptiva para cada variable

La primera tarea es describir los datos, los valores o las puntuaciones obtenidas para cada variable. Por
ejemplo, si aplicamos a 2 112 niños el cuestionario sobre los usos y las gratificaciones que la televisión
tiene para ellos, ¿cómo pueden describirse estos datos? Esto se logra al describir la distribución de las
puntuaciones o frecuencias de cada variable.

¿Qué es una distribución de frecuencias? 2

Una distribución de frecuencias es un conjunto de puntuaciones ordenadas en sus Distribución de frecuencias Conjunto
respectivas categorías y generalmente se presenta como una tabla. de puntuaciones ordenadas en sus respec-
tivas categorías.
La tabla 10.4 muestra un ejemplo de una distribución de frecuencias.

EJEMPLO

En un estudio entre 200 personas latinas que viven en el estado de California, Estados Unidos,2 se les
preguntó: ¿cómo prefiere que se refieran a usted en cuanto a su origen étnico? Las respuestas fueron:

Tabla 10.4 Ejemplo de una distribución de frecuencias
Variable: preferencias al referir el origen étnico (nombrada en SPSS: prefoe)

Categorías Códigos (valores) Fecuencias

Hispano 1 52
Latino 2 88
Latinoamericano 36
Americano 4 22
Otros 5 20
No respondieron 6 12

Total 200

2 Encuesta con 7% de margen de error (University of Southern California y Bendixen & Associates, 2002).

www.FreeLibros.com

288 Capítulo 10 Análisis de los datos cuantitativos

A veces, las categorías de las distribuciones de frecuencias son tantas que es necesario resumirlas.
Por ejemplo, examinaremos detenidamente la distribución de la tabla 10.5. Esta distribución podría
compendiarse como en la tabla 10.6.

Tabla 10.5 Ejemplo de una distribución que necesita resumirse

Variable: calificación en la prueba de motivación

Categorías Frecuencias

48 1
55 2
56 3
57 5
58 7
60 1
61 1
62 2
63 3
64 2
65 1
66 1
68 1
69 1
73 2
74 1
75 4
76 3
78 2
80 4
82 2
83 1
84 1
86 5
87 2
89 1
90 3
92 1
TOTAL
63

Tabla 10.6 Ejemplo de una distribución resumida

Variable: calificación en la prueba de motivación

Categorías Frecuencias

55 o menos 3
56-60 16
61-65 9
66-70 3
71-75 7
76-80 9
81-85 4
86-90 11
91-96 1
TOTAL
63
www.FreeLibros.com

Estadística descriptiva para cada variable 289

¿Qué otros elementos contiene una distribución de frecuencias?

Las distribuciones de frecuencias pueden completarse agregando los porcentajes de casos en cada cate-
goría, los porcentajes válidos (excluyendo los valores perdidos) y los porcentajes acumulados (porcen-
taje de lo que se va acumulando en cada categoría, desde la más baja hasta la más alta).

La tabla 10.7 muestra un ejemplo con las frecuencias y porcentajes en sí, los porcentajes válidos y
los acumulados. El porcentaje acumulado constituye lo que aumenta en cada categoría de manera por-
centual y progresiva (en orden descendente de aparición de las categorías), tomando en cuenta los
porcentajes válidos. En la categoría “sí se ha obtenido la cooperación”, se ha acumulado 74.6%. En la
categoría “no se ha obtenido la cooperación”, se acumula 78.7% (74.6% de la categoría anterior y
4.1% de la categoría en cuestión). En la última categoría siempre se acumula el total (100%).

Tabla 10.7 Ejemplo de una distribución de frecuencias con todos sus elementos
Variable: cooperación del personal con el proyecto de calidad de la empresa

Categorías Códigos Frecuencias Porcentaje válido Porcentaje acumulado

– Sí se ha obtenido la cooperación 1 91 74.6 74.6
– No se ha obtenido la cooperación 2 5 4.1 78.7
– No respondieron 3 26 21.3 100.0
Total
122 100.0

Las columnas porcentaje y porcentaje válido son iguales (mismas cifras o valores) cuando no hay
valores perdidos; pero si tenemos valores perdidos, la columna porcentaje válido presenta los cálculos
sobre el total menos tales valores. En la tabla 10.8 se muestra un ejemplo con valores perdidos en el
caso de un estudio exploratorio sobre los motivos de los niños celayenses para elegir su personaje tele-
visivo favorito (García y Hernández Sampieri, 2005).

Al elaborar el reporte de resultados, una distribución se presenta con los elementos más informativos
para el lector y la descripción de los resultados o un comentario, tal como se muestra en la tabla 10.9.

Tabla 10.8 Ejemplo de tabla con valores perdidos (en SPSS)

Motivos de la preferencia de su personaje favorito

Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado

Válidos Divertidos 142 72.1 73.2 73.2
Buenos 10 5.1 5.2 78.4
Perdidos Tienen poderes 23 11.7 11.9 90.2
TOTAL Son fuertes 19 9.6 9.8 100.0
Total
No contestaron 194 98.5 100.0
3 1.5

197 100.0

Tabla 10.9 Ejemplo de una distribución de frecuencias para presentar a un usuario

¿Se ha obtenido la cooperación del personal para el proyecto de calidad?

Obtención Núm. de organizaciones Porcentajes

Sí 91 74.6
No 5 4.1
No respondieron 26 21.3
Total
122 100.0

COMENTARIO. Prácticamente tres cuartas partes de las organizaciones sí han obtenido la cooperación del personal. Llama la
atención que poco más de una quinta parte no quiso comprometerse con su respuesta. Las organizaciones que no han logrado
la cooperación del personal mencionaron como factores ausentismo, rechazo al cambio y conformismo.

www.FreeLibros.com

290 Capítulo 10 Análisis de los datos cuantitativos

En SPSS se solicitan las tablas con distribuciones de frecuencias en: Analizar → Estadísticos des-
criptivos → Frecuencias.3

¿De qué otra manera pueden presentarse las distribuciones de frecuencias?

Las distribuciones de frecuencias, especialmente cuando utilizamos los porcentajes, pueden presentar-
se en forma de histogramas o gráficas de otro tipo (por ejemplo: de pastel). Algunos ejemplos se mues-
tran en la figura 10.4.

Histogramas4 Gráficas circulares Otros tipos de gráficas
Opinión acerca del actual alcalde del
Cooperación de todo el personal Control paterno sobre el uso que los niños
municipio de San Martín Aurelio5 (o la mayoría) para el proyecto de calidad hacen de la televisión.

44.4 (122 = 100%) 47.1% 52.9% Regañan cuando el
niño ve mucha televisión
31.1 No
4.1% 40.4% 59.6% A veces castigan al
20.3 niño sin ver televisión
No respondieron
21.3%

Sí 64.4% 35.6% Prohíben que vea
74.6% 68.4% algunos programas
Imponen la hora de
1.9 2.3
31.6% irse a la cama

Muy des- Des- Neutral Favorable Muy

favorable favorable favorable

Solamente la tercera parte de los ciudadanos Prácticamente tres cuartas partes han obtenido Hay control No hay control
expresa una opinión positiva respecto al la cooperación de todo el personal (o la mayoría)
alcalde (favorable o muy favorable). para el proyecto de la empresa. Pero llama la
atención que poco más de una quinta parte
no quiso comprometerse con su respuesta.
Los cinco motivos de no cooperación con dicho
proyecto fueron: ausentismo, falta de interés,
rechazo al cambio, falta de concientización y
conformismo.

Figura 10.4 Ejemplos de gráficas para presentar distribuciones.

S P S S® SPSS y Minitab producen tales gráficas, o bien, los datos pueden exportarse a otros programas y/o
paquetes que las generan (de cualquier tipo, a colores, utilizando efectos de movimiento y en tercera
dimensión, como por ejemplo: Power Point).

Para obtener las gráficas en SPSS no olvide consultar en el CD anexo el manual de SPSS/SPAW.

3 Esta secuencia en SPSS para obtener los análisis de frecuencias requeridos, al igual que el resto de análisis (valores, tablas y
gráficas), se incluyen en el CD anexo → Manual de SPSS/SPAW.

4 Este histograma fue hecho en Power Point, a partir de SPSS.
5 El nombre real del municipio se ha sustituido por este ficticio.

www.FreeLibros.com

Estadística descriptiva para cada variable 291

Las distribuciones de frecuencias también se pueden Polígonos de frecuencias Relacionan
graficar como polígonos de frecuencias las puntuaciones con sus respectivas fre-
cuencias, por medio de gráficas útiles para
Los polígonos de frecuencias relacionan las puntuaciones con sus respectivas fre- describir los datos.
cuencias. Es más bien propio de un nivel de medición por intervalos o razón. Los
polígonos se construyen sobre los puntos medios de los intervalos. Por ejemplo, si
los intervalos fueran 20-24, 25-29, 30-34, 35-39, y siguientes; los puntos medios
serían 22, 27, 32, 37, etc. SPSS o Minitab realizan esta labor en forma automática.
Un ejemplo de un polígono de frecuencias se muestra en la figura 10.5.

Variable: satisfacción en el trabajo

f
50
40
30
20
10
0

20 25 30 35 40 45 50 55

Figura 10.5 Ejemplo de un polígono de frecuencias.

El polígono de frecuencias obedece a la siguiente distribución:

Categorías/intervalos Frecuencias absolutas

20-24.9 10
25-29.9 20
30-34.9 35
35-39.9 33
40-44.9 36
45-49.9 27
50-54.9
TOTAL 8
169

Los polígonos de frecuencias representan curvas útiles para describir los datos. Nos indican hacia S P S S®
dónde se concentran los casos (personas, organizaciones, segmentos de contenido, mediciones de
polución, etc.) en la escala de la variable; más adelante se hablará de ello.

En resumen, para cada una de las variables de la investigación se obtiene su distribución de fre-
cuencias y, de ser posible, se grafica y obtiene su polígono de frecuencias correspondiente (para produ-
cir los polígonos en SPSS no olvide consultar en el CD anexo el manual respectivo).

En la figura 10.6 se muestra un ejemplo más.
El polígono puede presentarse con frecuencias como en la figura 10.5 o con porcentajes como con
este último ejemplo. Pero además del polígono de frecuencias, deben calcularse las medidas de tenden-
cia central y de variabilidad o dispersión.

www.FreeLibros.com

292 Capítulo 10 Análisis de los datos cuantitativos 20

Variable: innovación

Con respecto a la innovación en la empresa, que es Porcentaje 10
la percepción del apoyo a las iniciativas tendientes a
introducir mejoras en la manera como se realiza el
trabajo, a nivel organizacional y departamental, la

mayoría de los individuos tienden a estar en altos
niveles de la escala.

0
Omitido 2.00 2.40 2.80 3.20 3.60 4.00 4.40 4.80

1.80 2.20 2.60 3.00 3.40 3.80 4.20 4.60 5.00

Figura 10.6 Ejemplo de un polígono de frecuencias con la variable innovación.

¿Cuáles son las medidas de tendencia central?

Medidas de tendencia central Va- Las medidas de tendencia central son puntos en una distribución obtenida, los valores
lores medios o centrales de una distri- medios o centrales de ésta, y nos ayudan a ubicarla dentro de la escala de medición. Las
bución que sirven para ubicarla dentro principales medidas de tendencia central son tres: moda, mediana y media. El nivel de
de la escala de medición. medición de la variable determina cuál es la medida de tendencia central apropiada para
interpretar.
Moda Categoría o puntuación que
se presenta con mayor frecuencia. La moda es la categoría o puntuación que ocurre con mayor frecuencia. En la tabla
10.7, la moda es “1” (sí se ha obtenido la cooperación). Se utiliza con cualquier nivel de
Mediana Valor que divide la distri- medición.
bución por la mitad.
La mediana es el valor que divide la distribución por la mitad. Esto es, la mitad de
los casos caen por debajo de la mediana y la otra mitad se ubica por encima de ésta. La
mediana refleja la posición intermedia de la distribución. Por ejemplo, si los datos obte-
nidos fueran:

24 31 35 35 38 43 45 50 57

La mediana es 38, porque deja cuatro casos por encima (43, 45, 50 y 57) y cuatro casos por deba-
jo (35, 35, 31 y 24). Parte a la distribución en dos mitades. En general, para descubrir el caso o la
puntuación que constituye la mediana de una distribución, simplemente se aplica la fórmula:

N +1

2

9+1

Si tenemos nueve casos, 2 entonces buscamos el quinto valor y éste es la mediana. Note que la
mediana es el valor observado que se localiza a la mitad de la distribución, no el valor de cinco. La
fórmula no nos proporciona directamente el valor de la mediana, sino el número de caso en donde está
la mediana.

La mediana es una medida de tendencia central propia de los niveles de medición ordinal, por
intervalos y de razón. No tiene sentido con variables nominales, porque en este nivel no hay jerarquías
ni noción de encima o debajo. Asimismo, la mediana es particularmente útil cuando hay valores extre-
mos en la distribución. No es sensible a éstos. Si tuviéramos los siguientes datos:

24 31 35 35 38 43 45 50 248

la mediana seguiría siwendwo w38.. FreeLibros.com

Estadística descriptiva para cada variable 293

Para la interpretación de la media y la mediana, se incluye un comentario al respecto en el siguien-
te ejemplo.6

EJEMPLO

¿Qué edad tiene? Si teme contestar no se preocupe, los perfiles de edad difieren de un país a otro.
Con base en proyecciones sobre la población en 2009, la población mundial para finales de 2010 será

de aproximadamente 6 867 millones de habitantes (Knol, 2009).7
La mediana de edad a nivel mundial es en 2009 de 28.1 años, lo que significa que la mitad de los

habitantes del globo terrestre sobrepasa esta edad y el otro medio es más joven. Cabe señalar que la
mediana varía de un lugar a otro, ya que en los países más desarrollados la edad mediana de la población
—esto es, la edad que divide a la población en dos partes iguales— ha ido en ascenso constante desde
1950 hasta llegar, en el 2009, a 38.8 años. En los países más pobres del orbe es de 19.3. Por continente
tenemos las siguientes medianas: África = 19.2 años (no ha variado desde 1950), Asia = 27.7, Europa
= 39.2 (creciendo 10 años, desde 1950), Latinoamérica y el Caribe = 26.4 (avanzamos 6.4 años en casi
60 años), Canadá y Estados Unidos de América = 36.4, y Oceanía = 32.3.8 Se estima que para la mitad
de este siglo la edad mediana mundial habrá aumentado a aproximadamente 36 años. Actualmente, el
país con la población más joven es Yemen, con una edad mediana de 15 años, y el más viejo es Japón,
con una edad mediana de 41 años (Di Santo, 2009).

Buena noticia para el actual ciudadano global medio, porque parece ser que se encuentra en la situa-
ción de envejecer más lentamente.

La media es la medida de tendencia central más utilizada y puede_definirse Media Es el promedio aritmético de una
como el promedio aritmético de una distribución. Se simboliza como X , y es la distribución y es la medida de tendencia
suma de todos los valores dividida entre el número de casos. Es una medida sola- central más utilizada.

mente aplicable a mediciones por intervalos o de razón. Carece de sentido para

variables medidas en un nivel nominal u ordinal. Es una medida sensible a valores extremos. Si tuvié-

ramos las siguientes puntuaciones:

876432698

El promedio sería igual a 5.88. Pero bastaría una puntuación extrema para alterarla de manera
notoria:

8 7 6 4 3 2 6 9 20 (promedio igual a 7.22).

El cálculo de la media, así como el resto de fórmulas de diversos estadísticos los podrá encontrar
el lector en el CD anexo: Material complementario → Capítulos → Capítulo 8 “Análisis estadístico:
segunda parte” (al final).

¿Cuáles son las medidas de la variabilidad?

Las medidas de la variabilidad indican la dispersión de los datos en la escala de Medidas de la variabilidad Son inter-

medición y responden a la pregunta: ¿dónde están diseminadas las puntuaciones o valos que indican la dispersión de los
los valores obtenidos? Las medidas de tendencia central son valores en una distribu- datos en la escala de medición.

ción y las medidas de la variabilidad son intervalos que designan distancias o un número de unidades

en la escala de medición. Las medidas de la variabilidad más utilizadas son rango, desviación estándar y

varianza.

6 Basado en una idea de Leguizamo (1987).
7 De acuerdo con la Organización de las Naciones Unidas (2009), al iniciar 2009 la población mundial era de aproximadamente
6 829 millones de individuos.
8 Todos los datos fueron obtenidos de la Organización de las Naciones Unidas (2009).

www.FreeLibros.com

294 Capítulo 10 Análisis de los datos cuantitativos

Rango Indica la extensión total de El rango, también llamado recorrido, es la diferencia entre la puntuación mayor y
los datos en la escala. la puntuación menor, e indica el número de unidades en la escala de medición que se
necesitan para incluir los valores máximo y mínimo. Se calcula así: XM – Xm (puntuación
mayor, menos puntuación menor). Si tenemos los siguientes valores:

17 18 20 20 24 28 28 30 33

el rango será: 33 – 17 = 16.

Cuanto más grande sea el rango, mayor será la dispersión de los datos de una distribu-

Desviación estándar Promedio de ción.
desviación de las puntuaciones con La desviación estándar o típica es el promedio de desviación de las puntuaciones
respecto a la media que se expresa en
las unidades originales de medición con respecto a la media. Esta medida se expresa en las unidades originales de medición
de la distribución. de la distribución. Se interpreta en relación con la media. Cuanto mayor sea la disper-

sión de los datos alrededor de la media, mayor será la desviación estándar. Se simboliza

con: s o la sigma minúscula σ, o bien mediante la abreviatura DE. Su cálculo lo podrá encontrar el

lector en el CD anexo: Material complementario → Capítulos → Capítulo 8 “Análisis estadístico:

segunda parte” (al final).

La desviación estándar se interpreta como cuánto se desvía, en promedio, de la media un conjunto

de puntuaciones.

Supongamos que un investigador obtuvo para su muestra una media (promedio) de ingreso fami-

liar anual de $6 000 y una desviación estándar de $1 000. La interpretación es que los ingresos fa-

miliares de la muestra se desvían, en promedio, mil unidades monetarias respecto a la media.

La desviación estándar sólo se utiliza en variables medidas por intervalos o de razón.

2 La varianza

Varianza Se utiliza en análisis infe- La varianza es la desviación estándar elevada al cuadrado y se simboliza s2. Es un con-

renciales. cepto estadístico muy importante, ya que muchas de las pruebas cuantitativas se funda-

mentan en él. Diversos métodos estadísticos parten de la descomposición de la varianza

(Jackson, 2008; Beins y McCarthy, 2009). Sin embargo, con fines descriptivos se utiliza preferente-

mente la desviación estándar.

¿Cómo se interpretan las medidas de tendencia
central y de la variabilidad?

Cabe destacar que al describir nuestros datos, respecto a cada variable del estudio, interpretamos las
medidas de tendencia central y de la variabilidad en conjunto, no aisladamente. Consideramos todos
los valores. Para interpretarlos, lo primero que hacemos es tomar en cuenta el rango potencial de la
escala. Supongamos que aplicamos una escala de actitudes del tipo Likert para medir la “actitud hacia
el presidente” de una nación (digamos que la escala tuviera 18 ítems y se promediaran sus valores). El
rango potencial es de uno a cinco (vea la figura 10.7).

Actitud hacia el presidente

1 23 45

(Actitud totalmente (Actitud totalmente
desfavorable) favorable)

Figura 10.7 Ejemplo de escala con rango potencial.

www.FreeLibros.com

Estadística descriptiva para cada variable 295

Si obtuviéramos los siguientes resultados:

Variable: actitud hacia el presidente
Moda: 4.0
Mediana_: 3.9
Media (X ): 4.2
Desviación estándar: 0.7
Puntuación más alta observada (máximo): 5.0
Puntuación más baja observada (mínimo): 2.0
Rango: 3

podríamos hacer la siguiente interpretación descriptiva: la actitud hacia el presidente es favorable. La
categoría que más se repitió fue 4 (favorable). Cincuenta por ciento de los individuos está por encima
del valor 3.9 y el restante 50% se sitúa por debajo de este valor (mediana). En promedio, los partici-
pantes se ubican en 4.2 (favorable). Asimismo, se desvían de 4.2, en promedio, 0.7 unidades de la
escala. Ninguna persona calificó al presidente de manera muy desfavorable (no hay “1”). Las puntua-
ciones tienden a ubicarse en valores medios o elevados.

En cambio, si los resultados fueran:

Variable: actitud hacia el presidente
Moda: 1
Mediana_: 1.5
Media (X ): 1.3
Desviación estándar: 0.4
Varianza: 0.16
Máximo: 3.0
Mínimo: 1.0
Rango: 2.0

la interpretación es que la actitud hacia el presidente es muy desfavorable. En la figura 10.8 vemos
gráficamente la comparación de resultados. La variabilidad también es menor en el caso de la actitud
muy desfavorable (los datos se encuentran menos dispersos).

Actitud favorable Desviación
Moda (4) estándar
(promedio de
Mediana (3.9) Media (4.2) desviación):

(1) (2) (3) (4) (5) 0.7
Rango (3)

Actitud muy desfavorable Desviación
Moda (1) estándar
(promedio de
Media (1.3) desviación):
Mediana (1.5)

(1) (2) (3) (4) (5) 0.4

Rango (2)
Figura 10.8 Ejemplo de interpretación gráfica.de las estadísticas descriptivas.

www.FreeLibros.com

296 Capítulo 10 Análisis de los datos cuantitativos

Otro ejemplo de interpretación de los resultados de una medición respecto a una variable sería el
que ahora se presenta.

EJEMPLO

Hernández Sampieri y Cortés (1982) aplicaron una prueba de motivación intrínseca sobre la ejecución de
una tarea a 60 participantes de un experimento. La escala contenía 17 ítems (con cinco opciones cada
uno, uno a cinco) y los resultados fueron los siguientes:9

N: 60 Rango: 41 Mínimo: 40 Máximo: 81
Media: 66.883 Mediana: 67.833 Moda: 61 DE: 9.11
Varianza: 83.02 Curtosis: 0.587 Asimetría: –0.775 EE: 1.176
Sumatoria: 4 013

¿Qué podríamos decir sobre la motivación intrínseca de los participantes?
El nivel de motivación intrínseca exhibido por los participantes tiende a ser elevado, como lo indican
los resultados. El rango real de la escala iba de 17 a 85. El rango resultante para esta investigación varió
de 40 a 81. Por tanto, es evidente que los individuos se inclinaron hacia valores elevados en la medida
de motivación intrínseca. Además, la media de los participantes es de 66.9 y la mediana de 67.8, lo cual
confirma la tendencia de la muestra hacia valores altos de la escala. A pesar de que la dispersión de las
puntuaciones de los sujetos es considerable (la desviación estándar es igual a 9.1 y el rango es de 41),
esta dispersión se manifiesta en el área más elevada de la escala. Veámoslo gráficamente.

Rango resultante _
X = 66.9 Mediana = 67.8

17 18 20 30 40 50 60 70 80 85
Rango real

Escala de motivación intrínseca (datos ordinales, supuestos como
datos en nivel de intervalo).

En resumen, la tarea resultó intrínsecamente motivante para la mayoría de los participantes; sólo que
para algunos resultó muy motivante; para otros, relativamente motivante, y para los demás, medianamen-
te motivante. Esto es, que la tendencia general es hacia valores superiores.

Ahora bien, ¿qué significa un alto nivel de motivación intrínseca exhibido con respecto a una tarea?
Implica que la tarea fue percibida como atractiva, interesante, divertida y categorizada como una expe-
riencia agradable. Asimismo, involucra que los individuos, al ejecutarla, derivaron de ella sentimientos
de satisfacción, goce y realización personal. Por lo general, quien se encuentra intrínsecamente motivado
hacia una labor, disfrutará la ejecución de ésta, ya que obtendrá de la labor per se recompensas internas,
como sentimientos de logro y autorrealización. Además de ser absorbido por el desarrollo de la tarea y, al
tener un buen desempeño, la opinión de sí mismo mejorará o se verá reforzada.

¿Hay alguna otra estadística descriptiva?

Sí, la asimetría y la curtosis. Los polígonos de frecuencia suelen representarse como curvas (figura 10.9)
para que puedan analizarse en términos de probabilidad y visualizar su grado de dispersión. De hecho,

9 EE significa “error estándar”.

www.FreeLibros.com

Estadística descriptiva para cada variable 297

en realidad son curvas. Los dos elementos mencionados son esenciales para estas curvas o polígonos de

frecuencias.

La asimetría es una estadística necesaria para conocer cuánto se parece nuestra distribución a una

distribución teórica llamada curva normal (la cual se representa también en la figura 10.9) y constitu-

ye un indicador del lado de la curva donde se agrupan las frecuencias. Si es cero (asimetría = 0), la

curva o distribución es simétrica. Cuando es positiva, quiere decir que hay más valores agrupados

hacia la izquierda de la curva (por debajo de la media). Cuando es negativa, signifi- Asimetría y curtosis Estadísticas que
ca que los valores tienden a agruparse hacia la derecha de la curva (por encima de la se usan para conocer cuánto se parece una
media). distribución a la distribución teórica llama-

La curtosis es un indicador de lo plana o “picuda” que es una curva. Cuando es da curva normal o campana de Gauss.

cero (curtosis = 0), significa que puede tratarse de una curva normal. Si es positiva,

quiere decir que la curva, la distribución o el polígono es más “picuda(o)” o elevada(o). Si la curtosis

es negativa, indica que es más plana la curva.

La asimetría y la curtosis requieren mínimo de un nivel de medición por intervalos. En la figura

10.9 se muestran ejemplos de curvas con su interpretación.

Distribución simétrica (asimetría = 0), con curtosis Distribución con asimetría negativa, curtosis positiva,
positiva, y una desviación estándar y varianza medias. y desviación estándar y varianza mayores.

Distribución con asimetría positiva, curtosis negativa, Distribución con asimetría negativa, curtosis positiva,
y desviación estándar y varianza considerables. y desviación estándar y varianza menores.

Distribución simétrica, curtosis positiva, y una desviación Curva normal, curtosis = 0, asimetría = 0, y desviación
estándar y varianza bajas. estándar y varianza promedios.

Figura 10.9 Ejemplos de curvas o distribuciones y su interpretación.

¿Cómo se traducen las estadísticas descriptivas al inglés?

Algunos programas y paquetes estadísticos computacionales pueden realizar el cálculo de las estadísticas
descriptivas, cuyos resultados aparecen junto al nombre respectivo de éstas, muchas veces en inglés.

www.FreeLibros.com

298 Capítulo 10 Análisis de los datos cuantitativos

A continuación se indican las diferentes estadísticas y su equivalente en inglés.

Estadística Equivalente en inglés

• Moda • Mode
• Mediana • Median
• Media • Mean
• Desviación estándar • Standard deviation
• Varianza • Variance
• Máximo • Maximum
• Mínimo • Minimum
• Rango • Range
• Asimetría • Skewness
• Curtosis • Kurtosis

Nota final

Debe recordarse que en una investigación se obtiene una distribución de frecuencias y se calculan las
estadísticas descriptivas para cada variable, las que se necesiten de acuerdo con los propósitos de la
investigación y los niveles de medición.

EJEMPLO

Hernández Sampieri (2005), en su investigación sobre el clima organizacional, obtuvo las siguientes
estadísticas fundamentales de sus variables en una de las muestras:

N Mínimo Máximo Media Desviación estándar

Moral 390 1.00 5.00 3.3818 0.91905
Dirección
Innovación 393 1.00 5.00 2.7904 1.08775
Identificación
Comunicación 396 1.00 5.00 3.4621 0.91185
Desempeño
Motivación intrínseca 383 1.00 5.00 3.6584 0.91283
Autonomía
Satisfacción 397 1.00 5.00 3.2519 0.87446
Liderazgo
Visión 403 1.00 5.00 3.6402 0.86793
Recompensas
401 2.00 5.00 3.9111 0.73900

395 1.00 5.00 3.2025 0.85466

399 1.00 5.00 3.7249 0.90591

392 1.00 5.00 3.4532 1.10019

391 1.00 5.00 3.7341 0.89206

381 1.00 5.00 2.4528 1.14364

Notas: Todas las variables son compuestas (integradas de varios ítems). La columna “N” representa el
número de casos válidos para cada variable. El N total de la muestra es de 420, pero como podemos ver

www.FreeLibros.com

Estadística descriptiva para cada variable 299

en la tabla, el número de casos es distinto en las diferentes variables, porque SPSS elimina de toda la
variable a los casos que no hayan respondido a un ítem o más reactivos. La variable con mayor promedio
es la motivación intrínseca y la más baja es recompensas.

Posteriormente, obtuvo las tablas y distribuciones de frecuencias de todas sus 12 variables. De las
cuales solamente incluimos la variable “desempeño” por cuestiones de espacio.

Valores Desempeño Porcentaje válido Porcentaje acumulado
1 Frecuencia 0.5 0.5
2 8.7 9.2
3 2 33.0 42.2
4 35 41.9 84.1
5 133 15.9
169 100.0
64 100.0
Total 403
N = 420
Perdidos = 17

Desempeño
50

40

Porcentaje 30

20

10

0 2.00 3.00 4.00 5.00
1.00 Desempeño

Para el cálculo de estadísticas descriptivas (tendencia central y dispersión) en SPSS, se sugiere con-
sultar en el CD anexo el manual respectivo.

Puntuaciones z

Las puntuaciones z son transformaciones que se pueden hacer a los valores o las puntuaciones obteni-
das, con el propósito de analizar su distancia respecto a la medida, en unidades de desviación estándar.
Una puntuación z nos indica la dirección y el grado en que un valor individual obtenido se aleja de la
media, en una escala de unidades de desviación estándar. El lector puede conocer más sobre las pun-
tuaciones z en el CD anexo: Material complementario → Capítulos → Capítulo 8 “Análisis estadísti-
co: segunda parte”.

www.FreeLibros.com

300 Capítulo 10 Análisis de los datos cuantitativos

Razones y tasas

Una razón es la relación entre dos categorías. Por ejemplo:

Categorías Frecuencia

Masculino 60
Femenino 30

La razón de hombres a mujeres es de 60 = 2. Es decir, por cada dos hombres hay
una mujer. 30
Tasa Es la relación entre el número
de casos de una categoría y el número Una tasa es la relación entre el número de casos, frecuencias o eventos de una catego-
total de observaciones.
ría y el número total de observaciones, multiplicada por un múltiplo de 10, generalmente

100 o 1 000. La fórmula es:

Tasa = Número de eventos × 100 o 1 000

Número total de eventos posibles

Ejemplo = Número de nacidos vivos en la ciudad × 1 000
Número de habitantes en la ciudad

Tasa de nacidos vivos en Santa Lucía: 10 000 × 1000 = 33.33
300 000

Es decir, hay 33.33 nacidos vivos por cada 1 000 habitantes en Santa Lucía.

Corolario

Ahora bien, hemos analizado descriptivamente los datos por variable del estudio y los visualizamos
gráficamente. En caso de que alguna distribución resulte ilógica, debemos cuestionarnos si la variable
debe ser excluida, sea por errores del instrumento de medición o en la recolección de los datos, ya que
la codificación puede ser verificada. Por ejemplo, supongamos que nos encontramos un porcentaje
alto de valores perdidos (de 20%),10 debemos preguntarnos: ¿por qué tantos participantes no respon-
dieron o contestaron erróneamente? O, al medir la satisfacción laboral, resulta que 90% se encuentra
“sumamente satisfecho” (¿es lógico?); u otro caso sería que, en ingresos anuales el promedio fuera de
15 000 dólares por familia (¿resulta creíble en tal municipio?). La tarea es revisar la información des-
criptiva de todas las variables.

Ahora, debemos demostrar la confiabilidad y validez de nuestro instrumento, sobre la base de los
datos recolectados.

Paso 4: evaluar la confiabilidad o fiabilidad
y validez lograda por el instrumento de medición

La confiabilidad se calcula y evalúa para todo el instrumento de medición utilizado, o bien, si se admi-
nistraron varios instrumentos, se determina para cada uno de ellos. Asimismo, es común que el instru-
mento contenga varias escalas para diferentes variables, entonces la fiabilidad se establece para cada
escala y para el total de escalas (si se pueden sumar, si son aditivas).

Tal y como se mencionó en el capítulo 9, existen diversos procedimientos para calcular la confia-
bilidad de un instrumento de medición. Todos utilizan fórmulas que producen coeficientes de fiabili-

10 Un porcentaje de valores perdidos (missing data) no debe ser mayor de 15%, no es razonable (Creswell, 2005). Cuando tene-
mos valores perdidos, podemos ignorarlos o sustituirlos por el valor promedio obtenido del total de puntuaciones válidas, esto lo hacen
muchos programas de análisis si así lo deseamos y puede ser una solución (McKnight et al., 2007).

www.FreeLibros.com

Paso 4: evaluar la confiabilidad o fiabilidad y validez lograda por el instrumento de medición 301

dad que pueden oscilar entre cero y uno, donde recordemos que un coeficiente de cero significa nula
confiabilidad y uno representa un máximo de confiabilidad. Cuanto más se acerque el coeficiente a
cero (0), mayor error habrá en la medición.

Los procedimientos más utilizados para determinar la confiabilidad mediante un coeficiente son:

1. Medida de estabilidad (confiabilidad por test-retest). En este procedimiento un mismo instrumento
de medición se aplica dos o más veces a un mismo grupo de personas, después de cierto periodo. Si
la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento
se considera confiable. Se trata de una especie de diseño panel. Desde luego, el periodo entre las
mediciones es un factor a considerar. Si el periodo es largo y la variable susceptible de cambios, ello
suele confundir la interpretación del coeficiente de fiabilidad obtenido por este procedimiento. Y
si el periodo es corto las personas pueden recordar cómo respondieron en la primera aplicación del
instrumento, para aparecer como más consistentes de lo que en realidad son (Bohrnstedt, 1976).
El proceso de cálculo con dos aplicaciones se representa en la figura 10.10.

Resultados de la prueba A, Resultados de la prueba A,
momento 1 momento 2

Coeficiente de correlación

Figura 10.10 Medida de estabilidad.

2. Método de formas alternativas o paralelas. En este esquema no se administra el mismo instrumen-
to de medición, sino dos o más versiones equivalentes de éste. Las versiones (casi siempre dos)
son similares en contenido, instrucciones, duración y otras características, y se administran a
un mismo grupo de personas simultáneamente o dentro de un periodo relativamente corto. El
instrumento es confiable si la correlación entre los resultados de ambas administraciones es posi-
tiva de manera significativa. Los patrones de respuesta deben variar poco entre las aplicaciones.
Una variación de este método es el de las formas alternas prueba-posprueba (Creswell, 2005),
cuya diferencia reside en que el tiempo que transcurre entre la administración de las versiones es
mucho más largo, que es el caso de algunos experimentos. El método se representa en la figura
10.11.

Coeficiente de correlación

Resultados de la prueba Resultados de la prueba
A A

1 2

Figura 10.11 Método de formas alternativas o paralelas.

www.FreeLibros.com

302 Capítulo 10 Análisis de los datos cuantitativos

3. Método de mitades partidas (split-halves). Los procedimientos anteriores (medida de estabilidad y
método de formas alternas) requieren cuando menos dos administraciones de la medición en el
mismo grupo de individuos. En cambio, el método de mitades partidas necesita sólo una aplica-
ción de la medición. Específicamente el conjunto total de ítems o reactivos se divide en dos mita-
des equivalentes y se comparan las puntuaciones o los resultados de ambas. Si el instrumento es
confiable, las puntuaciones de las dos mitades deben estar muy correlacionadas. Un individuo con
baja puntuación en una mitad tenderá a mostrar también una baja puntuación en la otra mitad.
El procedimiento se diagrama en la figura 10.12.

Resultados de la mitad de la Resultados de la otra mitad
prueba A de la prueba A

Coeficiente de correlación

Figura 10.12 Método de mitades partidas.

4. Medidas de coherencia o consistencia interna. Éstos son coeficientes que estiman la confiabilidad:
a) el alfa de Cronbach (desarrollado por J. L. Cronbach) y b) los coeficientes KR-20 y KR-21 de
Kuder y Richardson (1937). El método de cálculo en ambos casos requiere una sola administra-
ción del instrumento de medición. Su ventaja reside en que no es necesario dividir en dos mitades
a los ítems del instrumento, simplemente se aplica la medición y se calcula el coeficiente. La
mayoría de los programas estadísticos como SPSS y Minitab los determinan y solamente deben
interpretarse.

Respecto a la interpretación de los distintos coeficientes mencionados cabe señalar que no hay una
regla que indique: a partir de este valor no hay fiabilidad del instrumento. Más bien, el investigador
calcula su valor, lo reporta y lo somete a escrutinio de los usuarios del estudio u otros investigadores.
Pero podemos decir —de manera más o menos general— que si obtengo 0.25 en la correlación o
coeficiente, esto indica baja confiabilidad; si el resultado es 0.50, la fiabilidad es media o regular. En
cambio, si supera el 0.75 es aceptable, y si es mayor a 0.90 es elevada, para tomar muy en cuenta.

Con respecto a los métodos basados en coeficientes de correlación, rogamos al lector se forme una
idea más clara después de revisar el apartado de correlación que se presenta más adelante en este capí-
tulo. Pero sí hay una consideración importante que hacer ahora. El coeficiente que elijamos para
determinar la confiabilidad debe ser apropiado al nivel de medición de la escala de nuestra variable
(por ejemplo, si la escala de mi variable es por intervalos, puedo utilizar el coeficiente de correlación
de Pearson; pero si es ordinal podré utilizar el coeficiente de Spearman o de Kendall; y si es nominal,
otros coeficientes). Alfa trabaja con variables de intervalos o de razón y KR-20 y KR-21 con ítems
dicotómicos. El cálculo del coeficiente alfa se incluye en el CD anexo: Material complementario →
Capítulos → Capítulo 8 “Análisis estadístico: segunda parte”.

Con la finalidad de comprender mejor los métodos para determinar la confiabilidad vea la tabla
10.10.

www.FreeLibros.com

Paso 4: evaluar la confiabilidad o fiabilidad y validez lograda por el instrumento de medición 303

Tabla 10.10 Aspectos básicos de los métodos para determinar la confiabilidad

Método Número de veces que Número de Número de Inquietud o pregunta que contesta
el instrumento es versiones diferentes participantes que
administrado proveen los datos
del instrumento

Estabilidad Dos veces en tiem- Una versión. Cada participante ¿Responden los individuos de una
(test-retest) pos distintos. responde al instru- manera similar a un instrumento
mento dos veces. si se les administra dos veces?
Formas alternas Dos veces al mismo Dos versiones
tiempo o con una diferentes, pero Cada participante Cuando dos versiones de un
Formas alternas y diferencia de tiem- equivalentes. responde a cada instrumento son similares, ¿hay
prueba-posprueba po muy corta. versión del instru- convergencia o divergencia en las
Dos versiones mento. respuestas a ambas versiones?
Dos veces en tiem- diferentes, pero
pos distintos. equivalentes. Cada participante Cuando dos versiones de un
responde a cada instrumento son similares, ¿hay
Mitades partidas Una vez Una fragmentada versión del instru- convergencia o divergencia en las
en dos partes mento. respuestas a ambas versiones?
Medidas de con- Una vez equivalentes.
sistencia interna Cada participante ¿Son las puntuaciones de una
(alfa y KR-20 y 21) Una versión responde a la mitad del instrumento similares a
única versión. las obtenidas en la otra mitad?

Cada participante ¿Las respuestas a los ítems del
responde a la instrumento son coherentes?
única versión.

Asimismo, en la tabla 10.11 se presentan ejemplos de estudios con su respectiva confiabilidad.

Tabla 10.11 Ejemplos de confiabilidad

Investigación Instrumento Métodos de cálculo y resultados Comentario
Confiabilidad baja que demues-
Evaluación de los conocimientos, Escala cognitiva de nueve ítems para Coherencia interna alfa = 0.34. tra incongruencia, atribuida
opiniones, experiencias y acciones infantes en edades preescolares y por los autores a lo corto de la
en torno al abuso sexual infantil primeros grados básicos. escala (pocos ítems).
(Kolko et al., 1987). Las dos mediciones (de la
Estudio sobre la repercusión que Dos escalas de 25 ítems tipo Likert, El valor de la confiabilidad para la ansiedad generada por las
tiene la ansiedad generada por las una para medir la ansiedad sobre escala de ansiedad, al aplicar una actividades académicas y la del
actividades académicas en el des- actividades académicas y la otra prueba alfa de Cronbach, fue de desempeño escolar) indican una
empeño escolar (Suárez Gallardo, para el desempeño escolar. 0.916; en tanto que para la escala de estabilidad muy alta.
2004). desempeño escolar resultó de 0.93. El valor α indica una fiabilidad
Desarrollo y validación de una Un inventario para medir la satisfac- La confiabilidad del inventario esta- sumamente elevada.
escala autoaplicable para medir ción sexual que está integrado por 29 blecida por medio de una prueba alfa
la satisfacción sexual en varones y reactivos y fue administrado a una Cronbach fue de 0.92. Confiabilidad muy elevada.
mujeres de México (Álvarez Gayou, muestra de 760 personas, de ambos
Honold y Millán, 2005). géneros, cuyas edades fluctuaron El coeficiente alfa-Cronbach obtenido Coeficientes muy considerables
entre los 16 y 65 años. resultó igual a 0.95 (con 95 ítems). para entrega y satisfacción, y
Validación de un instrumento para La muestra estuvo conformada por aceptable para inversión.
medir la cultura empresarial en Cuestionario estandarizado que mide 1 424 empleados de 12 empresas
función del clima organizacional el clima organizacional en función del (972 casos válidos completos).
y vincular empíricamente ambos Modelo de los Valores en Competen-
constructos (Hernández Sampieri, cia de Quinn y Rohrbaugh, a través Los coeficientes alfa resultantes de
2009). de escalas tipo Likert con cuatro aplicar las escalas a 400 universi-
opciones de respuesta: dos positivas tarios fueron: 0.94 para entrega y
Actitudes hacia el matrimonio: y dos negativas. satisfacción, y 0.88 para inversión
integración y sus resultados en psicológica.
las relaciones personales (Riggio y Escalas del Modelo de Inversión
Weiser, 2008). (IMS), las cuales a partir de 37
reactivos (cada uno con 9 categorías)
miden la entrega, la inversión psico-
lógica y la satisfacción con respecto a
una relación romántica actual.

www.FreeLibros.com

304 Capítulo 10 Análisis de los datos cuantitativos

Otro caso es el ya comentado de Núñez (2001) y su instrumento para medir el sentido de vida,
cuya fiabilidad fue de 0.96 en su tercera versión con 99 ítems (vea en el CD anexo → Material com-
plementario → Investigación cuantitativa → Ejemplo 5).

Como podemos observar en la tabla 10.11, entre más información se proporcione sobre la con-
fiabilidad, el lector se forma una idea más clara sobre su cálculo y las condiciones en que se demostró.
Es indispensable incluir las dimensiones de la variable medida, el tamaño de muestra y el método
utilizado. Una cuestión importante es que los coeficientes son sensibles al número de ítems o reactivos,
entre más agreguemos, el valor del coeficiente tenderá a ser más elevado.

Insistimos en que el coeficiente alfa es para intervalos y los coeficientes Kuder Richarson para
ítems dicotómicos (por ejemplo: sí-no). Estos últimos se usan en el método de “mitades partidas”,
aunque —como señalan Creswell (2005) y Babbie (2009)— se confía en la mitad de la información
del instrumento, por lo que conviene agregar el cálculo de “profecía” Spearman-Brown.

Además de estimar un coeficiente de correlación y/o un coeficiente de coherencia entre los ítems
del instrumento, es conveniente calcular la correlación ítem-escala completa. Ésta representa la vincu-
lación de cada reactivo con toda la escala. Habrá tantas correlaciones como ítems contenga el instru-
mento. Corbetta (2003, p. 237) lo ejemplifica adecuadamente de la siguiente manera: si estamos
midiendo el autoritarismo, es lógico pensar que quien alcanza altas puntuaciones en esta variable en
toda la escala (es muy autoritaria), habrá de tener puntuaciones elevadas en todos los ítems que la
conforman. Pero si uno de los reactivos sistemáticamente (en un número considerable de individuos)
presenta valores contradictorios con respecto a la escala total, podemos concluir que ese ítem no fun-
ciona adecuadamente (contradice a los demás reactivos). Los ítems que alcancen coeficientes de corre-
lación bajos con la escala, tal vez deban analizarse y, eventualmente, eliminarse.

Asimismo, cada uno de los reactivos puede ser evaluado en su capacidad de discriminación
mediante la prueba t de Student (paramétrica). Se consideran dos grupos, el primero integrado por
25% de los casos con los puntajes más altos obtenidos en el ítem y el otro grupo compuesto por 25%
de los casos con los puntajes más bajos. Los ítems cuya prueba no resulte significativa serán reconside-
rados.

Los conceptos estadísticos aquí vertidos (por ejemplo, correlación) tendrán mayor sentido, una
vez que se revisen más ampliamente, lo cual se hará más adelante en este capítulo.

La validez

Ya se comentó en el capítulo anterior que la evidencia sobre la validez del contenido se obtiene median-
te las opiniones de expertos y al asegurarse que las dimensiones medidas por el instrumento sean
representativas del universo o dominio de dimensiones de la(s) variable(s) de interés (a veces mediante
un muestreo aleatorio simple). La evidencia de la validez de criterio se produce al correlacionar las
puntuaciones de los participantes, obtenidas por medio del instrumento, con sus valores logrados en
el criterio. Recordemos que una correlación implica asociar puntuaciones obtenidas por la muestra en
dos o más variables.

Por ejemplo, Núñez (2001), además de aplicar su instrumento sobre el sentido de vida, adminis-
tró otras dos pruebas que supuestamente miden variables similares: el PIL (propósito de vida) y el
Logo-test de Elizabeth Lukas. El coeficiente de correlación de Pearson entre el instrumento diseñado
y el PIL fue de 0.541, valor que se considera moderado. El coeficiente de correlación de Spearman’s
rho fue igual a 0.42 entre el Logo Test y su instrumento, lo cual indica dos cuestiones: los tres instru-
mentos no miden la misma variable, pero sí conceptos relacionados.

La evidencia de la validez de constructo se obtiene mediante el análisis de factores. Tal método nos
indica cuántas dimensiones integran a una variable y qué ítems conforman cada dimensión. Los reac-
tivos que no pertenezcan a una dimensión, quiere decir que están “aislados” y no miden lo mismo que
los demás ítems; por tanto, deben eliminarse. Es un método que tradicionalmente se ha considerado
complejo, por los cálculos estadísticos implicados, pero que es relativamente sencillo de interpretar y
como los cálculos hoy en día los realiza la computadora, está al alcance de cualquier persona que se

www.FreeLibros.com

Paso 5: analizar mediante pruebas estadísticas las hipótesis planteadas 305

inicie dentro de la investigación. Este método se revisa —con ejemplos reales— en el CD anexo → S P S S®
Material Complementario → Capítulos → Capítulo 8 “Análisis estadístico: segunda parte”.

La confiabilidad se obtiene en Minitab siguiendo los comandos: Estadísticas (Statistics) →
Confiabilidad/supervivencia (Reliability/Survival), y en SPSS no olvide consultar en el CD anexo el
manual respectivo. En las futuras versiones de estos programas, las opciones podrían cambiar, pero es
cuestión de localizar en dónde se solicita el análisis de interés.

Una vez que se determina la confiabilidad (de 0 a 1) y se muestra la evidencia sobre la validez, si
algunos ítems son problemáticos (no discriminan, no se vinculan a otros ítems, van en sentido contra-
rio a toda la escala, no miden lo mismo, etc.), se eliminan de los cálculos (pero en el reporte de la
investigación, se indica cuáles fueron eliminados, las razones de ello y cómo alteran los resultados);
posteriormente se vuelve a realizar el análisis descriptivo (distribución de frecuencias, medidas de ten-
dencia central y de variabilidad, etcétera).

En el CD anexo → Material complementario → Investigación cuantitativa → Ejemplo 4 “Diseño
de una escala autoaplicable para la evaluación de la satisfacción sexual en hombres y mujeres mexica-
nos” (Álvarez Gayou, Honold y Millán, 2005), se presenta la validación de un instrumento que mues-
tra todos los elementos para ello, paso por paso. Incluye la generación de redes semánticas. Su
abordaje es desde el punto de vista de la salud y con propiedad científica.

¿Hasta aquí llegamos?

Cuando el estudio tiene una finalidad puramente exploratoria o descriptiva, debemos interrogarnos:
¿podemos establecer relaciones entre variables? En caso de una respuesta positiva, es factible seguir;
pero si dudamos o el alcance se limitó a explorar y describir, el trabajo de análisis concluye y debemos
comenzar a preparar el reporte de la investigación. De lo contrario es necesario continuar con la esta-
dística inferencial.

Paso 5: analizar mediante pruebas estadísticas las hipótesis
planteadas (análisis estadístico inferencial)

En este paso se analizan las hipótesis a la luz de pruebas estadísticas, que a continuación detallamos.

Estadística inferencial: de la muestra a la población

¿Para qué es útil la estadística inferencial?

Con frecuencia, el propósito de la investigación va más allá de describir las distribuciones de las varia- 5

bles: se pretende probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o

universo. Los datos casi siempre se recolectan de una muestra y sus resultados estadísticos se denomi-

nan estadígrafos; la media o la desviación estándar de la distribución de una muestra son estadígrafos.

A las estadísticas de la población se les conoce como parámetros. Éstos no son calculados, porque no se

recolectan datos de toda la población, pero pueden ser inferidos de los estadígrafos, Estadística inferencial Se utiliza para
de ahí el nombre de estadística inferencial. El procedimiento de esta naturaleza de probar hipótesis y estimar parámetros.
la estadística se esquematiza en la figura 10.13.

Recolección de Cálculo de Inferencia de los Población
los datos en la estadígrafos parámetros mediante o
técnicas estadísticas
muestra universo
apropiadas

Figura 10.13 Procedimiento de la estadística inferencial.

www.FreeLibros.com

306 Capítulo 10 Análisis de los datos cuantitativos

Entonces, la estadística inferencial se utiliza fundamentalmente para dos procedimientos vincu-
lados (Wiersma y Jurs, 2008; Asadoorian, 2008):

a) Probar hipótesis poblacionales
b) Estimar parámetros

La prueba de hipótesis la comentaremos en este capítulo y se efectúa dependiendo del tipo de hipó-
tesis de que se trate. Existen pruebas estadísticas para diferentes clases de hipótesis como iremos viendo.

La inferencia de los parámetros depende de que hayamos elegido una muestra probabilística con
un tamaño que asegure un nivel de significancia adecuado. En el CD anexo → Material Complemen-
tario → Capítulos → Capítulo 8 “Análisis estadístico: segunda parte”, se presenta un ejemplo de
inferencia sobre la hipótesis de la media poblacional.

¿En qué consiste la prueba de hipótesis?

Prueba de hipótesis Determina Una hipótesis en el contexto de la estadística inferencial es una proposición respecto a

si la hipótesis es congruente con los uno o varios parámetros, y lo que el investigador hace por medio de la prueba de hipó-
datos de la muestra. tesis es determinar si la hipótesis poblacional es congruente con los datos obtenidos en

la muestra (Wiersma y Jurs, 2008; Gordon, 2010).

Una hipótesis se retiene como un valor aceptable del parámetro, si es consistente con los datos. Si

no lo es, se rechaza (pero los datos no se descartan). Para comprender lo que es la prueba de hipótesis

en la estadística inferencial es necesario revisar los conceptos de distribución muestral11 y nivel de

significancia.

¿Qué es una distribución muestral?

Distribución muestral Conjunto de Una distribución muestral es un conjunto de valores sobre una estadística calculada de

valores sobre una estadística calculada todas las muestras posibles de determinado tamaño de una población. Las distribucio-
de todas las muestras posibles de una nes muestrales de medias son probablemente las más conocidas. Expliquemos este con-
población. cepto con un ejemplo. Supongamos que nuestro universo son los automovilistas de una

ciudad y deseamos averiguar cuánto tiempo pasan diariamente manejando (“al volan-

te”). De este universo podría extraerse una muestra representativa. Vamos a suponer que el tamaño

adecuado de muestra es de 512 automovilistas (n = 512). Del mismo universo se podrían extraer dife-

rentes muestras, cada una con 512 personas.

Teóricamente, incluso podría elegirse al azar una, dos, tres, cuatro muestras, y las veces que fuera

necesario hacerlo, hasta agotar todas las muestras posibles de 512 automovilistas de esa ciudad (todos

los individuos serían seleccionados en varias muestras). En cada muestra se obtendría una media del

tiempo que pasan los automovilista_s m_ane_jan_do. _Tendrí_amos pues, una gran cantidad de medias,
tantas como las muestras extraídas (X1, X2, X3, X4, X5, … Xk ). Y con éstas elaboraríamos una distribu-
ción de medias. Habría muestras que, en promedio, pasaran más tiempo “al volante” que otras. Este

concepto se representa en la figura 10.14.

Si calculáramos la media de todas las medias de las muestras, prácticamente obtendríamos el valor

de la media poblacional.

De hecho, casi nunca se obtiene la distribución muestral (la distribución de las medias de todas

las muestras posibles). Es más bien un concepto teórico definido por la estadística para los investiga-

dores. Lo que comúnmente hacemos es extraer una sola muestra.

En el ejemplo de los automovilistas, sólo una de las líneas verticales de la distribución muestral

presentada en la figura 10.14 es la media obtenida para nuestra única muestra seleccionada de 512

personas. Y la pregunta es: ¿nuestra media calculada se encuentra cerca de la media de la distribución

11 Distribución muestral y distribución de una muestra son conceptos diferentes, esta última es resultado de los datos de nuestra
investigación y es por variable.

www.FreeLibros.com

Paso 5: analizar mediante pruebas estadísticas las hipótesis planteadas 307

_
Son medias (X ), no se trata de puntuaciones. Cada media representaría una muestra.

Figura 10.14 Distribución muestral de medias.

muestral?, debido a que si está cerca podremos tener una estimación precisa de la media poblacional
(el parámetro poblacional es prácticamente el mismo que el de la distribución muestral). Esto se expre-
sa en el teorema central del límite:

Si una población (no necesariamente normal) tiene de media m y de desviación estándar s, la distribu-
ción de las medias en el muestreo aleatorio realizado en esta población tiende, al aumentar n, a una
distribución normal de media m y desviación estándar s , donde n es el tamaño de muestra.

n

El teorema especifica que la distribución muestral tiene una media igual a la de la población, una 2

varianza igual a la varianza de la población dividida entre el tamaño de muestra (su desviación estándar
σ
es n y se distribuye normalmente). La desviación estándar (s) es un parámetro normalmente desco-

nocido, aunque es posible estimarlo por la desviación estándar de la muestra. El concepto de distribu-

ción normal es importante otra vez y se ofrece una breve explicación en la figura 10.15.

¿Qué es el nivel de significancia?

Wiersma y Jurs (2008) ofrecen una explicación sencilla del concepto, en la cual nos basaremos para 2

analizar su significado. La probabilidad de que un evento ocurra oscila entre cero (0) y uno (1), donde

cero implica la imposibilidad de ocurrencia y uno la certeza de que el fenómeno ocurra. Al lanzar al

aire una moneda no cargada, la probabilidad de que salga “cruz” es de 0.50 y la probabilidad de que la

moneda caiga en “cara” también es de 0.50. Con un dado, la probabilidad de obtener cualquiera de

sus caras al lanzarlo es de 1/6 = 0.1667. La suma de posibilidades siempre es de uno.

Aplicando el concepto de probabilidad a la distribución muestral, tomaremos el área de ésta como

1.00; en consecuencia, cualquier área comprendida entre dos puntos de la distribución corresponderá

a la probabilidad de la distribución. Para probar hipótesis inferenciales respecto a la media, el investi-

gador debe evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media

de la distribución muestral. Si es baja, el investigador dudará de generalizar a la población. Si es alta,

el investigador podrá hacer generalizaciones. Es aquí donde entra el nivel de signi- Nivel de significancia Es un nivel de

ficancia o nivel alfa (α)12, el cual es un nivel de la probabilidad de equivocarse y se la probabilidad de equivocarse y que fija
fija antes de probar hipótesis inferenciales. de manera a priori el investigador.

Este concepto fue esbozado en el capítulo 8 con un ejemplo coloquial, pero lo volvemos a recor-

dar: si fuera a apostar en las carreras de caballos y tuviera 95% de probabilidades de atinarle al ganador,

contra sólo 5% de perder, ¿apostaría? Obviamente sí, siempre y cuando le aseguraran ese 95% en

favor.

12 No confundir con el coeficiente Alfa-Cronbach, éste es para determinar la confiabilidad.

www.FreeLibros.com

308 Capítulo 10 Análisis de los datos cuantitativos

Una gran cantidad de los fenómenos del comportamiento humano se manifiestan de la siguiente forma: la mayoría de
las puntuaciones se concentran en el centro de la distribución, en tanto que en los extremos encontramos sólo algunas
puntuaciones. Por ejemplo, la inteligencia: hay pocas personas muy inteligentes (genios), pero también hay pocas personas con
muy baja inteligencia (por ejemplo: personas con capacidades mentales diferentes). La mayoría de los seres humanos somos
medianamente inteligentes. Esto podría representarse así:

Poco Común de Genios
inteligente la gente:
inteligencia
media

Inteligencia

Debido a ello, se creó un modelo de probabilidad llamado curva normal o distribución normal. Como todo modelo es una
distribución teórica que difícilmente se presenta en la realidad tal cual, pero sí se presentan aproximaciones a éste. La curva
normal tiene la siguiente configuración:

Media = 0
Desviación estándar (s) = 1

68.26%

–3s –2s –1s +1s +2s +3s

95.44%

99.74%

68.26% del área de la curva normal es cubierta entre –1s y +1s, 95.44% del área de esta curva es cubierta entre –2s y +2s y
99.74% se cubre con –3s y +3s.
Las principales características de la distribución normal son:

1. Es unimodal, una sola moda.
2. La asimetría es cero. La mitad de la curva es exactamente igual a la otra mitad.

La distancia entre la media y +3s es la misma que la distancia entre la media y –3s.
3. Es una función particular entre desviaciones con respecto a la media de una distribución y la probabilidad de que éstas

ocurran.
4. La base está dada en unidades de desviación estándar (puntuaciones z), destacando las puntuaciones –1s, –2s, –3s,

+1s, +2s y +3s (que equivalen respectivamente a –1.00z, –2.00z, –3.00z, +1.00z, +2.00z, +3.00z). Las distancias entre
puntuaciones z representan áreas bajo la curva. De hecho, la distribución de puntuaciones z es la curva normal.
5. Es mesocúrtica (curtosis de cero).
6. La media, la mediana y la moda coinciden en el mismo punto.

Figura 10.15 Concepto de curva o distribución normal.

www.FreeLibros.com


Click to View FlipBook Version