The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Aprendizaje Humano, 4ta Edición - Jeanne Ellis Ormrod

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by Marvin's Underground Latino USA, 2018-08-31 12:45:37

Aprendizaje Humano, 4ta Edición - Jeanne Ellis Ormrod

Aprendizaje Humano, 4ta Edición - Jeanne Ellis Ormrod

78 APRENDIZAJE HUMANO

mediante un esquema de reforzamiento continuo. Cuando reunía una serie de tarros con 36 fichas,
podía realizar diferentes actividades; por ejemplo, con dos tarros podía jugar, y con siete podía ver
una película de dibujos animados. Cuando llegó a ser capaz de leer con un nivel básico, se le refor-
zó con un esquema de proporción fija 1:2; esto es, recibía una ficha por cada dos palabras que leía
correctamente. Más adelante se le reforzó por cada cuatro palabras, después por cada página, más
adelante por cada historia completa, y al final por cada cuatro historias. Después de quince sesio-
nes de este tipo se suprimió el reforzamiento y el niño volvió a sus clases normales; tres meses des-
pués todavía mantenía el mismo nivel que sus compañeros (siempre me ha preocupado una cosa so-
bre este estudio: debido a que se necesitaban tantas fichas para poder hacer una «compra», supongo
que el niño no pudo comprar muchas actividades. Me da la sensación de que su éxito en la lectura
fue el auténtico reforzador).

Se han llegado a utilizar esquemas de proporción que llegan a 1:1.000, siempre y cuando se in-
troduzcan paulatinamente (Fester y Skinner, 1957). De hecho, las proporciones más elevadas sue-
len producir ritmos de respuesta más altos que las proporciones más bajas (Collier, Hirsh y Hamlin,
1972; Stephens, Pear, Wray y Jackson, 1975), si bien se ha encontrado que bajo estas circunstancias
los organismos tienden a mostrar una pausa post-reforzamiento (una disminución temporal en su
respuesta) después de que se haya reforzado una respuesta (Fester y Skinner, 1957).

Proporción variable (PV)

Un reforzamiento con un esquema de proporción variable es aquél en que se presenta el refor-
zamiento después de que sean emitidos un determinado número de respuestas, si bien dicho núme-
ro varía de una ocasión a otra. Este tipo de esquema se define por el número medio de respuestas
que se necesitan para obtener un reforzamiento. Por ejemplo, en un esquema 1:5 PV, podría darse
un primer reforzamiento después de cuatro respuestas, y luego otro después de siete más, otro des-
pués de tres más, etc. Como se puede observar, la ocurrencia del reforzamiento en un esquema PV
es bastante impredecible.

La venta Buenos días, señora ...la envidia ...la envidia
telefónica se Armrot. me llamo de todos de todos
refuerza María. ¿cómo está sus amigos... sus amigos...
mediante un usted? Le llamo para
esquema de Cielos, ...la envidia
proporción ofrecerle una gracias, de todos
variable. oportunidad que sólo pero no... sus amigos...
se presenta una vez

en la vida, y que
consiste en un tractor

que sólo le costará
unos cuantos céntimos
al día. Usted podría ser

la envidia de todos
sus amigos...

...la envidia
de todos
sus amigos...

Pueden ¿Por qué no?
metérselo... Compraré una

docena

El reforzador

Capítulo 4 I Condicionamiento operante 79

Las máquinas tragaperras son un ejemplo de respuesta reforzada con un esquema de este tipo.
Cuantas más veces se inserta una moneda en la máquina, más veces vendrá un refuerzo en forma
de premios, pero ese premio no llega de manera predecible tras determinado número de monedas
insertadas. De manera similar, las ventas telefónicas se refuerzan también mediante este tipo de es-
quema. Cuantas más llamadas se realicen, mayor será el número de ventas, si bien el operador tele-
fónico nunca sabe en qué llamada obtendrá el reforzamiento.

Margarita, una amiga que mi hija Tina tuvo en la escuela primaria, era muy persistente cada vez
que quería alguna cosa, y casi nunca obtenía un no por respuesta. Una tarde en la que Tina y yo ha-
bíamos ido a cenar a un restaurante con Margarita y su madre, entendí por qué la niña era tan per-
sistente. Las dos niñas engulleron rápidamente su comida y salieron a explorar, mientras sus madres
tomábamos café. Margarita volvió rápidamente a la mesa para pedir algo a su madre:

«Mamá, ¿Me das dinero para un videojuego?»
«No».
«Por favor, mamá».
«He dicho que no, Margarita».
«Pero Tina tiene uno». (Yo miré ausente hacia el vacío).
«No».
«Te lo pagaré en cuanto volvamos a casa».
«No, Margarita».
«¡Porfa!» (Margarita pone cara de desesperación).
«De acuerdo, aquí tienes el dinero».

La conducta de Margarita probablemente era un esquema de reforzamiento de proporción va-
riable: había aprendido que el que persevera, gana.

Los esquemas de proporción variable dan lugar a ritmos de respuesta más elevados que los
esquemas de proporción fija. Y lo que es más, las respuestas reforzadas mediante un esquema
PV son también más resistentes a la extinción. De hecho, las palomas que reciben esquemas PV
muy altos pueden llegar a gastar más energía en su respuesta de la que ganan con la comida
(Swenson, 1980).

Esquemas de intervalo: reforzar la primera respuesta
que se da tras un período de tiempo

Un esquema de intervalo es aquél en el que el reforzamiento está asociado con la primera res-
puesta que se emite después de que haya pasado un determinado período de tiempo. Ese intervalo
puede ser constante (un esquema de intervalo fijo) o variar entre un reforzamiento y el siguiente (un
esquema de intervalo variable).

Intervalo fijo (IF)
En un esquema de reforzamiento de intervalo fijo, el refuerzo se asocia con la primera res-

puesta que se emite cuando ha pasado un determinado período de tiempo. Por ejemplo, el organis-
mo puede obtener un reforzamiento cuando emita una respuesta después de 5 minutos, y sea cual
sea la cantidad de respuestas que haya emitido durante ese tiempo. Después del reforzamiento,

Minutos estudiando80 APRENDIZAJE HUMANO

comienza otro intervalo de 5 minutos, pasado el cual volverá a reforzarse la primera respuesta que
se produzca.

Un esquema de intervalo fijo produce un único patrón de respuesta: tras el reforzamiento, el rit-
mo de respuestas disminuye hasta que se aproxima el final del período, momento en el que vuelve
a incrementarse (Fester y Skinner, 1957; Shimoff, Catania y Matthews, 1981). Por ejemplo, cuando
mi hija Tina estaba en 5.° curso de primaria tenía que hacer un examen de deletreo todos los vier-
nes. El profesor le daba la lista de palabras el lunes, de manera que tenían cuatro días para estu-
diarla. Alguna vez empezó el miércoles, pero lo normal era que esperase hasta el jueves por la no-
che para empezar a estudiar. Si hubiese que plasmar gráficamente la conducta de estudio de Tina,
aparecería algo similar al gráfico de la figura 4.5. Este patrón «festoneado» es característico de las
conductas reforzadas mediante un esquema de intervalo fijo. Las respuestas no son tan frecuentes
ni tan resistentes a la extinción como las que producen los esquemas de proporción fija y variable.

60

30

0
Lu Ma Mi Ju Vi Sa Do Lu Ma Mi Ju Vi Sa Do Lu Ma Mi Ju Vi Sa
Días de la semana

Figura 4.5 Las respuestas reforzadas mediante un esquema de intervalo fijo muestran un patrón «festoneado».

Intervalo variable (IV)
En un esquema de reforzamiento de intervalo variable, el reforzamiento se asocia con la pri-

mera respuesta que se emite después de que haya pasado un período de tiempo determinado, si bien
la longitud de ese intervalo varía de una ocasión a la siguiente. Por ejemplo, el organismo puede ser
reforzado en la primera respuesta que da tras 5 minutos y, luego, en la primera respuesta después de
8 minutos y, luego, en la primera respuesta después de 2 minutos, etcétera, de manera que es una
media de tiempo la que define este tipo de esquema.

Por ejemplo, si usted tiene un amigo de aquéllos a quienes les encanta hablar por teléfono, pro-
bablemente siempre tenga la línea ocupada. Si usted tiene una necesidad urgente de contactar con
él, probablemente continuará marcando su número de teléfono cada pocos minutos hasta que des-
cuelgue. De manera similar, aquellos alumnos a quienes se ha dicho que siempre es posible que se
encuentren con un examen sorpresa, tenderán a estudiar un poco todos los días. Ellos nunca saben
exactamente qué día obtendrán el fruto de su trabajo. Este patrón de respuesta es típico de los es-
quemas de intervalo variable: un ritmo de respuesta lento pero mantenido. Cuanto más largo sea el
intervalo de tiempo medio hasta el momento del reforzamiento, más lento será el ritmo de respues-
ta (Catania y Reynolds, 1968). (Es necesario resaltar que por razones distintas, los exámenes sor-
presa no son recomendables, ya que aumentan la ansiedad de los alumnos y, como descubriremos
en el capítulo 16, demasiada ansiedad interfiere en el aprendizaje. De hecho, los exámenes sorpre-
sa no tienen en cuenta que las actividades extraescolares y las obligaciones familiares no siempre
permiten que las tareas escolares se realicen el mismo día en que se asignan).

Capítulo 4 I Condicionamiento operante 81

Así pues, tanto respecto a los esquemas de proporción como a los de intervalo, los de tipo va-
riable producen respuestas que se mantienen más que los esquemas fijos, probablemente debido a
lo impredecible del reforzamiento. Con un esquema variable, siempre existe la posibilidad de que
la próxima respuesta correcta obtenga un beneficio. Los esquemas variables también parecen con-
llevar una mayor resistencia a la extinción, precisamente por su carácter impredecible.

Cuando se utilizan esquemas de proporción o de intervalo para evitar la extinción de una res-
puesta previamente adquirida, el mejor esquema que podemos usar depende del ritmo de respuesta
deseada. En la mayoría de los casos, se recomienda una proporción variable para ritmos muy ele-
vados de respuesta, y un esquema de intervalo variable para un ritmo lento pero mantenido. De ma-
nera ideal, cuando el reforzamiento continuo se sustituye por un reforzamiento intermitente, la pro-
porción debería ser pequeña (por ejemplo, 1:2 o 1:3), o el intervalo debería ser breve. Aparte de que
la proporción o el intervalo de tiempo pueden aumentarse progresivamente hasta que las respuestas
se produzcan sin que apenas tengamos que proporcionar reforzamiento.

Esquemas diferenciales: reforzar ritmos de respuesta

Cuando se desea obtener un ritmo de respuesta determinado, lo más apropiado es utilizar un es-
quema de reforzamiento diferencial: el reforzamiento se obtiene cuando se produce un determi-
nado número de respuestas durante un período de tiempo específico. Los investigadores han estu-
diado el efecto de diversos esquemas de este tipo, tales como los siguientes:

• Reforzamiento de un ritmo diferencial de muchas respuestas.
• Reforzamiento de un ritmo diferencial de pocas respuestas.
• Reforzamiento de la no ocurrencia de esa respuesta (reforzamiento diferencial de otras

conductas.

Ritmo diferencial de muchas respuestas (RDM)

Un esquema RDM proporciona refuerzo sólo cuando se ha emitido un gran número de res-
puestas durante un determinado período de tiempo. Por ejemplo, recuérdese a Margarita, la amiga
de Tina que persistentemente pedía dinero su madre para comprar un videojuego. Margarita proba-
blemente estaba siguiendo un esquema RDM y no tanto un esquema de proporción variable, ya que
en realidad pedía el dinero muchas veces de una vez para poder obtener reforzamiento. Con un es-
quema de proporción, el tiempo requerido para producir el número necesario de respuestas es irre-
levante, pero en un esquema RDM este período de tiempo resulta importante. Dado que este es-
quema exige que se produzcan muchas respuestas durante un corto período de tiempo, el patrón más
común es de una gran cantidad de respuestas.

En teoría, estudiar para exámenes fijados de antemano seguiría un esquema RDM: cuanto más
se estudia, mayor es la probabilidad de obtener reforzamiento en el momento del examen. Sin em-
bargo, como ha señalado Klein (1987), la mayoría de los estudiantes se enfrentan a los exámenes
desde una perspectiva de esquema de intervalo fijo, lo que provoca un patrón de estudio del tipo
«disfrutamos ahora, empollamos después».

Ritmo diferencial de pocas respuestas (RDP)

Un esquema RDP refuerza la primera respuesta que se emita tras un intervalo de tiempo deter-
minado, durante el cual el organismo no ha producido ninguna respuesta. Esto podría sonar a

82 APRENDIZAJE HUMANO

intervalo fijo, pero recuérdese que, en este caso, las respuestas que se produjeran no se reforzarían,
pero serían aceptables. Un ejemplo de RDP es cuando intentamos arrancar un coche que tiene el
motor ahogado. Cuanto más lo intentemos será peor; lo mejor que podemos hacer es esperar un ra-
to e intentarlo de nuevo.

Las peticiones que hacen los alumnos para que el profesor les ayude en un examen, podrían ser
un ejemplo de respuestas que deberían reforzarse mediante un esquema RDP. Si reforzamos conti-
nuamente a nuestros alumnos cada vez que nos piden ayuda, provocaremos un ritmo muy alto de
peticiones y, por lo tanto, una gran dependencia del profesor. Sin embargo, si sólo reforzamos a los
estudiantes que piden ayuda cuando han estado trabajando por sí mismos durante un período de
tiempo determinado, estaremos enseñándoles que es más aceptable la independencia unida a peti-
ciones de ayuda ocasionales.

Debemos observar que aprender el patrón de respuesta apropiada para un esquema de este tipo
suele ser difícil, ya que exige que no realicemos una conducta que previamente había sido reforza-
da (Reynolds, 1975).

Reforzamiento diferencial de otras conductas (RDO)

En un esquema RDO, se refuerza al organismo por no hacer nada excepto realizar determinada
conducta durante determinado momento; en tal situación el organismo nunca debe realizar esa res-
puesta específica. Por ejemplo, imaginemos a un profesor que dice: «voy a escribir en la pizarra el
nombre de cada alumno que hable sin que sea su turno. Si a las tres en punto su nombre no está es-
crito en la pizarra, obtendrá media hora de tiempo libre». Este profesor está utilizando un esquema
RDO, ya que está reforzando a los niños por no hablar sin permiso.

El reforzamiento continuo es, evidentemente, la forma más eficaz de enseñar una respuesta
nueva. Sin embargo, una vez que se ha alcanzado la conducta terminal, resulta más interesante
aplicar diferentes esquemas de reforzamiento (proporción, intervalo y diferencial), para evitar la
extinción (con excepción del esquema RDO), y para controlar la frecuencia y el patrón que siguen
las respuestas.

CONTROL DEL ESTÍMULO

Al principio de este capítulo he descrito el condicionamiento operante de Skinner como un mo-
delo RÆErf (donde Erf es el reforzamiento) y no como un modelo E-R. En efecto, un estímulo que
precede a una respuesta puede influir sobre la probabilidad de que esta respuesta ocurra de nuevo;
si bien el papel de ese estímulo antecedente en el condicionamiento operante es diferente del que
desempeña en otros modelos conductistas, como el condicionamiento clásico.

Por ejemplo, imaginemos un escenario típico de un curso de bachillerato: el profesor empieza a
describir los deberes que va a mandar para casa, cuando la campana que señala el final de la clase
le interrumpe. Inmediatamente, los estudiantes dejan de estar interesados en escuchar las tareas que
el profesor les propone, por lo que cierran sus cuadernos y empiezan a empujar intentando salir del
aula. Estos alumnos están bajo el control del estímulo: han aprendido que una respuesta determi-
nada (abandonar el aula) resulta aceptable bajo ciertas condiciones estimulantes (por ejemplo, cuan-
do suena el timbre). Un profesor astuto se pondría de pie delante de la puerta mientras asignaba los
deberes y no dejaría levantarse a los alumnos, con campana o sin campana. De esta manera, los
alumnos aprenderían que abandonar la clase sólo está permitido bajo un estímulo diferente, como
que el profesor salga de la clase.

Capítulo 4 I Condicionamiento operante 83

En el condicionamiento operante, el estímulo antecedente no provoca directamente la respues-
ta, tal y como sí sucede en el condicionamiento clásico. Por el contrario, la presencia del estímulo
antecedente señala que en ese momento puede ser reforzada una respuesta determinada. Cuando un
estímulo antecedente aumenta la probabilidad de que se produzca una respuesta, éste se denomina
estímulo discriminativo que, a menudo, se simboliza como E+8 y se expresa diciendo que la res-
puesta está bajo el control del estímulo. Las respuestas a un estímulo en el condicionamiento ope-
rante suelen mostrar generalización y discriminación del estímulo, fenómenos similares a la gene-
ralización y la discriminación que observamos en el condicionamiento clásico.

Generalización del estímulo

Cuando un organismo ha aprendido a responder de cierta manera en presencia de un estímulo
(el E+), es probable que responda de la misma manera en presencia de un estímulo parecido; este
fenómeno se conoce como generalización del estímulo. Tal y como sucede en el condicionamien-
to clásico, la generalización del estímulo tiende a ocurrir con más probabilidad ante estímulos pa-
recidos. Por ejemplo, los niños de una escuela infantil (el aula sería el E+) podrían aprender algu-
nas conductas apropiadas, como levantar la mano para poder hablar. Estas conductas pueden
generalizarse mejor a una situación parecida (el aula de primaria) que a una situación distinta (sen-
tados a la mesa durante la cena). Esta tendencia de los organismos a generalizar con más facilidad
cuando los estímulos son parecidos, se conoce como gradiente de generalización.

Discriminación del estímulo

En el condicionamiento clásico, la discriminación del estímulo se produce cuando un estímulo (el
EC+) se presenta junto a un estímulo incondicionado, y otro estímulo (el EC–) se presenta en ausen-
cia del estímulo incondicionado. Algo parecido sucede en el condicionamiento operante: una respues-
ta puede ser reforzada en presencia de un estímulo (E+), pero no en presencia de otro estímulo (E–):

(S+) R ———> Erf
(S–) R ———> (nada)

El proceso mediante el que se aprende bajo qué circunstancias una respuesta será reforzada me-
diante el condicionamiento operante, se denomina discriminación del estímulo. Se trata esencial-
mente del proceso de aprender que una respuesta condicionada que se realiza en presencia de E+ no
debe generalizarse a E–. Considérese el niño de preescolar que ha aprendido a decir «b» cada vez
que ve este símbolo:

b

Entonces ve esté estímulo que se le parece:

d

8 Si usted lee alguna de las obras de Skinner sobre este tema, tenga presente que él utilizada el símbolo Ed en vez de E+.

84 APRENDIZAJE HUMANO

y responde diciendo «be», esto es, generaliza. (Cualquiera que haya trabajado con niños pequeños
que están aprendiendo las letras, habrá observado que, de manera coherente con este principio, los
niños tienen más tendencia a generalizar la «be» a la letra d que a otras letras menos parecidas co-
mo la s o la y). Si el profesor no refuerza al niño por dar la respuesta «be» ante el símbolo d, pro-
bablemente el niño aprenderá a distinguir entre las letras b y d.

Control del estímulo en el aula

En la escuela, como en tantas otras situaciones, se requiere dar diferentes respuestas en distin-
tos momentos. Por ejemplo, resulta perfectamente apropiado, e incluso deseable, charlar con los
compañeros en determinados momentos (por ejemplo, durante un debate) pero no en otros (por
ejemplo, durante un examen). De manera similar, las carreras pueden ser apropiadas en las pistas
deportivas pero no en los pasillos del colegio. ¿Cómo hacen los profesores para conseguir que los
alumnos muestren conductas diferentes en ocasiones distintas? Los psicólogos han sugerido dos es-
trategias: los indicadores y los contextos.

Indicadores
En el aula, los estímulos discriminativos que señalan la ocasión para realizar conductas deseables,

no siempre son evidentes; por ejemplo, el único estímulo que habitualmente señala el momento de
ordenar la mesa y prepararse para ir a comer, será un reloj en la pared que marque las 12:25. Por es-
ta razón, resulta útil que los profesores proporcionen estímulos discriminativos adicionales que per-
mitan a los estudiantes saber qué deben hacer, una estrategia que suele denominarse indicador o re-
cordatorio (Krumboltz y Krumboltz, 1972; Shabani y otros, 2002; Taylor y Levin, 1998).

En algunas situaciones, los profesores pueden proporcionar indicadores no verbales para señalar
cuál es la respuesta deseada. Por ejemplo, durante una tarea de aprendizaje cooperativo, podría en-
cender y apagar rápidamente varias veces la luz para recordar a los alumnos que pueden hablar en
voz baja pero no a gritos. En otras ocasiones, los profesores pueden utilizar claves verbales para pro-
mover una conducta apropiada. Por ejemplo, un profesor de primaria cuyos estudiantes se están pre-
parando para ir al comedor podría decir: «caminad en silencio y en fila india». A continuación, el
profesor podría reforzar esta conducta permitiendo a los estudiantes salir únicamente si van en si-
lencio y en fila. Un profesor que quiere recordar a sus alumnos la necesidad de realizar sus deberes
rápidamente podría decir: «cuando hayáis terminado de leer sobre el reciclaje en vuestro libro de ge-
ografía, os diré lo que vamos a hacer mañana durante la excursión a una planta de reciclaje»9.

Establecer contextos
Hasta este momento hemos centrado nuestro estudio sobre el control de estímulos específicos co-

mo la letra b o la instrucción del profesor de «caminar en silencio», que animan a los alumnos a com-
portarse de una forma determinada. Algunos psicólogos no aluden a estímulos tan específicos, sino más
bien a condiciones ambientales complejas (contextos) bajo las cuales es más probable que se produz-
can respuestas determinadas (Brown, Bryson-Brockmann y Fox, 1986; Hoch, McComas, Johnson,

9 Este tipo de indicios también son muy eficaces fuera del aula. Por ejemplo cuando los empleados del supermercado
o los camareros del restaurante dicen adiós a los clientes que salen y les recuerdan que deben usar el cinturón de seguridad,
éstos muestran más tendencia a utilizarlo (Austin, Alvero y Olson, 1998; Engerman, Austin y Bailey, 1997).

Capítulo 4 I Condicionamiento operante 85

Faranda y Guenther, 2002; Kantor, 1959; Morris, 1982; Wahler y Fox, 1981). Por ejemplo, los niños de
preescolar muestran más tendencia a relacionarse con sus compañeros durante el tiempo libre si dispo-
nen de una zona relativamente pequeña donde jugar, y con juguetes a su disposición que promuevan la
actividad de grupo (Brown, Fox, y Brady, 1987; Martin, Brady y Williams, 1991). De manera similar,
las conductas de los niños también están influidas por el tipo de juegos que realizan: los juegos coope-
rativos promueven la conducta cooperativa, mientras que los juegos competitivos promueven la con-
ducta agresiva (Bay-Hinitz, Peterson y Quilitch, 1994). Por lo tanto, los profesores deben tener en cuen-
ta la necesidad de crear el tipo de entorno que promueva las conductas más deseables en sus alumnos.

PERSPECTIVAS CONTEMPORÁNEAS

DEL CONDICIONAMIENTO OPERANTE

Como se ha dicho anteriormente en este capítulo, las ideas de Skinner sobre el condicionamiento
operante han sufrido muy pocos cambios desde que las propuso en 1938 hasta su muerte en 1990.
Sin embargo, las ideas de otros conductistas sí han evolucionado de manera considerable a lo largo
del tiempo. A continuación, ofrecemos algunos ejemplos de perspectivas contemporáneas del con-
dicionamiento operante que difieren de las nociones originales de Skinner:

• La conducta se comprende mejor observando un contexto más amplio y un período de tiem-
po más largo de lo que tradicionalmente se ha hecho. Los primeros conductistas tendían a
pensar en términos de relaciones específicas E-R dentro de un período de tiempo relativa-
mente corto; por ejemplo, un investigador solía estudiar las consecuencias inmediatas de una
respuesta determinada. Por el contrario, la mayoría de los conductistas estudian ahora rela-
ciones entre la conducta y el entorno cada vez más amplias y duraderas (Herrnstein, 1990;
Rachlin, 1990, 1991). Los contextos que acabamos de comentar en el apartado anterior ilus-
tran esta tendencia, en el sentido de que se trata de condiciones ambientales relativamente
complejas, y no tanto de estímulos específicos. Algunos psicólogos analizan las elecciones
que deberán hacer los organismos ante situaciones en las que conductas diferentes obtendrían
reforzadores distintos (de Villiers, 1977; Rachlin, 1991). Otros examinan las condiciones ba-
jo las cuales tienden a persistir determinadas conductas a pesar de los cambios que puedan
producirse en los estímulos ambientales, un fenómeno conocido como impulso conductual
(Belfiore, Lee, Vargas y Skinner, 1997; Mace y otros, 1988; Nevin, Mandell y Atak, 1983).

• Un estudio de Belfiore y sus asociados (1997) ilustra perfectamente lo que es el impulso
conductual. Dos chicas (Allison, de catorce años y Roberta, de quince años) solían rechazar
las tareas académicas que les ponían sus profesores. Los investigadores encontraron que una
manera de animar a las chicas a realizar multiplicaciones difíciles de tres dígitos era comen-
zar por asignarles multiplicaciones más sencillas de un dígito. Así pues, los profesores pue-
den promover el impulso conductual comenzando por asignar tareas sencillas y gratificantes
antes de pasar a otras tareas más complejas y potencialmente frustrantes.

• El condicionamiento operante también incluye la cognición y no sólo la conducta. Muchos
teóricos actuales sugieren que el condicionamiento operante se comprende mejor cuando to-
mamos en consideración procesos mentales no observables, además de las respuestas y los
estímulos observables (Colwill, 1993; Rachlin, 1991; Schwartz y Reisberg, 1991; Vaughan,
1988; Wasserman, 1993). Por ejemplo, un organismo establece expectativas respecto a qué

86 APRENDIZAJE HUMANO

reforzador tiene más probabilidad de ocurrir tras una respuesta determinada (Colwill, 1993;
Rachlin, 1991; Schwartz y Reisberg, 1991). Estos investigadores han descubierto que tanto
los seres humanos como otros animales desarrollan categorías de estímulos ante las cuales
responden. Por ejemplo, es posible enseñar a las palomas a distinguir entre miembros de ca-
tegorías diferentes, como pueden ser gatos y flores, coches y camiones, dibujos de Carlitos y
de otros de sus compañeros, e incluso, entre períodos de tiempo de diferente duración
(Killeen, 1991; Rachlin, 1991; Vaughan, 1988; Wasserman, 1993). Los conductistas también
están empezando a utilizar expresiones como prestar atención a los estímulos discriminati-
vos, codificar mentalmente y encontrar el significado de la relación respuesta-reforzamiento,
y buscar información en el entorno, como se puede ver expresiones que tienen un carácter
claramente cognitivo (Colwill, 1993; Colwill y Rescorla, 1986; DeGrandpre, 2000; Rachlin,
1991; Rescorla, 1987; Schwartz y Reisberg, 1991).
• El condicionamiento clásico y el operante no llegan a determinar por completo las conduc-
tas que un organismo puede mostrar en una ocasión determinada. Skinner fue un determi-
nista: propuso que si tenemos un conocimiento absoluto de la historia de reforzamientos de
un organismo y de las circunstancias ambientales actuales, así como información sobre las
predisposiciones genéticas de ese organismo, podríamos predecir su conducta con total segu-
ridad y precisión. Sin embargo, la perspectiva de algunos conductistas contemporáneos no
tiene un carácter tan determinista: propone que cualquier conducta de un organismo refleja
cierto grado de variabilidad que las relaciones E-R no pueden explicar (Epstein, 1991;
Rachlin, 1991). Por ejemplo, si se piensa detenidamente, el proceso de modelado no sería po-
sible a menos que un organismo fuera modificando sus propias respuestas de acuerdo con el
proceso de reforzamiento. En definitiva, sólo es posible que aparezcan conductas nuevas y
más adaptativas, mediante la introducción de pequeños cambios en las respuestas y la cons-
tatación de sus consecuencias (Epstein, 1991).
• De la misma manera que un reforzamiento incrementa la frecuencia de una respuesta, el cas-
tigo puede ser una medida eficaz para disminuir una respuesta. Las primeras investigaciones
de Thorndike (1932a, 1932b) y de Skinner (1938) indicaban que el castigo tenía poca proba-
bilidad de reducir la conducta que lo precedía. Sin embargo, estudios posteriores han puesto
de manifiesto que el castigo puede ser eficaz en muchas situaciones. En consecuencia, algu-
nos teóricos han rescatado la parte «punitiva» de la ley del efecto propuesta por Thorndike,
asegurando que las respuestas seguidas por un estímulo desagradable se debilitan (Aronfreed,
1968; Aronfreed y Reber, 1965; Lentz, 1988; Parke, 1972, 1977; Rachlin, 1991). Es necesa-
rio señalar que cuando los conductistas describen los efectos del reforzamiento y del castigo
en el aprendizaje y la conducta, suelen utilizar el término condicionamiento instrumental
más que el de condicionamiento operante.

En el capítulo 6 discutiremos el castigo, junto con sus efectos y algunos consejos de uso. Por
ahora, nos concentraremos en los métodos basados en el reforzamiento, dirigidos a eliminar la con-
ducta indeseable.

ELIMINACIÓN DE LAS CONDUCTAS INDESEABLES

Hemos dedicado mucho espacio a explicar cómo se aprenden, modifican y mantienen conduc-
tas nuevas mediante el condicionamiento operante. Sin embargo, en ocasiones puede que nos inte-

Capítulo 4 I Condicionamiento operante 87

rese más eliminar una conducta que se ha adquirido previamente. Existen cuatro posibles métodos
para reducir y eliminar este tipo de conductas: la extinción, las consecuencias no congruentes, el re-
forzamiento diferencial de otras conductas y el reforzamiento de conductas incompatibles.

Extinción de respuestas

A un psicólogo se le consultó en una ocasión sobre Jaime, un niño que había estado hospitali-
zado durante mucho tiempo. Las enfermeras estaban preocupadas porque se golpeaba la cabeza
contra el lateral de la cuna; cuando alguien lo veía hacer eso, entraba en su habitación y lo detenía,
reforzando así involuntariamente la conducta del niño. El psicólogo fue capaz de eliminar esa con-
ducta utilizando un proceso de extinción: a Jaime se le colocó un casco para que no se hiciera da-
ño, y se indicó a las enfermeras que le ignoraran cada vez que empezara a golpearse la cabeza.
Paralelamente se les instruyó para que le prestaran atención en los momentos en que no lo hacía.

La extinción, esto es, asegurarse de que una respuesta no obtendrá reforzamiento, suele ser un
método eficaz para eliminar conductas inapropiadas. Los alumnos que alborotan la clase dejarán de
hacerlo si notan que su conducta ya no atrae la atención de los demás. En realidad, no es necesario
eliminar los reforzadores que están operando en esa circunstancia; simplemente necesitamos ase-
gurarnos de que esos reforzadores dejan de estar asociados con las respuestas que intentamos eli-
minar (Fisher, Iwata y Mazalewski, 1997).

Por desgracia, la extinción no suele ser el mejor método para eliminar conductas indeseables, y
ello por varias razones. En primer lugar, no siempre es posible identificar la consecuencia específi-
ca que está reforzando una respuesta. Por ejemplo los niños que, como Jaime, se golpean la cabeza
lo hacen por diferentes razones, quizá para obtener la atención de los adultos, no hacer los deberes
(una forma de reforzamiento negativo), u obtener autoestimulación (Iwata, Pace, Cowdery y
Miltenberger, 1994)). En segundo lugar, lo normal es que sean varios los reforzadores que mantie-
nen una respuesta, incluyendo algunos difíciles de eliminar; por ejemplo, aunque es posible que un
profesor sea capaz de ignorar los comentarios del payaso de la clase, probablemente algunos de sus
compañeros continúen reforzando esos comentarios. En tercer lugar, incluso aunque pudiéramos eli-
minar todas las fuentes de reforzamiento, la conducta podría experimentar un remonte espontáneo
antes de empezar a disminuir (Lerman y otros, 1999; McGill, 1999). En cuarto lugar, las conductas
extinguidas suelen mostrar una recuperación espontánea: una respuesta que se ha extinguido un día
puede surgir posteriormente y, quizás en un contexto distinto (Alberto y Troutman, 2003; Skinner,
1953). Por último, algunas respuestas pueden ser especialmente resistentes a la extinción, debido a
que han sido previamente reforzadas mediante un esquema intermitente. Así pues, cuando la con-
ducta no puede extinguirse por alguna de esas razones, resulta de utilidad recurrir a otros métodos.

Presentación de consecuencias deseadas de manera no congruente

Como hemos visto, en ocasiones los niños actúan de manera inapropiada para conseguir deter-
minadas consecuencias, quizás obtener la atención del profesor o escapar de una tarea frustrante. En
los últimos años, algunos investigadores han descubierto que la presentación de las consecuencias
deseadas de manera no congruente, por ejemplo, prestar atención en momentos impredecibles o
proporcionar descansos a intervalos regulares para tareas difíciles, puede llevar a una disminución
de la conducta inapropiada (Coleman y Holmes, 1998; Hagopian, Crockett, van Stone, DeLeon y

88 APRENDIZAJE HUMANO

Bowman, 2000; Ringdahl, Vollmer, Borrero y Connell, 2001)10. De esta manera, los niños pueden
obtener las consecuencias que desean, sin necesidad de realizar la conducta (inapropiada). La prin-
cipal desventaja de este método, por supuesto, es que los niños no necesariamente terminan por
aprender conductas más apropiadas que reemplacen a las problemáticas.

El reforzamiento de otras conductas

Como se ha dicho anteriormente, el reforzamiento diferencial de otras conductas, esto es, un
esquema de reforzamiento RDO, es un procedimiento mediante el cual se refuerza al organismo
por no mostrar una conducta determinada durante un período de tiempo especificado. Por ejem-
plo, cuando un profesor alaba a un estudiante que ha sido capaz de pasar todo el recreo sin pelear
con ningún compañero, está utilizando un esquema RDO. El reforzamiento diferencial de otras
conductas es una técnica más eficaz y duradera que la extinción (Uhl, 1973; Uhl y García, 1969;
Zeiler, 1971) y, además, resulta también más efectiva para reducir conductas inapropiadas
(Parrish, Cataldo, Kolko, Neef y Egel, 1986; Pinkston, Reese, LeBlanc y Baer, 1973; Repp,
Barton y Brulle, 1983; Repp y Deitz, 1974). Su mayor debilidad es que si no somos cuidadosos
respecto a qué otras conductas realiza el individuo, es posible que algunas de ellas también re-
sulten inapropiadas. La siguiente estrategia, el reforzamiento de las conductas incompatibles, re-
suelve este problema.

El reforzamiento de conductas incompatibles

Ya hemos hablado antes de la utilización de respuestas incompatibles cuando hemos discutido
el contracondicionamiento y la ruptura de hábitos en el capítulo 3. En el ámbito del condiciona-
miento operante, resulta igualmente útil la noción de incompatibilidad. El primer paso es identifi-
car una respuesta que sea incompatible con la respuesta indeseable, esto es, que no pueda realizar-
se a la vez. Entonces se refuerza esa conducta incompatible. Por ejemplo, la conducta inapropiada
de levantarse de la mesa podría reducirse reforzando al niño siempre que esté sentado. Un alumno
agresivo puede ser reforzado cada vez que lo vemos relacionándose de manera sociable con sus
compañeros. Un jugador de tenis que muestra un estallido emocional inapropiado cada vez que pier-
de un tanto, puede ser reforzado por mantener bajo control su frustración mediante el procedimien-
to de hacer algunas inspiraciones hondas, contar hasta diez y seguir jugando (Allen, 1998).
Krumboltz y Krumboltz (1972) han descrito la eficacia de estas técnicas para controlar la conduc-
ta de tirar basura al suelo en un instituto: cuando un alumno tiraba basura al suelo, se le ponía al
frente de una campaña por la limpieza en el instituto, y se le proporcionaba reconocimiento y ala-
banzas por tales esfuerzos.

El reforzamiento de las conductas incompatibles parece muy similar al esquema RDO, pero
existe una importante diferencia entre ambos métodos: el esquema RDO exige reforzar a una per-
sona simplemente por no realizar una respuesta determinada. Por su parte, el reforzamiento de con-
ductas incompatibles implica el reforzamiento de una respuesta específica y opuesta. Este sistema,

10 Los teóricos han utilizado diferentes términos para este fenómeno, como son esquema temporal, reforzamiento no
congruente y escape no congruente.

Capítulo 4 I Condicionamiento operante 89

igual que el anterior, también resulta más eficaz que la extinción para eliminar conductas indesea-
bles (Allen, 1998; Lentz, 1988; Woods y Miltenberger, 1995; Zirpoli y Melloy, 2001)11.

CUANDO EL REFORZAMIENTO NO FUNCIONA

El principio básico del condicionamiento operante, que una respuesta aumenta su frecuencia
cuando va seguida de un refuerzo, se ha utilizado con éxito en muchas situaciones diferentes para
modificar una amplia variedad de conductas. Cuando el reforzamiento no funciona, el origen del
problema suele centrarse en alguna de estas cuatro circunstancias:

• El «reforzador» no es reforzante. En una ocasión, una profesora de primaria me hizo una con-
sulta en relación con uno de sus alumnos cuya conducta era tan problemática, que sólo pasa-
ba la mitad del día en el aula. Para intentar modificar su conducta problemática, la profesora
había colocado en el pupitre del niño la imagen de un payaso en tamaño natural, cuya nariz
era una pequeña bombilla roja. Cuando el niño mostraba conductas apropiadas, como estar
sentado tranquilamente y realizar sus tareas, el profesor pulsaba un botón que había en su me-
sa y que encendía la nariz del payaso. «No comprendo por qué no consigo modificar su con-
ducta», me decía; yo le sugerí que quizás ese payaso no le resultara reforzante. «Lo dudo»,
dijo la profesora; «ese payaso siempre ha funcionado con todos los niños».
Uno de los errores más frecuentes que cometen los profesores al aplicar técnicas de con-
dicionamiento operante, es dar por sentado que ciertos estímulos resultarán reforzantes para
todos los alumnos. Pero no todo el mundo responde a los mismos reforzadores; una conse-
cuencia que incrementa la conducta de un niño puede no funcionar con otro. Por ejemplo,
aunque la mayoría de los estudiantes encuentran reforzantes las alabanzas del profesor, algu-
nos no las perciben así (Pfiffner, Rosén y O’Leary, 1985). Puede que algunos alumnos teman
ser considerados «enchufados», especialmente si valoran mucho la amistad de los compañe-
ros menos diligentes (Fuller, 2001).
¿Y cómo pueden los profesores saber qué estímulos serán reforzantes para diferentes
alumnos? Una forma de saberlo es preguntar a los padres o, incluso, a los propios alumnos.
Sin embargo, los niños no siempre son conscientes de lo que realmente les gusta (Northup,
2000), de manera que quizá lo mejor que se puede hacer es observarlos para averiguar qué es
lo que realmente prefieren. Lo único que no se debe hacer es adivinar.
Debemos señalar que cualquier reforzador no mantendrá necesariamente su carácter refor-
zante de manera indefinida, especialmente si se presenta con mucha frecuencia (Bowman,
Piazza, Fisher, Hagopian y Kogan, 1997; Viken y McFall, 1994). En el capítulo 5 expondre-
mos una estrategia, la economía de fichas, que ofrece una manera sencilla para proporcionar
variedad en los reforzadores que se utilizan.

11 El reforzamiento de una conducta incompatible se denomina a veces reforzamiento diferencial de conductas incom-
patibles (RDI) (Allen, 1998). También es posible encontrar conductistas que se refieran a un esquema de reforzamiento di-
ferencial de conductas alternativas (RDA) (Lerman, Kelley, Vorndran, Kuhn y LaRue, 2002; Vollmer, Roane, Ringdahl y
Marcus, 1999). El método RDA, que resulta muy eficaz, supone el reforzamiento de una o más conductas específicas (y no
de cualquier otra conducta como ocurre en el esquema RDO). Sin embargo, las conductas alternativas no tienen por qué ser
incompatibles con la conducta que se desea eliminar.

90 APRENDIZAJE HUMANO

El «reforzador»
debe ser reforzante.

Anda, Enrique, cariño,
¡deja a tu vieja tía Andrea
que te dé un beso bien fuerte!

• El reforzamiento no es congruente. En ocasiones, no resulta conveniente reforzar una con-
ducta cada vez que se presenta. Sin embargo, debe recordarse que el reforzamiento continuo
produce cambios conductuales más rápidos que el reforzamiento intermitente. Si la conduc-
ta de un alumno ha sido especialmente problemática puede ser necesario dedicar un tiempo
extra a reforzar de manera continua las conductas apropiadas de ese alumno lo cual, aunque
de momento pueda ser más costoso, ahorrará tiempo a largo plazo.

• El individuo o bien pierde mucho o bien gana muy poco al modificar su conducta. Imagínese
a un adolescente que se cierra a las alabanzas de su profesor porque su grupo de amigos no
valora el rendimiento académico. Puede ocurrir que las alabanzas del profesor sean en reali-
dad reforzantes para ese alumno; pero que, sin embargo, éste no las acepte porque corre el
riesgo de perder su estatus entre el grupo de amigos. Quizá sea mejor y más reforzante ofre-
cerle las alabanzas de manera privada, lejos de los oídos de los demás.

• A veces, la conducta deseada requiere demasiado esfuerzo (Friman y Poling, 1995). Por ejem-
plo, la mayoría de las personas recicla la basura cuando los contenedores apropiados están
cercanos a su domicilio (Brothers, Krantz y McClannahan, 1994; Ludwig, Gray y Rowell,
1998). O, supongamos que un estudiante estima que tendrá que dedicar al menos 20 horas a
la semana para conseguir un sobresaliente en Historia. Aunque esta calificación sea un buen
reforzador, puede que para ese alumno no merezca la pena la cantidad de tiempo que hay que
emplear para conseguirla.
De manera consciente o inconsciente, muchas veces las personas realizan un análisis de
costes y beneficios cuando se enfrentan a las consecuencias de sus conductas (Eccles y
Wigfield, 1985; Feather, 1982; Perry y Fisher, 2001). Si bien, quizás hayan aprendido que de-
terminada respuesta será reforzada; sin embargo, no responden de manera acorde si tienen
mucho que perder o demasiado poco que ganar por hacerlo así. Para que las personas res-
pondan a los refuerzos, éstos deben merecer la pena.

• El modelado se ha realizado demasiado rápido. Muchas veces conseguir una conducta
deseable exige un proceso de modelado de esa conducta. Recuérdese que el modelado

Capítulo 4 I Condicionamiento operante 91

implica el reforzamiento de una serie de respuestas que cada vez se parecen más a la con-
ducta terminal. Cada una de esas respuestas debe ser aprendida antes de pasar a la siguien-
te. Si el proceso de modelado se realiza precipitadamente, de manera que cada respuesta no
llega a establecerse claramente antes de pasar a la siguiente, el programa de reforzamiento
será ineficaz.

Por ejemplo, imaginemos a la señora García, una profesora de 3.° curso de primaria, que
quiere reforzar a Santiago, un alumno especialmente hiperactivo, por permanecer tranquila-
mente en su asiento; su objetivo (la conducta terminal) es que permanezca sentado tranquila-
mente y durante 20 minutos. La primera mañana del programa de intervención, Santiago per-
manece sentado 1 minuto, y su profesora lo refuerza. Sin embargo, todavía no es el momento
de pasar a un criterio de 2 minutos o más, sino que es mejor continuar reforzando al niño por
estar sentado 1 minuto, hasta que sea evidente que el niño puede mantenerse tranquilo du-
rante más tiempo.

SKINNER Y LA EDUCACIÓN

Skinner escribió prolíficamente sobre la ineptitud de la escuela desde un punto de vista del con-
dicionamiento operante (Skinner, 1953, 1954, 1958, 1968, 1973). Consideraba que el reforzamien-
to en el aula suele producirse de manera incoherente y demasiado después de que se haya produci-
do la respuesta deseada. Si bien los reforzadores «naturales» (por ejemplo, la oportunidad de
controlar el propio entorno o el valor intrínsecamente gratificante de la asignatura), pueden refor-
zar en algunas ocasiones (y por tanto incrementar) conductas académicas apropiadas, en la prácti-
ca la mayoría de los reforzadores de un aula se imponen de manera artificial. Un problema inhe-
rente a nuestro sistema educativo es que los profesores deben enseñar conductas que serán útiles a
los estudiantes no en el momento presente sino en un futuro, de manera que esas conductas segura-
mente no provocan en el momento presente las consecuencias positivas que tendrán en un futuro
(por ejemplo, aunque un alumno pueda llegar a encontrar la utilidad del álgebra cuando se haya con-
vertido en un ingeniero industrial, probablemente no la encuentre especialmente útil para su vida
actual). En consecuencia, los profesores recurren a reforzadores artificiales como las calificaciones,
las alabanzas o el tiempo libre, para fomentar el rendimiento académico. Sin embargo, con fre-
cuencia esos reforzadores son ineficaces, en parte debido a que su relación con las respuestas de los
estudiantes no es evidente.

En su desesperación, los profesores pueden terminar por castigar las conductas problemáticas,
mediante consecuencias aversivas como el ridículo o los suspensos, en vez de reforzar las respues-
tas apropiadas; como señala Skinner, los profesores «inducen a los estudiantes a aprender amena-
zándolos por no aprender» (Skinner, 1968, p. 57). Este control aversivo sobre la conducta no sólo
resulta ineficaz, sino que puede, incluso, impulsar a los alumnos a realizar conductas que les per-
mitan evadirse de las tareas escolares o evitarlas en su conjunto.

Skinner urgía a los educadores a centrarse en reforzar el éxito de los alumnos en vez de en cas-
tigar sus fracasos. Propuso una «tecnología de enseñanza» caracterizada por una instrucción indivi-
dualizada, el modelado gradual de las conductas verbales complejas, el reforzamiento de las res-
puestas apropiadas de manera congruente y inmediata, y el mantenimiento de las conductas
aprendidas mediante esquemas de reforzamiento intermitente. Las sugerencias sobre cómo aplicar
de la mejor manera posible el condicionamiento operante a la escuela, junto con las ideas de otros
psicólogos y educadores, constituyen el tema del siguiente capítulo.

92 APRENDIZAJE HUMANO

RESUMEN

Mientras observaba a los gatos recorrer un laberinto al realizar su tesis doctoral, Edward
Thorndike llegó a la conclusión de que las consecuencias que producen satisfacción (recompensas)
aumentan la fuerza de las respuestas, mientras que las consecuencias que producen desagrado (cas-
tigos) disminuyen estas respuestas. Posteriormente, Thorndike revisó su ley del efecto y sugirió que
si bien la recompensa fortalece la respuesta, el castigo no necesariamente la debilita.

A partir del trabajo de Thorndike, Skinner ofreció su principio básico del condicionamiento ope-
rante: las respuestas que van seguidas de reforzamiento aumentan su frecuencia. Para que se pro-
duzca un condicionamiento operante, un reforzador debe seguir de manera inmediata a una res-
puesta y ser congruente con ella. El condicionamiento operante se diferencia del condicionamiento
clásico al menos de tres maneras: 1) se produce como resultado de que una respuesta va seguida de
un estímulo reforzador y no como resultado de la asociación de dos estímulos; 2) implica respues-
tas voluntarias, pero no las involuntarias, y 3) se describe mejor como una relación RÆE que como
una relación EÆR.

El nivel operante básico o línea de base de una respuesta es su frecuencia en ausencia de refor-
zamiento; la conducta terminal es la forma y frecuencia de la respuesta deseada al finalizar el pro-
grama de reforzamiento. Incluso cuando una secuencia respuesta-reforzador se produce por casua-
lidad, es posible observar un incremento en la frecuencia de esa respuesta (conducta supersticiosa).
Una respuesta que se ha reforzado previamente pero ya no continúa siéndolo, tiende a disminuir su
frecuencia hasta aproximarse a su línea de base inicial (extinción). Las conductas complejas pueden
enseñarse mediante el procedimiento de reforzar aproximaciones sucesivas a la conducta terminal
deseada (modelado) o mediante el reforzamiento de una secuencia de respuestas cada vez más lar-
ga (encadenamiento).

El reforzamiento puede adoptar diversas formas. Un reforzador primario es aquél que satisface
una necesidad biológica, quizá porque proporciona algo esencial para la supervivencia; un reforza-
dor secundario es aquél que se convierte en reforzante a través de su asociación repetida con otro
reforzador. Mientras que el refuerzo positivo supone la presentación de un estímulo (supuestamen-
te agradable), el reforzamiento negativo supone la eliminación de un estímulo (supuestamente aver-
sivo); dado que el reforzamiento negativo incrementa la conducta tal y como lo hace el reforza-
miento positivo, no se trata de un castigo. Un reforzador no siempre es un objeto material; por
ejemplo, puede ser también un acontecimiento social, una actividad favorita, una retroalimentación
positiva o un sentimiento intrínseco de satisfacción.

La oportunidad del momento, la magnitud, el atractivo y la congruencia del reforzamiento afec-
tan al ritmo con que se aprenden las nuevas conductas. También, diferentes esquemas de reforza-
miento influyen sobre la frecuencia con la que se producen las respuestas, así como sobre el ritmo
con que dichas respuestas se adquieren y se extinguen.

Los estímulos antecedentes también influyen sobre la ocurrencia de una respuesta. Por ejemplo,
cuando un organismo ha aprendido a responder de cierta manera en presencia de un estímulo, es
probable que responda de la misma manera en presencia de otro estímulo similar (generalización
del estímulo). Sin embargo, si una respuesta determinada se ha reforzado en presencia de un estí-
mulo pero no en presencia de otro, el organismo manifestará esa respuesta solamente cuando esté
presente el primer estímulo (discriminación del estímulo). Los profesores pueden recurrir a diver-
sos estímulos antecedentes, que pueden adoptar la forma de indicios o contextos para promover la
realización de conductas apropiadas.

Capítulo 4 I Condicionamiento operante 93

Las perspectivas contemporáneas del condicionamiento operante son relativamente diferentes de
las que propuso Skinner en su momento. Por ejemplo, algunos teóricos proponen que la conducta
se comprende mejor si vamos más allá de las relaciones específicas E-R, y nos centramos en con-
textos más amplios y en períodos de tiempo más largos. Por otra parte, algunas explicaciones ac-
tuales del condicionamiento operante incluyen una serie de factores cognitivos que subyacen al con-
dicionamiento. Además, en la actualidad muchos teóricos consideran que la conducta nunca puede
ser absolutamente predecible.

Además del castigo (que, de acuerdo con muchos conductistas actuales, sí conduce a una dis-
minución de la respuesta), algunas técnicas basadas en el reforzamiento (extinción, presentación de
consecuencias deseadas de manera no congruente, reforzamiento diferencial de otras conductas y el
reforzamiento de conductas incompatibles), permiten la eliminación de conductas indeseables. Sin
embargo, el reforzamiento probablemente no resultará eficaz si la consecuencia no es verdadera-
mente reforzante, o si se presenta de manera infrecuente, tampoco si el aprendiz pierde demasiado
o gana demasiado poco por cambiar su conducta, o si el proceso de modelado se realiza con dema-
siada precipitación. Skinner consideraba que, en situaciones escolares, las conductas apropiadas
suelen reforzarse de manera incongruente, mientras que con frecuencia se refuerzan involuntaria-
mente las conductas indeseables.



5C A P Í T U L O

Aplicaciones del condicionamiento operante

Objetivos educativos
Objetivos conductuales
La perspectiva actual sobre los objetivos educativos
Formulación de diferentes niveles de objetivos
Utilidad y eficacia y de los objetivos

La enseñanza programada y la enseñanza asistida por ordenador
Eficacia de la EP y la EAO

El aprendizaje experto
El sistema de enseñanza personalizada de Keller (SEP)
Eficacia del aprendizaje experto y del SEP

Análisis aplicado de la conducta
Componentes del análisis aplicado de la conducta
Utilidad del análisis aplicado de la conducta con grupos grandes
Adición de un componente cognitivo al análisis aplicado de la conducta
Eficacia del análisis aplicado de la conducta

Críticas a la utilización del reforzamiento en el aula
Críticas espurias
Preocupaciones genuinas

Cuándo resultan más apropiadas las técnicas de condicionamiento operante
Resumen

Durante los últimos 40 años, el condicionamiento operante ha tenido una influencia decisiva en
las prácticas educativas y terapéuticas. Algunas innovaciones educativas se pueden atribuir, ya sea
de manera directa o indirecta, al condicionamiento operante, lo que incluye los objetivos de la ins-
trucción, la enseñanza programada, la enseñanza asistida por ordenador, el aprendizaje experto y el
análisis aplicado de la conducta. En este capítulo analizaremos los componentes básicos de estas
técnicas y estudiaremos las evidencias empíricas relativas a su eficacia. A continuación, revisare-
mos algunas preocupaciones frecuentes respecto a la utilización del reforzamiento en el aula.

OBJETIVOS EDUCATIVOS

En su informe de 1947, la Comisión Presidencial para la Educación Superior describía como
principal objetivo del sistema educativo norteamericano «el desarrollo continuado, completo y

96 APRENDIZAJE HUMANO

rotundo de la persona» (citado en Dyer, 1967, p. 14). A primera vista, éste parece un objetivo muy
apropiado para la educación, pero si lo analizamos más detenidamente, esta afirmación proporcio-
na muy poca información específica sobre cómo debería ser la persona a la que se quiere educar. El
informe de la Comisión Presidencial es un buen ejemplo de lo que es una «palabra mágica»: suena
bien, pero llega un momento en que nos damos cuenta de que no tenemos ni idea de lo que real-
mente quiere decir (Dyer, 1967). Desde el momento en que no sabemos exactamente cuáles son
nuestros objetivos educativos, tampoco podemos saber qué o cómo enseñar, ni si la instrucción es-
tá realmente alcanzando sus objetivos.

Como hemos señalado en el capítulo anterior, una práctica habitual cuando se utiliza el condi-
cionamiento operante consiste en especificar la conducta terminal de una manera precisa y obser-
vable antes de comenzar el condicionamiento, lo que nos permite desarrollar métodos adecuados
para modelar la conducta deseada y para saber cuándo ha sido adquirida. Este principio de especi-
ficar a priori, de manera observable y mensurable, cuál es la conducta terminal, se ha aplicado a la
enseñanza mediante la utilización de objetivos de la instrucción. Inicialmente, tales objetivos tenían
una naturaleza excesivamente conductual.

Objetivos conductuales

Un objetivo conductual tiene tres componentes (Mager, 1962, 1984; Schloss y Smith 1994). En
primer lugar, el resultado debe establecerse en términos de una conducta observable y mensurable.
Considérese este objetivo:

El alumno será consciente de los acontecimientos actuales.

La conciencia de un alumno no es fácilmente observable. Pero ese mismo objetivo se puede ex-
presar en términos de conductas más específicas que sí pueden observarse; considérese éste como
ejemplo:

El alumno describirá los principales elementos de debate entre israelíes y palestinos.

Hay algunos verbos (por ejemplo, comprender, apreciar, saber, ser consciente de, recordar) que
nos dicen muy poco sobre lo que los alumnos son realmente capaces de hacer, pero hay otros ver-
bos (escribir, calcular, enumerar, describir, seleccionar), que describen de manera muy clara con-
ductas observables. Resulta relativamente sencillo expresar nuestros objetivos en términos conduc-
tuales, si pensamos en aquellas tareas concretas que deberían hacerse para convencer a alguien de
que se ha alcanzado ese objetivo (Mager, 1972).

En segundo lugar, un objetivo conductual especifica las condiciones bajo las cuales debería
mostrarse esa conducta. En ocasiones, esperamos que se produzcan determinadas conductas en si-
tuaciones específicas (condiciones estimulares). Uno de los objetivos de mi curso de evaluación
educativa es el siguiente:

El alumno calculará correctamente la fiabilidad test-retest.

Capítulo 5 I Aplicaciones del condicionamiento operante 97

Sin embargo, yo no pretendo que mis alumnos memoricen la fórmula para calcular la fiabilidad.
Por lo tanto, hay una condición bajo la cual yo espero que se produzca la conducta:

A partir de la fórmula del coeficiente de correlación, el alumno calculara correctamente
la fiabilidad test-retest.

Por último, el objetivo incluye un criterio para valorar cuándo se ha producido una realización
aceptable de esa conducta. Muchas conductas no pueden clasificarse de manera dicotómica en co-
rrectas o incorrectas; por el contrario, se extienden sobre una medida continua de «corrección» e
«incorrección» relativa. En aquellos casos en los que no resultan obvias cuáles son las conductas
correctas e incorrectas, el objetivo conductual debería especificar el criterio que supone una reali-
zación aceptable, por ejemplo, en términos de un porcentaje de respuestas correctas, de un límite de
tiempo determinado o del grado aceptable de desviación de la respuesta correcta (Mager, 1962,
1984). Estos son algunos ejemplos de lo que acabamos de decir:

En los exámenes semanales de deletreo escrito, el alumno deletreará correctamente al me-
nos el 85% de las palabras presentadas.

A partir de una hoja que contiene 100 problemas con sumas de dos dígitos, incluyendo to-
das las posibles combinaciones desde el cero hasta el nueve, el alumno realizará correcta-
mente todos los problemas en 5 minutos.

A partir de la fórmula del coeficiente de correlación, el alumno calculará correctamente
la fiabilidad test-retest, sin más diferencias respecto al resultado obtenido por ordenador que
las atribuibles a los efectos de redondeo.

La perspectiva actual sobre los objetivos educativos

Muchas veces se han criticado los objetivos conductuales por centrarse en detalles muy concre-
tos y sin importancia, olvidando otros objetivos educativos más importantes pero, tal vez, más abs-
tractos. Las listas de objetivos conductuales se centran en la conducta que depende de la memori-
zación mecánica de hechos, y no tanto en aquellas conductas que manifiestan un aprendizaje más
complejo y sofisticado (Trachtenberg, 1974); en otras palabras, se centran en capacidades de nivel
básico y, no tanto, en capacidades de nivel superior. Quizás estos objetivos de nivel básico sean
los que predominen, simplemente, debido a que son los más fáciles de expresar.

Los profesores suelen tener en mente muchos objetivos para cada curso, que incluyen tanto ca-
pacidades de nivel básico como capacidades de nivel superior. Describir objetivos conductuales que
cubran todas y cada una de las metas puede llegar a convertirse en una tarea agobiante, por no de-
cir imposible. Por esta razón, muchos educadores han propuesto que, quizás, una alternativa razo-
nable podría ser especificar sólo algunos objetivos más generales y de carácter no conductual
(Dressel, 1977; Gronlun, 2000; Popham, 1995; Posner y Rudnitsky, 1986). En este caso resulta útil
enumerar ejemplos de conductas como prototipo de cada uno de esos objetivos abstractos. Por ejem-
plo, imagínese que deseamos que los estudiantes de instituto comprendan, evalúen y critiquen lo
que leen, un objetivo que verdaderamente implica capacidades de pensamiento de alto nivel.
Podríamos entonces enumerar manifestaciones conductuales de un tipo de lectura crítico, tales
como las siguientes:

98 APRENDIZAJE HUMANO

1. Distinguir entre las ideas principales y los detalles accesorios.
2. Distinguir entre hechos y opiniones.
3. Distinguir entre hechos e inferencias.
4. Identificar relaciones causa-efecto.
5. Identificar errores en el razonamiento.
6. Distinguir entre conclusiones válidas y no válidas.
7. Identificar los supuestos que subyacen las conclusiones (Gronlund, 2000, p. 52; formato

adaptado).

La anterior no es una lista exhaustiva de lo que es una lectura crítica; pero nos proporciona una
idea de qué conductas terminales queremos conseguir.

Formulación de diferentes niveles de objetivos

Algunas veces, resulta apropiado limitarse a objetivos que reflejan un conocimiento básico.
Pero, en otras circunstancias, es mejor utilizar objetivos que reflejen niveles de aprendizaje relati-
vamente sofisticados, especialmente con los estudiantes más mayores (véase Cole, 1990). En tales
situaciones resultan útiles las taxonomías de objetivos, esto es, diferentes conductas que tienen que
demostrar los estudiantes, y que suelen presentarse ordenadas por dificultad (véase Bloom,
Englehurt, Furst, Hill y Krathwohl, 1956; Harrow, 1972; Kratchwohl, Bloom y Masia, 1964;
Stiggins, 2001). Un ejemplo muy ampliamente utilizado, la Taxonomía de Bloom de objetivos edu-
cativos (Bloom y otros, 1956), describe seis niveles generales del conocimiento y utilización de la
información, esto es, seis posibles objetivos en el dominio cognitivo. Esos seis niveles se resumen
en la figura 5.1.

1. Conocimiento: memorización mecánica de información al pie de la letra. Por ejemplo,
recitar definiciones o términos, o recordar los elementos de una lista

2. Comprensión: expresar la información con las palabras propias; por ejemplo, rehacer una
definición o parafrasear una regla.

3. Aplicación: utilizar la información en una situación nueva; por ejemplo, aplicar princi-
pios matemáticos para solucionar problemas con las palabras o aplicar teorías psicológi-
cas del aprendizaje a la práctica educativa.

4. Análisis: descomponer la información en sus partes constituyentes; por ejemplo, descu-
brir los supuestos subyacentes en un ensayo filosófico o identificar las falacias de un ar-
gumento lógico.

5. Síntesis: construir algo nuevo integrando diversas piezas de información; por ejem-
plo, desarrollar una teoría o presentar una defensa lógica de un punto de vista deter-
minado.

6. Evaluación: realizar un juicio de valor sobre datos; por ejemplo, criticar una teoría o
establecer lo adecuadas que son las conclusiones extraídas de un estudio de investi-
gación.

Figura 5.1 Taxonomía de objetivos educativos de Bloom (Bloom, Englehart, Furst y Krathwohl, 1956).

Capítulo 5 I Aplicaciones del condicionamiento operante 99

Bloom y sus asociados presentaron inicialmente estos seis niveles como una jerarquía, en la que
cada uno de ellos dependía de los que le precedían. Si bien el carácter jerárquico de esta lista pue-
de ser discutible (L. W. Anderson y otros, 2001; Furst, 1981; Krathwohl, 1994; Seddon, 1978); sin
embargo, la propia taxonomía proporciona un recordatorio muy útil de que los objetivos de la ins-
trucción deben proporcionar capacidades cognitivas de nivel superior, además del conocimiento de
hechos simples y específicos (Gronlund, 2000; Hastings, 1977; Popham, 1988). En el capítulo 12
estudiaremos una de las taxonomías de Bloom que incorpora las perspectivas teóricas contemporá-
neas sobre el aprendizaje y el conocimiento.

Utilidad y eficacia de los objetivos

Si bien los educadores se han ido distanciando de los objetivos conductuales demasiado especí-
ficos, otros objetivos de la instrucción de carácter más general, etiquetados como resultados, des-
trezas, metas o evaluaciones, siguen desempeñando un papel esencial en el diseño de los currículos
y en las evaluaciones. Desde la perspectiva del profesor, los objetivos de la instrucción tienen dife-
rentes funciones que resultan muy útiles (Gronlund, 2000; Mager, 1962, 1984; Stiggins, 2001). En
primer lugar, la especificación de los objetivos de una lección en términos precisos, permite a un
profesor elegir el método más eficaz para enseñar esa lección. Por ejemplo, cuando enseñamos los
aspectos básicos de la suma, un profesor podría recurrir a tarjetas si su objetivo es el conocimiento
de los números, aunque probablemente prefiera problemas de la vida real si su objetivo es la apli-
cación de estos conocimientos. Una segunda ventaja es que los objetivos, en términos conductua-
les, son muy fáciles de comunicar. Por ejemplo, aunque los profesores pueden diferir en su percep-
ción de lo que significa «aplicación de los principios de la adición», muy probablemente
interpretarán de manera muy similar «la solución correcta de problemas con sumas». Por último,
los objetivos facilitan la evaluación, tanto de los estudiantes como de los programas de instrucción:
ambos pueden evaluarse a partir de la observación de las conductas deseadas. Desde la perspectiva
de los alumnos, los objetivos de la instrucción también tienen ventajas adicionales: cuando los
alumnos saben qué deberán ser capaces de hacer al finalizar una unidad, pueden concentrarse en
esos elementos, y disponen de una herramienta para juzgar si han aprendido esos objetivos
(Gronlund, 2000; McAshan, 1979; Stiggins, 2001).

Pese a estos posibles beneficios, las investigaciones que estudian la eficacia de los objeti-
vos para mejorar el aprendizaje académico, han obtenido resultados ambiguos (Melton, 1978).
Los objetivos tienden a centrar la atención de alumnos y profesores en determinadas informa-
ciones y capacidades, mientras que ignoran otros aspectos de la asignatura (Slavin, 1990b). Si
los objetivos propuestos describen todo lo que los estudiantes deberían aprender, entonces me-
jorarán el aprendizaje. Pero si los objetivos sólo incluyen una parte de lo que el profesor con-
sidera importante, mientras que excluyen otro material que también es valioso, probablemente
no se aprendan adecuadamente determinadas informaciones y capacidades. El hecho de que al-
gunas decisiones importantes se basen en que los alumnos hayan alcanzado los objetivos pro-
puestos (por ejemplo, la promoción y la graduación de los alumnos, el salario del profesor, la
financiación del centro educativo, etc.), no hace más que exacerbar este problema. Cuando los
profesores saben que estas decisiones dependen de pruebas que tendrán que realizar sus alum-
nos, resulta comprensible que dediquen muchas horas de clase a estos conocimientos y capaci-
dades; y no a otros igualmente importantes, pero con menos trascendencia inmediata (Darling-
Hammond, 1991; Linn, 2000; Resnick, 1996). El resultado suele ser que los alumnos realizan

100 APRENDIZAJE HUMANO

muy bien los exámenes, pero no mejoran en otras habilidades más generales (Amrein y
Berliner, 2002)1.

LA ENSEÑANZA PROGRAMADA Y LA ENSEÑANZA

ASISTIDA POR ORDENADOR

Desde la perspectiva del condicionamiento operante, el reforzamiento debe producirse inmedia-
tamente después de que se haya dado la respuesta. Sin embargo, muchos de los reforzadores que se
ofrecen en el aula se retrasan horas, días o, en el caso de los diplomas y los títulos de graduación,
incluso años. Para proporcionar un reforzamiento inmediato a las respuestas de los sujetos, Skinner
(1954) desarrolló una técnica que se conoce como enseñanza programada o EP. En un principio,
esta técnica se hacía con una «máquina de enseñar»: una caja que encerraba un rollo de material es-
crito que los alumnos hacían pasar tras una ventana, con lo que podían ver pequeñas porciones de
información que aparecían de manera sucesiva y sistemática. Durante las décadas de los sesenta y
de los setenta, la EP fue adoptando progresivamente la forma de manuales y, eventualmente, de pro-
gramas informáticos.

Sea cual sea el medio utilizado, la enseñanza programada tiene una serie de características co-
munes. En primer lugar, el material que se tiene que aprender se presenta en partes aisladas, deno-
minadas esquemas. El primer esquema ofrece un fragmento nuevo de información y plantea una
pregunta sobre el mismo. El alumno responde a la pregunta y pasa al siguiente esquema: ese es-
quema proporciona la respuesta correcta a la pregunta anterior, ofrece más información y plantea
otra pregunta. Así, el alumno avanza a lo largo de los esquemas, encontrándose con nueva informa-
ción, respondiendo a preguntas y comprobando sus respuestas.

Existen algunos conceptos y principios intrínsecos a la enseñanza programada, que están basa-
dos en el condicionamiento operante:

1. Respuesta activa. Se pide al alumno que realice una respuesta en cada esquema.
2. Modelado. La instrucción comienza a partir de información ya conocida. La nueva informa-

ción que debe aprenderse se descompone en pequeños fragmentos, de manera que la ins-
trucción avanza mediante una presentación gradual de fragmentos cada vez más difíciles. A
medida que se presentan fragmentos sucesivos y se plantean preguntas de dificultad cada vez
mayor, las respuestas correctas a las mismas ponen de manifiesto que se va moldeando pro-
gresivamente la conducta terminal.
3. Reforzamiento inmediato. El modelado se produce de manera tan lenta que los alumnos ca-
si siempre dan la respuesta correcta; de esta manera, practican las respuestas apropiadas, y

1 En los Estados Unidos, el Acta de 2001 de Ningún Niño Retrasado prometía incrementar el énfasis en la evaluación
de capacidades superiores. Mientras me hallaba redactando esta cuarta edición, todavía no sabía cómo afectaría esta legisla-
ción al rendimiento académico general de los alumnos. La pretensión que se encuentra tras esta ley (promover el rendimiento
académico de los niños, sobre todo de los grupos minoritarios y de entornos desfavorecidos) es verdaderamente loable. Sin
embargo, muchos expertos temen que al centrarse en mejorar las puntuaciones de los exámenes, más que en apoyar y re-
compensar la práctica educativa eficaz, continuará siendo poco efectiva, e incluso contraproducente. El tiempo (y la inves-
tigación) nos lo dirá.

Capítulo 5 I Aplicaciones del condicionamiento operante 101

no las inapropiadas, de manera que la probabilidad de obtener un reforzamiento es muy ele-
vada2. Cada respuesta correcta se refuerza de manera inmediata como una retroalimentación
que indica que se ha dado la respuesta correcta.
4. Se admiten diferencias individuales en el ritmo de aprendizaje. La enseñanza programada es
escalonada, por lo que permite a los estudiantes avanzar a su propio ritmo.

Las primeras experiencias de enseñanza programada se hacían mediante programas lineales:
todos los estudiantes avanzaban siguiendo exactamente la misma secuencia de esquemas y en un or-
den idéntico. En 1961, Crowder y Martin introdujeron el programa ramificado, que progresa me-
diante pasos más grandes que el programa lineal (de manera que cada esquema presenta más infor-
mación), por lo que los promedios de error son mayores. Un estudiante que responde de manera
incorrecta se encamina hacia esquemas «correctores» que le permiten practicar esa parte de la lec-
ción antes de poder continuar aprendiendo material nuevo.

La principal ventaja de un programa ramificado es que proporciona esquemas de enseñanza co-
rrectiva solamente a aquellos alumnos que tienen dificultades con un concepto determinado, mien-
tras que el resto puede avanzar aprendiendo la nueva información, sin necesidad de perder el tiem-
po en practicar cosas que ya conocen. Lamentablemente, este tipo de programas puede llegar a ser
muy engorroso, al menos en un formato de libro de texto. Los estudiantes tienen que moverse en-
tre diferentes esquemas, que suelen estar en páginas distintas, para poder dar respuestas diferentes,
de manera que los avances no se producen con fluidez. Este problema del programa ramificado ha
sido virtualmente eliminado una vez que se han introducido los ordenadores en la enseñanza.

La enseñanza asistida por ordenador o EAO es, en realidad, una enseñanza programada que
se presenta mediante un ordenador. Esto tiene algunas ventajas, que eran impensables cuando se uti-
lizaba lápiz y papel en la enseñanza programada. En primer lugar, los programas ramificados pue-
den utilizarse sin necesidad de enseñar a los alumnos a moverse de un esquema a otro, ya que el or-
denador selecciona de manera automática el esquema apropiado a las respuestas de los estudiantes.
En segundo lugar, las capacidades gráficas de los ordenadores permiten presentar la información de
una manera inimaginable en la enseñanza programada. En tercer lugar, un ordenador puede grabar
y guardar los datos de cada estudiante, tales como su avance en el programa, la frecuencia con que
se equivoca y acierta, etc. A partir de estos datos, un profesor puede controlar el progreso de cada
estudiante e identificar a quienes tienen dificultades con el material de estudio. Finalmente, un or-
denador puede utilizarse para proporcionar enseñanza, incluso, cuando no está disponible el profe-
sor de carne y hueso; por ejemplo, la EAO se ha utilizado para llevar la enseñanza universitaria a
áreas rurales que están muy alejadas de una universidad.

Eficacia de la EP y la EAO

La mayoría de las investigaciones apuntan a que la enseñanza programada tradicional (que no se
basa en el ordenador) apenas tiene ventajas sobre los métodos tradicionales de enseñanza (Kulik,

2 Skinner consideraba que los errores interfieren en el aprendizaje, en gran medida debido a que los alumnos producen
respuestas incorrectas. Por el contrario, muchos teóricos cognitivos están convencidos de que, en ocasiones, los errores pue-
den resultar de utilidad, ya que animan a los estudiantes a examinar y analizar su razonamiento y sus estrategias de solución
de problemas (véase la discusión sobre el cambio conceptual en el capítulo 13).

102 APRENDIZAJE HUMANO

Cohen y Ebeling, 1980; Kulik, Schwalb y Kulik, 1982). Por el contrario, la EAO promueve resulta-
dos académicos superiores y mejora la actitud de los alumnos hacia el trabajo escolar, al menos en
comparación con los métodos tradicionales de enseñanza (Blok, Oostdam, Otter y Overmaat, 2002;
Christmann, Badgett y Lucking, 1997; Fletcher-Flinn y Gravatt, 1995; Hativa y Shorer, 1989; Kulik,
Kulik, y Cohen, 1980; Lepper y Gurtner, 1989; Liao, 1992). No obstante, las diferencias en los re-
sultados académicos obtenidos mediante la EAO y mediante los métodos tradicionales de enseñan-
za, son pequeñas o moderadas.

Llegados a este punto es necesario hacer una llamada de precaución respecto a la utilización de
la EP y de la EAO. Algunos sistemas de enseñanza programada no están bien diseñados (Bell-
Gredler, 1986; O´Leary y O´Leary, 1972); por ejemplo, puede que no incorporen adecuadamente
principios tales como el de respuesta activa, el reforzamiento inmediato de la respuesta o el mode-
lado gradual hacia la conducta terminal. Evidentemente, tanto la EP como la EAO serán menos efi-
caces cuando no se tienen en cuenta estos principios del condicionamiento operante (Kritch y
Bostrow, 1998; Tudor, 1995), si bien hay que decir que se han encontrado excepciones a lo dicho.
En un estudio se encontró que demoras de 10 segundos en la retroalimentación favorecían el apren-
dizaje de los alumnos, aparentemente debido a que tales demoras les proporcionaban más tiempo
para asimilar la materia que se les presentaba (Crosbie y Kelly, 1994).

A medida que las teorías cognitivas se van enseñoreando de las explicaciones sobre el aprendi-
zaje humano, la enseñanza por ordenador se va desvinculando de la aproximación conductista tra-
dicional, lo que se refleja en un cambio de terminología, desde la enseñanza basada en el ordena-
dor (EBO) o el aprendizaje asistido por ordenador (AAO). En la actualidad la enseñanza basada en
el ordenador abarca una amplia variedad de innovaciones, tales como simulaciones que permiten a
los alumnos trabajar en actividades muy realistas (por ejemplo, diseccionar un animal o volar en un
avión), «tutores inteligentes» que diagnostican problemas específicos, herramientas informáticas
(procesadores del texto, programas de gráficos, programas para componer música), así como pro-
blemas y juegos motivadores e interesantes. En la última parte de este libro analizaremos cómo la
tecnología informática se ha utilizado para promover capacidades de resolución de problemas com-
plejos (capítulo 14) y para promover el aprendizaje de los grupos y la construcción de significados
(capítulo 15).

EL APRENDIZAJE EXPERTO

Inherente a la perspectiva conductista y, especialmente, al modelo de condicionamiento ope-
rante, se halla la creencia de que, dadas unas condiciones ambientales apropiadas (por ejemplo, el
reforzamiento congruente de las respuestas deseables y el modelado progresivo de las respuestas),
las personas somos capaces de adquirir una gran cantidad de conductas complejas. Como ejemplo
de este optimismo podríamos recordar la famosa cita de John Watson que reprodujimos en el ca-
pítulo 3: «denme una docena de niños sanos, bien formados, y mi propio mundo específico para
criarlos, y yo garantizo que elijo uno al azar y lo convierto en cualquier tipo de especialista que yo
desee...».

Este optimismo conductista tiene su reflejo en el aprendizaje experto, una aproximación a la
enseñanza en la que los estudiantes deben aprender muy bien una lección (deben hacerse expertos
en el contenido) antes de pasar a la siguiente. Tras esta propuesta se encuentra la convicción de que
la mayoría de los estudiantes pueden aprender las asignaturas escolares si se les proporciona el tiem-
po y la enseñanza suficientes para hacerlo.

Capítulo 5 I Aplicaciones del condicionamiento operante 103

El aprendizaje experto se basa, en parte, en el concepto de modelado del condicionamiento
operante: al principio, una respuesta relativamente simple se refuerza hasta que se emite de mane-
ra frecuente (hasta que se domina) y, entonces, empieza a reforzarse una respuesta ligeramente más
difícil, y así sucesivamente hasta que termina por adquirirse la respuesta terminal deseada. Así
pues, de acuerdo con el principio del modelado, el aprendizaje experto suele incluir los siguientes
componentes:

1. Unidades pequeñas y separadas. El contenido del curso se descompone en diferentes uni-
dades o lecciones independientes, cada una de las cuales abarca una pequeña parte de la
materia.

2. Una secuencia lógica. Esas unidades se organizan de tal manera que los conceptos y proce-
dimientos básicos, que son la base de los posteriores, se aprendan en primer lugar. Por ejem-
plo, una unidad en que los alumnos deben aprender qué es una fracción, debe enseñarse evi-
dentemente antes que la unidad en que se aprende a sumar fracciones. El proceso mediante
el cual se identifican y organizan los componentes de un curso, desde lo más simple a lo más
complejo, se denomina análisis de tareas.

3. Hay que demostrar la maestría al terminar cada unidad. Antes de «graduarse» en una uni-
dad, los alumnos deben demostrar que la dominan, por ejemplo, realizando un examen sobre
el contenido de esa unidad.

4. Establecer un criterio observable para demostrar el dominio de cada unidad. El dominio de
un tema se debe definir en términos concretos y específicos. Por ejemplo, para superar una
unidad sobre la adición de fracciones con el mismo denominador, los alumnos tendrían que
responder de manera correcta al menos al 90% de las preguntas del examen.

5. Actividades correctivas adicionales para aquellos estudiantes que necesitan ayuda extra.
Los alumnos no siempre demuestran su dominio al primer intento. Por lo tanto, es necesario
proporcionarles apoyo y recursos adicionales, como materiales diferentes, libros de ejercicio,
grupos de estudio, y enseñanza individualizada (Guskey 1985).

El aprendizaje experto tuvo una época dorada durante la década de los sesenta y, todavía, mu-
chos educadores lo defienden de una manera u otra (Block, 1980; Bloom, 1968, 1974, 1976, 1981,
1984; Boschee y Baron, 1993; Carroll, 1963, 1989; Guskey, 1985, 1994; Hunter, 1982; Keller,
1968; Lee y Pruitt, 1984). Hay una versión de esta técnica, el sistema de enseñanza personalizada
de Fred Keller, que se ha utilizado muy frecuentemente en el ámbito universitario. En el siguiente
apartado vamos a estudiar lo que implica esta propuesta.

El sistema de enseñanza personalizada de Keller (SEP)

Como ha señalado Michael (1974), la enseñanza tradicional de la universidad tiene una debilidad
muy clara cuando se observa desde la perspectiva de los principios del condicionamiento operante.
Por ejemplo, los alumnos no pueden saber la nota que han obtenido en su trabajo hasta días o sema-
nas después de que lo hayan presentado, por lo cual, sus logros no se refuerzan de manera inmedia-
ta. Y lo que es más, los alumnos frecuentemente deben avanzar hacia materias más complejas antes
de que hayan tenido ocasión de dominar la información más básica para comprenderla.

Para corregir esta debilidad, Keller (1968, 1974) elaboró el sistema de enseñanza personali-
zado (también conocido como SEP o el plan Keller) como una aproximación alternativa a la

104 APRENDIZAJE HUMANO

enseñanza universitaria. Además de unidades independientes, una secuencia lógica y evaluaciones
frecuentes del dominio que se tiene de la materia, la SEP incorpora las siguientes características:

1. Énfasis en el estudio individual. La mayor parte del aprendizaje tiene lugar mediante el es-
tudio independiente de material escrito, como libros de texto y guías de estudio. Cuando re-
sulta necesario, es posible acceder a tutorías individuales.

2. Exámenes por unidades. El examen de cada módulo permite evaluar el dominio que los
alumnos tienen de la materia. Los estudiantes reciben una retroalimentación inmediata sobre
la calidad de su examen.

3. Ritmo propio. Los alumnos hacen los exámenes cuando están preparados para ello; en este
sentido, el aprendizaje sigue su propio ritmo. Algunos alumnos avanzan muy rápido mien-
tras otros van más lentamente.

4. Técnicas suplementarias de enseñanza. Los métodos de enseñanza tradicional (por ejemplo,
clases, demostraciones y discusiones) se completan con otros materiales que aparecen en el
libro de texto o en lecturas adicionales. Estas actividades son opcionales, pero sirven para
motivar y estimular a los alumnos.

5. Utilización de ayudantes. Los ayudantes, generalmente, alumnos más avanzados, se dedican
a corregir los exámenes y a ayudar en aquellos temas en los que los alumnos menos avanza-
dos encuentran dificultades.

El profesor de un curso SEP desempeña un papel diferente de aquéllos que utilizan métodos de
enseñanza más convencionales. El profesor SEP no es tanto un conferenciante como el elaborador
de un currículo, un escritor de exámenes, un coordinador de ayudantes, y el guardián de los datos.
En vez de conducir a los alumnos a través de los contenidos del curso, SEP proporciona un sistema
en el que los alumnos, con la ayuda de guías y tutores, encuentran su propio sendero para seguir es-
tos contenidos.

Eficacia del aprendizaje experto y del SEP

Algunas revisiones de los resultados de la investigación sobre el tema (Arlin, 1984; Block y
Burns, 1976; Kulik, Kulik y Bangert-Drowns, 1990; Kulik, Kulik y Cohen 1979; Shuell, 1996) indi-
can que el aprendizaje experto (incluyendo el SEP) facilita el aprendizaje de los alumnos y promue-
ve mejores resultados académicos que la enseñanza tradicional (si bien, otros investigadores como
Slavin [1987, 1990b] no han encontrado diferencias). Incluso, se ha encontrado que los alumnos que
han seguido programas de aprendizaje experto suelen retener estos aprendizajes durante períodos de
tiempo más largos (DuNann y Weber, 1976; Kulik y otros, 1979); por ejemplo, en un estudio, alum-
nos universitarios que siguieron este programa recordaban entre el 75% y el 85% del material cuatro
meses después, y entre el 70% y el 80% once meses más tarde (Semb, Ellis y Araujo, 1993). También
parece que el SEP favorece mejores hábitos de estudio: si bien los estudiantes SEP no parecen estu-
diar más que otros, sí lo hacen de manera regular en vez de dejarlo para última hora y hacerlo depri-
sa y corriendo, como suele ser habitual entre los alumnos de cursos tradicionales (Born y Davis,
1974; Kulik y otros, 1979). De hecho, son los estudiantes de bajo rendimiento los que parecen bene-
ficiarse más de esta estrategia didáctica (DuNann y Weber, 1976; Kulik y otros, 1979).

Sin embargo, ninguno de estos dos métodos está libre de problemas. Con frecuencia, los alum-
nos que aprenden con más rapidez reciben menos enseñanza que sus compañeros más lentos, lo que

Capítulo 5 I Aplicaciones del condicionamiento operante 105

despierta dudas sobre la generación de posibles desigualdades (Arlin, 1984). De hecho, los estu-
diantes de aprendizaje más rápido generalmente tienen que esperar a que sus compañeros más len-
tos hayan dominado la materia antes de poder avanzar a la siguiente unidad; en consecuencia apren-
den menos de lo que podrían aprender en otras circunstancias (Arlin, 1984). Por otra parte, cuando
a los alumnos se les permite trabajar a su propio ritmo, los profesores deben ayudar a unos veinti-
cinco o treinta de ellos, cada uno con un ritmo diferente, lo que les obliga a hacer más tareas admi-
nistrativas (distribución de material, elaboración de exámenes) que un profesor tradicional
(Berliner, 1989; Prawat, 1992).

El SEP en concreto tiene otras debilidades. Una dificultad radica en el dominio de la materia
que se exige; algunos alumnos son incapaces de alcanzar el criterio para poder superar los exáme-
nes, a pesar de las evaluaciones constantes (Sussman, 1981). Una segunda debilidad radica en que
no existe interacción entre los estudiantes, lo que muchos consideran negativo para su aprendizaje
(Gasper, 1980). Un tercer problema está relacionado con el avance autónomo que caracteriza al SEP,
que no puede llevarse a cabo cuando la política de la universidad exige que los estudiantes termi-
nen un curso en un cuatrimestre o en un semestre (Sussman, 1981). Los estudiantes menos motiva-
dos pueden ir demorando su trabajo, hasta que finalmente tendrán que abandonar el curso
(Sussman, 1981; Swenson, 1980). Si bien, en general, la proporción de abandonos de los cursos SEP
no es mayor que la de los tradicionales, sí puede llegar a ser mucho más alta si los alumnos siguen
por completo el curso de manera virtual, sin llegar a aparecer nunca por clase (Kulik y otros, 1979,
1990; Pear y Crone-Todd, 1999). Se han desarrollado algunas técnicas para reducir el retraso y el
abandono, entre las que se puede citar el establecimiento de fechas para la realización de cada mó-
dulo (Reiser y Sullivan, 1977), ofrecer puntos extra por la pronta finalización de los módulos
(Bufford, 1976) y eliminar la necesidad de terminar el curso dentro de un período determinado
(Sussman, 1981).

La utilización más apropiada del aprendizaje experto se hace cuando el objetivo principal del
profesor es que sus alumnos aprendan capacidades o informaciones previas a otros temas. En tales
situaciones, la retroalimentación inmediata y el énfasis en el dominio de la materia mejoran los re-
sultados de los alumnos y, especialmente, los de los más retrasados. Sin embargo, cuando el objeti-
vo no es únicamente la adquisición de información, como cuando el propósito es que los alumnos
comprendan temas controvertidos o que trabajen cooperativamente para solucionar problemas com-
plejos, esta aproximación no es la más apropiada.

ANÁLISIS APLICADO DE LA CONDUCTA

El análisis aplicado de la conducta (AAC), también llamado modificación de conducta, tera-
pia de conducta o administración de contingencias, es probablemente la aplicación más directa de
los principios del condicionamiento operante. A partir del supuesto de que los problemas de con-
ducta son resultado de circunstancias ambientales pasadas y presentes, el análisis aplicado de la
conducta comprende cierto número de procedimientos que se caracterizan porque el ambiente del
individuo se modifica para conseguir el reforzamiento de sus conductas aceptables, y que no se re-
fuercen aquéllas que son inapropiadas. Las técnicas AAC están directamente relacionadas con con-
ceptos del condicionamiento operante tales como reforzamiento, modelado, control del estímulo y
refuerzo de conductas incompatibles. También, los conceptos de castigo y modelado, propios del
modelo de Skinner, se usan con frecuencia en las intervenciones AAC; ambos aspectos se tratarán
en los capítulos 6 y 7 respectivamente.

106 APRENDIZAJE HUMANO

Componentes del análisis aplicado de la conducta

Si bien el AAC abarca diferentes técnicas, hay algunas estrategias comunes a la mayoría:

• Tanto las conductas actuales como las deseables se especifican en términos observables y
mensurables. De manera coherente con la tradición conductista, los profesores y terapeutas
que utilizan el AAC centran su atención en las respuestas correctas. Las conductas que se pre-
tende aumentar o disminuir suelen denominarse conductas diana. Por ejemplo, en un pro-
grama diseñado para disminuir la agresividad de un niño, lo primero que debe hacerse es
identificar conductas diana como gritar, pegar a otros o tirar objetos (Morris, 1985).

• La conducta se mide tanto antes como durante la intervención. Sólo de esta manera es posi-
ble saber si un determinado procedimiento AAC está resultando eficaz para modificar la con-
ducta diana. Una forma de medir es, simplemente, contar la frecuencia de una respuesta de-
terminada; por ejemplo, si hemos diseñado un programa para modificar la conducta de
Juanita de pegar a otros, deberíamos contabilizar cada ocasión en que la niña golpea a al-
guien. Otra forma de medir la conducta es examinar el ritmo de respuestas, mediante el pro-
cedimiento de contabilizar cuántas respuestas se producen durante un intervalo de tiempo de-
terminado; por ejemplo, podríamos contabilizar el número de veces que Juanita golpea a
alguien en una hora. Un tercer método, denominado tiempo de muestreo, supone dividir el
período de tiempo durante el que los individuos están siendo observados en intervalos idén-
ticos y, a continuación, examinar si en cada uno de ellos tiene lugar la conducta diana. Por
ejemplo, podríamos medir la conducta de pegar a los demás, dividiendo la jornada escolar en
intervalos de 5 minutos y contabilizando aquellos intervalos en los que se ha observado di-
cha conducta.
Los conductistas insisten en que las conductas diana se observen y registren de la manera
más objetiva posible. Lo ideal sería que una persona (profesor o terapeuta) administre el AAC
y que, al menos, dos observadores entrenados registren la aparición de la conducta diana. Si
la conducta está definida de manera objetiva y precisa, la coincidencia entre los registros de
los observadores (la fiabilidad entre observadores) debería ser muy elevada.

Antecedente Un Ninguna Un
Conducta diana (pegar) compañero observación compañero

se burló le pegó
de él
no sí sí no
no sí no

Consecuencia regañina regañina nada

9:00 9:02 9:04 9:06 9:08 9:10 9:15
(la hora indica el comienzo del intervalo de dos minutos)

Figura 5.2 Muestra temporal de conductas diana junto con los sucesos antecedentes y consecuentes.

Capítulo 5 I Aplicaciones del condicionamiento operante 107

• Deben identificarse aquellas condiciones ambientales que pueden provocar problemas de
conducta. Generalmente, sirve de ayuda recoger información no sólo de las conductas diana
sino también de los acontecimientos que se producen inmediatamente antes y después de es-
tas conductas. Lo normal es que el profesor o terapeuta recoja sobre los siguientes aspectos:

— antecedentes: estímulos y situaciones que encuentra el individuo;
— conductas: respuestas que realiza el individuo;
— consecuencias: estímulos y situaciones que siguen a esas conductas.

La figura 5.2 ilustra una pequeña muestra temporal de las respuestas de pegar de Juanita, junto
con las situaciones antecedente y consecuente.

Una vez que se ha recogido esa información, el profesor o el terapeuta busca patrones regulares en
los datos e identifica situaciones específicas que pueden estar provocando o reforzando la conducta
diana, una aproximación que se conoce como análisis funcional3. Por ejemplo, imaginemos a Jeb, un
niño autista de cinco años. Sus profesores informan de que pasa una gran cantidad de su tiempo es-
colar con las orejas tapadas. Los investigadores Tang, Kennedy, Koppekin y Caruso (2002) se propu-
sieron averiguar por qué realizaba con tanta frecuencia esta conducta. Registraron las siguientes con-
ductas a intervalos de 30 segundos: 1) cada vez que se tapaba las orejas; 2) sucesos que ocurrían en
ese momento (cualquier respuesta que se produjera durante el tiempo de juego, el almuerzo, la ense-
ñanza o la transición entre actividades, así como si había algún niño gritando), y 3) la conducta del
profesor tras cada respuesta (por ejemplo, si el profesor empezaba, terminaba o continuaba interac-
tuando con Jeb). La figura 5.3 muestra la frecuencia con que ocurría cada episodio de taparse las ore-
jas, bajo diferentes condiciones antecedentes y consecuentes. Como puede verse, los profesores no
cambiaban su conducta hacia Jeb cuando éste se tapaba las orejas, de manera que aparentemente no
reforzaban la conducta diana. Lo que resulta más esclarecedor es observar los estímulos antecedentes:
el 80% de las conductas de taparse las orejas se producía inmediatamente después de que algún com-
pañero hubiese gritado. Es muy probable que el niño tuviese una sensibilidad excesiva a los sonidos
elevados, algo muy característico de los niños con autismo (Sullivan, 1994; Williams, 1996.

• Desarrollo de un plan de intervención o de tratamiento específico. Elaborar un plan de trata-
miento supone la necesidad de determinar el método mediante el cual se modificará la con-
ducta diana. En ocasiones, la frecuencia de una conducta puede incrementarse simplemente
mediante el reforzamiento de esa conducta cada vez que ocurre. Sin embargo, cuando el ni-
vel operante básico de una respuesta deseada es muy bajo, puede que sea necesario modelar
la respuesta mediante el reforzamiento de aproximaciones sucesivas. Una conducta indesea-
ble puede eliminarse mediante métodos como la extinción, el reforzamiento diferencial de
otras conductas, el reforzamiento de conductas incompatibles, o el control del estímulo (esto
es, reduciendo las situaciones en que se permite esa conducta).
Como se ha dicho en el capítulo anterior, nunca debemos asumir que ciertas consecuencias
serán reforzantes. Por el contrario, necesitamos identificar uno o más reforzadores observando

3 En algunos análisis funcionales, el profesor o el terapeuta manipula sistemáticamente el entorno para contrastar di-
versas hipótesis sobre la influencia de los estímulos antecedentes y consecuentes (Iwata, Dorsey, Slifer, Bauman y Richman,
1982/1994; Van Camp y otros, 2000). Para ejemplos de esta aproximación, véase Jones, Drew, Turner y Scattone (2001); y
Piazza y otros, 1999.

108 APRENDIZAJE HUMANO Proporción de la conducta de taparse las orejasConsecuencia
Juego
100 Antecedente Almuerzo
80 Enseñanza
60 Transición
40 Gritos
20 Inicia
0 interacción
Termina
interacción
No hay cambio
en la interacción

Figura 5.3 Frecuencia de las respuestas de Jeb de taparse las orejas, bajo diferentes condiciones antece-
dentes y consecuentes.
Reproducido con permiso. J. C. Tang, C. H. Kennedy, A. Koppekin, y Mary Caruso, «Functional Analysis of
Steriotypical Ear Covering in a Child with Autism» Journal of Applied Behavior Analysis, 2002, 35, p. 96.
Copyright 2002 de la Society for the Experimental Analysis of Behavior, Inc.

qué es lo que motiva a nuestros sujetos (por ejemplo mediante un análisis funcional) o, tam-
bién, preguntando a las personas que los conocen. Cuando se aplica un programa AAC en un
ámbito escolar, suelen ser muy eficaces los reforzadores sociales como las alabanzas, o los
reforzadores de actividad tales como privilegios especiales, o la oportunidad de jugar con un
compañero favorito (Bates, 1979; Brophy, 1981; Northup y otros, 1995; Piersel, 1987). En al-
gunos casos, el único refuerzo que necesita un estudiante es la retroalimentación inmediata
de que ha hecho las cosas correctamente, sobre todo cuando esa es la única manera que tie-
ne de saber que lo ha hecho bien (Bangert-Drowns, Kulik, Kulik y Morgan, 1991; Harris y
Rosenthal, 1985; Kulik y Kulik, 1988). Si es necesario recurrir a reforzadores materiales por-
que los otros no funcionan, suele ser muy eficaz pedir a los padres que proporcionen en ca-
sa estos reforzadores, aunque sea para conductas que se han producido en la escuela (Barth,
1979; Kelley y Carper, 1988; Miller y Kelley, 1994; Wielkiewicz, 1986).

En muchos casos, también puede ser necesaria instrucción explícita (Craft y otros, 1998;
Heck, Collins y Peterson, 2001). Por ejemplo, imaginemos que unos cuantos alumnos es-
tán haciendo travesuras para conseguir la atención del profesor. Una buena estrategia pue-
de ser enseñarles a obtener su atención mediante conductas apropiadas, por ejemplo, 1) le-
vantando la mano o acercándose la mesa del profesor; 2) esperando tranquilamente a que
el profesor repare en ellos; y 3) pidiendo retroalimentación mediante preguntas como
«¿cómo lo estoy haciendo?», «no comprendo eso», «¡mira, he terminado!» (Craft y otros,
1998, p. 402).

Capítulo 5 I Aplicaciones del condicionamiento operante 109

• Cuando resulta apropiado, el sujeto se implica también en el plan de tratamiento. En algunas
ocasiones, profesor y alumno suscriben un contrato de contingencia, esto es, un acuerdo que
especifica determinadas expectativas para el estudiante (la conducta terminal) y las consecuen-
cias que tendrán que cumplir esas expectativas (el reforzador). Por ejemplo, un profesor y un
alumno pueden acordar que este último devolverá todas las tareas en su momento y con al me-
nos el 80% de exactitud, durante todos los días de una semana. Si el alumno realiza esa tarea,
el contrato podría especificar que dispondrá de tiempo libre para realizar su actividad favorita
o que podrá trabajar con el profesor algún tema que le interese especialmente. Si bien un con-
trato de contingencia puede hacerse de manera verbal, lo más frecuente es que sea un contrato
escrito. Profesor y estudiante negocian las condiciones del contrato y lo firman. Lo ideal es que
los primeros contratos exijan pequeñas tareas que el alumno pueda realizar en un breve perío-
do de tiempo, y que tanto la conducta deseable como la reforzada se especifiquen en términos
muy concretos y precisos (Homme, Csanye, Gonzales y Rechs, 1970; Walker y Sea, 1995).
Un contrato de contingencia también puede utilizarse para promover el logro académico;
y también para modificar la conducta en clase. Por ejemplo, cuando un profesor y un estu-
diante firman un contrato en el que se especifica que ciertas conductas producirán determi-
nadas consecuencias, el contrato podría ayudar al alumno a pasar más tiempo realizando las
tareas que se le asignan o demostrando conductas más sociables durante el recreo. Esta es-
trategia ha demostrado ser muy efectiva ante problemas tan diversos como malos hábitos de
estudio (Brooke y Ruthren, 1984; Miller y Kelley, 1994), delincuencia juvenil (Rueger y
Liberman, 1984; Welch, 1985) y adicción a las drogas (Anker y Crowley, 1982; Crowley,
1984; Rueger y Liberman, 1984)4.

• El tratamiento se controla para valorar su eficacia y se modifica si resulta necesario. Cuando
una conducta deseable aumenta su frecuencia o una conducta indeseable la disminuye duran-
te el programa de intervención, la conclusión lógica es que nos encontramos ante un progra-
ma eficaz. Sin embargo, cuando el cambio es muy pequeño, puede ser aconsejable realizar
una modificación del programa. Es posible que el profesor o el terapeuta estén intentando
modelar la conducta con demasiada rapidez. Quizá el «reforzador» no es realmente reforzan-
te, y debe ser sustituido por uno diferente. También, es posible que la conducta indeseable que
se está intentando eliminar mediante la extinción, esté manteniéndose gracias a otros refor-
zadores que no se controlan. En cualquier caso, un programa de intervención fallido debe
examinarse cuidadosamente para buscar éstas u otras posibles explicaciones de su ineficacia
y modificarlo adecuadamente.

• Deben tomarse medidas que promuevan la generalización de las conductas recién adquiri-
das. Aunque las personas solemos generalizar las respuestas que aprendemos de una situa-
ción a otra (R. V. Hall, Cristler, Cranston y Tucker, 1970; Walker, Mattsen y Buckley, 1971)
no existen garantías de que esto ocurra siempre. De hecho, muchos programas AAC tienen
un éxito limitado precisamente porque las respuestas no se generalizan a otras condiciones
estimulares distintas (Alberto y Troutman, 2003; Hughes, 1988; Schloss y Smith 1994). Los
psicólogos han sugerido diversas estrategias para promover la generalización durante un pro-
grama AAC:

4 Debido a que el contrato de contingencia permite al aprendiz tener algo que decir en su propio plan de tratamiento,
debería aumentar su sentido de la autodeterminación y, por lo tanto, incrementar la probabilidad de que cambie su conduc-
ta. Examinaremos la naturaleza y los efectos de la autodeterminación en el capítulo 17.

110 APRENDIZAJE HUMANO

* enseñar la conducta deseable en una amplia variedad de contextos, incluyendo muchos de
carácter realista; si fuera posible, enseñar la conducta en aquellas situaciones en las que de-
bería producirse (Anderson-Inman, Walker, y Purcell, 1984; Emshoff, Redd y Davidson,
1966; R.V. Hall y otros, 1970; Haring y Liberty, 1990; Stokes y Baer, 1977);

* enseñar muchas versiones diferentes de la conducta; por ejemplo, cuando se entrenan ha-
bilidades sociales, enseñar diferentes maneras de relacionarse de manera apropiada con
otras personas (Stokes y Baer, 1977);

* enseñar la relación de la conducta deseada con los reforzadores que se producen de mane-
ra natural en el entorno; por ejemplo, destacar que una mejor higiene personal produce una
atención más positiva por parte de los demás (Bourbeau, Sowers y Close, 1986; Stokes y
Baer, 1977);

* reforzar la conducta cuando ocurre de manera espontánea en situaciones nuevas; en otras
palabras, reforzar la generalización de una manera específica (Stokes y Baer, 1977).

• El tratamiento se retira gradualmente una vez que se ha adquirido la conducta deseada. En
muchas ocasiones, las conductas recién aprendidas empiezan a tener su propia recompensa;
por ejemplo, el estudiante agresivo que aprende conductas sociales más aceptables empieza
a tener nuevos amigos, mientras que el alumno que por fin ha aprendido a leer empieza a sen-
tirse bien y a disfrutar con la lectura. Sin embargo, en otras situaciones, el mantenimiento de
la conducta diana puede requerir un reforzamiento intermitente como, por ejemplo, series de
esquemas de reforzamiento de proporción variable muy alta.

Utilidad del análisis aplicado de la conducta con grupos grandes

Hasta este momento nos hemos centrado en el análisis aplicado de la conducta referido a una
sola persona. Pero esta técnica también puede utilizarse para modificar la conducta de grupos, por
ejemplo, toda un aula de alumnos. Hay dos métodos que son especialmente eficaces para trabajar
con grupos: la contingencia de grupos y la economía de fichas.

Contingencia de grupos
Con esta técnica se pretende que todo el grupo realice una conducta deseada para poder obtener

reforzamiento. Por ejemplo, en un estudio (Lovitt, Guppy y Blattner, 1969) se mejoraron los resul-
tados de un grupo de 4.° curso de primaria en los exámenes semanales de deletreo. En la primera
fase del estudio, la línea de base indicó que doce estudiantes (38%) mostraban unos resultados per-
fectos en las pruebas de deletreo. En la segunda fase, se administraron pruebas de deletreo durante
cuatro días de la semana; cualquier estudiante que obtuviera una puntuación perfecta cualquiera de
los días obtenía tiempo libre, mientras el resto de sus compañeros continuaba realizando esta prue-
ba el resto de los días. Durante este período más centrado en los individuos, el número medio de
evaluaciones perfectas ascendió a más del doble (80%). Durante la tercera fase, continuaron apli-
cándose los refuerzos individuales de la segunda fase; pero, además, cuando toda la clase conseguía
un resultado perfecto, se le permitía escuchar la radio durante 15 minutos. Durante esta última fase
se consiguió que el 94% del grupo realizara pruebas perfectas.

«El juego de la buena conducta» es un ejemplo de cómo una contingencia de grupo puede redu-
cir las malas conductas en el aula. En una investigación dirigida por Barrish, Saunders y Wolf (1969)
se trabajó con un aula de 4.° curso particularmente problemática, que se dividió en dos grupos cuya

Capítulo 5 I Aplicaciones del condicionamiento operante 111

conducta se observó cuidadosamente durante las lecciones de lectura y de matemáticas. Cada vez que
un miembro de un equipo se levantaba de su asiento o hablaba fuera de su turno, el equipo recibía un
punto. El equipo que menos puntos tuviera recibía privilegios especiales, como podría ser tiempo li-
bre; si ambos equipos tenían menos de cinco puntos, uno y otro obtenían estos privilegios.

La figura 5.4 muestra los resultados del estudio. Nótese que la línea de base se recogía al prin-
cipio durante las matemáticas y la lectura. El juego de la buena conducta se implantó para las ma-
temáticas el día 23; las conductas de levantarse del asiento y de hablar en clase disminuyeron brus-
camente durante las matemáticas, mientras que se mantuvieron en una elevada frecuencia durante
la clase de lectura. El día 45 se inició el juego durante la clase de lectura, y se detuvo durante la cla-
se de matemáticas; obsérvese cómo cambian las frecuencias de las conductas problemáticas. El día
51 se volvió a implantar el juego durante la clase de matemáticas y, de nuevo, las conductas pro-
blemáticas disminuyeron a un nivel muy bajo. Esta técnica de recoger datos en situaciones diferen-
tes (líneas de base múltiples) y de alternar entre el reforzamiento y el no reforzamiento (una téc-
nica denominada inversión), se emplea habitualmente en la investigación AAC para descartar la
posibilidad de que los cambios de conducta se deban a una coincidencia.

Economía de fichas

La economía de fichas, indudablemente la técnica más utilizada para la modificación de la con-
ducta de los grupos, parte de una situación en la que los sujetos que se comportan apropiadamente
son reforzados con fichas que, posteriormente, pueden intercambiarse por reforzadores que elige
cada individuo. Por ejemplo, un profesor que use esta estrategia en clase podría reforzar a sus alum-
nos con una ficha de póquer por cada tarea terminada. Antes del almuerzo los alumnos pueden uti-
lizar sus fichas para «comprar» pequeños premios, como tiempo libre en la sala de lectura o una po-
sición adelantada en la fila del comedor. Una economía de fichas suele incluir los siguientes
componentes:

1. Un conjunto de reglas que describe las respuestas que van a ser reforzadas. Las reglas debe-
rían ser relativamente pocas, de manera que puedan recordarse con facilidad.

2. Fichas que se entregan de manera inmediata ante las conductas apropiadas. Pueden utilizar-
se elementos como las fichas de póquer, dinero de juguete o puntos (McKenzie, Clark, Wolf,
Kothera y Benson, 1968).

3. Diferentes reforzadores (objetos, actividades y privilegios) por los cuales pueden intercam-
biarse las fichas. Algunos ejemplos que han mostrado su eficacia en el aula son el tiempo li-
bre (Osborne, 1969), la participación en acontecimientos especiales (Bushell, Wrobel y
Michaelis, 1968) y premios otorgados por los padres (McKenzie, Clark, Wolf, Kothera y
Benson, 1968).

4. Una «tienda» donde se puedan adquirir los reforzadores. A los niños más pequeños se les de-
be permitir, al menos, la oportunidad de un intercambio diario; los demás tienen suficiente
con una o dos oportunidades a la semana.

Los reforzadores de fichas resultan muy interesantes porque permiten a los profesores utilizar-
los para recompensar conductas individuales de manera inmediata y en el seno de un grupo. Otra
ventaja es el hecho de que los alumnos puedan intercambiar fichas para obtener muchos reforzado-
res diferentes; de esta manera se asegura que cada individuo encuentre aquello que más le gusta. De
hecho, tanto los niños como los adultos prefieren tener la oportunidad de elegir los reforzadores pa-
ra los que se están esforzando (Bowman y otros, 1997; Fisher y Mazur, 1997; Geckeler, Libby, Graff

112 APRENDIZAJE HUMANO

Matemáticas

100

Hablar

75

Levantarse
del asiento

50

Porcentaje de intervalos resultados de la conducta 25

0

1 3 5 8 10 11 13 15 20 21 23 26 33 36 41 43 45 48 50 51 53 55 58

Línea de base Juego1 Inversión Juego2

Lectura Hablar

100

75

50 Levantarse
del asiento

25

0

1 3 5 8 10 11 13 15 20 21 23 26 33 36 41 43 45 48 50 51 53 55 58

Línea de base Juego

Sesiones observadas

Figura 5.4 Porcentaje de intervalos de un minuto durante los cuales se produjeron conductas de levantarse
del asiento y de hablar, durante la clase de matemáticas y de lectura. Extraído de H. H. Barrish, M. Saunders
y M. M. Wolf, «Good Behavior Game: Effects of Individual Contingencies for group Consequences on
Disruptive Behavior a Classroom» Journal of Applied Behavior Analysis, 1969, 2, p. 122. Copyright 2002 de
Journal of Applied Behavior Analysis. Reproducido con permiso.

y Ahearn, 2000). De hecho, las propias fichas suelen convertirse en reforzadores eficaces (Hundert,
1976). Probablemente se conviertan en reforzadores secundarios mediante su asociación con otros
objetos y situaciones reforzantes o, quizá, su eficacia también provenga de que proporcionan retro-
alimentación de que se están haciendo las cosas adecuadamente.

Capítulo 5 I Aplicaciones del condicionamiento operante 113

Adición de un componente cognitivo
al análisis aplicado de la conducta

Durante los últimos años, muchos clínicos han añadido un elemento cognitivo a las técnicas
AAC, al emplear términos como modificación cognitiva de la conducta, terapia cognitiva de la con-
ducta o intervención cognitiva conductual (Elliott y Busse, 1991; Hughes, 1988; Robinson, Smith,
Miller y Brownell, 1999; Yell, Robinson y Drasgow, 2001). Desde tales posturas, el profesor o el te-
rapeuta modelan la conducta deseada, bajo el supuesto de que eso ayuda al estudiante a compren-
der qué se desea que realice esa conducta, y por lo tanto facilita el proceso de aprendizaje. Otra es-
trategia frecuente es el entrenamiento, en que el profesor o el terapeuta instruyen verbalmente al
alumno a medida que éste pone en práctica las conductas apropiadas. Las aproximaciones cogniti-
vas también se centran en la solución de problemas; por ejemplo, el profesor o el terapeuta pueden
pedir al alumno que piense cuidadosamente en los efectos que ciertas conductas pueden tener en de-
terminadas situaciones, y que elija aquellas conductas que tengan mayor probabilidad de producir
consecuencias deseables.

Eficacia del análisis aplicado de la conducta

El análisis aplicado de la conducta suele producir un cambio de comportamiento y, frecuente-
mente, tiene éxito donde han fallado otras técnicas (O´Leary y O´Leary, 1972). Hay numerosos es-
tudios que apoyan su eficacia para mejorar los resultados académicos y los hábitos de estudio
(Braukmann, Ramp y Wolf, 1981; Glover y Gary, 1976; Harris y Sherman, 1973; Iwata, 1987;
Lovitt y otros, 1969; McLaughlin y Malaby, 1972; McLaughlin y Williams, a 1988; McNamara,
1987; Piersel, 1987; Rapport y Bostow, 1976). También, pueden promover la mejoría de la atención
en clase, habilidades sociales, y la higiene personal (Braukmann, Ramp y Wolf, 1981; Iwata, 1987;
McLaughlin y Williams, 1988; Packard, 1970; Schloss y Smith, 1994; Taylor y Kratochwill, 1978).
Además, también reduce de manera eficaz conductas indeseables como la hiperactividad, la impul-
sividad, la agresión y la violencia (Ayllon, Layman y Kandel, 1925; Braukmann y otros, 1981;
Frankel y Simmons, 1985; Mayer y Butterworth, 1979; Northup y otros, 1995; Plummer, Baer y
LeBlanc, 1927; Robinson, Smith, Miller y Brownell, 1999; Shafto y Sulzbacher, 1977; Wulbert y
Dries, 1977).

El análisis aplicado de la conducta resulta especialmente beneficioso para aquellos estu-
diantes a los que se tiene que motivar constantemente para que realicen conductas sociales y
académicas apropiadas. También se usa frecuentemente para la educación y la terapia de alum-
nos con necesidades especiales, especialmente aquéllos con dificultades de aprendizaje o con
problemas de conducta (Haring, Roger, Lee, Breen y Gaylor-Ross, 1986; Hobbs y Holt, 1976;
McLaughlin y Williams, 1988; Northup y otros, 1995; O´Leary y Becker, 1967; Pfiffner y
Barkley, 1998; Plummer y otros, 1977; Witt, Elliott y Grasham, 1988; Wolf, Braukman y Ramp,
1987).

Aunque sabemos que estas técnicas funcionan, no siempre sabemos por qué funcionan. Un fac-
tor que probablemente contribuye a su eficacia es el hecho de que se utilizan contingencias de re-
fuerzo muy claramente especificadas. Debido a que las conductas deseables se describen en térmi-
nos muy concretos y específicos, los aprendices saben exactamente qué es lo que se espera de ellos.
Además, la retroalimentación inmediata que reciben a través del reforzamiento les proporciona una
orientación muy clara de cuándo van por buen camino y cuando no.

114 APRENDIZAJE HUMANO

CRÍTICAS A LA UTILIZACIÓN DEL REFORZAMIENTO EN EL AULA

Si bien las técnicas de enseñanza que se basan en los principios del condicionamiento operante
resultan evidentemente eficaces, no escapan a la crítica. Algunas de esas críticas probablemente no
tienen fundamento, mientras que otras deben ser analizadas con más detenimiento. Comenzaremos
examinando algunas de las quejas «ficticias» y pasaremos después a las preocupaciones más
genuinas.

Críticas espurias

Muchas de las críticas que se han dirigido a la utilización del reforzamiento en el aula proceden
de la incomprensión de los principios del condicionamiento operante o, quizá del desconocimiento
de su fundamento empírico. A continuación citamos algunos ejemplos típicos de estas críticas:

• El reforzamiento es una especie de chantaje. El argumento del chantaje probablemente cons-
tituye la queja más frecuente contra la utilización del reforzamiento en el aula. Sin embargo,
la palabra chantaje implica que la conducta que se refuerza tiene un carácter ilegal o no éti-
co. Por el contrario, la utilización apropiada del reforzamiento en el aula facilita la consecu-
ción de los objetivos educativos, lo cual supone lograr conductas deseables desde un punto de
vista tanto académico como social.

• El reforzamiento provoca la dependencia de las recompensas externas. Algunos críticos su-
gieren que los alumnos deberían aprender por el mero placer de aprender; argumentan que al
reforzar, generan la expectativa de que los alumnos siempre recibirán recompensas. Pero es-
te argumento puede rebatirse de dos maneras. En primer lugar, las técnicas AAC no exigen la
utilización de reforzadores materiales. Hay otros reforzadores como los sociales, las activi-
dades, la retroalimentación y los reforzadores intrínsecos (por ejemplo, el sentimiento de éxi-
to), que también son muy eficaces para modificar la conducta, de tal manera que un profesor
astuto tenderá a utilizarlos en lugar de los reforzadores materiales, siempre que sea posible.
En segundo lugar, incluso aunque un profesor deba recurrir a los reforzadores materiales,
éstos conllevan la aparición de conductas deseables que no se producirían de ninguna otra
manera. De hecho, el reforzamiento suele utilizarse cuando otros métodos más tradicionales
dirigidos a cambiar la conducta han fracasado. Si tenemos que elegir entre enseñar a leer a
María utilizando el reforzamiento, o que no aprenda a leer, evidentemente tendremos que op-
tar por su aprendizaje recurriendo a cualesquiera medios disponibles. No está de más recor-
dar, por otra parte, que cuando se utilizan reforzadores materiales, todos los aspectos socia-
les, como las alabanzas, que se asocian con ellos, pueden convertirse en reforzadores
secundarios.

• Si reforzamos a un alumno por portarse bien, estamos enseñando a los demás a portarse mal.
«Hummm», piensa Carmen. «Ángela ha sido tan parlanchina últimamente que el profesor le
está dando caramelos para que esté callada. Puede que si yo empiezo a dar la lata, también
consiga algunos caramelos». Si los alumnos piensan de esta manera, está claro que algo está
fallando en el programa de reforzamiento. Todos los estudiantes deberían recibir reforza-
miento por hacer conductas apropiadas. Las alabanzas y la retroalimentación positiva no
debería limitarse a un puñado de revoltosos crónicos, sino que deberían dirigirse de manera

Capítulo 5 I Aplicaciones del condicionamiento operante 115

El reforzamiento como un soborno. ¡Pssst, chico!
¿quieres aprender

a leer?

coherente a todos los alumnos. Si la conducta de un alumno determinado sólo puede modifi-
carse mediante reforzadores materiales, hay que asegurarse de que ese reforzamiento se ad-
ministre de manera discreta y privada.
• Modificar una conducta problemática no altera la causa que produce esta conducta, por lo
que terminarán haciendo su aparición otras manifestaciones conductuales que respondan a
esta causa. Esta crítica tiene su origen en la noción psicoanalítica de la sustitución de sínto-
mas: las conductas problemáticas serían un producto de conflictos psicológicos muy profun-
dos, de tal manera que cuando se elimina una conducta sin haber solucionado su auténtica
causa, aparecerá otra conducta problemática para sustituirla. La mejor manera de rebatir esta
crítica es de tipo empírico: cuando las conductas problemáticas son tratadas mediante el aná-
lisis aplicado de la conducta, prácticamente nunca aparecen síntomas sustitutivos (Rimm y
Masters, 1974).

Una posible razón para ello es que al modificar la conducta de una persona, probablemen-
te, también estemos alterando las causas subyacentes que la provocan. Por ejemplo, supon-
gamos una niña que es muy agresiva en el recreo. Tal vez, a esa niña le gustaría relacionarse
con sus compañeras, pero sólo conoce la agresión como forma de comenzar la interacción.
Al reforzar a la niña por emplear métodos más apropiados de interacción social, no sólo la
estamos ayudando a tener amigas, sino que además tratamos la causa subyacente de su agre-
sividad, esto es, su deseo de compañía.

Preocupaciones genuinas

Las quejas ficticias que acabamos de comentar pueden ser rebatidas con facilidad. Sin embargo
hay tres críticas al condicionamiento operante que deben considerarse con más detenimiento:

• La modificación de la conducta ignora el papel de factores cognitivos que pueden interferir
en el aprendizaje. Cuando los estudiantes son capaces de aprender una habilidad nueva pero
no están motivados para hacerlo, el reforzamiento puede convertirse en el detonante que
provoque el cambio de conducta. Pero cuando existen deficiencias cognitivas (por ejemplo,

116 APRENDIZAJE HUMANO

trastornos específicos de aprendizaje) que interfieren en la adquisición de una nueva habili-
dad, el reforzamiento por sí mismo no basta para ello. En esta situación, los profesores nece-
sitan emplear técnicas de enseñanza más basadas en las teorías cognitivas del aprendizaje, te-
orías que exploraremos en capítulos posteriores.
• El reforzamiento de algunas conductas puede interferir a largo plazo en el aprendizaje. El re-
forzamiento para lograr la realización de una tarea centra la atención de los estudiantes en la
realización de esta actividad los más rápidamente posible, aunque sea con una mínima calidad,
y desatienden el aprendizaje de esa tarea (Brophy, 1986; Clifford, 1990; Lepper y Hodell,
1989; McCaslin y Good, 1996). Cuando los profesores desean que sus alumnos realicen tareas
que impliquen un pensamiento complejo de nivel superior, por ejemplo, que piensen de ma-
nera flexible y creativa, entonces el reforzamiento extrínseco puede ser incluso contraprodu-
cente (Brophy, 1986; Deci y Ryan, 1985; Hennessey y Amabile, 1987; Lepper y Hodell, 1989).
• El reforzamiento extrínseco de una conducta que ya está motivada de manera intrínseca, pue-
de disminuir el valor intrínsecamente reforzante de esa conducta. Las personas suelen reali-
zar actividades debido a su interés intrínseco, por ejemplo, el placer o el sentimiento de triun-
fo, que aquéllas les proporcionan. Algunas investigaciones demuestran que estas actividades
placenteras pueden incrementarse mediante reforzadores extrínsecos, pero que disminuyen
por debajo de la frecuencia de base una vez que éstos reforzadores extrínsecos se eliminan.
Por ejemplo, en un estudio pionero, a un grupo de niños de preescolar a quienes se les había
prometido «un premio al mejor jugador» por dibujar, mostraron posteriormente menos ten-
dencia a dibujar en una situación de juego libre, que aquellos niños que a) se les había dado
un premio similar pero sin decirles nada previamente, o b) aquéllos que no habían sido re-
forzados en absoluto (Lepper, Greene y Nisbett, 1973). También se han obtenido resultados
similares en un estudio con estudiantes universitarios: aquéllos que recibieron 1 dólar por ca-
da solución correcta de una serie de rompecabezas, mostraron menos tendencia a continuar
jugando cuando ya no recibían reforzamiento, que aquellos estudiantes que no habían recibi-
do dinero por solucionarlos (Deci, 1971). Esta tendencia a que disminuya la motivación in-
trínseca por realizar la actividad se muestra de una forma especialmente patente en aquellas
situaciones en que el interés inicial en la actividad es elevado, cuando se ofrecen reforzado-
res tangibles como juguetes o dinero, cuando se dice de antemano que se reforzará la activi-
dad o cuando lo que se refuerza es el mero hecho de hacer la actividad y no el hacerla bien
(Cameron, 2001; Deci, Koester y Ryan, 2001). En el capítulo 17 cuando estudiemos la auto-
determinación, analizaremos una posible explicación de estos resultados.

CUÁNDO RESULTAN MÁS APROPIADAS

LAS TÉCNICAS DE CONDICIONAMIENTO OPERANTE

Los métodos de enseñanza que se basan en los principios del condicionamiento operante pro-
bablemente resulten más apropiados para unos grupos de estudiantes que para otros. Entre aquellos
estudiantes que parecen beneficiarse más de la estructura y la definición específica de la relación
entre la respuesta y el refuerzo, están aquéllos con una historia de fracaso académico, escasa moti-
vación, ansiedad, y aquéllos con los que no ha funcionado ninguna otra cosa.

Las experiencias de éxito frecuente y los reforzamientos, tal y como ocurre en la aprendizaje ex-
perto o en la enseñanza programada, resultan radicalmente beneficiosos para aquellos estudiantes

Capítulo 5 I Aplicaciones del condicionamiento operante 117

que previamente han obtenido poco éxito en su carrera académica (Gustafsson y Undheim, 1996;
Snow, 1989). Dentro de esta teoría caben aquellos alumnos que suelen etiquetarse de manera ofi-
cial como niños con «retraso evolutivo» o con «trastornos de aprendizaje», así como muchos alum-
nos con problemas crónicos de conducta. Una experiencia duradera de éxito académico es exacta-
mente lo que estos estudiantes necesitan para apuntalar su baja autoestima que, probablemente, sea
el producto de una larga historia de fracasos académicos.

Los alumnos con poca motivación también se benefician de las técnicas del condicionamiento
operante. Aunque algunos anhelan los sentimientos que proporciona el éxito académico, otros no
valoran estos sentimientos. La introducción de reforzadores extrínsecos (de carácter material, social
o de actividad) asociados al logro académico pueden resultar útiles para motivar a estos estudiantes
aparentemente «desinteresados» ante la consecución de logros escolares (Cameron, 2001; Coving-
ton, 1992; Lepper, 1981).

También, los estudiantes con mucha ansiedad parecen necesitar una clase bien estructurada pa-
ra realizar adecuadamente sus tareas escolares (Corno y otros, 2002; Dowaliby y Schumer, 1973;
Grimes y Allinsmith, 1961; Helmke, 1989). Estos estudiantes necesitan un entorno que especifi-
que claramente qué se espera de ellos, así como el reforzamiento que obtendrá su conducta.
También parecen necesitar frecuentes experiencias de éxito y de retroalimentación positiva. La ma-
yoría de los métodos de enseñanza que se derivan de los principios del condicionamiento operan-
te satisfacen especialmente bien las necesidades de los niños muy ansiosos: los objetivos educati-
vos desgranan la conducta deseada en términos muy concretos, la enseñanza programada y el
aprendizaje experto facilitan el éxito y la retroalimentación positiva, y las técnicas de análisis apli-
cado de la conducta transmiten con claridad qué conductas van asociadas a los reforzadores pre-
feridos de los alumnos.

Por último, existen algunos estudiantes para quienes no funciona otra cosa. Las técnicas basa-
das en los principios del condicionamiento operante han demostrado ser métodos muy eficaces pa-
ra modificar, incluso, los problemas de conducta más difíciles (Greer, 1983; Rimm y Masters,
1974). Aquellas situaciones pertinaces como el autismo u otros trastornos de conducta muy graves,
también son más susceptibles de mejoría mediante la utilización de las técnicas de análisis aplica-
do de la conducta que mediante cualquier otro método.

Y sin embargo, no todo el mundo se beneficia por igual de los métodos basados en el condicio-
namiento operante. Los alumnos brillantes pueden encontrar muy tedioso el avance tan gradual de
la enseñanza programada. Una economía de fichas en un aula llena de alumnos muy motivados,
puede disminuir el deseo intrínseco de éstos para esforzarse en sus tareas. En estos casos es prefe-
rible acudir a otras teorías del aprendizaje, fundamentalmente las de carácter cognitivo.

RESUMEN

Los objetivos de la instrucción y, especialmente, los de tipo conductual (que describen objeti-
vos educativos en términos de respuestas observables y específicas) proceden directamente del con-
cepto de conducta terminal. El planteamiento de objetivos facilita la comunicación entre alumnos y
profesores; también contribuye a la selección de estrategias de enseñanza y técnicas de evaluación
adecuadas. Los objetivos tienden a concentrar la atención de profesores y alumnos en la informa-
ción y las capacidades a las que aluden (como ventaja) pero también a alejarla de otras capacidades
e informaciones (una evidente desventaja cuando los objetivos importantes no se han identificado
o evaluado).

118 APRENDIZAJE HUMANO

La enseñanza programada, la enseñanza asistida por ordenador y el aprendizaje experto incor-
poran principios del condicionamiento operante tales como la respuesta activa, el modelado y el re-
forzamiento inmediato. En general, la enseñanza programada no parece resultar más eficaz que los
métodos tradicionales de enseñanza, mientras que la utilización del ordenador puede tener efectos
pequeños o moderados. El aprendizaje experto sí produce resultados superiores a los de la ense-
ñanza tradicional, especialmente para aquellos alumnos de bajo rendimiento, y resulta especial-
mente apropiada para enseñar información y habilidades básicas que constituyen prerrequisitos pa-
ra otras adquisiciones más complejas.

El análisis aplicado de la conducta (AAC) supone una utilización planificada y sistemática de
los principios conductistas destinada a optimizar la conducta. Debe basarse en una medición muy
precisa de las conductas diana, en la manipulación de los acontecimientos antecedentes y conse-
cuentes (por ejemplo, reforzamiento, castigo) para modificar la frecuencia de diferentes respues-
tas, en el control constante de la intervención para asegurar su eficacia, y en planes para lograr la
generalización. Estrategias como los contratos de contingencias y las contingencias de grupo per-
miten a los profesores y los terapeutas utilizar de manera eficaz el reforzamiento, incluso, con gru-
pos muy grandes. Estas técnicas han demostrado que facilitan la mejoría de una amplia variedad
de conductas académicas y sociales, incluso en aquellas situaciones en que han fracasado otros
métodos.

La utilización del reforzamiento en el aula ha provocado cierto número de críticas; algunas re-
flejan el desconocimiento de las técnicas conductistas habituales, pero otras críticas sí son muy le-
gítimas. Las técnicas del condicionamiento operante probablemente se utilizan de manera óptima
con ciertos tipos de alumnos (por ejemplo, aquéllos que muestran una elevada ansiedad, escasa mo-
tivación o una historia de fracaso académico), pero no se pueden aplicar indiscriminadamente a to-
dos los alumnos.

6C A P Í T U L O

Efectos de los estímulos aversivos

Aprendizaje de escape y de evitación
Aprendizaje de escape
Aprendizaje de evitación

El castigo
Desventajas del castigo
Eficacia del castigo
Perspectivas teóricas sobre el castigo
Utilización del castigo en el entorno escolar
Orientaciones para utilizar el castigo de manera eficaz

La indefensión aprendida
Resumen

Cuando discutimos el condicionamiento operante en los capítulos 4 y 5, nos centramos en el pa-
pel que desempeñan las consecuencias deseables (reforzadores) en el aprendizaje y en la conducta.
En este capítulo vamos a describir el impacto de los acontecimientos aversivos, prestando una aten-
ción especial a tres situaciones diferentes. Comenzaremos examinando cómo aprenden las personas
y los animales a escapar y a evitar situaciones desagradables. A continuación, analizaremos los efec-
tos de las consecuencias punitivas sobre el aprendizaje y la conducta. Finalmente, examinaremos un
fenómeno que aparece cuando personas y animales han sido expuestas a estímulos aversivos de los
cuales no pueden escapar, pero que tampoco pueden evitar, un fenómeno que se conoce como in-
defensión aprendida.

APRENDIZAJE DE ESCAPE Y DE EVITACIÓN

Mi anterior universidad en Colorado, como tantas otras, tenía multitud de comisiones. Cuando
ingresé en la facultad como profesora ayudante intenté ávidamente participar en tantas comisiones
como podía, ya que las consideraba como un medio de conocer a otros compañeros y de participar
en las decisiones de la universidad. Sin embargo, hace ya mucho tiempo que descubrí que la mayo-
ría de las comisiones dilapidan el tiempo en los mismos temas de siempre sin terminar de alcanzar
el consenso y sin avanzar apenas en los resultados. Frustrada por la gran cantidad de tiempo que es-
taba desperdiciando, en seguida me encontré inventando excusas para abandonar la reunión lo an-
tes posible («lo siento mucho, pero tengo que llevar a mi hijo al dentista»). Poco a poco dejé de alis-
tarme en comisiones, hasta que termine evitándolas por completo.

120 APRENDIZAJE HUMANO

Las reuniones de las comisiones se han convertido en situaciones aversivas para mí. Mí apren-
dizaje para inventar excusas que me permitieran abandonar lo antes posible las reuniones y, poste-
riormente, mi aprendizaje para no alistarme en ninguna comisión, es típico de lo que ocurre cuan-
do se presenta un estímulo aversivo: los organismos aprenden a escapar y, también, a evitar el
estímulo si tienen la posibilidad de hacerlo.

Aprendizaje de escape

El aprendizaje de escape es el proceso mediante el cual se adquiere una respuesta que permi-
te acabar con un estímulo aversivo. Por ejemplo, en el estudio clásico de Neal Miller (1948) sobre
el aprendizaje de escape, se colocaron ratas en un compartimento de una caja compuesta por dos
departamentos, y se les suministraron una serie de descargas eléctricas. Las ratas aprendieron ense-
guida a girar una rueda que les permitía pasar al otro compartimento, escapando de esta manera de
las descargas aversivas. En un estudio análogo con seres humanos (Hiroto, 1974), los sujetos apren-
dieron rápidamente a mover una manivela para apagar un sonido desagradablemente alto.

Igual que ocurre en el laboratorio, los estudiantes aprenden diferentes modos de escapar de ta-
reas o situaciones desagradables. Las excusas («mi perro ha destrozado mis deberes») y las con-
ductas inapropiadas en clase, les permiten escapar de obligaciones académicas tediosas o frustran-
tes (Magee y Ellis, 2000; Taylor y Romanczyk, 1994). Mentir sobre la propia conducta («no he sido
yo, ha sido él») es una manera de escapar del ojo vigilante del profesor. La hipocondría, hacer no-
villos o abandonar la escuela son formas de escapar por completo del ambiente escolar. Por supuesto
que algunas respuestas tienen un carácter productivo; por ejemplo, muchas adolescentes adquieren
sutiles tácticas para rechazar aproximaciones sexuales no deseadas o para abandonar una fiesta en
la que abundan las drogas y el alcohol.

Dado que escapar de un estímulo aversivo hace que finalice ese estímulo, la respuesta de esca-
pe se refuerza negativamente. Cuando las ratas dan una respuesta que detiene una descarga eléctri-
ca, cuando los niños dan una respuesta que detiene el ojo vigilante1, y cuando yo doy una excusa
para abandonar la reunión de una comisión, todos quedamos reforzados en virtud del hecho de que
desaparece un acontecimiento desagradable.

Cuanto más aversivo es un estímulo, más probable es que las personas aprendan a escapar de él
(Piliavin, Dovidio, Gaertner y Clark, 1981; Piliavin, Piliavin y Rodin, 1975). Por ejemplo, aquellos
niños que tienen dificultades particulares con sus deberes, es más probable que también posean pe-
rros muy proclives a comérselos. Asimismo, aquellos alumnos que abandonan la escuela antes de
terminar sus estudios, suelen ser aquéllos que han sufrido un fracaso académico y social frecuente
(Garnier, Stein y Jacobs, 1997; Rumberger, 1995).

Aprendizaje de evitación

El aprendizaje de evitación es el proceso de aprendizaje que permite permanecer lejos de los
estímulos aversivos. Para que se produzca el aprendizaje de evitación, el organismo debe recibir

1 El ojo vigilante puede que le recuerde «la mirada», que describimos en nuestra discusión del condicionamiento clási-
co en el capítulo 3. Si bien algunos estímulos como aquéllos que producen dolor tienen un carácter aversivo en sí mismos,
hay otros como ciertas expresiones faciales que se convierten en aversivos mediante su asociación con estímulos desagrada-
bles o, en otras palabras, mediante condicionamiento clásico.

Capítulo 6 I Efectos de los estímulos aversivos 121

Respuestas comunes de escape y evitación. No me No he
siento bien. sido yo.

Me parece que mi No puedo; esta noche tengo
madre me está llamando. que lavarme el pelo.

algún tipo de estímulo preaversivo, esto es, alguna señal que avise de la proximidad del estímulo
aversivo. Por ejemplo, las ratas que escuchan un zumbido y que entonces reciben una descarga eléc-
trica (siendo el zumbido el estímulo preaversivo) aprenden fácilmente a saltar una valla en cuanto
suena el zumbido, evitando de esta manera el estímulo doloroso (Mowrer, 1938, 1939). De manera
similar, los niños aprenden rápidamente a apretar una luz que indica que pueden evitar un ruido
desagradablemente elevado (Robinson y Robinson, 1961).

El aprendizaje de evitación adopta dos formas: el aprendizaje de evitación activo y el aprendi-
zaje de evitación pasivo. En el aprendizaje de evitación activo el organismo debe realizar de ma-
nera activa una respuesta determinada para evitar un acontecimiento aversivo. Por ejemplo, la con-
ducta de estudiar es, en muchos casos, una situación de aprendizaje de evitación activo. En
condiciones ideales estudiar debería ser una actividad agradable por sí misma (y que por lo tanto
produce un reforzamiento intrínseco); pero, por desgracia la mayoría de la gente no disfruta de ella
(yo, por ejemplo, prefiero leer una novela de misterio o ver un programa de televisión). Sin embar-
go, al estudiar más a menos frecuentemente, la mayoría de los estudiantes pueden evitar un estímu-
lo aversivo como puede ser un suspenso. Y si no, considérese cuán raramente aparece la conducta
de estudio cuando no hay señales de que se aproxima de manera inminente (no hay un estímulo
preaversivo), un informe de investigación o un examen de evaluación.

En otras situaciones, los organismos aprenden que no realizar una respuesta determinada les per-
mite evitar el estímulo aversivo (Lewis y Maher, 1965; Seligman y Campbell, 1965); este tipo de
aprendizaje se denomina aprendizaje de evitación pasivo. Ejemplo, las personas que sienten an-
siedad e incomodidad en situaciones sociales tienden a no existir a fiestas u otros eventos sociales.
De manera similar, los estudiantes que tienen dificultades con las matemáticas difícilmente se apun-
tarán a clases de matemáticas avanzadas sí pueden evitarlo.

¿Qué procesos de aprendizaje subyacen en el aprendizaje de evitación? Una de las primeras teo-
rías más frecuentemente citadas es la teoría bifactorial de Mowrer (Mowrer, 1956; Mowrer y
Lomoreaux, 1942). Según la teoría de Mowrer, el aprendizaje de evitación consiste en un proceso
de dos etapas que consta de condicionamiento clásico y de condicionamiento operante. En la pri-
mera etapa, dado que el estímulo preaversivo y el estímulo aversivo se presentan de manera casi si-
multánea, el organismo aprende a temer al estímulo preaversivo mediante un proceso de condicio-
namiento clásico, como se ilustra en la figura 6.1. En la segunda etapa, aparece una respuesta de
evitación como consecuencia de un reforzamiento negativo, ya que permite escapar del estímulo
preaversivo que produce temor.

Por muy lógica que parezca la propuesta de Mowrer, no ha sido apoyada de manera satisfacto-
ria por la investigación empírica. Por ejemplo, las ratas pueden aprender a evitar un estímulo aver-
sivo incluso aunque sean incapaces de escapar del estímulo preaversivo (Kamin, 1956); este resul-
tado refuta la noción de Mowrer de que es el escape del estímulo preaversivo el que refuerza

122 APRENDIZAJE HUMANO

EN RI
(estímulo preaversivo) (miedo)

EI
(estímulo aversivo)

EC RC
(estímulo preaversivo) (miedo)

Figura 6.1 Aprender a temer un estímulo preaversivo mediante condicionamiento clásico.

negativamente la respuesta de evitación. Es más, una vez que la respuesta de evitación está perfec-
tamente aprendida, los organismos suelen mostrar muy poco temor ante el estímulo preaversivo; de
esta manera, la respuesta de evitación ya no queda reforzada por la reducción del temor (Kamin,
Brimer y Black, 1963).

Desde que se propuso la hipótesis de Mowrer, se han planteado otras teorías explicativas (Bolles,
1975; D´Amato, 1970; Herrnstein, 1969; Seligman y Johnston, 1973). Por ejemplo, algunos teóri-
cos proponen que el auténtico reforzador de una respuesta de evitación es un sentimiento de con-
fianza (D´Amato, 1970; Denny y Weisman, 1964). Sin embargo, dado que la conducta de evitación
puede producirse en ausencia de temor, otros teóricos (Bolles, 1975; Seligman y Johnston, 1973)
han abandonado las explicaciones puramente conductistas para profundizar en los mecanismos ex-
plicativos que proporciona la teoría cognitiva: los organismos establecen expectativas sobre qué si-
tuaciones son aversivas y qué conductas les permiten evitarlas.

Extinción de las respuestas de evitación

Si bien existe desacuerdo sobre cuál es la mejor explicación teórica del aprendizaje de evitación,
sí existe consenso respecto a una cosa: las respuestas de evitación son muy difíciles de extinguir.
Cuando una situación que ha sido aversiva deja de serlo, aún así los organismos continúan evitán-
dola. Por ejemplo, los perros continuarán escapando de una caja que se haya asociado previamente
con descargas eléctricas, mucho tiempo después de que las descargas hayan sido eliminadas (Solo-
mon y Wynne, 1954).

Una razón probable para explicar la elevada resistencia ante la extinción de las respuestas de evi-
tación, es que cuando un organismo evita una situación previamente aversiva, no tiene la oportuni-
dad de aprender que esa situación ha dejado de serlo. Imaginemos como ejemplo, la evitación de la
asignatura de Matemáticas. Como se ha sugerido en el capítulo 3, la ansiedad ante las matemáticas
puede ser una respuesta condicionada, adquirida en un momento en que los niños todavía no esta-
ban cognitivamente preparados para dominar los conceptos matemáticos abstractos. Puede ocurrir
que los estudiantes con ansiedad ante las matemáticas continúen evitando estas clases de manera in-
definida, incluso cuando ya hayan desarrollado la madurez cognitiva necesaria para comprender
conceptos que antes resultaban inaprensibles. Si los alumnos nunca llegan a cursar otra asignatura
de Matemáticas, no podrán aprender que no tienen nada que temer.

Capítulo 6 I Efectos de los estímulos aversivos 123

Muchos psicólogos consideran que la mejor manera de eliminar la respuesta de evitación es co-
menzar por extinguir el miedo que conduce a esta respuesta. Una manera de hacer esto es median-
te la desensibilización sistemática, una técnica que mencionamos en el capítulo 3: conseguir que al-
guien se relaje mientras imagina una serie de escenarios que le producen ansiedad, puede reducir su
temor ante ciertas situaciones, tales como un examen o hablar en público. Otra estrategia consiste
en impedir que la persona realice la respuesta de evitación. Al hacer esto creamos una ocasión en
que esa persona experimenta el estímulo condicionado en ausencia del estímulo incondicionado que
le produce temor; de esta manera, facilitamos la extinción de la respuesta de temor condicionada de
manera clásica. Por ejemplo, un alumno con temor a las matemáticas y del cual sabemos que posee
las capacidades cognitivas necesarias para desenvolverse con éxito, podría ser obligado a matricu-
larse en una clase de matemáticas; una vez en la clase, el alumno puede llegar a descubrir que las
matemáticas constituyen una experiencia gratificante más que frustrante. En algunas circunstancias
parece cierto que los estudiantes no siempre saben qué es lo mejor para ellos.

Indudablemente, la mejor manera de enfrentarse a las conductas de escape y evitación en el au-
la es prevenir tales conductas desde el principio, algo que sólo podemos lograr reduciendo los estí-
mulos aversivos del aula. Por ejemplo, los profesores deberían tener en cuenta cuál es la edad, los
conocimientos y la madurez cognitiva de sus alumnos, cuando programan los objetivos educativos
y, a partir de ahí, proporcionar la ayuda necesaria para que sus alumnos alcancen de manera satis-
factoria estos objetivos. Cuando los alumnos tienen éxito en sus tareas escolares (un reforzador po-
sitivo) y no experimentan frustración y fracaso constantes, tienen más probabilidades de buscar que
de evitar dichas tareas.

Tanto en el aprendizaje de escape como en el de evitación, un organismo realiza una respuesta
que le permite finalizar o evitar un estímulo aversivo, un estímulo que, particularmente en el caso
del aprendizaje de escape, ya está presente en el entorno. Pero cuando un estímulo aversivo sólo
ocurre después de que el organismo da una respuesta, entonces nos encontramos ante una situación
de castigo. A continuación vamos a examinar este fenómeno.

EL CASTIGO

El castigo puede adoptar dos formas. El castigo I es la forma más habitual; supone la presenta-
ción de un estímulo que disminuye la fuerza de la respuesta previa. Generalmente el castigo I su-
pone la presentación de un estímulo aversivo, por ejemplo una reprimenda o un suspenso. El casti-
go II disminuye la fuerza de una respuesta debido a que se elimina un estímulo, generalmente de
carácter agradable. Perder un privilegio o ser multado por la policía (en cuyo caso lo que se pierde
es dinero), son ejemplos de castigo II2. El castigo es algo habitual en nuestra vida cotidiana; algu-
nos teóricos consideran que, incluso, la ausencia de reforzamiento puede considerarse como un cas-
tigo (exploraremos esta idea en el capítulo 7).

Las ideas sobre la eficacia del castigo se han modificado de manera considerable durante los úl-
timos 60 años. Las primeras investigaciones indicaron que el castigo era un medio muy poco eficaz

2 También se puede considerar el castigo I como un castigo positivo (ya que algo se añade a la situación) o un castigo
de presentación. Se puede considerar el castigo II como un castigo negativo (ya que se retira algo de la situación) o un cas-
tigo de sustracción.

124 APRENDIZAJE HUMANO

para modificar la conducta. Por ejemplo, Thorndike (1932b) encontró que aunque la retroalimenta-
ción positiva facilitaba el aprendizaje de las respuestas correctas, la retroalimentación negativa no
reducía las respuestas incorrectas. De manera similar, Skinner (1938) descubrió que cuando se cas-
tiga a ratas por dar una respuesta que previamente había sido reforzada, esa respuesta desaparecía
temporalmente pero enseguida alcanzaba la misma frecuencia que tenía antes del castigo. Por lo tan-
to, muchos de los primeros conductistas desaconsejaban el uso del castigo.

Probablemente, el hecho de que los principales teóricos del aprendizaje expresaran esta pers-
pectiva negativa del castigo, provocó que éste fuese ignorado hasta la década de los sesenta. Hasta
ese momento, la preocupación se centraba más en las desventajas que en las ventajas que pudiera
tener el castigo. Sin embargo, más recientemente, están apareciendo investigaciones que indican
que en determinadas circunstancias el castigo puede resultar eficaz.

En las siguientes páginas vamos a explorar el tema heterogéneo del castigo. Comenzaremos ana-
lizando las numerosas desventajas del mismo. A continuación revisaremos las evidencias que apo-
yan su utilización como un medio eficaz para modificar la conducta, y analizaremos diversas ex-
plicaciones teóricas de su efecto sobre la conducta. Por último, discutiremos algunas orientaciones
para utilizar de manera apropiada el castigo en el aula.

Desventajas del castigo

Durante muchos años los psicólogos han descrito una serie de desventajas derivadas de la utili-
zación del castigo:

• Una conducta castigada no se elimina, sólo se suprime. El castigo suprime una respuesta: ha-
ce que la respuesta tenga menos probabilidad de ocurrir. Sin embargo, esta supresión suele
tener un efecto temporal: la conducta castigada puede reaparecer, quizá cuando cese el casti-
go o cuando esté ausente la persona que lo aplica (Appel y Peterson, 1965; Azrin, 1960;
Griffore, 1981; Holz y Azrin, 1962; Skinner, 1938).

• A veces, el castigo provoca un aumento de la conducta que se castiga. En algunos casos, es-
te efecto puede deberse al hecho de que el «castigo» tenga en realidad un efecto reforzante.
Por ejemplo, la reprimenda de un profesor puede resultar reforzante para una niña que busca
llamar su atención o para un chico que intenta parecer «duro» delante de sus compañeros.
Incluso, cuando el castigo es realmente punitivo, también puede provocar un incremento en
la respuesta a la que sigue. En concreto, cuando se castiga una conducta en una situación de-
terminada, puede que esa conducta disminuya en esa situación, pero aumente en otra en la
que esa conducta no se ha castigado, un fenómeno que se conoce como contraste conduc-
tual (Reynolds, 1975; Swenson, 1980). Por ejemplo, algunos niños que se portan mal en la
escuela puede que sean descritos por sus padres como auténticos angelitos cuando están en
su casa. Es posible que esos niños estén muy controlados en su casa y que allí sus infraccio-
nes se castiguen con severidad y, por ello, realicen las conductas prohibidas en la escuela,
donde quizá las consecuencias sean más soportables.

• Puede que no se advierta la relación entre la respuesta y el castigo. El castigo y, especial-
mente, el castigo físico, puede distraer la atención del individuo respecto a la conducta que
ha sido castigada. Las personas suelen ser menos conscientes de la respuesta que ha sido cas-
tigada que del castigo en sí mismo (Maurer, 1974). Evidentemente, el castigo no puede ser
eficaz si la persona no sabe porqué está siendo castigada.

Capítulo 6 I Efectos de los estímulos aversivos 125

• El castigo suele provocar respuestas emocionales indeseables y puede conducir a conductas
de escape y evitación. Cuando el castigo recurre a un estímulo especialmente aversivo, la aso-
ciación de ese estímulo con otros estímulos (por ejemplo, con la persona que castiga o la si-
tuación en que ocurre el castigo), puede, mediante condicionamiento clásico, provocar res-
puestas emocionales indeseables ante tales estímulos (Skinner, 1938). Por ejemplo, cuando
un profesor castiga a un alumno en la escuela, el castigo (el EI) puede quedar asociado con
el profesor, la tarea o el aula, los cuales se convierten en estímulos condicionados (EC) que
provocan respuestas condicionadas (RC) tales como miedo y ansiedad. De una manera simi-
lar, cuando un entrenador de atletismo critica continuamente a los niños por su mal rendi-
miento durante el juego, es posible que aparezcan actitudes negativas ante el deporte (Feltz,
Chaase, Moritz y Sullivan, 1999; Smith y Smoll, 1997).
Es más, un estímulo que ha llegado a provocar miedo debido a su asociación con el casti-
go, puede acarrear respuestas de escape o evitación (Redd, Morris y Martin, 1975). Estas res-
puestas adoptan diversas formas en la escuela, tales como el déficit de atención, las trampas,
las mentiras, el rechazo a participar en las actividades de clase o el absentismo (Becker, 1971;
Magee y Ellis, 2000; Skinner, 1938; Taylor y Romanczyk, 1994).

• El castigo puede provocar agresión. Cuando el castigo produce dolor, evoca una activación
emocional que puede dar lugar a la angustia y la agresión, especialmente en personas que ya
están predispuestas a la agresividad (Azrin, 1967; Berkowitz y LePage, 1967; Walters y
Grusec, 1977). La conducta agresiva parece reducir esta activación emocional y, en general,
provocar un sentimiento de «bienestar», con lo que se refuerza la agresión (Bramel, Taub y
Blum, 1968; Hokanson y Burgess, 1962).
Es más, algunas formas de castigo proporcionan un modelo de agresión, por lo que comu-
nican el mensaje de que la agresión es aceptable. Recuerdo muchas interacciones hipócritas
que pueden verse por ejemplo en el supermercado, cuando una madre grita «¡Cuántas veces
te he dicho que no pegues a tu hermana!, mientras le propina al niño un buen cachete. Los ni-
ños que observan agresividad en otras personas, tienden ellos también a mostrarse agresivos;
estudiaremos la investigación sobre la agresividad en el capítulo 7.

• El castigo no ofrece un modelo de conducta correcta. Como ha señalado Skinner (1938) el
castigo dice a un individuo lo que no debe hacer, pero no le dice lo que sí debe hacer.

El castigo físico modela la agresión. ¡Cuantas veces
te he dicho que
no debes pegar a

los demás!

126 APRENDIZAJE HUMANO

Imagínese un chico que suele ser agresivo durante el recreo. Quizás esa agresividad es el único
medio que conoce para relacionarse con otros niños. Tratar su conducta agresiva sin enseñar-
le habilidades sociales más apropiadas, apenas contribuye a que llegue a ser capaz de desa-
rrollar relaciones amistosas.
• El castigo severo puede llegar a causar daño físico o psicológico. Evidentemente, un castigo
físico severo puede provocar daños corporales. Pero un castigo psicológico duro, como una
crítica muy fuerte o una disminución de la autoestima, pueden llegar a ser igualmente dañi-
na. La madre de un compañero de colegio lo avergonzaba constantemente con comentarios
del tipo «¡cómo puedes ser tan estúpida!» y «¿podrías hacer bien algo, alguna vez?». Durante
el tiempo que estuvimos en el colegio, mi amigo atravesó numerosos episodios de depresión,
y estuvo entrando y saliendo constantemente de instituciones mentales. La línea entre el cas-
tigo y el abuso resulta extremadamente delgada y difusa.

Pese a todas estas desventajas, el castigo puede llegar a ser un método muy eficaz para conse-
guir un cambio de conducta. En las páginas siguientes revisaremos algunos ejemplos en los que el
castigo sí funciona. Un poco más adelante ofreceré algunos consejos para utilizar el castigo, que
pueden contribuir a reducir o eliminar las desventajas que acabamos de enumerar.

Eficacia del castigo

Si bien las primeras investigaciones arrojaron dudas sobre la idea de que el castigo haga dismi-
nuir las respuestas a las que sigue, algunos investigadores han encontrado que el castigo sí puede
reducir o eliminar con éxito conductas indeseables (Azrin y Holt, 1966; Dinsmoor, 1954, 1955;
Rachlin, 1991; Tanner y Zeiler, 1975; Walters y Grusec, 1977). Con frecuencia, el castigo se utili-
za cuando otros métodos como la extinción, el reforzamiento diferencial de otras conductas o el re-
forzamiento de respuestas incompatibles, han resultado ineficaces; de hecho, parece que el castigo
puede, en ocasiones, resultar más eficaz que cualquiera de esas técnicas (Boe y Church, 1967;
Corte, Wolf, y Locke, 1971; Frankel y Simmons, 1985; Pfiffner y O´Leary, 1987; Walters y Grusec,
1977). El castigo resulta especialmente aconsejable cuando la conducta en cuestión puede llegar a
dañar a uno mismo o a los demás; en esos casos utilizar el castigo para eliminar rápidamente esa
conducta puede ser la opción más humanitaria.

En una serie de estudios, R. Vance Hall y sus compañeros (1971) demostraron la rapidez y efi-
cacia con que el castigo puede provocar un cambio de conducta. En uno de esos estudios, por ejem-
plo, la aplicación sistemática del castigo eliminó la conducta agresiva de una niña ciega de siete
años que se llamaba Andrea. Esa niña pellizcaba y golpeaba a cualquiera que se pusiese a su alcan-
ce, pero también a sí misma; esas conductas eran tan frecuentes (un promedio de 72 diarias) que ha-
cían imposible cualquier enseñanza académica normal. Tras un período de línea de base, comenzó
el castigo de cualquier acto agresivo: cada vez que Andrea pellizcaba o golpeaba, su profesor le ha-
blaba severamente y gritaba «¡No!». La figura 6.2 muestra los cambios en la conducta de Andrea
(el breve retorno a un período de no reforzamiento se utiliza para eliminar la posibilidad de que el
cambio de conducta hubiera sido una coincidencia). Como se puede ver, incluso aunque Andrea era
ciega, este tipo de castigo eliminó su agresividad.

En un segundo estudio, Hall y sus colaboradores (1971) modificaron las conductas de quejas y
gimoteos de un niño que se llamaba Guillermo. Guillermo solía llorar y gimotear frecuentemente,
y se quejaba de dolores de estómago cada vez que debía hacer tareas de lectura o de matemáticas,

Capítulo 6 I Efectos de los estímulos aversivos 127

100 Línea de Señalar con el dedo «No»1 B2 Señalar con el dedo «No»2
base1
Número de golpes y pellizcos diarios
80

60

40

20

0
5 10 15 20 25 30 35
Días

Figura 6.2 Número de pellizcos y golpes que da Andrea durante la jornada escolar.
Reproducido con permiso de R. V. Hall, S. Axelrod, M Foundopoulos, J. Shellmen, R. A. Campbell y S. S.
Cranston, Classroom Management: The Successful Use of Behavior Modification, 1972, p. 175. «The Effective
Use of Punishment to Modify Behavior in a Classroom» en K. D. O’Leary y S. O’Leary (editores), Copyright
1972 de Pergamon Press, Ltd.

si bien el resto del día parecía estar muy saludable y feliz. El programa de tratamiento consistió en
dar a Guillermo cinco tarjetas coloreadas con su nombre cada vez que empezaba una clase de lec-
tura o de matemáticas, y quitarle una de ellas (castigo II) cada vez que lloraba, gimoteaba o se que-
jaba. El tratamiento comenzó en el sexto día para la lectura y en el decimoprimer día para las ma-
temáticas, con el fin de eliminar la posibilidad de una coincidencia. La figura 6.3 muestra la
eficacia de este castigo eminentemente suave (obsérvese la inversión temporal a una línea de base
sin castigo, similar a la que aparece en la figura 6.2).

En otro estudio de los mismos autores, tres estudiantes de secundaria que asistían a clases de fran-
cés obtuvieron calificaciones más altas simplemente con la amenaza de tener que asistir a tutorías
extraescolares si obtenían calificaciones bajas. Estos alumnos habían estado obteniendo sistemática-
mente suspensos en esta asignatura. Su profesor les dijo que como evidentemente tenían dificultades
con ella, tendrían que quedarse durante media hora después de clase cada vez que obtuvieran un sus-
penso en su evaluación diaria. Las calificaciones durante la línea de base y durante el tiempo en que
se castigaba la mala calificación se muestran en la figura en 6.4 (obsérvese una vez más las líneas de
base múltiples). Como puede verse, ninguno de los alumnos llegó a necesitar tutorías extraescolares.
Aparentemente la amenaza del castigo en sí misma fue suficiente para promover la conducta de es-
tudio. Posiblemente la desaparición temporal de la amenaza, tras estudiar cada examen, fue suficiente
reforzamiento negativo, para incrementar hábitos de estudio sistemáticos.

Lo más interesante de estos estudios es que ninguno de los castigos utilizados puede conside-
rarse como posible causa de daño físico o psicológico. Y, sin embargo, todos ellos fueron evidente-
mente eficaces para producir cambios de conducta importantes en diferentes alumnos. ¿Pero por
qué funciona el castigo? Exploremos algunas posibles explicaciones.


Click to View FlipBook Version