Adquisición del responder bajo condiciones de reforzamiento demorado en programas temporales señalados

FLORES-AGURRE, CARLOS JAVIER; MATEOS-M0RFÍN, LAURA REBECA

Servicios Personalizados

Revista

Articulo

Indicadores

Citado por SciELO
Accesos

Links relacionados

Citado por Google
Similares en SciELO
Similares en Google

Otros
Otros

Permalink

Universitas Psychologica

versión impresa ISSN 1657-9267

Univ. Psychol. v.8 n.1 Bogotá ene./abr. 2009

Adquisición del responder bajo condiciones de reforzamiento demorado en programas temporales señalados*

Response Acquisition under Signaled Delay of Reinforcement in Temporally Defined Schedules

CARLOS JAVIER FLORES-AGURRE**

LAURA REBECA MATEOS-M0RFÍN CEIC, Universidad de Guadalaj ara, México

* Una versión preliminar de este trabajo se presentó en el XVIII Congreso de la Sociedad Mexicana de Análisis de la Conducta. Xalapa, Veracruz, México, noviembre de 2007. Este trabajo forma parte de los estudios realizados por el primer autor durante el año sabático otorgado por la UNAM-Iztacala.

^** La correspondencia relacionada con este trabajo puede enviarse a Centro de Estudios e Investigaciones en Comportamiento, Francisco de Quevedo No. 180, Col. Arcos Vallarta, Guadalajara, Jalisco, México, 44130, Correo electrónico: cjflores@servidor.unam.mx o carlos.flores@cucba.udg.mx

Recibido: abril 30 de 2008 | Revisado: mayo 10 de 2008 | Aceptado: mayo 19 de 2008

Resumen

El estudio se diseñó con el propósito de evaluar los efectos de diferentes duraciones de demora de reforzamiento sobre la adquisición de la respuesta de presión de la palanca en ratas, empleando un programa definido temporalmente señalado. Manteniendo un ciclo T constante (64 s), para cada tres ratas se empleó una duración de demora de reforzamiento (8,24 y 56 s) que resultó de variar la posición temporal del subciclo Td al interior del ciclo T (intervalo Td-T). Se encontraron tasas de respuesta que variaron sistemáticamente en función de la duración del intervalo de demora. Los resultados se discuten atendiendo a la tasa de respuesta y a la efectividad del responder como medidas de adquisición.

Palabras clave autores Adquisición de la respuesta, reforzamiento demorado, programas definidos temporalmente, tasa de respuesta, efectividad del responder, ratas.

Palabras clave descriptores Animales de laboratorio, psicología, ratas, psicología, condicionamiento (Psicología).

Abstract

A temporally defined schedule of delayed reinforcement was used to establish lever pressing by rats. A constant 8 s Td subinterval was introduced at different temporal locations into reinforcement cycle (64 s). The first response during Td produced reinforcement at the end of the cycle. Varying the temporal location of Td generated reinforcement delays of either 8 s, 24 s or 56 s. Three rats each were assigned to different delay duration. Response rates were considerably lower when Td was at the beginning of the cycle (56 s) than when the opportunity to respond was at the middle (24 s) and its end (8 s). The results are discussed focusing in the response rates and the convenience of responses per reinforcement proportion as an effectiveness acquisition measure.

Key words author Response Acquisition, Delay of Reinforcement, Temporally Defined Schedules, Response Rates, Effectiveness of Responding, Rats.

Key words plus Animals, Laboratory, Psychology, Rats, Psychology, Conditioning (Psychology).

Uno de los parámetros de estímulo que mayor atención ha recibido en el análisis experimental del comportamiento es la demora de reforzamiento, tanto en el estudio del mantenimiento de la respuesta (Azzi, Fix, Keller & Rocha e Silva, 1964; Dews, 1960; Ferster, 1953; Sizemore & Lattal, 1977, 1978; Williams, 1976), como en la adquisición de nuevas respuestas o discriminaciones (Grice, 1948; Lattal & Gleeson, 1990; Perin, 1943; Spence, 1947; Wolfe, 1934).

Los procedimientos más comunes para el estudio de la demora de reforzamiento incluyen manipulaciones como: a) cambios de estimulación que implican correlacionar una señal durante el periodo de demora -procedimientos señalados- (Ávila & Bruner, 1995; Lattal, 1984; Mc Devitt & Williams, 2001; Richards, 1981); b) sin cambios de estimulación -procedimientos no señalados- (Richards & Hittesdorf, 1978; Sizemore & Lattal, 1978; Williams, 1976); c) el uso de programas que incluyen un componente de reforzamiento diferencial de otras conductas (RDO) para especificar la duración de la demora -programas con demora reiniciable- (Critchfield & Lattal, 1993; Haaren van, 1992; Lattal & Gleeson, 1990; Lattal & Metzger, 1994; Schlinger & Blakely, 1994; Snycersky, Laraway, Byrne & Poling, 1999; Stuphin, Byrne & Poling, 1998); y d) el empleo de programas que incluyen un componente de Tiempo Fijo (TF) que definen la duración del periodo de demora -procedimientos con demora no reiniciable- (Ávila & Bruner, 1995; Bruner, Ávila & Gallardo, 1994; Wilkenfield, Nickel, Blakely & Poling, 1992).

La importancia que se le ha conferido a la demora de reforzamiento radica en el hecho de que alargar el intervalo respuesta-reforzador debilita la fuerza de la operante produciendo tasas de respuesta gradualmente más bajas, efecto que en la literatura y en las revisiones sobre el tema se ha reportado como gradiente de demora (Lattal, 1987; Pulido, Lanzagorta, Morán, Reyes & Rubí, 2004; Pulido, Sosa & Valadez, 2006; Renner, 1964; Tarpy & Sawabini, 1974).

Una de las características de los programas con demora reiniciable es que cada respuesta que ocurre durante el intervalo respuesta-reforzador reinicia nuevamente el reloj del programa, lo que resulta en una variación concomitante de la duración del intervalo entre reforzadores (i. e. decrementos en la frecuencia de reforzamiento). Es por ello que el uso de programas que incluyen un componente de RDO no es adecuado si la tasa de respuesta es principalmente la variable dependiente por excelencia en este tipo de estudios, más aún cuando se sabe que la frecuencia de reforzamiento controla la tasa de respuesta (Baum, 1995; Catania & Reynolds, 1968; Clark, 1958; Findley, 1958; Wilson, 1954).

En un estudio reportado por Weil (1984) se evaluaron los efectos de variar la demora de reforzamiento sin que implicara cambios o variaciones concomitantes en la frecuencia de reforzamiento. El procedimiento empleado fue una versión modificada de los programas definidos temporalmente (Schoenfeld & Cole, 1972; Schoenfeld, Cole, Lang & Mankoff, 1973) y tuvo la ventaja de poder evaluar la separación temporal entre la respuesta procuradora y la ocurrencia de reforzador sin variar la frecuencia programada de reforzamiento. Los programas definidos temporalmente consisten en la repetición de un ciclo temporal (T) dividido en dos subciclos que se alternan, Td y T-delta, en los cuales la primera respuesta que ocurre en el periodo Td es reforzada, mientras que las respuestas que ocurren en T-delta normalmente no son reforzadas.

Weil (1984) varió la duración y la posición temporal de Td al interior del ciclo T. Se varió entre fases la duración de Td, desde 30 s hasta 0.1 s. Para un grupo de sujetos Td se ubicó desde el inicio del ciclo T (Td inicial), mientras que para otro grupo Td se colocó en la parte final de T (Td final). Esta manipulación permitió que variara la demora de reforzamiento en valores máximos (Td inicial) como en valores mínimos (Td final). Weil reportó que la tasa de respuesta fue una función decreciente de incrementar la duración de la demora de reforzamiento en ambos grupos y que la tasa de respuesta fue mucho más baja para los grupos con las demoras máximas (Td inicial).

Dada la ventaja que tienen los programas definidos temporalmente respecto de los programas que incluyen un componente de RDO, en diversos trabajos se han evaluado los efectos de la demora de reforzamiento sobre el mantenimiento y la adquisición del responder (Bruner, Ávila & Gallardo, 1994; Bruner, Ávila, Acuña & Gallardo, 1998; Bruner, Pulido & Escobar, 1999; 2000; Pulido, López & Lanzagorta, 2005; Pulido & López, 2006).

A la fecha se han publicado cuatro trabajos, empleando programas definidos temporalmente, que han tratado de replicar los hallazgos reportados por Weil (1984), pero evaluando la adquisición de la respuesta en lugar de su mantenimiento bajo condiciones de reforzamiento demorado (Bruner et al., 1999, 2000; Pulido et al., 2005; Pulido & López, 2006).

En un par de estudios Bruner et al. (1999, 2000) evaluaron los efectos de la demora de reforzamiento sobre la adquisición del responder empleando programas definidos temporalmente.

Bruner et al. (1999) realizaron una réplica sistemática del procedimiento empleado por Weil (1984), evaluaron los efectos de diferentes duraciones de demora de reforzamiento sobre la adquisición de la respuesta de palanqueo en ratas. Utilizaron un programa definido temporalmente con una duración constante de 64 s, el ciclo T se dividió en dos subciclos (Td y T-delta) y variaron entre grupos la duración de Td (8 s, 16 s, 32 s, 48 s o 56 s). Para cada duración de Td se empelaron dos ubicaciones, al inicio del ciclo T (Td inicial) o al final del ciclo (Td final). Bruner et al. (1999) reportaron sustanciales tasas de respuesta, en particular en las ratas expuestas a la condición de Td final, y que la tasa de respuesta decreció a medida que se alargó la duración de la demora.

Más recientemente Bruner et al. (2000), empleando un diseño factorial, expusieron a diferentes grupos de ratas a distintas combinaciones de la duración del ciclo T (32 s, 64 s y 128 s) y de la demora de reforzamiento definida por la ubicación temporal de Td respecto del final de T (8 s, 24 s, 56 s o 120 s). Bruner et al. reportaron adquisición de la respuesta de palanqueo ante las tres duraciones del ciclo T, particularmente con combinaciones de demora de 8 s y 24 s. Con relación a la duración de la demora de reforzamiento, encontraron que las tasas de respuesta fueron significativamente más elevadas con demoras de 8 s y 24 s que con demoras de 56 s y 120 s ante las cuales el responder fue prácticamente escaso o nulo.

El presente estudio se diseñó con el propósito de evaluar los efectos de la entrega demorada de agua sobre la adquisición del responder. Se replicó parcialmente el procedimiento utilizado por Bruner et al. (2000) empleando solamente una duración de ciclo T (64 s) y como duraciones de demora se utilizaron 8, 24 y 56 s. A diferencia del estudio de Bruner et al., en el presente estudio se agregó una señal al periodo Td, esta manipulación permitió evaluar la función que desarrolló la señal agregada como una fuente de control en la adquisición del responder bajo condiciones de reforzamiento demorado.

Método Sujetos

Se utilizaron nueve ratas Wistar de seis meses de edad al inicio del estudio e ingenuas experimentalmente. Los animales se mantuvieron en un régimen de privación de agua por un periodo de 23.5 h diarias y con acceso libre al alimento en su caja habitación.

Aparatos

Se utilizaron 4 cámaras experimentales para ratas marca MED (ENV-008), cada caja estuvo equipada con un dispensador de agua (ENV-202M), una palanca de respuesta y una tecla translúcida de 2.5 cm de diámetro que se iluminó de color blanco. La palanca se encontraba a 2.5 cm del piso y requirió de una fuerza de 25 gr para cerrar el microswitch. Como reforzador se utilizó una gota de agua de 0.01 cc que se presentó por medio de la activación del dispensador de agua. Cada cámara experimental se colocó dentro de un cubículo de aislamiento acústico (ENV-022M) con un ventilador que sirvió como ruido blanco y facilitó la circulación del aire al interior de la cámara. La programación, el registro y la colección de eventos se realizó mediante un equipo de cómputo, una interfase y el software MED-PC IV para ambiente Windows.

Procedimiento

Se utilizó un programa definido temporalmente que consistió en un ciclo repetitivo de tiempo con una duración fija (T = 64 s). El programa temporal se dividió en dos subciclos (Td y T-delta), la primera respuesta que ocurrió en el subciclo Td procuró la entrega de una gota de agua que siempre ocurrió al final del ciclo T. Para cada tres ratas se varió la posición del subciclo Td (intervalo Td-T) al interior de cada ciclo T. Durante el subciclo Td se iluminó la tecla con luz blanca que se mantuvo durante los 8 s de duración del subciclo. Para tres de los sujetos (1, 2 y 3) Td se ubicó temporalmente 8 s antes del final del ciclo T, (intervalo Td-T = 8 s), para otros tres sujetos (4, 5 y 6) Td se ubicó 24 s antes del final de T (intervalo Td-T = 24 s), mientras que para las tres ratas restantes (7, 8 y 9) Td se ubicó 56 s antes de la finalización de T (intervalo Td-T = 56 s). En la Figura 1 se presenta un esquema de la ubicación temporal de Td al interior del ciclo T para cada uno de los grupos. Las respuestas que ocurrieron fuera del subciclo Td no tuvieron ninguna consecuencia programada. Los sujetos se mantuvieron en estas condiciones durante 30 sesiones consecutivas que se condujeron durante seis días a la semana. Cada sesión concluyó con la entrega de 30 gotas de agua o a los 60 ciclos T, lo que ocurriese primero.

Resultados

Con el propósito de mostrar las diferencias del responder durante el periodo señalado (Td) y durante el periodo no señalado (T-delta), en la Figura 2 se presentan las tasas de respuesta por sujeto en cada condición de demora en bloques de 5 sesiones. En esta figura se puede observar que para las tres condiciones de demora (8, 24 y 56 s) la tasa de respuesta durante Td es sistemáticamente más elevada que la observada durante el periodo T-delta y que la diferencia o separación entre las tasas de respuesta en Td y T-delta tiende a disminuir conforme se incrementa el periodo de demora.

En la Figura 3 se presenta la diferencia de la tasa de respuesta en Td con respecto a la tasa de T-delta (resultado de restar la tasa obtenida en T-delta a la tasa obtenida en Td) promedio de los tres sujetos en cada condición de demora. En esta figura se puede observar que las diferencias entre las tasas de respuesta en Td y T-delta fueron disminuyendo a medida que se incrementó la duración de la demora de reforzamiento. Un ANOVA de un factor confirmó la diferencia entre las tasas de respuesta en Td y T-delta entre los grupos (F (2, 8) = 26.686, p = 0.001). Pruebas post hoc (Tukey) revelaron que la diferencia entre las tasas de respuesta en Td y T-delta fue significativamente más alta para el grupo con demora 8 s (1.59), mientras que no se encontraron diferencias significativas entre los grupos con demora 24 s (0.63) y 56 s (0.12).

En la Figura 4 se presenta el porcentaje de reforzadores obtenidos, promedio de los tres sujetos en cada condición de demora. De manera general se puede observar que los sujetos con demora de 8 s obtienen el mayor porcentaje de reforzadores (31.7%), seguidos por los sujetos con demora de 24 s (16.6%) y finalmente los sujetos con demora de 56 s son los que obtienen el menor porcentaje de reforzadores (5.6%). Un análisis visual refleja una tendencia decreciente del porcentaje de reforzadores obtenidos conforme se alarga la demora de reforzamiento. Un ANOVA de un factor mostró diferencias significativas entre los porcentajes de reforzadores obtenidos entre los grupos (F (2, 8) = 9.697, p = 0.013). Pruebas post hoc (Tukey) revelaron que no se encontraron diferencias entre las condiciones con demora 8 s y 24 s, ni entre 24 s y 56 s, únicamente se encontraron diferencias significativas entre los porcentajes de reforzadores obtenidos por los sujetos en las condiciones con demora 8 s y 56 s.

Discusión

El propósito del presente estudio fue evaluar la adquisición de la respuesta de palanqueo en ratas bajo condiciones de reforzamiento demorado empleando un programa definido temporalmente con señal agregada.

Los resultados generales muestran que en las tres condiciones de demora se estableció la respuesta, estos resultados son consistentes con los reportados por otros trabajos en los que se han evaluado los efectos del reforzamiento demorado sobre la adquisición de la respuesta (Ávila & Bruner, 1995; Bruner et al., 1994; Bruner, et al., 1998).

Bruner et al. (2000) reportaron adquisición del responder en sus tres duraciones del intervalo entre reforzadores (32 s, 64 s y 128 s) en particular con demoras de 8 s y 24 s; con fines de comparación se destacarán los resultados de sus grupos expuestos a un intervalo entre reforzadores de 64 s (T=64).

Las tasas de respuesta que reportan Bruner et al. (2000) siguen el gradiente de demora tradicional, es decir, menores tasas de respuesta a medida que aumentaron la demora de reforzamiento.

En el presente experimento y a diferencia de los resultados de Bruner et al. (2000), en general las tasas de respuesta fueron más bajas en los tres grupos; Bruner et al. reportaron tasas de respuesta que oscilaron entre 5 y 10 respuestas por minuto, en particular en las condiciones con demora de 8 s y 24 s, mientras que en el presente estudio las tasas de respuesta no superaron 3 respuestas por minuto; en sus sujetos con demora de 56 s las tasas de respuesta fueron tan bajas como las observadas en el presente estudio.

La diferencia entre las tasas de respuesta reportadas por Bruner et al. (2000) y las observadas en el presente estudio puede ser explicada por un posible control desarrollado por la señal agregada durante el periodo Td; de todo el ciclo entre reforzadores (T) Td es el tiempo durante el cual el responder se torna funcionalmente efectivo para procurar la entrega del agua al final del ciclo T. Observar que la tasa de respuesta decrece a medida que se aumenta la duración de la demora se explica como un efecto claro de la demora de reforzamiento (ver Figura 2).

El hecho de encontrar tasas de respuesta sistemáticamente más elevadas durante el periodo Td que en T-delta (con excepción del sujeto 8) puede ser explicado atendiendo al desarrollo de una función discriminativa por parte de la señal agregada, control que se va perdiendo a medida que el intervalo de demora se alarga. Esta explicación se puede ver fortalecida si se atiende a que la diferencia entre las tasas de respuesta en Td y T-delta va disminuyendo conforme se aumentó la demora de reforzamiento (véase, Figura 3).

Los resultados del presente estudio son consistentes con los reportados por Ávila y Bruner (1989) quienes empleando palomas evaluaron los efectos tanto de la duración de la demora de reforzamiento como del intervalo entre reforzadores. Ávila y Bruner reportaron que sus palomas concentraron sus respuestas principalmente en presencia del estímulo que señalaba el periodo en el que la respuesta era efectiva para la entrega del reforzador y que la tasa de respuesta decreció a medida que se alargó la duración del intervalo respuesta-reforzador.

En la gran mayoría de los trabajos en los que se han evaluado los efectos de la demora de reforzamiento se ha privilegiado a la tasa de respuesta como la medida o variable dependiente por excelencia. La razón de esto obedece a que la tasa de respuesta es la medida de la fuerza del reflejo operante y que la separación temporal entre la respuesta y el reforzador resulta en un debilitamiento o reducción en la fuerza del reflejo.

Como se mencionó anteriormente, los programas temporales tienen ventajas para evaluar los efectos de la demora de reforzamiento respecto de los programas tándem que incluyen un componente de RDO, sin embargo resulta conveniente y necesario reflexionar sobre medidas adicionales a la tasa de respuesta como variables dependientes que sean sensibles a diferentes manipulaciones, en este caso a manipulaciones en parámetros de reforzamiento como es la demora. Una medida que puede ser pertinente además de la persistencia de la respuesta (tasa de respuesta), es la proporción de respuestas por reforzador, medida que permitiría capturar el grado en que el comportamiento del organismo se torna más o menos efectivo para procurar la entrega del reforzador.

Aunque esta medida parece restringirse a estudios en los cuales se emplea la metodología de los programas definidos temporalmente, es importante destacar que con los programas temporales se logra reproducir la ejecución típica observada en los programas de reforzamiento dicotomizados con criterios ordinales (programas de razón) y temporales (programas de intervalo), así como la integración de fenómenos o áreas de investigación aparentemente inconexas, como puede ser el caso de reforzamiento positivo, castigo, reforzamiento dependiente e independiente de la respuesta, entre otros (Bruner, 1981, 1991; Cabrer, Daza & Ribes, 1975; Schoenfeld & Cole, 1972) lo cual representa y deja ver el potencial heurístico de esta metodología.

Referencias

Ávila, R. & Bruner, C. (1989). Efectos del intervalo respuesta-reforzador y del ciclo de reforzamiento en un programa de demora variable. Revista Mexicana de Análisis de la Conducta, 15, 23-39. [ Links ]

Ávila, R. & Bruner, C. (1995). Adquisición de la respuesta bajo demoras largas de reforzamiento señalado y no señalado. Revista Mexicana de Análisis de la Conducta, 21, 117-127. [ Links ]

Azzi, R., Fix, D. S., Keller, F. S. & Rocha e Silva, M. I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7, 159-162. [ Links ]

Baum, W. M. (1995). Introduction to molar behavior analysis. Revista Mexicana de Análisis de la Conducta, 21, 17-35. [ Links ]

Bruner, C. (1981). The effect of cycle length, interstimulus interval and probability of reinforcement in autoshaping. Revista Mexicana de Análisis de la Conducta, 7, 149-157. [ Links ]

Bruner, C. (1991). El problema de la contingencia en teoría de la conducta. En V. Colotla (Ed.), La investigación del comportamiento en México (pp. 153172). AIC-CONACYT-SMAC-UNAM. [ Links ]

Bruner, C., Ávila, R. & Gallardo, L. (1994). La adquisición del palanqueo en ratas bajo un programa intermitente de reforzamiento demorado. Revista Mexicana de Análisis de la Conducta, 20, 119-129. [ Links ]

Bruner, C., Ávila, R., Acuña., L. & Gallardo, L. (1998). Effects of reinforcement rate and delay on the acquisition of lever pressing by rats. Journal of the Experimental Analysis of Behavior, 69, 59-75. [ Links ]

Bruner, C., Pulido, M. & Escobar, R. (1999). Response acquisition and maintenance with a temporallydefined schedule of delayed reinforcement. Revista Mexicana de Análisis de la Conducta, 25, 379391. [ Links ]

Bruner, C., Pulido, M. & Escobar, R. (2000). La adquisición del palanqueo con programas temporales de reforzamiento demorado. Revista Mexicana de Análisis de la Conducta, 26, 91-103. [ Links ]

Cabrer, F., Daza, B. C. & Ribes, E. (1975). Teoría de la conducta: ¿Nuevos conceptos o nuevos parámetros? Revista Mexicana de Análisis de la Conducta, 1, 191-212. [ Links ]

Catania, A. C. & Reynolds, G. S. (1968). A quantitative analysis of the responding maintained by interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 11, 327-383. [ Links ]

Clark, F. C. (1958). The effect of deprivation and frequency of reinforcement on variable-interval responding. Journal of the Experimental Analysis of Behavior, 1, 221-228. [ Links ]

Critchfield, T S. & Lattal, K. A. (1993). Acquisition of a spatially defined operant with delayed reinforcement. Journal of the Experimental Analysis of Behavior, 59, 373-387. [ Links ]

Dews, P B. (1960). Free-operant behavior under conditions of delayed reinforcement. I. CRF-type schedules. Journal of the Experimental Analysis of Behavior, 3, 221-234. [ Links ]

Ferster, C. B. (1953). Sustained behavior under delayed reinforcement. Journal of Experimental Psychology, 45, 218-224. [ Links ]

Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal of the Experimental Analysis of Behavior, 1, 123-144. [ Links ]

Grice, G. R. (1948). The relation of secondary reinforcement to delayed reward in visual discrimination learning. Journal of Experimental Psychology, 38, 1-16. [ Links ]

Haaren van, F. (1992). Response acquisition with fixed and variable resetting delays of reinforcement in male and female Wistar rats. Physiology and Behavior, 52, 767-772. [ Links ]

Lattal, K. A. (1984). Signal functions in delayed reinforcement. Journal of the Experimental Analysis of Behavior, 42, 239-253. [ Links ]

Lattal, K. A. (1987). Considerations in the experimental analysis of reinforcement delay. En M. L. Commons, J. E. Mazur, J. A. Nevin & H. Rachlin (Eds.), Quantitative analysis of behavior: V. The effect of delay and intervening events on reinforcement value (pp. 107-123). Hillsdale, NJ: Erlbaum. [ Links ]

Lattal, K. A. & Gleeson, S. (1990). Response acquisition with delayed reinforcement. Journal of Experimental Psychology: Animal Behavior Processes, 16, 27-39. [ Links ]

Lattal, K. A. & Metzger, B. (1994). Response acquisition by Siamese fighting fish (betha splenders) with delayed visual reinforcement. Journal of the Experimental Analysis of Behavior, 61, 35-44. [ Links ]

Mc Devitt, M. A., & Williams, B. (2001). Effects of signaled versus unsignaled delay of reinforcement on choice. Journal of the Experimental Analysis of Behavior, 75, 165-182. [ Links ]

Perin, C. T (1943). A quantitative investigation of the delay-of-reinforcement gradient. Journal of Experimental Psychology, 32, 37-51. [ Links ]

Pulido, M., Lanzagorta, N., Morán, E., Reyes, A. & Rubí, M. (2004). El efecto de las señales en programas de reforzamiento demorado: una revisión contemporánea. Revista del Consejo Nacional para la Enseñanza e Investigación en Psicología, 9, 321339. [ Links ]

Pulido, M., López, L. & Lanzagorta, N. (2005). Effects of contingent and non-contingent signals during delay interval. Revista Mexicana de Análisis de la Conducta, 31, 227-244. [ Links ]

Pulido, M. & López, L. (2006). Delay of reinforcement effects under temporally defined schedules of reinforcement. Revista Mexicana de Análisis de la Conducta, 32, 39-53. [ Links ]

Pulido, M., Sosa, R. & Valadez, L. (2006). Adquisición de la operante libre bajo condiciones de reforzamiento demorado: Una revisión. Acta Comportamentalia, 14, 5-21. [ Links ]

Renner, K. E. (1964). Delay of reinforcement: A historical review. Psychological Bulletin, 61, 341-361. [ Links ]

Richards, R. W. & Hittesdorf, W. M. (1978). Inhibitory stimulus control under conditions of signalled and unsignalled delay of reinforcement. The Psychological Record, 28, 615-625. [ Links ]

Richards, R. W. (1981). A comparison of signaled and unsignaled delay of reinforcement. Journal of the Experimental Analysis of Behavior, 35, 145-152. [ Links ]

Sizemore, O. J. & Lattal, K. A. (1977). Dependency, temporal contiguity, and response-independent reinforcement. Journal of the Experimental Analysis of Behavior, 27, 119-125. [ Links ]

Sizemore, O. J. & Lattal, K. A. (1978). Unsignalled delay of reinforcement in variable.interval schedule. Journal of the Experimental Analysis of Behavior, 30, 169-175. [ Links ]

Schoenfeld, W. N., & Cole, B. K. (1972). Stimulus schedules: The t-tau systems. New York: Harper and Row. [ Links ]

Schoenfeld, W. N., Cole, B. K., Lang, L. & Mankoff, R. (1973). Contingency in behavior theory. En F. J. McGuigan & D. B. Lumsden (Eds.), Contemporary approaches to conditioning and learning (pp. 151172). Washington, DC: Winston and Sons. [ Links ]

Schlinger, H. D. & Blakely, E. (1994). The effects of delayed reinforcement and a response-produced auditory stimulus on the acquisition of operant behavior in rats. Psychological Record, 44, 391-409. [ Links ]

Snycersky, S., Laraway, S., Byrne, T. & Poling, A. (1999). Acquisition of lever-press responding with delayed consequences in rats: Is a minute too long? Revista Mexicana de Análisis de la Conducta, 25, 341-350. [ Links ]

Stuphin, G., Byrne, T & Poling, A. (1998). Response acquisition with delayed reinforcement: comparison of two-lever procedures. Journal of the Experimental Analysis of Behavior, 69, 1-28. [ Links ]

Spence, K. W. (1947). The role of secondary reinforcement in delayed reward learning. Psychological Review, 54, 1-8. [ Links ]

Tarpy, R. M. & Sawabini, F. L. (1974). Reinforcement delay: A selective review of the last decade. Psychological Bulletin, 81, 984-997. [ Links ]

Williams, B.A. (1976). The effects of unsignalled delayed reinforcement. Journal of the Experimental Analysis of Behavior, 26, 441-449. [ Links ]

Wilkenfield, J., Nickel, M., Blakely, E. & Poling, A. (1992). Acquisition of lever-press responding in rats with delayed reinforcement: A comparison of three procedures. Journal of the Experimental Analysis of Behavior, 26, 441-449. [ Links ]

Wilson, M. P (1954). Periodic reinforcement interval and number of periodic reinforcements as parameters of response strength. Journal of comparative and Physiological Psychology, 47, 51-56. [ Links ]

Weil, J. L. (1984). The effects of delayed reinforcement on free-operant responding. Journal of the Experimental Analysis of Behavior, 41, 143-155. [ Links ]

Wolfe, J. B. (1934). The effect of delayed reward upon learning in the white rat. Journal of Comparative Psychology, 17, 1-21. [ Links ]