Acondicionamiento BF Skinner y Operant
![]() |
Los efectos del refuerzo y el castigo fueron descubiertos por BF Skinner a través de sus experimentos usando su cámara de acondicionamiento operante. La cámara de acondicionamiento operante, también conocida como Skinner Box, es una caja lo suficientemente grande como para contener un animal de laboratorio, como una rata o una paloma. La caja está equipada con dispositivos que refuerzan o castigan el comportamiento del animal. Skinner desarrolló la caja mientras era un estudiante de posgrado en Harvard a principios de la década de 1930.
Skinner descubrió que al usar el refuerzo y el castigo, podía entrenar a sus animales para que realizaran ciertos comportamientos. Llamó a este tipo de condicionamiento condicionamiento operante , lo que significa que el comportamiento se aprende a través del refuerzo y el castigo. El condicionamiento operante formó la base de la teoría del conductismo radical de Skinner y lo llevó a convertirse en uno de los psicólogos más importantes del siglo XX.
![]() |
Reforzamiento
El refuerzo es cualquier reacción a un comportamiento que alienta al sujeto de la investigación a aumentar ese comportamiento. Hay dos tipos de refuerzo: refuerzo positivo y refuerzo negativo.
El refuerzo positivo es lo que podríamos denominar recompensa; es algo deseable que se le da al sujeto de investigación después de que realiza la conducta. Si está tratando de desarrollar una rutina de alimentación y ejercicio saludable, es posible que desee recompensarse después de una semana de cumplir sus objetivos saliendo con amigos o comprándose un pequeño obsequio. Una vez que haya aprendido que su buen comportamiento dará como resultado esta recompensa, es más probable que continúe con el buen comportamiento; esto es un refuerzo positivo.
El refuerzo negativo , por otro lado, se produce cuando se quita una cosa o acción indeseable después de que se realiza una conducta. Imagina que siempre tienes frío cuando vas a un cine en particular. Después de un par de experiencias de tener un frío incómodo mientras ve la última película, puede comenzar a llevar un suéter. Al usar el suéter, se elimina el elemento negativo del frío y es probable que continúe trayendo un suéter. La ausencia del frío refuerza tu comportamiento.
Horarios de refuerzo
Una de las mayores contribuciones de Skinner fue descubrir que la frecuencia del reforzamiento afecta en gran medida la rapidez y la duración del refuerzo de un comportamiento. Estas frecuencias se denominan programas de refuerzo . Skinner estudió tres programas de refuerzo: continuo, intervalo y proporción.
En el caso de refuerzo continuo , el refuerzo se proporciona después de cada acción correcta. Da como resultado un aprendizaje rápido, pero es posible que no genere un comportamiento duradero. El refuerzo de intervalo proporciona refuerzo después de que pasa una cierta cantidad de tiempo, y la cantidad de tiempo que pasa entre refuerzos puede permanecer igual (fijo) o cambiar (variable). El refuerzo de razón se refiere al refuerzo después de un cierto número de respuestas correctas. El número de respuestas correctas necesarias también puede ser fijo o variable.
![]() |
Los programas de refuerzo de intervalos y proporciones variables han demostrado ser particularmente interesantes para explicar la adicción. El juego, por ejemplo, proporciona un refuerzo de proporción variable. Cuando juegas en una máquina tragamonedas, siempre existe la posibilidad de ganar un premio mayor, pero el número de veces que debes jugarlo antes de que se obtenga un premio mayor varía y se desconoce. Puede ganar un premio gordo en su próximo intento o después de 100 intentos; no sabe cuándo será recompensado por sus esfuerzos, pero sabe que si continúa indefinidamente, eventualmente obtendrá la recompensa. Dado que odiaría alejarse de una máquina, solo para ver a la siguiente persona acercarse y ganar en su primer intento, existe un incentivo para continuar jugando.
![]() |
Para comprender cómo funciona el refuerzo de intervalo variable, piense en la frecuencia con la que revisa su correo electrónico o teléfono en busca de nuevos mensajes. Si el intervalo fuera fijo, sabría cuándo llegarían nuevos mensajes. Por ejemplo, si supiera que recibiría un mensaje cada tres horas, probablemente solo buscaría un mensaje cada tres horas. Sin embargo, dado que el intervalo entre mensajes nuevos varía, un mensaje nuevo podría llegar en cualquier momento, lo que probablemente haga que revise su correo electrónico y teléfono con mucha más frecuencia que cada tres horas.
![]() |
Castigo
El castigo cambia el comportamiento de un sujeto al proporcionar una respuesta negativa al comportamiento que necesita cambiar. Para Skinner, esto significaba enviar una descarga eléctrica a través del piso de la Skinner Box o administrar un ruido fuerte que sobresaltaría al animal de laboratorio. La rata o la paloma aprenderían a asociar un comportamiento particular con el castigo y dejarían de realizar ese comportamiento.
Iconoclasia Bizantina: Descripción general e historia
![]() |
Cualquiera que haya recibido una multa por exceso de velocidad o por estacionamiento y, posteriormente, sea mucho más cuidadoso en la carretera, conoce el efecto del castigo. El castigo es más efectivo cuando opera de la manera en que lo hacen las multas de tránsito: existe un castigo claro para una infracción clara. Si el castigo no está claramente vinculado al comportamiento, es menos probable que resulte en un cambio de comportamiento.
Extinción
Los comportamientos se pueden aprender, pero también se pueden olvidar. La extinción es el proceso de perder un comportamiento condicionado. Una vez que el refuerzo o el castigo ha terminado, es probable que se pierda la conducta condicionada.
En algunos casos, cuando el refuerzo se suspende por primera vez, el sujeto se volverá agresivo o aumentará la tasa de respuesta. Imagina que eres una rata en una jaula que ha aprendido que al presionar una palanca se te administra un líquido dulce. De repente, el dulce líquido deja de salir. Sigues presionando la palanca, y puedes enojarte y presionar la palanca con más fuerza que antes. Sin embargo, con el tiempo, aprende que presionar la palanca ya no lo recompensa y deja de comportarse.
Resumen de la lección
Los efectos del refuerzo y el castigo fueron descubiertos por BF Skinner, a través de sus experimentos, usando su cámara de condicionamiento operante. El condicionamiento operante es un comportamiento que se aprende mediante el refuerzo y el castigo. El refuerzo es cualquier reacción a un comportamiento que alienta al sujeto de la investigación a aumentar ese comportamiento. Hay dos tipos de refuerzo: refuerzo positivo y refuerzo negativo. El refuerzo positivo es lo que podríamos denominar recompensa. Es algo deseable que se le da al sujeto de investigación después de que realiza la conducta. Reforzamiento negativo, por otro lado, resulta cuando una cosa o acción indeseable se elimina después de que se realiza un comportamiento. Una de las mayores contribuciones de Skinner fue descubrir que la frecuencia del reforzamiento afecta en gran medida la rapidez y la duración del refuerzo de un comportamiento. Estas frecuencias se denominan programas de refuerzo . El refuerzo continuo es cuando se proporciona refuerzo después de cada acción correcta. El refuerzo de intervalo proporciona refuerzo después de que pasa una cierta cantidad de tiempo. Y la cantidad de tiempo se puede fijar o cambiar; variable. El refuerzo de razón se refiere al refuerzo después de un cierto número de respuestas correctas. Castigo cambia el comportamiento de un sujeto al proporcionar una respuesta negativa al comportamiento que necesita cambiar.
Explora más sobre este tema
Selecciona un tema y sigue aprendiendo...






