Refuerzos en psicología: definición y ejemplos

Rodrigo Ricardo Publicado el 22 septiembre, 2020 5 minutos y 36 segundos de lectura

Refuerzo positivo y negativo

Una de las muchas formas en que las personas aprenden es a través del condicionamiento operante. El condicionamiento operante simplemente significa aprender por refuerzo. Hay una serie de factores que intervienen en el refuerzo de los comportamientos de un individuo y, al aplicar refuerzos, también podemos aumentar o disminuir los comportamientos.

Hay varios tipos de refuerzo que se pueden utilizar en el condicionamiento operante. Las dos formas más comunes se conocen como refuerzo positivo y refuerzo negativo . Es importante señalar que, en este caso, las palabras positivo y negativo no significan bueno o malo. En cambio, significan que está agregando (positivo) o quitando (negativo) algo para fortalecer el comportamiento deseado. El refuerzo negativo a menudo se confunde con el castigo; sin embargo, no son iguales.

El refuerzo positivo ocurre cuando se da una muestra o recompensa para fortalecer un comportamiento deseado. Por ejemplo, si un niño limpia su habitación, puede recibir una barra de chocolate o un juguete como recompensa. La recompensa servirá para fortalecer el comportamiento porque es más probable que el niño continúe con este comportamiento deseado para recibir la recompensa.

Asimismo, el refuerzo negativo también fortalece una conducta, pero lo hace eliminando algo que no es deseado. Por ejemplo, cuando ingresa a su automóvil y coloca la llave en el encendido, es posible que escuche una campana fuerte o un sonido de timbre. Para que la campana se detenga, debe ponerse el cinturón de seguridad. Este es un ejemplo de refuerzo negativo. Para eliminar el sonido, debe abrocharse el cinturón de seguridad.

Castigo

El castigo es otra forma de refuerzo, y puede ser tanto positivo como negativo. Al igual que con el refuerzo positivo y negativo, las palabras positivo y negativo no están relacionadas con lo bueno o lo malo; en cambio, se refieren a agregar o eliminar un castigo. A diferencia del refuerzo, el castigo tiene como objetivo disminuir la probabilidad de un comportamiento indeseable.

El castigo positivo ocurre cuando introducimos algo para detener un comportamiento no deseado. Por ejemplo, si un niño se comporta de una manera que un padre considera incorrecta o incluso peligrosa, como correr hacia una calle muy transitada con autos pasando, el padre puede regañar o azotar al niño. Ambos sirven para disminuir la probabilidad de que el comportamiento peligroso y no deseado vuelva a ocurrir.

El castigo negativo es cuando quitamos algo después de que ocurre un comportamiento indeseable. Nuevamente, el objetivo del castigo es disminuir el comportamiento. Entonces, si un niño está peleando con su hermano, uno de los padres puede quitarle su juguete favorito o suspender sus privilegios de televisión. Al hacerlo, el padre disminuirá la probabilidad de que continúe el comportamiento no deseado.

Horarios de refuerzo

Cómo y cuándo se da un refuerzo puede cambiar la respuesta de una persona. Debido a esto, también hay una variedad de programas de refuerzo que pueden usarse para fortalecer un comportamiento. La palabra horario se refiere al momento del refuerzo.

Los cuatro programas de refuerzo más utilizados:

Horarios fijos

Los horarios fijos ocurren en un horario regular. El refuerzo de proporción fija es cuando se otorga una recompensa después de que se haya producido un número específico de respuestas. Por ejemplo, si es miembro de un programa de viajero frecuente, puede recibir un certificado de recompensa por pasaje aéreo gratuito después de ganar una cierta cantidad de puntos.

Un horario de intervalo fijo ocurre cuando reforzamos un comportamiento después de que ha transcurrido un período de tiempo específico. A los empleados que reciben un cheque de pago ya sea semanal o quincenalmente se les paga a intervalos fijos. Saber que recibirá un cheque de pago después de trabajar durante un período de tiempo fortalece la probabilidad del empleado de trabajar con regularidad.

Horarios variables

Los horarios variables ocurren de manera inconsistente o impredecible. Los programas de razón variable se relacionan con el refuerzo del comportamiento después de un número impredecible de respuestas. Esto se ve más comúnmente cuando una persona juega en una máquina tragamonedas. La mayoría de la gente sabe que si juegan en la misma máquina el tiempo suficiente, eventualmente ganarán algo.

Un programa de intervalo variable refuerza un comportamiento después de que ha transcurrido un período de tiempo impredecible. Por ejemplo, los estudiantes ven esto con mayor frecuencia cuando se les da una prueba sorpresa en clase. No saben exactamente cuándo se realizará una prueba, por lo que deben estudiar de forma rutinaria para asegurarse de que les irá bien si se les evalúa.

Resumen de la lección

El condicionamiento operante es una de las formas más populares de ajustar el comportamiento. A través de positivo y refuerzo negativo y positivo y castigos negativos , una persona puede cambiar su comportamiento para mejor. Es importante recordar que cuando se habla de refuerzos y castigos, positivo y negativo no significan buenos y malos. En cambio, positivo significa que se está agregando algo, mientras que negativo significa que se está quitando algo. Los horarios de refuerzo se utilizan a menudo en los negocios y la educación, desde juegos de azar y compras hasta exámenes sorpresa. Los cuatro tipos comunes de horarios se de razón fija , de intervalo fijo , de relación variabley programas de intervalo variable .

Refuerzo: definiciones para recordar

Reforzamiento
  • Condicionamiento operante: aprendizaje a través del refuerzo
  • Refuerzo positivo: se otorga una recompensa para aumentar la probabilidad de un comportamiento
  • Refuerzo negativo: se quita algo que no es deseado para aumentar la probabilidad de un comportamiento
  • Castigo positivo: se da algo no deseado para disminuir la probabilidad de un comportamiento
  • Castigo negativo: se quita algo deseado para disminuir la probabilidad de un comportamiento
  • Horarios de refuerzo: el momento de los refuerzos introducidos
  • Proporción fija: la recompensa se otorga después de la misma cantidad de respuestas.
  • Intervalo fijo: la recompensa se otorga después de la misma cantidad de tiempo
  • Relación variable: la recompensa se otorga después de un número impredecible de respuestas.
  • Intervalo variable: la recompensa se otorga después de un período de tiempo impredecible

Los resultados del aprendizaje

Al completar esta lección, debería estar listo para:

  • Definir condicionamiento operante
  • Explicar qué significan los términos ‘positivo’ y ‘negativo’ en el contexto del refuerzo.
  • Diferenciar entre refuerzo positivo y refuerzo negativo
  • Distinguir entre castigo positivo y castigo negativo
  • Definir programa de refuerzo
  • Identificar y describir cuatro programas comunes de refuerzo.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador