Glosario

Refuerzo intermitente.

El refuerzo intermitente es el esquema de condicionamiento en el que las recompensas se entregan de manera impredecible en lugar de cada vez que ocurre un comportamiento.

0:00 / 0:00

Lectura en audio.

Definición

El marco proviene de las investigaciones de condicionamiento operante de B. F. Skinner a mediados del siglo XX. El investigador estudió los efectos de diferentes esquemas de recompensa: continuo (cada comportamiento recompensado), de proporción fija (cada n-esima conducta recompensada), proporción variable (recompensada en un cronograma aleatorio), y variaciones en versiones basadas en el tiempo de cada uno. El hallazgo robusto a través de décadas de replicación posterior es que el refuerzo de proporción variable produce las tasas más altas de comportamiento, la persistencia más larga después de la parada de recompensas y la mayor resistencia a la extinción , es decir, produce un comportamiento que es muy difícil de detener.

Este es el horario en el que funcionan las máquinas tragamonedas. Es el calendario que hace que los juegos de azar sean adictivos de una manera que los boletos de lotería (recompensas de baja frecuencia) no lo son. También es, por accidente o por diseño, el calendário que las relaciones narcisistas patológicas implementan.

Cómo el ciclo narcisista lo implementa

La relación oscila de manera impredecible entre la idealización (alta recompensa atención, calidez, intimidad) y la devaluación (ninguna recompensa, o peor retirada, crítica, desprecio). El sobreviviente no puede predecir qué versión aparecerá en un momento dado, pero sabe por experiencia que la fase de idealizacion a veces regresa. El resultado es un patrón de comportamiento aprendido de trabajar más duro para obtener el comportamiento gratificante, que es exactamente el comportamento que el horario selecciona.

Dejar una relación narcisista está más cerca en el perfil de dificultad de dejar una adicción a las sustancias que de terminar una asociación infeliz ordinaria, y la literatura sobre lo que ayuda proviene tanto del campo de la adicción como de la recuperación del abuso.

Lo que ayuda

El único horario que rompe el acondicionamiento es uno en el que las recompensas variables dejan de aparecer. Sin contacto es, en términos operantes, el protocolo de extinción el comportamiento del sobreviviente ya no se refuerza, incluso ocasionalmente, y la respuesta condicionada eventualmente se debilita. Cada contacto, incluso uno, restablece el reloj de extinguimiento. Esta es la razón neurobiológica por la que las primeras semanas de no contacto son las más difíciles y los meses siguientes se vuelven progresivamente más fáciles se está deshaciendo el condicionamiento.

← Glosario