Che cos'è un programma di rinforzo?

Quale impatto hanno gli orari di rinforzo sull'apprendimento?

Il condizionamento operativo è un processo di apprendimento in cui i nuovi comportamenti vengono acquisiti e modificati attraverso la loro associazione con le conseguenze. Rafforzare un comportamento aumenta la probabilità che si verifichi di nuovo in futuro, mentre punire un comportamento diminuisce la probabilità che venga ripetuto. Nel condizionamento operante , gli schemi di rinforzo sono una componente importante del processo di apprendimento.

Quando e quanto spesso rafforziamo un comportamento, possiamo avere un impatto drammatico sulla forza e sul tasso della risposta.

Che cos'è un programma di rinforzo?

Quindi, cos'è esattamente un programma di rinforzo e come funziona nel processo di condizionamento? Un programma di rinforzo è fondamentalmente una regola che stabilisce quali istanze di un comportamento saranno rinforzate. In alcuni casi, un comportamento potrebbe essere rinforzato ogni volta che si verifica.

A volte, un comportamento potrebbe non essere rinforzato affatto.

Possono essere usati rinforzi positivi o rinforzi negativi , a seconda della situazione. In entrambi i casi, l'obiettivo del rinforzo è sempre quello di rafforzare il comportamento e aumentare la probabilità che si verifichi di nuovo in futuro.

Puoi avere un'idea migliore di come funzionano i programmi di rinforzo pensando a come l'apprendimento si svolge in entrambe le situazioni di apprendimento naturali e in situazioni di allenamento più strutturate.

Nelle impostazioni del mondo reale, i comportamenti probabilmente non verranno rinforzati ogni volta che si verificano. Per le situazioni in cui stai intenzionalmente cercando di addestrare e rafforzare un'azione, ad esempio in classe, nello sport o nella formazione degli animali, potresti scegliere di seguire un programma di rinforzo specifico.

Come vedrai di seguito, alcuni programmi sono più adatti a determinati tipi di situazioni di allenamento. In alcuni casi, la formazione potrebbe richiedere di iniziare con un programma e passare a un altro una volta che il comportamento desiderato è stato insegnato. Alcuni schemi di rinforzo possono essere più efficaci in situazioni specifiche.

Esistono due tipi di programmi di rinforzo:

Orari di rinforzo continui

Nel rinforzo continuo, il comportamento desiderato viene rinforzato ogni volta che si verifica. Questo programma viene utilizzato al meglio durante le fasi iniziali dell'apprendimento al fine di creare una forte associazione tra il comportamento e la risposta.

Ad esempio, immagina che stai cercando di insegnare a un cane a stringergli la mano. Durante le fasi iniziali dell'apprendimento, si dovrebbe probabilmente attenersi a un programma di rinforzo continuo al fine di insegnare e stabilire il comportamento. Potresti iniziare afferrando la zampa dell'animale, eseguendo il movimento di scuotimento, dicendo "Shake", e quindi offrendo una ricompensa ogni volta che esegui questa sequenza di passaggi. Alla fine, il cane inizierà a eseguire l'azione da solo e potresti decidere di continuare a rinforzare ogni singola risposta corretta fino a quando il comportamento non sarà ben definito.

Una volta che la risposta è stata saldamente collegata, il rinforzo viene solitamente convertito in un programma di rinforzo parziale.

Orari di rinforzo parziale

Nel rinforzo parziale o intermittente, la risposta è rinforzata solo in parte tempo . I comportamenti appresi vengono acquisiti più lentamente con il rinforzo parziale, ma la risposta è più resistente all'estinzione .

Per esempio, pensa al nostro esempio precedente in cui stavi addestrando un cane a tremare. Mentre inizialmente si utilizzava un programma continuo, il rafforzamento di ogni singola istanza del comportamento potrebbe non essere sempre realistico. Alla fine, potresti decidere di passare a una pianificazione parziale in cui fornisci rinforzo dopo che si sono verificate così tante risposte o dopo che è trascorso così tanto tempo.

Vi sono quattro programmi di rinforzo parziale:

I programmi a tasso fisso sono quelli in cui una risposta viene rafforzata solo dopo un numero specificato di risposte. Questo programma produce un alto e costante tasso di risposta con solo una breve pausa dopo la consegna del rinforzo. Un esempio di un programma a tasso fisso dovrebbe fornire un pastone di cibo a un topo dopo che preme una barra cinque volte.

Le pianificazioni a rapporto variabile si verificano quando una risposta viene rinforzata dopo un numero imprevedibile di risposte. Questo programma crea un alto tasso costante di risposta. I giochi d'azzardo e le lotterie sono buoni esempi di una ricompensa basata su un programma di rapporto variabile. In un ambiente di laboratorio, questo potrebbe comportare il rilascio di pastiglie di cibo a un topo dopo una pressa a barra, di nuovo dopo quattro presse a barra, e un terzo pellet dopo due presse a barra.

Le pianificazioni a intervallo fisso sono quelle in cui la prima risposta viene premiata solo dopo che è trascorso un determinato periodo di tempo. Questo programma causa un alto numero di risposte vicino alla fine dell'intervallo, ma molto più lento risponde immediatamente dopo la consegna del rinforzo. Un esempio di questo in un ambiente di laboratorio sarebbe rinforzare un topo con un pallino da laboratorio per la prima pressione sulla barra dopo che è trascorso un intervallo di 30 secondi.

Le pianificazioni a intervalli variabili si verificano quando una risposta viene premiata dopo che è trascorso un tempo imprevedibile. Questo programma produce un ritmo lento e costante di risposta. Un esempio di questo sarebbe fornire un pastone di cibo ad un ratto dopo la prima pressione della barra dopo un intervallo di un minuto, un altro granulo per la prima risposta dopo un intervallo di cinque minuti e un terzo pastoncino di cibo per la prima risposta dopo un intervallo di tre minuti.

Come si sceglie un programma di rinforzo?

Decidere quando rinforzare un comportamento può dipendere da una serie di fattori. Nei casi in cui stai specificamente cercando di insegnare un nuovo comportamento, un programma continuo è spesso una buona scelta.

Una volta che il comportamento è stato appreso, è spesso preferibile passare a un programma parziale.

Nella vita quotidiana, gli schemi parziali di rinforzo si verificano molto più frequentemente di quelli continui. Ad esempio, immagina se hai ricevuto qualche tipo di premio ogni volta che ti sei presentato per lavorare in orario. Invece, tali premi vengono solitamente distribuiti su un programma di rinforzo parziale molto meno prevedibile. Questi piani non solo sono molto più realistici e facili da implementare, ma tendono anche a produrre tassi di risposta più elevati pur essendo meno suscettibili all'estinzione.

Realisticamente, rinforzare un comportamento ogni volta che si verifica può essere difficile e richiede una grande quantità di attenzione e risorse. Gli orari parziali non solo tendono a condurre a comportamenti che sono più resistenti all'estinzione, ma riducono anche il rischio che il soggetto si sazi. Se il rinforzo utilizzato non è più desiderato o ricompensato, il soggetto può smettere di eseguire il comportamento desiderato.

Ad esempio, immagina che stai cercando di insegnare a un cane a sedersi. Se stai usando il cibo come ricompensa, il cane potrebbe smettere di eseguire l'azione una volta che è pieno. In tali casi, qualcosa come lode o attenzione potrebbe essere un rinforzo più efficace.

Una parola da

Il condizionamento operativo può essere un potente strumento di apprendimento. Il programma di rinforzo utilizzato durante il processo di addestramento e manutenzione può influire notevolmente sulla rapidità con cui un comportamento viene acquisito, sulla forza della risposta e sulla frequenza con cui viene visualizzato il comportamento. Per determinare quale programma è preferibile, è importante considerare diversi aspetti della situazione, incluso il tipo di comportamento che viene insegnato e il tipo di risposta richiesto.

> Fonti:

> Cooper, J, Heron, T, e Heward, W. Analisi del comportamento applicata . New Jersey: Pearson Education; Del 2007.

> Nevid, JS. Elementi essenziali della psicologia: concetti e applicazioni. Boston, MA: Cengage Learning; Il 2016.