Condizionamento strumentale

Un altro termine per il condizionamento operativo

Il condizionamento strumentale è un altro termine per condizionamento operante , un processo di apprendimento descritto per la prima volta da BF Skinner . Nel condizionamento strumentale, rinforzo o punizione sono usati per aumentare o diminuire la probabilità che un comportamento si verifichi di nuovo in futuro.

Esempi di condizionamento strumentale

Ad esempio, se uno studente viene ricompensato con lode ogni volta che alza la mano in classe, diventa più probabile che alzi la mano di nuovo in futuro.

Se anche lei viene rimproverata quando parla a turni, diventa meno probabile che interrompa la lezione. In questi esempi, l'insegnante sta usando il rinforzo per rafforzare il comportamento e la punizione di innalzamento della mano per indebolire il comportamento fuori discorso.

Il condizionamento strumentale è spesso usato anche nell'addestramento degli animali. Ad esempio, addestrare un cane a stringere la mano implicherebbe offrire una ricompensa ogni volta che si verifica il comportamento desiderato.

Una breve storia del condizionamento strumentale

Lo psicologo EL Thorndike è stato uno dei primi a osservare l'impatto del rinforzo negli esperimenti con i gatti. Durante questi esperimenti, Thorndike osservò un processo di apprendimento che chiamava apprendimento "per tentativi ed errori".

Gli esperimenti consistevano nel mettere un gatto affamato in una scatola di puzzle e per liberarsi, il gatto doveva capire come scappare. Thorndike poi ha notato quanto tempo ci sono voluti i gatti per liberarsi da soli in ogni sperimentazione sperimentale.

Inizialmente, i gatti si sono impegnati in metodi di fuga inefficaci, grattando e scavando ai lati o nella parte superiore della scatola. Alla fine, tentativi ed errori porterebbero i gatti a spingere o tirare con successo la via di fuga. Dopo ogni prova successiva, i gatti si sono impegnati sempre meno nei comportamenti di fuga inefficaci e più rapidamente hanno risposto con le azioni di fuga corrette.

Thorndike si riferì alle sue osservazioni come la legge dell'effetto . La forza di una risposta aumenta quando viene immediatamente seguita da un "più soddisfacente" (rinforzo). D'altra parte, le azioni che sono seguite da effetti spiacevoli hanno maggiori probabilità di essere indebolite.

Negli esperimenti con la scatola del puzzle di Thorndike, la fuga dalla scatola era più soddisfacente. Ogni volta che i gatti riuscivano a sfuggire alla scatola, il comportamento che immediatamente precedeva la fuga fu rinforzato e rafforzato.

Il lavoro di Thorndike ebbe un enorme effetto sulla successiva ricerca di BF Skinner sul condizionamento operante . Skinner ha persino creato la sua versione dei riquadri di puzzle di Thorndike, che ha definito una camera operistica, nota anche come scatola Skinner .

Come funziona il condizionamento strumentale

Skinner ha identificato due tipi principali di comportamenti. Il primo tipo sono i comportamenti rispondenti. Queste sono semplicemente azioni che si verificano in modo riflessivo senza alcun apprendimento. Se tocchi qualcosa di caldo, ritirerai immediatamente la mano in risposta. Il condizionamento classico si concentra su questi comportamenti rispondenti. Nei classici esperimenti di Pavlov con i cani , la salivazione alla presentazione del cibo era il comportamento rispondente. Tuttavia, formando un'associazione tra il suono di una campana e la presentazione del cibo, Pavlov è stato in grado di addestrare i cani a salivare semplicemente semplicemente al suono di quella campana.

Skinner si rese conto che mentre il condizionamento classico poteva spiegare come i comportamenti rispondenti potevano portare all'apprendimento, non poteva tenere conto di ogni tipo di apprendimento. Invece, ha suggerito che erano le conseguenze delle azioni volontarie che portano alla maggior quantità di apprendimento.

Il secondo tipo di comportamento è quello che Skinner ha definito comportamenti da operante. Li ha definiti come ogni comportamento volontario che agisce sull'ambiente per creare una risposta. Questi sono i comportamenti volontari che sono sotto il nostro controllo cosciente. Queste sono anche azioni che possono essere apprese. Le conseguenze delle nostre azioni giocano un ruolo importante nel processo di apprendimento.

Rinforzo e punizione

Skinner ha identificato due aspetti chiave del processo di condizionamento operante. Il rinforzo serve ad aumentare il comportamento mentre la punizione serve a diminuire il comportamento.

Esistono anche due diversi tipi di rinforzo e due diversi tipi di punizione. Il rinforzo positivo comporta la presentazione di un esito favorevole, come dare un trattamento a un bambino dopo aver pulito la sua stanza. Il rinforzo negativo comporta la rimozione di uno stimolo spiacevole, come dire a un bambino che se mangia tutte le sue patate, allora non dovrà mangiare i suoi broccoli. Poiché il bambino considera i broccoli una conseguenza sgradevole e mangiare le patate porta alla rimozione di questa conseguenza indesiderata, mangiare le patate viene quindi rinforzato negativamente.

Punizione positiva significa applicare un evento spiacevole dopo un comportamento. La sculacciata, per esempio, è un esempio comune di punizione positiva. Questo tipo di punizione viene spesso definito come punizione per applicazione. Una conseguenza negativa viene applicata direttamente per ridurre il comportamento indesiderato.

La punizione negativa comporta la rimozione di qualcosa di piacevole dopo che si è verificato un comportamento. Ad esempio, se un bambino non riesce a pulire la sua stanza, i suoi genitori potrebbero dirle che non può andare al centro commerciale con i suoi amici. Portare via l'attività desiderabile agisce come un punitore negativo sul comportamento precedente.