NEUROBIOLOGIA DEL CONDIZIONAMENTO OPERANTE: DOPAMINA, APPRENDIMENTO E DISTURBO DA GIOCO D’AZZARDO
La neurobiologia del condizionamento operante è una parte della complessa neurobiologia del gioco d’azzardo patologico: estrapolarla ci aiuta a mettere a fuoco un momento cruciale nel percorso di apprendimento della dipendenza da gioco d’azzardo. In un fondamentale articolo apparso su Addiction nel 2002 Alex Blaszczynski e Lia Nower suddividono i giocatori d’azzardo patologici in tre tipologie, ma nella storia naturale della loro progressiva perdita di controllo sul gioco d’azzardo evidenziano che tutte e tre hanno in comune gli stessi fattori ecologici e le stesse modalità di apprendimento. I fattori ecologici sono l’aumentata disponibilità e l’aumentata accessibilità ai giochi d’azzardo. Disponibilità e accessibilità sono conseguenza delle scelte politiche e legislative di ciascun paese utili a creare e sostenere un ambiente in cui il gioco d’azzardo sia socialmente accettato, incoraggiato e promosso.
In particolare, le indagini epidemiologiche citate dagli autori (Blaszczynski e Nower, 2002) evidenziano che la capillare diffusione e la facilità di accesso all’azzardo sono associate a un’aumentata incidenza di azzardo patologico. Le modalità di apprendimento della dipendenza da gioco d’azzardo sono sempre indotte dai meccanismi del condizionamento classico e del condizionamento operante, che portano anche al manifestarsi di schemi cognitivi caratterizzati da credenze irrazionali e dall’illusione di poter controllare il caso (Blaszczynski e Nower, 2002). La gabbia di Skinner La descrizione della Skinner box si è rivelata essere un momento molto importante del possibile intervento di cura dei giocatori con disturbo da gioco d’azzardo. L’apparato usato da Skinner (fig. 1) consiste nella sua forma più consueta di sei elementi fondamentali che sono, nella descrizione di Meazzini (1978), 1. Uno stimolo di discriminazione, che può essere costituito da un suono, da una luce colorata o da altre situazioni-stimolo; 2. Un manipolandum; un dispositivo cioè la cui attivazione produce la comparsa dell’evento di rinforzo, che varia in funzione della specie animale oggetto dell’analisi sperimentale. Nel caso di un ratto il manipolandum consiste in genere in una levetta che può essere facilmente abbassata; 3. Uno spazio racchiuso (gabbia), che contiene lo stimolo di discriminazione, il manipolandum e l’organismo sottoposto all’analisi sperimentale. In molti casi la gabbia è illuminata da luce diffusa ed è isolata acusticamente, allo scopo di impedire che suoni e luci estranei a quelli prodotti intenzionalmente dallo sperimentatore interferiscano con il processo di condizionamento; 4. Un serbatoio che contiene gli eventi di rinforzo adeguati alla motivazione sperimentalmente indotta, di solito costituiti da cibo o da acqua; 5. Uno strumento di registrazione, che registra graficamente ogni scatto fatto dal manipolandum; 6. Un quadro di comando elettronico che programma la presentazione degli stimoli di discriminazione e delle sequenze di rinforzi (Meazzini 1978). Quando nella terapia del disturbo da gioco d’azzardo vengono mostrate le immagini della gabbia di Skinner i giocatori d’azzardo, soprattutto quelli che prediligono azzardare con le slot machine, immediatamente capiscono che cosa si sta loro descrivendo: l’oggetto dei loro desideri e delle loro ossessioni apparentemente ingiustificate. Fig. 1 - La gabbia di Skinner Nella Skinner box, detta anche camera di condizionamento operante, una scheda programmata determina la frequenza con cui, se si preme la leva, viene dato un premio all’animale. La frequenza di solito è intermittente e casuale e questo algoritmo, come è stato dimostrato infinite volte, rende l’animale estremamente collaborante. Non c’è quindi nessuna possibilità per l’animale di prevedere l’arrivo del cibo dopo avere schiacciato la leva, ma l’animale impara che se continua a schiacciare la leva, prima o poi il premio arriverà. E l’animale in questo modo impara a non smettere di schiacciare la leva, poiché impara che il premere la leva può essere seguito da un rinforzo. La Skinner box induce ad apprendere, condiziona ad apprendere. Ma cosa ha ispirato Skinner a inventare le gabbie di Skinner? Un filmato in cui c’è una sua intervista (Video “Operant Conditioning”) ci svela che si è ispirato alle modalità di rinforzo che ha potuto osservare nei giocatori di slot machine. La Skinner box ricorda i meccanismi della slot machine e si potrebbe dire che le slot machine sono Skinner box per umani. In effetti le prime slot machine sono del 1895 (vedi la “Liberty bell” di Charles Fey), mentre le Skinner box sono apparse nel 1938 (Skinner, 1938). Condizionamento operante Il condizionamento operante è un processo di apprendimento in cui la frequenza o la probabilità del manifestarsi di un determinato comportamento è influenzata dalle conseguenze che lo seguono. “E’ il legame associativo che s’instaura tra risposta (comportamento) e rinforzo (conseguenza) a determinare l’apprendimento e quindi il mantenimento del comportamento” (Mandolesi e Passafiume, 2003). La misura in cui il giocatore continuerà a giocare dipende da numerosi fattori; lo schema secondo il quale riceverà il rinforzo è sicuramente uno di quelli principali. Nel caso del gioco d’azzardo il soggetto non sa mai quando riceverà la ricompensa successiva, e grazie agli studi di Skinner si sa che questo sistema di rinforzo è molto efficace nello stimolare risposte comportamentali costanti, frequenti e difficili da estinguere. Skinner nel 1953 scrisse: “L’efficacia di questo sistema che genera tassi elevati (di risposta) è da molto tempo ben noto all’industria del gioco d’azzardo” (Skinner, 1953). Un’altra osservazione importante fatta da Skinner già nel 1938 riguarda lo sviluppo del comportamento “superstizioso” (Skinner, 1938) a causa del condizionamento operante. “Questo comportamento s’instaura allorché un individuo attribuisce ad una risposta la capacità di produrre un rinforzo, quando in realtà tra risposta e rinforzo c’è solo un nesso accidentale” (Mandolesi e Passafiume, 2003). Il rinforzo “E’ rinforzo qualsiasi evento che nelle stesse situazioni od in situazioni analoghe aumenta la probabilità di comparsa della risposta che lo ha provocato” (Meazzini, 1978). La gratificazione, cioè l'erogazione del premio, nelle slot e nei gratta e vinci, è intermittente e non prevedibile, casuale non solo per intervallo e ratio, cioè rispetto al tempo e al numero di giocate, ma anche rispetto all'entità del premio. L'imprevedibilità crea uno stato di aspettativa e di tensione che rende questo apprendimento molto difficile da estinguere (Ferster e Skinner, 1957). I giocatori d'azzardo imparano ad associare il loro comportamento di gioco al fatto di ottenere un rinforzo positivo (denaro). Lo schema con cui il giocatore riceve il rinforzo è uno dei fattori principali da cui dipende quanto continuerà a giocare e lo schema variabile è il più efficace nell'agganciare e mantenere l'aggancio anche quando perde. Lo schema di rinforzo variabile aumenta la resistenza all'estinzione. Le vincite grosse sono poche, ma emozionano moltissimo e sono molto importanti. Quando un certo comportamento elimina uno stimolo spiacevole si ha un rinforzo negativo di quel comportamento: questo può essere molto importante per influenzare il comportamento di gioco. Il gioco d'azzardo “aiuta” infatti a non annoiarsi, a tirarsi su, a dimenticare problemi e preoccupazioni (comprese quelle create dal gioco). Questo è paragonabile a quanto nella Skinner box avviene quando il topo preme la leva e contemporaneamente l’elettricità della griglia elettrica si spegne, dandogli immediato sollievo. Dopamina La Dopamina (DA) è un neurotrasmettitore cerebrale. Modula la plasticità sinaptica. Non è la molecola del piacere, anche se la sua concentrazione si alza nel nucleo accumbens nelle condizioni in cui c'è piacere: il suo ruolo è ben più complesso. Interviene nella regolazione delle funzioni cognitive (working memory, apprendimento, judgment decision making), nella regolazione dei comportamenti motivati (goal direct behaviour), in quella dei programmi motori, nelle regolazioni neuro-ormonali (risposte allo stress), e del tono dell'umore (Di Chiara e Bassareo, 2007). “I neuroni dopaminergici modificano la loro attività quando capitano eventi importanti, come un sorso di succo di frutta, o la comparsa di cibo, oppure un suono nel laboratorio che preannuncia che stanno per essere distribuiti cibo e bevande… I neuroni dopaminergici codificano informazioni sugli eventi di ricompensa e sugli eventi che portano a ricompensa…In gioco non sono semplici equazioni del tipo dopamina=ricompensa, oppure dopamina=piacere. Le reazioni dei neuroni dopaminergici sono disarmanti, nella loro complessità, specialmente quando si tratta di ricompense…I neuroni dopaminergici imparano dall’esperienza: correggono il ritmo al quale emettono impulsi elettrici a seconda della storia di esperienza delle ricompense che l’organismo ha alle spalle…Sorprendente è la somiglianza tra l’attività dei neuroni dopaminergici e i segnali di errore utilizzati in algoritmi astratti per l’apprendimento per rinforzo” (Montague, 2008). I neuroni dopaminergici presentano due modalità di attività elettrica e quindi di rilascio della dopamina: 1. Firing tonico, con andamento ritmico e costante nel tempo, simile all’andamento di un orologio. 2. Firing fasico, con andamento a raffiche brevi ed intense, dipendente dalla ricompensa imprevista e inattesa. Il rilascio fasico della DA è un evento transitorio circoscritto (che avviene nello spazio sinaptico), i livelli tonici di DA nello spazio extracellulare sono relativamente costanti e strettamente regolati. Una riduzione della dopamina tonica causa un aumento della responsività del sistema dopaminergico per una potente disinibizione del rilascio fasico di DA e quindi la iperresponsività del sistema DA. Apprendimento codificato dall'attività dopaminergica Il termine apprendimento si riferisce al processo mediante il quale il comportamento cambia. Il condizionamento operante è una forma di apprendimento per rinforzo (più efficace quando il rinforzo è intermittente e casuale e quindi imprevisto). La dopamina è il neurotrasmettitore cerebrale dell’apprendimento per rinforzo, che viene attivato in modo “fasico” di fronte ad un errore di previsione della ricompensa (quando la ricompensa è inattesa e/o imprevista). I neuroni dopaminergici in questi casi mostrano guizzi di attività elettrica (potenziali d’azione seguiti da rilascio di dopamina) di fronte a un atto di ricompensa imprevista. La dipendenza (come il disturbo da gioco d’azzardo) è una forma di apprendimento. “I neuroni dopaminergici dell'Area ventro tegmentale (VTA) e della substantia nigra sono stati a lungo identificati con la processazione degli stimoli di ricompensa. Questi neuroni inviano loro assoni a strutture cerebrali coinvolte in comportamenti motivati e goal-directed, per esempio, lo striato, il nucleo accumbens, e la corteccia frontale. Molteplici evidenze supportano l'ipotesi che questi neuroni assemblino e distribuiscano informazioni su eventi gratificanti. In primo luogo, droghe come amfetamine e cocaina esercitano le loro azioni di dipendenza in parte prolungando l'influenza della dopamina su neuroni bersaglio. In secondo luogo, percorsi neurali associati a neuroni dopaminergici sono tra i migliori obiettivi per auto-stimolazione elettrica. In questi esperimenti, i ratti premono leve per eccitare i neuroni collegati a un elettrodo impiantato. I ratti spesso scelgono questi stimoli che risultano essere gratificanti più di cibo e sesso. In terzo luogo, gli animali trattati con farmaci bloccanti dei recettori della dopamina imparano meno rapidamente a premere una leva per un compenso a base di pellet. Tutti i risultati di cui sopra implicano generalmente attività dopaminergica mesencefalica e sono correlabili all’apprendimento dipendente da ricompensa” (Shultz et al, 1997). Secondo l’algoritmo definito Dopamine Prediction Errors (errori nella predizione di ricompensa) quando un evento è nuovo e significativo, il cervello lo apprende e lo memorizza grazie a una secrezione fasica o a un burst: i neuroni dopaminergici emettono un segnale elettrico positivo (Montague, 2008; Fiorillo, 2004; Shultz et al, 1997). I cambiamenti di segnale nei neuroni dopaminergici per codifica di errore nella previsione di eventi gratificanti si manifestano sotto forma di scariche e pause nella produzione di impulsi elettrici. Se la gratificazione arriva in assenza di una sua previsione, si ha un errore positivo nella previsione di ricompensa. Il neurone dopaminergico è attivato da questa imprevista gratificazione che si esprime con un picco elettrico positivo di tipo fasico. Se lo stimolo gratificante è previsto e la ricompensa si verifica secondo la previsione, non c’è nessun errore nella previsione della ricompensa. Il neurone dopaminergico quindi non viene attivato dalla ricompensa giustamente predetta: permane lo stato elettrico tonico basale. Se lo stimolo gratificante è previsto, ma la ricompensa non riesce a verificarsi l'attività del neurone dopaminergico è depressa esattamente nel momento in cui la ricompensa avrebbe dovuto verificarsi: l’attività elettrica risulta essere depressa- assente. La depressione dell’attività elettrica si verifica più di 1 secondo dopo lo stimolo condizionato, senza stimoli intermedi, svelando una rappresentazione interna del tempo della ricompensa prevista (Montague, 2008; Shultz et al, 1997). Sintesi Il gioco d’azzardo eccessivo è una dipendenza molto forte, dovuta al meccanismo di sorpresa che c’è ogni volta che si gioca d’azzardo. E’ una dipendenza comportamentale che nasce come forma di apprendimento per rinforzo da errori di previsione. Il neurotrasmettitore cerebrale che sancisce l’apprendimento attraverso la plasticità cerebrale è la dopamina. Caratteristica fondamentale della dopamina è rispondere in modo prevalente agli errori di predizione. Questo tipo di risposta si accorda in modo particolare con il condizionamento operante a rinforzo intermittente e casuale, caratteristico del gioco d’azzardo, e il più difficile da estinguere. La Skinner-box è la camera del condizionamento operante (una forma di apprendimento per rinforzo, più efficace e più difficile da estinguere se il rinforzo è intermittente e casuale). Le slot-machine non sono altro che Skinner-box per umani, che attivano il rilascio di dopamina fasica, che fa apprendere dall’errore di previsione. La neurobiologia del condizionamento operante è determinata dai segnali della dopamina fasica: questo genera il pericoloso apprendimento per rinforzo del gioco d’azzardo (Slot-machine). Ci possiamo dunque chiedere quali sono i possibili danni per chi utilizza i suoi meccanismi di apprendimento applicandoli al gioco d’azzardo, un campo governato dal caso, nel quale non si può dunque apprendere.
BIBLIOGRAFIA
- - Blaszczynski A., Nower L., A pathways model of problem and pathological gambling, Addiction, 2002, 97: 487-499.
- - Di Chiara G., Bassareo V., Reward system and addiction: what dopamine does and doesn’t do, Current Opinion in Pharmacolgy, 2007, 7: 69-76.
- - Ferster, C. B., & Skinner, B. F., Schedules of reinforcement, Appleton Century Crofts, New York, 1957.
- - Fiorillo, C. D., The uncertain nature of dopamine. Molecular Psychiatry, 2004, 9: 122–123.
- - Mandolesi L., Passafiume D., Psicologia e psicobiologia dell’apprendimento, Springer, Milano, 2003.
- - Meazzini P., Skinner e la tecnologia del comportamento, in Skinner B.F. Studi e ricerche, Giunti Barbera, Firenze, 1976.
- - Montague R., Perchè l’hai fatto? Come prendiamo le nostre decisioni, Raffaello Cortina Editore, Milano, 2008.
- - Schultz W., Dayan P. , Montague P.R., A neural substrate of prediction and reward. Science,1997, 275: 1593–1599.
- - Skinner B.F., The behavior of organisms: an experimental analysis, Appleton Century Crofts, New York, 1938.
- - Skinner B.F., Science and human behaviour, Macmillan, New York, 1953, p.104. - Video “Operant conditioning”, http://www.youtube.com/watch?v=I_ctJqjlrHA