Un model de învățare a recompenselor alimentare cu expunere dinamică la recompensă

Ross A. Hammond

1 Center on Social Dynamics and Policy, The Brookings Institution, Washington, DC, SUA

Joseph T. Ornstein

1 Center on Social Dynamics and Policy, The Brookings Institution, Washington, DC, SUA

Lesley K. Fellows

2 Institutul și Spitalul Neurologic din Montreal, Universitatea McGill, Montreal, QC, Canada

Laurette Dubé

3 Facultatea de Management Desautels, Universitatea McGill, Montreal, QC, Canada

Robert Levitan

4 Departamentul de Psihiatrie, Universitatea din Toronto, Toronto, ON, Canada

Alain Dagher

2 Institutul și Spitalul Neurologic din Montreal, Universitatea McGill, Montreal, QC, Canada

Abstract

Procesul de condiționare prin învățarea recompensei este extrem de relevant pentru studiul alegerii alimentelor și al obezității. Învățarea este în sine modelată de expunerea la mediu, cu potențialul ca astfel de expuneri să varieze în mod substanțial între indivizi, în funcție de loc și timp. În această lucrare, folosim tehnici de calcul pentru a extinde un model standard bine validat de învățare a recompensei, introducând atât eterogenitate substanțială, cât și expuneri dinamice la recompense. Apoi, aplicăm modelul extins unui context de alegere a alimentelor. Modelul produce o varietate de comportamente individuale și modele la nivel de populație care nu sunt evidente din formularea tradițională, dar care oferă perspective potențiale pentru înțelegerea învățării recompensei alimentare și a obezității. Acestea includ un efect de „blocare”, prin care expunerea timpurie poate modela puternic evaluarea recompensei ulterioare. Discutăm implicațiile potențiale ale rezultatelor noastre pentru studiul și prevenirea obezității, pentru câmpul de învățare a recompenselor și pentru viitoarele lucrări experimentale și de calcul.

Introducere

Obezitatea are o etiologie complexă, cu multiple căi cunoscute (Huang și Glass, 2008; Hammond, 2009; Dubé și colab., 2010; IOM, 2010, 2012). Dovezi considerabile sugerează că mediul alimentar poate fi un factor important al obezității (Lakdawalla și Philipson, 2009) și că indivizii pot diferi prin tendința lor de a consuma în exces ca răspuns la indicii alimentare din mediu (Guerrieri și colab., 2008). Unii cercetători se referă la „foamea hedonică” - foamea condusă de indicii alimentare și anticiparea plăcerii alimentare mai degrabă decât de necesitățile calorice pur homeostatice (Lowe și Butryn, 2007) - subliniind importanța sistemelor de recompensare a creierului în orientarea deciziilor alimentare.

Ne concentrăm pe propunerea conform căreia preferința pentru alimentele bogate în calorii și incapacitatea de a rezista atracției indicilor alimentari se dezvoltă parțial printr-o formă de condiționare (Epstein și colab., 2007). Condiționarea se referă la atribuirea proprietăților de stimulare unor indicii anterior neutre asociate cu recompense primare, cum ar fi mâncarea, prin învățare (Frank și Claus, 2006; Samson și colab., 2010). Persoanele cu o capacitate sporită de a învăța din recompense ar fi mai predispuse la această formă de condiționare și, de asemenea, la fenomenul conex de sensibilizare, care se referă la o creștere progresivă a răspunsului neuronal și comportamental la recompense repetate (Robinson și Berridge, 1993) . Cercetările pe animale sugerează cu tărie că diferențele inerente în sistemul dopaminei promovează învățarea diferențiată despre indicii de predicție a recompenselor, care, la rândul lor, promovează o motivație mai mare de a consuma și de a căuta recompensa asociată în prezența acestor indicii (Dalley și colab., 2005, 2007; Petrovich și Gallagher, 2007; Flagel și colab., 2008, 2009; Berridge și colab., 2009; Yager și Robinson, 2010; Lovic și colab., 2011).

Modelul pe care îl prezentăm în această lucrare nu este destinat să fie un model cuprinzător al comportamentului alimentar, ci se concentrează în mod special pe elucidarea rolului învățării recompensatoare. Prin excluderea altor factori care contribuie, cum ar fi homeostazia, controlul executiv și normele alimentare, izolăm efectul dinamic al învățării recompensei în contextul expunerii variate și schimbătoare a recompensei de mediu. Modelul nostru nu se referă în mod explicit la dopamină, chiar dacă rolul său în învățarea și sensibilizarea la medicamente și alimente nu este pus la îndoială (Sclafani și colab., 2011). Mai degrabă propunem că o vulnerabilitate moștenită (învățarea îmbunătățită a recompenselor), împreună cu un mediu bogat în alimente bogate în calorii, poate duce la adaptări neuronale de lungă durată care promovează consumul excesiv de-a lungul vieții. Explorăm ipoteza că învățarea dinamică a recompenselor poate ajuta la explicarea atât a importanței vieții timpurii, ca o perioadă cheie în dezvoltarea comportamentului alimentar, cât și a dovezilor contradictorii din jurul efectului mediului alimentar asupra comportamentului alimentar și a obezității (Morland și colab., 2006 Larson și colab., 2009; Murakamia și colab., 2010).