Fenotipuri ecologice complexe pe copaci filogenetici un model Markov ascuns pentru analiză comparativă
ABSTRACT
Majoritatea speciilor din lumea naturală folosesc mai multe tipuri de resurse ecologice distincte categoric. Multe specii de fluturi folosesc mai multe plante gazdă, de exemplu (Ehrlich și Raven 1964; Robinson 1999). Parulele insectivore din America de Nord temperată folosesc mai multe microhabitate distincte și comportamente de hrănire (MacArthur 1958), la fel ca și mâncătorii de miere din Australia mesică și aridă (Miller și colab. 2017). Evoluția noilor modele de utilizare a resurselor poate avea impact asupra evoluției fenotipice (Martin & Wainwright 2011; Davis și colab. 2016), diversificare (Mitter și colab. 1988; Givnish și colab. 2014), adunarea comunității (Losos și colab. 2003; Gillespie 2004) și funcția ecosistemului (Harmon și colab. 2009; Bassar și colab. 2010). În consecință, a existat un interes substanțial în înțelegerea modului în care evoluează trăsăturile ecologice legate de utilizarea resurselor și explorarea impactului acestora asupra altor fenomene evolutive și ecologice (Vrba 1987; Futuyma și Moreno 1988; Forister și colab. 2012; Price și colab. 2012; Burin et al. 2016).

Pentru a face inferențe cu privire la dinamica evolutivă a utilizării resurselor, totuși, este necesar mai întâi să rezumăm modelele complexe de variație observate între taxe în trăsături care pot fi modelate pe copaci filogenetici. Este larg recunoscut faptul că complexitatea reală a utilizării resurselor nu este descrisă în mod adecvat de un set de variabile categorice (Hardy & Linder 2005; Hardy 2006). Cu toate acestea, este de asemenea adevărat că diferențele majore în utilizarea resurselor pot fi uneori rezumate într-un set mic de stări ecologice, un punct subliniat de Mitter și colab. (1988) în studiul lor privind fitofagia și diversificarea insectelor. Din acest motiv, modelele în lanț continuu Markov (CTMC), care necesită clasificarea speciilor într-un set de stări de caracter, au devenit obișnuite în studiile macroevolutive ale evoluției trăsăturilor ecologice (Kelley & Farrell 1998; Nosil 2002; Price et al. 2012; Hardy & Otto 2014; Cantalapiedra și colab. 2014; Burin și colab. 2016). Modelele CTMC descriu un proces stocastic pentru tranziții evolutive între un set de stări de caracter și sunt utilizate pentru a deduce stări ancestrale și rate evolutive și pentru a efectua teste de ipoteză bazate pe model (O’Meara 2012).
Utilitatea lanțurilor Markov în timp continuu pentru studierea dinamicii evolutive a utilizării resurselor este limitată de presupunerea de modelare a faptului că taxele sunt monomorfe pentru stările ecologice (Hardy & Linder 2005; Hardy 2006). Ca o soluție practică, majoritatea studiilor empirice definesc una sau mai multe stări generalizate pentru a găzdui specii care utilizează mai multe tipuri de resurse și care, prin urmare, nu pot fi caracterizate ca specialiști pentru o anumită resursă (Alencar și colab. 2013; Price și colab. 2012; Burin și colab. 2016; Gajdzik și colab. 2019). O altă soluție, mai degrabă decât clasificarea fiecărei specii ca specialist sau generalist, reprezintă fiecare categorie de resurse cu un scor binar de prezent sau absent (Janz și colab. 2001; Colston și colab. 2010; Hardy 2017). În acest caz, starea ecologică a unei specii este resursele stabilite ca prezente. Fiecare dintre aceste abordări reprezintă o soluție la provocarea de modelare pusă de variația intraspecifică a utilizării resurselor, dar ambele soluții neglijează variația importanței relative a resurselor diferite pentru taxoni diferiți. În consecință, speciile clasificate într-un singur stat pot prezenta totuși diferențe substanțiale în tiparele de utilizare a resurselor, creând provocări pentru interpretarea tranzițiilor evolutive între stările de caracter precum și pentru înțelegerea legăturilor dintre evoluția stării de caracter și diversificare.
O altă limitare a lanțurilor Markov în timp continuu pentru modelarea evoluției utilizării resurselor reiese din faptul că speciile sunt clasificate în stări ecologice, fără a ține cont de calitatea și cantitatea informațiilor disponibile pentru efectuarea exercițiului de clasificare. De exemplu, speciile cu puține observații ecologice ar putea fi clasificate ca specialiști pentru o anumită resursă, atunci când specializarea lor aparentă este strict o funcție a numărului mic de observații ecologice disponibile pentru taxon. Mai general, prin eșecul utilizării unui model statistic pentru efectuarea atribuțiilor de stare a resurselor, neglijăm o sursă majoră de incertitudine în datele noastre: cunoștințele inegale și incomplete privind utilizarea resurselor între diferiți taxoni. La rândul său, această incertitudine are implicații substanțiale pentru modul în care proiectăm modele de utilizare a resurselor pe un set de stări de resurse. Nerespectând dimensiunile inegale și finite ale eșantionului caracteristice datelor empirice privind utilizarea resurselor, nu putem fi siguri dacă atribuțiile de stat reflectă adevărate asemănări sau diferențe în utilizarea resurselor sau sunt doar rezultatul așteptat al variației eșantionării.
În această lucrare folosim formularea stărilor ascunse ca distribuții de probabilitate pentru a dezvolta un model CTMC pentru studierea dinamicii evolutive a utilizării resurselor ecologice pe copaci filogenetici. Abordarea noastră este concepută în mod explicit pentru a modela trăsăturile resurselor care sunt intra-specific variabile și pentru a ține seama de incertitudinea în atribuțiile de stare ecologică a impozitului terminal care rezultă din efectele variației eșantionării. Presupunem că fiecare stare este o distribuție multinomială neobservată (latentă) și că datele observate sunt rezultate eșantionate din aceste distribuții latente (vezi panourile (i) până la (iii) din Fig. 1). Numărul de stări din model și stările în sine nu sunt observate direct și sunt estimate din date. Folosind simulări și un set de date empiric al dietelor de șarpe, arătăm cum metoda poate utiliza numărările observaționale pentru a deduce simultan numărul stărilor resurselor, utilizarea proporțională a resurselor de către diferite stări și distribuția filogenetică a stărilor ecologice între speciile vii și strămoșii lor. . Metoda este generală și se aplică oricăror date exprimabile ca un set de numărări observaționale din diferite categorii de resurse.
MATERIALE ȘI METODE
Descrierea modelului
Acest model pentru datele de numărare este strâns legat de modelele tematice ale compoziției cuvintelor într-o colecție de documente text (Blei și colab. 2003; Yin și Wang 2014) și de modelele genetice ale populației de compoziție a frecvenței alelelor într-un set de populații (de exemplu, programul STRUCTURA: Pritchard și colab. 2000). Diferența cheie aici este că statul atribuit unui taxon este rezultatul evoluției și nu este independent de stările altor linii. Conceptual, acest lucru este similar cu modelele de prag filogenetice, în care probabilitatea completă combină un model de probabilitate pentru evoluția unei variabile neobservate și un model de probabilitate pentru eșantionarea datelor observate condiționate de setul de variabile neobservate (Felsenstein 2012; Revell 2014). Modelăm evoluția ca un proces Poisson în care rata de schimbare este aceeași între toate stările (adică nu există o tendință evolutivă în model), dar variază între linii. Introducem două mecanisme pentru adaptarea la această variație a ratei.