Peisaj local de fitness al proteinei fluorescente verzi Natura
Subiecte
Abstract
Am analizat peisajul de fitness local al avGFP prin estimarea nivelurilor de fluorescență ale genotipurilor obținute prin mutageneză aleatorie a secvenței avGFP (Fig. 1). Am folosit sortarea celulelor activate prin fluorescență (Fig. 1 suplimentară) și am secvențiat întreaga regiune de codificare GFP pentru a testa fluorescența multor mii de genotipuri create prin mutageneza aleatorie a secvenței de tip sălbatic (Informații suplimentare 2 și date extinse Fig. 1) . Am aplicat mai multe strategii pentru a minimiza eroarea estimării noastre de fluorescență (informații suplimentare 3.4 și 4.4), care a fost estimată din mii de măsurători independente ale secvenței de tip sălbatic (rata de eroare fals negativă = 0,08%) și genotipuri care încorporează mutații cunoscute de eliminați fluorescența (rata de eroare fals pozitivă = 0,24%). Setul nostru de date finale a inclus 56.086 secvențe de nucleotide unice care codifică 51.715 secvențe de proteine diferite. Procedura noastră a introdus în medie 3,7 mutații per secvență de gene, iar cele mai multe genotipuri testate conțineau mai multe, până la 15, mutații cu sens. Totuși, deoarece numărul total de secvențe posibile crește exponențial odată cu numărul de mutații, fracțiunea de secvențe eșantionate a fost mică pentru secvențele care conțin mai mult de două mutații (Tabelul 1 de date extinse). Am folosit aceste date pentru a analiza peisajul de fitness local al GFP, analizând efectul mutațiilor simple, duble și multiple.

A, AvGFP de tip sălbatic (centru) și majoritatea mutanților unici (cercul cel mai interior) fluoresc verde. Genotipurile cu mutații multiple pot prezenta epistaze negative, cu combinații de mutații neutre care creează fenotipuri non-fluorescente (gri) sau epistoză pozitivă, în care o mutație într-un genotip non-fluorescent restabilește fluorescența. , Secvența GFP aranjată într-un cerc, fiecare coloană reprezentând un situs de aminoacizi. În primul cerc, intensitatea culorii pătratelor indică strălucirea unei singure mutații la locul corespunzător în raport cu tipul sălbatic, arătat în centru. Site-urile cu interacțiuni epistatice pozitive și negative între perechi de mutații sunt conectate prin linii verzi, respectiv negre. În cercuri mai îndepărtate de centru, reprezentând genotipuri cu mutații multiple, fracția coloanei colorate în verde (negru) reprezintă fracția de genotipuri corespunzătoare fluorescenței mari (scăzute) dintre toate genotipurile testate cu o mutație la locul respectiv. Foarfecele indică locul restricției.
10% dintre stările mutante care conferă un fenotip non-fluorescent au fost totuși fixate în evoluția pe termen lung (date extinse Fig. 3b), iar o fracțiune substanțială de genotipuri care conțin doar mutații care conduc la stări de aminoacizi de la ortologii GFP a fost ne-fluorescentă Fig. 3), indicând faptul că epistaza afectează peisajul de fitness avGFP 16 .
A, Distribuțiile fluorescenței măsurate independent pentru 2.442 secvențe de tip sălbatic (gri), 1.114 mutanți singuri (albastru) și fracția estimată a mutațiilor neutre (alb). , c, Mutațiile cu un singur sens care scad puternic fluorescența (violet) au avut tendința să apară în locuri cu reziduuri orientate intern (), afișat pe un șir β selectat al structurii GFP (c).
A, O reprezentare ipotetică a epistazei negative și pozitive în funcție de numărul de mutații unice din avGFP. WT, tip sălbatic. , Fracția genotipurilor non-fluorescente observate (roșu) și fracția preconizată a genotipurilor non-fluorescente observate calculate ca suma efectelor log-fluorescenței mutațiilor individuale (albastru). c, Distribuțiile epistazei pentru epistazele negative și pozitive de forță diferită, cu rata de descoperire falsă așteptată prezentată în gri.