Peisaj de fitness local al proteinei fluorescente verzi
Karen S. Sarkisyan
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
2 Academia de Stat Nizhny Novgorod, Minin Sq. 10/1, 603005 Nijni Novgorod, Rusia
3 Institutul Tehnologic Central European, Universitatea Masaryk, Brno, Republica Cehă
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
Dmitry A. Bolotin
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
3 Institutul Tehnologic Central European, Universitatea Masaryk, Brno, Republica Cehă
Margarita V. Meer
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
Dinara R. Usmanova
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
6 Institutul de Fizică și Tehnologie din Moscova, Institutskiy pereulok 9, Dolgoprudny, 141700, Rusia
Alexander S. Mishin
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
2 Academia de Stat Nizhny Novgorod, Minin Sq. 10/1, 603005 Nijni Novgorod, Rusia
George V. Sharonov
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
7 Facultatea de Medicină, Universitatea de Stat din Moscova, av. Lomonosov. 31/5 119192 Moscova, Rusia
Dmitry N. Ivankov
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
8 Laboratorul de Fizică a Proteinelor, Institutul de Cercetare a Proteinelor din Academia Rusă de Științe, str. Institutskaya 4, Pushchino, regiunea Moscovei, 142290, Rusia
Nina G. Bozhanova
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
Mihail S. Baranov
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
9 Pirogov Russian National Research Medical University, Ostrovitianov 1, Moscova, 117997, Rusia
Onuralp Soylemez
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
Natalya S. Bogatyreva
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
8 Laboratorul de Fizică a Proteinelor, Institutul de Cercetare a Proteinelor din Academia Rusă de Științe, str. Institutskaya 4, Pushchino, regiunea Moscovei, 142290, Rusia
Peter K. Vlasov
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
Evgeny S. Egorov
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
Maria D. Logacheva
9 Pirogov Russian National Research Medical University, Ostrovitianov 1, Moscova, 117997, Rusia
10 A.A. Institutul Kharkevich pentru probleme de transmitere a informațiilor, Academia Rusă de Științe, Moscova, Rusia
11 Departamentul de Bioinformatică și Bioinginerie, Universitatea de Stat din Moscova, Moscova, Rusia
Alexey S. Kondrashov
11 Departamentul de Bioinformatică și Bioinginerie, Universitatea de Stat din Moscova, Moscova, Rusia
12 Departamentul de Ecologie și Biologie Evolutivă, Universitatea din Michigan, Ann Arbor, MI, SUA
Dmitry M. Chudakov
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
3 Institutul Tehnologic Central European, Universitatea Masaryk, Brno, Republica Cehă
Ekaterina V. Putintseva
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
3 Institutul Tehnologic Central European, Universitatea Masaryk, Brno, Republica Cehă
Ilgar Z. Mamedov
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
3 Institutul Tehnologic Central European, Universitatea Masaryk, Brno, Republica Cehă
Dan S. Tawfik
13 Departamentul de chimie biologică, Institutul de Științe Weizmann, Rehovot 76100, Israel
Konstantin A. Lukyanov
1 Institutul de Chimie Bioorganică Shemyakin-Ovchinnikov, Miklukho-Maklaya 16/10, 117997 Moscova, Rusia
2 Academia de Stat Nizhny Novgorod, Minin Sq. 10/1, 603005 Nijni Novgorod, Rusia
Fyodor A. Kondrashov
4 Programul de Bioinformatică și Genomică, Centrul de Reglare Genomică (CRG), Institutul de Știință și Tehnologie din Barcelona, 88 Dr. Aiguader, 08003 Barcelona, Spania
5 Universitat Pompeu Fabra (UPF), 08003 Barcelona, Spania
14 Institution Catalana de Recerca i Estudis Avançats (ICREA), 23 Pg. Lluís Companys, 08010 Barcelona, Spania
Date asociate
Abstract
Am analizat peisajul de fitness local al avGFP prin estimarea nivelurilor de fluorescență ale genotipurilor obținute prin mutageneză aleatorie a secvenței avGFP (Figura 1). Am folosit sortarea celulelor activate de fluorescență și secvențiat întreaga regiune de codificare GFP pentru a testa fluorescența a mii de genotipuri create prin mutageneză aleatorie a secvenței de tip sălbatic (Informații suplimentare S2 și date extinse Fig. 1). Am aplicat mai multe strategii pentru a minimiza eroarea estimării noastre de fluorescență (informații suplimentare S3.4 și S4.4), care a fost estimată din mii de măsurători independente ale secvenței de tip sălbatic (rata de eroare fals negativă 0,08%) și genotipuri care încorporează mutații cunoscute pentru a elimina fluorescența (rata de eroare fals pozitivă 0,24%). Setul nostru de date final a inclus 56.086 secvențe de nucleotide unice care codifică 51.715 secvențe de proteine diferite. Procedura noastră a introdus în medie 3,7 mutații per secvență de gene, iar majoritatea genotipurilor testate conțineau mai multe, până la 15, mutații cu sens. Totuși, deoarece numărul total de secvențe posibile crește exponențial odată cu numărul de mutații, fracțiunea de secvențe eșantionate a fost mică pentru secvențele care conțin mai mult de două mutații (Tabelul 1 de date extinse). Am folosit aceste date pentru a analiza peisajul de fitness local al GFP analizând impactul mutațiilor simple, duble și multiple.