Spargerea alfabetului genomului

de John G. Cramer

Această coloană este despre alfabetul genomului și o nouă metodă de extindere a acestuia, descrisă într-o lucrare publicată recent în Nature online. În special, numărul de litere din alfabetul genomului a fost extins de la 4 la 6. Pentru a înțelege semnificația acestei dezvoltări, vom începe prin a revedea o biologie moleculară de bază.

spargerea

Toată viața de pe pământ, de la bacterii la oameni, folosește același cod genetic al a patru baze nucleotidice: acid timidilic (T), acid citidilic (C), acid adenilic (A) și acid guanilic (G). Nucleotidele formează perechi, astfel încât A perechi cu T și C perechi cu G pentru a forma lanțuri de ADN asemănătoare scărilor care acționează ca o bibliotecă de instrucțiuni pentru asamblarea proteinelor din care sunt construite toate formele de viață. Enzima transcriptază rulează de-a lungul lanțului ADN, transcriind secvența nucleotidică a A, C, G și T într-un lanț de "ARN mesager" (ARNm) de nucleotide A, C, G și U, cu preluarea acidului uridicilic (U) locul T în lanțul mARN. ARNm transcris este apoi citit ca o bandă de bandă de hârtie perforată, câte 3 litere odată, de către enzima ribozomului (vezi coloana mea # 106 „Decoding the Ribosome” din ediția din mai-2001 a Analog) care, cu ajutorul „Transfer ARN” (ARNt), asamblează o moleculă proteică.

O proteină este în esență un șir unidimensional de aminoacizi care se pliază într-un obiect tridimensional. Astfel de proteine ​​pliate sunt elementele de bază ale tuturor ființelor vii. Proteinele formează membri structurali, regulatori, apărători, catalizatori, comunicatori și pompe; mișcătorii și agitatorii tuturor organismelor vii. Instrucțiunile active de asamblare ale fiecărei proteine ​​sunt codificate într-un fir de ARNm. ADN-ul are o coloană vertebrală de dezoxiriboză și fosfat care susține o secvență alternativă de litere A, C, G și T, în timp ce mARN are o coloană vertebrală de riboză și fosfat care susține o secvență alternativă de litere A, C, G și U. Aceste diferențe structurale fac din ARNm o secvență liniară mai mobilă, care nu are tendința ADN-ului de a se înfășura și de a forma o dublă spirală.

Un grup de la Institutul Scripps din La Jolla, California, a făcut recent o schimbare semnificativă în aceste reguli de bază ale geneticii prin extinderea alfabetului genomului de la 4 litere la 6. Au folosit un truc care implică cloroplaste în plante, care au capacitatea de a importa nucleotide. din țesuturile înconjurătoare. Gena responsabilă de aceasta a fost identificată, iar grupul Scripps a extras acea genă dintr-o celulă de alge și a îmbinat-o în ADN-ul unei bacterii Escherichia coli.

Grupul Scripps identificase anterior o pereche „nenaturală” de nucleotide, d5SICSTP (X) și dMaMTP (Y), care au aproximativ aceeași dimensiune și pereche în același mod ca și nucleotidele naturale ale ADN-ului. În publicațiile anterioare au demonstrat că aceste nucleotide nenaturale s-au comportat ca perechi de nucleotide naturale, ar putea fi amplificate prin reacția în lanț a polimerazei (PCR) și ar putea fi transcrise cu precizie de la ADN la ARNm. În lucrarea de față au introdus un inel mic de ADN (o plasmidă) conținând o pereche de baze XY în genomul E. coli și au demonstrat, urmărind procesul prin 24 de cicluri de reproducere bacteriană, că mecanismul normal de replicare a celulelor a cauzat întotdeauna ADN care conține perechea de baze XY pentru a fi reprodus împreună cu celălalt material genetic al organismului. Lucrarea a fost realizată cu o singură pereche de baze X-Y adăugată la celulă, dar este de așteptat ca celulele cu multe astfel de perechi de baze să se reproducă în același mod.

Implicația acestei lucrări este că două litere au fost adăugate la alfabetul genomului, ducând la 6 x 6 x 6 sau 216 posibile combinații de cuvinte din 3 litere, astfel încât, chiar și cu redundanțe suplimentare și coduri de oprire, mai multe 3- sunt disponibile cuvinte cu litere pentru comandarea asamblării aminoacizilor în proteine. Codul natural al genomului din 4 litere permite utilizarea a doar 20 de aminoacizi ca componente proteice. Se estimează că, odată cu codul natural de 6 litere, în asamblarea proteinelor ar putea fi folosiți până la 172 de aminoacizi diferiți, ducând la un spectru mult mai bogat de proteine ​​posibile. Acest lucru are implicații mari pentru medicamentele de designer produse de bacterii și medicamentele de varietate, potență și eficacitate crescute.

Cum se stabilește legătura dintre noile cuvinte din 3 litere care conțin X și/sau Y și 152 de aminoacizi în plus? Aceasta este o posibilă problemă pentru orice utilizare a alfabetului extins. Conexiunea dintre codurile ARNm și aminoacizii este implementată prin molecule speciale de ARN de transfer (ARNt) prezente în citoplasma celulei. Acestea sunt catene de ARN destul de scurte care funcționează ca manipulatori de aminoacizi în procesul de sinteză a proteinelor. Molecula de ARNt are o secțiune specială care conține o secvență complementară care se potrivește și se ancorează cu codul ARNm din trei litere, iar molecula ARNT se termină cu o secvență care se atașează la o formă activată a aminoacidului specific la care codul de trei litere se referă. Aceste molecule de ARNt colectează aminoacizii lor desemnați, îi transportă la ribozom și participă la asamblarea lor într-o proteină.