Adnotarea caracteristicilor conservate și noi ale transcriptomilor primatelor utilizând secvențierea genomului biologiei
Abstract
Secvențierea recentă de mare capacitate a transcriptomilor creierului și ficatului cimpanzeului publicată în Biologia genomului dezvăluie mai multe transcrieri pierdute în genomul uman și evidențiază incompletitudinea adnotărilor genomului primatului.

Evidențierea cercetării
Finalizarea genomului uman a fost urmată de secvențierea genomului speciilor de primate strâns legate, cum ar fi cimpanzeul și macacul resus. Motivația a fost simplă: deoarece genomul a furnizat planul unui organism, comparațiile dintre genomul uman și genomul primatelor neumane ar trebui să dezvăluie trăsăturile genomice care stau la baza fenotipului uman.
O problemă cu această abordare, totuși, este că un genom nu este într-adevăr un plan al unui fenotip, ci mai degrabă un mesaj bine amestecat, în care secvențe relevante din punct de vedere funcțional se pierd într-o mare de informații fenotipice neutre. O modalitate aparent simplă de identificare a secvențelor funcționale este determinarea regiunilor transcrise. Aceasta nu este o sarcină simplă, totuși, deoarece transcriptomul variază foarte mult în funcție de tipurile de celule și se schimbă dramatic de-a lungul duratei de viață a unui organism. Astfel, în ultimul deceniu, s-a depus un efort mare în adnotarea transcriptomului uman, în principal prin secvențierea transcrierilor convertite în biblioteci de ADNc prin secvențierea convențională Sanger. Ca rezultat, a devenit clar că, având în vedere acoperirea suficientă a secvențierii, aproape orice secvență genomică poate fi detectată la nivelul transcriptomului [1]. Acest lucru nu este deloc surprinzător, deoarece genele umane conțin frecvent introni lungi; în plus, ARN polimeraza poate genera transcripții spontane fără relevanță funcțională. Totuși, acest rezultat a indicat că împărțirea genomului în părți transcrise și non-transcrise pentru a determina funcționalitatea a fost în mare parte inutilă.
Aceste proiecte de secvențiere ADNc au arătat, de asemenea, că limitele majorității genelor umane, inclusiv site-urile de pornire și terminare a transcripției și modelele de îmbinare a exonilor interni, sunt destul de neclare [2-6]. În plus, multe dintre transcrierile identificate și izoformele genetice s-au dovedit a fi rare. Acest lucru nu înseamnă, totuși, că acestea sunt irelevante din punct de vedere funcțional, deoarece astfel de transcrieri pot avea roluri importante într-un număr limitat de celule dintr-un țesut sau într-un stadiu specific de dezvoltare. Mai mult, mulți regulatori importanți, cum ar fi factorii de transcripție, sunt exprimați la niveluri scăzute. Ca urmare, adnotarea transcriptomului uman actual reprezintă un anumit compromis între încredere și cuprinzătoare și conține transcrieri identificate cu diferite grade de încredere. Dificultatea în compilarea unei astfel de adnotări este ilustrată cel mai bine de diferențele care există între RefSeq, Ensembl, Universitatea din California Santa Cruz (UCSC) Genome Browser, Vega Genome Browser și o bază de date integrată de gene și transcrieri umane (H-Invitational Database ): se constată o suprapunere medie de 60 până la 70% comparând oricare dintre aceste două baze de date de adnotări.
O altă modalitate de a determina transcrierile relevante funcțional este de a cere ca expresia unei transcrieri date să fie conservată între specii. Alternativ, dacă cineva este interesat de loci importanți pentru fenotipul uman, s-ar putea identifica regiuni cu profiluri de transcripție specifice omului. Cu toate acestea, adnotarea transcriptomului primatelor neumane este practic inexistentă și ceea ce este prezent se bazează în totalitate pe cartarea adnotării umane la genomii primatelor respective. Deoarece adnotarea transcriptomului uman în sine este departe de a fi cuprinzătoare, iar calitatea genomului primatului neuman este mult mai proastă decât calitatea genomului uman, o astfel de adnotare bazată pe cartografiere nu este lipsită de probleme. Dar, cel mai important, chiar dacă această metodă ar putea permite identificarea transcrierilor prezente la om și absente la alte primate, nu permite identificarea transcrierilor pierdute din descendența umană.