Dovezi că genele implicate în semnalizarea arici sunt asociate atât cu tulburarea bipolară, cât și
Subiecte
Abstract
Introducere
Tulburarea bipolară (BD) este o boală psihiatrică cronică și invalidantă, cu o prevalență de 0,8-1,2% în populația generală 1, caracterizată prin episoade maniacale și depresive recurente. Fiind caracterizat de rate ridicate de comorbiditate fizică și risc crescut de sinucidere, BD este asociată cu scăderea speranței de viață și creșterea mortalității prin toate cauzele și, prin urmare, este o povară socio-economică majoră 2 .
În studiul de față, am profitat de seturile de date GWAS disponibile public pentru a efectua analize bazate pe gene, precum și meta-analize încrucișate care vizează (1) identificarea genelor asociate în mod obișnuit cu BD și IMC sau BD și T2D și (2) ) investigarea dacă genele împărțite între aceste condiții sunt îmbogățite pentru căile implicate anterior în fiziopatologia BD sau în mecanismul de acțiune al medicamentelor utilizate pentru tratarea BD.
Material si metode
Probă
Prezentul studiu a fost realizat pe baza statisticilor sumare a trei mari seturi de date publice GWAS. Statisticile sumare includ toate SNP-urile care au fost analizate, împreună cu dimensiunile efectului calculate. Evaluarea genelor asociate BD a fost efectuată utilizând statistici de sinteză din cel mai mare GWAS realizat de Grupul de lucru pentru tulburarea bipolară a consorțiului psihiatric de genomică (PGC) până în prezent 37. Setul de date a inclus rezultate GWAS din analize de regresie logistică pe peste 13,4 milioane de SNP-uri autozomale pe 20.352 cazuri BD conform criteriilor DSM-IV, ICD-9 sau ICD-10 și 31.358 controale de descendență europeană. Caracteristicile detaliate ale fiecărei cohorte incluse au fost descrise în lucrarea lui Stahl și colegii săi 37. Mai mult, pentru a identifica genele asociate cu T2D, am folosit setul de date Etapa 1 meta-analiză DIAGRAM 1000G GWAS, incluzând 26.676 de cazuri T2D și 132.532 controale caucaziene din 18 studii 38. Criteriile pentru diagnosticul T2D au diferit între studii și au inclus diagnosticul auto-raportat al diabetului de către un medic, utilizarea auto-raportată a medicamentelor pentru tratarea diabetului, glucoza de post ≥ 7,0 mmol/l sau glucoza non-post ≥ 11,1 mmol/l, hemoglobina A1c (HbA1c)> = 6,5% 38. Acest set de date a raportat statistici rezumative ale asociației pentru peste 12,06 milioane de SNP-uri autozomale.
În cele din urmă, genele asociate cu IMC au fost investigate folosind setul de date meta-analiză GWAS plus Metabochip din GIANT Consortium 39. Acest set de date a inclus statistici de asociere sumară a 322.154 subiecți de origine europeană. Participanții au fost recrutați din 125 de studii (82 cu GWAS și 43 cu rezultate Metabochip). În acest set de date, peste 2,47 milioane de variante autotipice genotipate sau imputate au fost testate pentru asocierea cu reziduuri BMI transformate în regresii liniare, presupunând un model genetic aditiv 39 .
Analiza bazată pe gene
Pentru fiecare dintre cele trei seturi de date, a fost efectuată o analiză bazată pe gene cu MAGMA 40, utilizând platforma FUMA 41. MAGMA este un instrument pentru analiza genelor care estimează statisticile bazate pe gene, luând în considerare dezechilibrul de legătură (LD) al SNP-urilor incluse. LD a fost estimat folosind panoul european al datelor de fază 3 1000 genomi ca referință 42. Locațiile genelor care codifică proteinele au fost definite ca regiunile de la locul de pornire a transcrierii la locul de oprire a transcripției (opțiune implicită în MAGMA). În cazul în care un set de date a raportat informații despre calitatea imputării sau frecvența alelei minore (MAF), SNP-urile cu scorul calității imputării 43 folosind funcția p.adjust în R 44. Testul hipergeometric a fost utilizat pentru a evalua supra-reprezentarea genelor semnificativ asociate cu BD și IMC sau T2D după corecția testării multiple. Analizele au fost efectuate folosind R v. 3.6.1 (ref. 44).
Analiza căii
Îmbogățirea pentru termenii non-redundanți ai Ontologiei genetice (GO) și căile Reactome printre genele asociate în mod obișnuit cu BD și IMC, BD și T2D sau toate cele trei fenotipuri a fost evaluată folosind instrumentul de analiză funcțională de îmbogățire funcțională WebGestalt (www.webgestalt.org/). Pentru a include cel mai mare număr de gene potențial relevante în analiza căii, am folosit lista genelor asociate nominal cu trăsăturile intereselor, cu o 45. Pentru această analiză, scorul de interacțiune a fost stabilit la o încredere ridicată (scor = 0,7) și au fost incluse toate sursele de interacțiune active susținute de instrument (extragerea textului, experimente, baze de date, coexpresie, vecinătate, fuziune genică și co-apariție).
Metaanaliza și efectele funcționale ale SNP-urilor asociate cu BD și IMC sau T2D
Pentru a identifica SNP-uri specifice asociate cu BD și IMC sau T2D, am realizat două meta-analize între BD și IMC, precum și BD și T2D folosind Metasoft 46. Acest software oferă estimări ale efectului, estimări ale eterogenității, precum și o probabilitate posterioară ca un efect să existe în fiecare studiu (m-statistici valorice> 0,9). Cele două meta-analize au fost realizate cu un model conservator cu efect aleatoriu utilizând aceeași listă de SNP-uri ale analizei bazate pe gene ca input. Pentru ambele meta-analize, am selectat SNP-uri cu o meta-analiză 0,9 și a 47. Dintre SNP-urile prezise de RegulomeDB care afectează probabil legarea factorilor de transcripție (scor 48. În cele din urmă, prezența SNP-urilor localizate în gene potențial drogabile a fost investigată folosind baza de date de interacțiune cu genele medicamentoase (DGIdb) 49 .
Rezultate
Analiza bazată pe gene
O diagramă a analizelor este raportată în Fig. Suplimentară. 1. Un total de 2.013.566 SNP-uri care au trecut controlul calității și au fost prezente în toate seturile de date au fost utilizate ca input pentru analiza bazată pe gene. Aceste SNP-uri au permis efectuarea unei analize bazate pe gene pentru 17.455 de gene. Analizele genetice efectuate cu MAGMA au identificat 2700, 2144 și 1988 gene asociate nominal cu BD, IMC și respectiv T2D. Dintre acestea, un total de 579, 549 și 173 au fost semnificative după corecția testelor multiple cu BH, respectiv.
La compararea celor trei liste, s-a constatat că 518 gene sunt asociate în mod obișnuit cu BD și IMC, dintre care 52 au fost semnificative după corecția testării multiple (Tabelul 1 suplimentar). Numărul de gene asociate cu ambele fenotipuri a fost de 2,86 ori mai mare decât se aștepta pe baza rezultatelor testului hipergeometric ( = 9.4E - 12, Tabelul suplimentar 2). În ceea ce privește BD și T2D, 390 de gene au fost asociate cu ambele fenotipuri, dintre care 12 au fost semnificative după corecția testării multiple (Tabelul suplimentar 3). Numărul de gene suprapuse a fost de 2,09 ori mai mare decât se aștepta pe baza rezultatelor testului hipergeometric ( = 0,01, tabelul suplimentar 2). În mod similar, genele asociate cu BD au fost îmbogățite pentru țintele asociate fie cu IMC, fie cu T2D ( = 2.6E - 12, tabelul suplimentar 2). În cele din urmă, 93 de gene, dintre care trei au fost semnificative după corecția testării multiple, au fost asociate cu toate fenotipurile investigate (Tabelul suplimentar 4). Genele asociate cu BD nu au fost îmbogățite semnificativ pentru țintele asociate atât cu IMC, cât și cu T2D ( = 0,076, Tabelul suplimentar 2).
Analize ale căilor
Analizele efectuate utilizând WebGestalt au arătat că genele asociate în mod obișnuit cu BD și IMC au fost îmbogățite pentru un termen GO cu componentă celulară: corpul celular neuronal ( = 0,0001; rata de descoperire falsă (FDR) = 0,025) (Tabelul 2). În plus, genele asociate în mod obișnuit cu BD și IMC au fost îmbogățite pentru 12 căi (Tabelul suplimentar 5). Metoda de acoperire a setului ponderat implementată de WebGestalt, care reduce redundanța seturilor de gene, a confirmat o asociere semnificativă pentru patru dintre aceste căi: hemostază, semnalizare prin arici, interacțiuni L1CAM și semnalizare prin fuziuni BRAF și RAF (Tabelul 2), precum și pentru termenul GO. Am explorat în continuare interacțiunile potențiale dintre proteinele codificate de cele 518 gene asociate în mod obișnuit cu BD și IMC folosind STRING. Această analiză a arătat că rețeaua de proteine codificate de aceste gene a prezentat un număr de interacțiuni mai mare decât se aștepta pentru un set aleatoriu de proteine de dimensiuni similare extrase din genom (numărul așteptat de margini: 332; numărul de margini observat: 392; Îmbogățirea PPI = 0,0007, Fig. 1), susținând ipoteza că proteinele codificate de gene asociate în mod obișnuit cu BD și IMC ar putea fi legate biologic.