Întrebări frecvente Institutul European de Bioinformatică


În consorțiul GO, există o serie de baze de date model de organisme care sunt sursa autoritară a adnotărilor GO pentru speciile lor respective. Aceste grupuri integrează, de asemenea, adnotări din alte surse, inclusiv GOA (o resursă multi-specie) în mod regulat.

specifice speciei

GOA oferă, de asemenea, o serie de fișiere specifice speciilor pentru om, șoarece, șobolan, pește zebră, Arabidopsis, pui, câine, vacă, porc, Dictyostelium, vierme, drojdie și Drosophila. Adnotările din aceste fișiere se bazează pe intrări în proteomul de referință centrat pe genă UniProtKB (GCRP), complexe proteice (Portal complex) și ARN-uri necodificatoare (RNACentral). GOA integrează adnotări manuale de la toate celelalte grupuri GO Consortium, precum și o serie de grupuri de adnotări externe în care identificatorul de produse genetice adnotate poate fi mapat la unul dintre cei trei identificatori pe care îi acceptăm (UniProtKB, Complex Portal și RNACentral ID-uri).
Atât grupul de organisme model, cât și fișierele specifice speciilor GOA sunt disponibile pe site-ul nostru FTP.

2. De ce nu pot vedea o adnotare într-o înregistrare UniProtKB când apare în fișierul de asociere genică?


Ar putea exista o serie de motive pentru aceasta:

A. Dacă se pare că lipsește o adnotare manuală:

Dacă adnotarea GO a fost creată recent, este posibil ca UniProtKB să nu fi făcut încă referință încrucișată; poate exista un decalaj de până la 3 luni.

B. Dacă se pare că lipsește o adnotare electronică:

Dacă vă uitați la o intrare curată UniProtKB (adică una din secțiunea Swiss-Prot din UniProtKB), atunci nu toate afișările electronice sunt afișate aici. Sunt incluse doar adnotările din anumite metode, cum ar fi mapările HAMAP2GO și EC2GO.

În plus, seturile de adnotări GO afișate în UniProtKB sunt filtrate pentru a încerca să ofere un set cuprinzător, dar concis de referințe încrucișate. Pentru a trece de la înregistrarea UniProtKB la browserul QuickGO (care va afișa cel mai actualizat și complet set de adnotări manuale și electronice pentru o proteină) faceți clic pe linkul „[Vizualizați adnotarea completă GO pe QuickGO]” la partea de jos a secțiunii de referințe încrucișate GO a intrării UniProtKB.

Cu toate acestea, dacă niciunul dintre aceste motive nu se aplică adnotării dvs. lipsă, vă rugăm să ne informați și vom investiga!

3. De ce sunt diferite fișierele specifice speciei și fișierul de asociere a genelor multi-specie UniProt?


Fișierul de asociere a genei GOA UniProt conține toate adnotările manuale și electronice pe care GOA le-a atribuit intrărilor UniProtKB. Acest set de date conține adnotări la peste 800.000 de specii diferite (https://www.ebi.ac.uk/GOA/uniprot_release) și este redundant pentru adnotările electronice în care două metode electronice diferite au atribuit același termen GO sau mai puțin granular.

Fișierele specifice speciei sunt create folosind seturile complete de proteomi de referință pentru a determina compoziția proteinelor fișierelor. Fișierele specifice speciei pot conține adnotări atât pentru accesările UniProtKB revizuite (Swiss-Prot), cât și pentru cele nerevizuite (TrEMBL). Orice utilizator care dorește să identifice doar subsetul de adnotări proteice UniProt revizuit (Swiss-Prot) va putea continua să facă acest lucru folosind informațiile furnizate în fișierul gp_information.goa_uniprot, care pot fi găsite aici; ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/gp_ .