IJMS Free Full-Text K-meruri unici ca coduri de bare specifice tulpinii pentru analize filogenetice și naturale

Mărimea „genomurilor unice” reprezentate de k-meri de lungimi diferite pentru opt cromozomi individuali de E. coli și gradul de intersecție a acestora exemplificat de trei genomi indicați. (a) Liniile solide arată numărul normalizat la 1 Mbp în fiecare genom de k-meri (N), găsit în cromozomii E. coli (tulpini: K-12 MG1655, ETEC H10407, O26: H11 pp. 11368, ABU 83972, APEC O78, pp. 042, O157: H7 pp. EC4115 și O7: K1 pp. CE10) care sunt absente în secvențele de nucleotide din baza de date de referință. Liniile întrerupte arată curbele de incrementare reprezentate pentru ΔN/Δ k. (b) Diagrama Venn care ilustrează intersecția dintre seturile de 18-mer identificați în genomul a două bacterii din grupa A (E. coli K-12 MG1655 și ETEC H10407) și E. coli O26: H11 p. 11368, aparținând grupei B1. Numărul de 18-meri unici în fiecare genom, mărimea setului lor comun și intersecția dintre cele două seturi ale grupului A sunt indicate fără normalizare. Diagrama a fost creată folosind un Venn Diagram Maker [54].

free

Arborele filogenetic pentru 124 de tulpini de E. coli deduse din secvențe aliniate concatenate de 27 de gene din programul IQ-TREE [70] folosind metoda maximă probabilitate. Modelul optim pentru substituția nucleotidică a fost GTR + G + I (modelul general reversibil în timp presupunând o porțiune fixă ​​a siturilor invariante și diferențele de rată evolutivă descrise de distribuția gamma). Nivelul de suport al ramurilor prezentat în procente a fost estimat pe baza a 2000 de iterații cu aproximare de bootstrap ultrarapidă [71]. Bara de scară corespunde numărului de substituții de nucleotide pe sit. Codul de culoare corespunde celor opt filogrupuri indicate. Numele tuturor tulpinilor sunt indicate lângă ramurile corespunzătoare și separate cu virgulă pentru secvențe identice din grupul B1.