CReM cadru de mutații rezonabile din punct de vedere chimic pentru generarea de structuri SpringerLink

Abstract

Generatoarele de structuri sunt utilizate pe scară largă în studiile de proiectare de novo și performanța lor influențează substanțial rezultatul. Abordările bazate pe modelele de învățare profundă și abordările convenționale bazate pe atomi pot duce la structuri nevalide și nu reușesc să abordeze problemele lor de fezabilitate sintetică. Pe de altă parte, abordările convenționale bazate pe reacții au ca rezultat compuși fezabili sintetic, dar noutatea și diversitatea compușilor generați pot fi limitate. Abordările bazate pe fragmente pot oferi atât o mai bună noutate, cât și o diversitate a compușilor generați, dar problema complexității sintetice a structurii generate nu a fost abordată în mod explicit înainte. Aici am dezvoltat un nou cadru de generare de structuri bazate pe fragmente care, prin proiectare, are ca rezultat structuri chimic valabile și oferă un control flexibil asupra diversității, noutății, complexității sintetice și chimiotipurilor compușilor generați. Cadrul a fost implementat ca un modul Python open-source și poate fi utilizat pentru a crea fluxuri de lucru personalizate pentru explorarea spațiului chimic.

crem

Introducere

Spațiul chimic asemănător drogurilor este foarte mare - dimensiunea sa estimează în

10 33 compuși [1]. În viitorul apropiat, va fi imposibil să enumerăm acest spațiu sau să efectuăm orice fel de căutare exhaustivă. Prin urmare, metodele și strategiile de explorare a acestui spațiu atrag în mod eficient un interes viu de cercetare. Una dintre strategiile populare este proiectarea de novo - generarea bazată pe modele de noi structuri chimice cu proprietăți anticipate promițătoare [2, 3]. Există două strategii majore de generare a structurilor: (i) generarea iterativă de structuri pentru a se potrivi predicțiilor modelului și (ii) generarea de structuri care au un set dorit de proprietăți direct prin modele de învățare automată (ML) (de exemplu QSAR invers sau rețele neuronale generative).

Prima strategie este utilizată pe scară largă și multe studii descriu diferite scheme de implementare [4,5,6,7,8,9]. Fluxul general de lucru include: (i) generarea sau selectarea structurilor inițiale, (ii) evaluarea structurilor generate de modelul (modelele) (QSAR, andocare, farmacofori etc.), (iii) selectarea celor mai promițători candidați, iv ) generarea de noi structuri bazate pe cele selectate și revenirea la pasul (ii). Această procedură se repetă până când sunt generați compuși cu proprietăți dorite. Etapele de generare a structurii și de estimare a proprietății sunt separate în acest caz. Deci, se poate utiliza orice combinație de abordări de generare a structurilor și modele in silico pentru a prezice proprietățile compușilor. Putem împărți abordările convenționale în trei grupuri: generatori de structuri bazate pe atomi, bazate pe fragmente și bazate pe reacții, fiecare având avantajele și problemele sale (Tabelul 1).

Abordările bazate pe atom reprezintă metode „ab initio” printre generatorii de structuri și utilizează reguli simple precum „adăugare/eliminare/înlocuire atom/legătură” pentru a modifica structurile de intrare și a genera altele noi [10]. Teoretic, ar trebui să fie posibil să se genereze fiecare structură posibilă folosind aceste reguli, ceea ce poate avea ca rezultat o noutate ridicată și o diversitate a structurilor enumerate. Cu toate acestea, vor fi necesari o mulțime de pași de generație, rezultând o explozie combinatorie. Prin urmare, abordările bazate pe atomi se potrivesc mai bine pentru explorarea sistematică a unui spațiu chimic local. Validitatea chimică trebuie controlată suplimentar în timpul generării structurii pentru a evita modificările structurale eronate. Cu toate acestea, problema principală a abordărilor bazate pe atomi este fezabilitatea sintetică, care nu poate fi controlată pe parcursul generației și poate duce la structuri sintetic mai puțin accesibile. Din câte știm, există o singură implementare a generatorului bazat pe atomi - Molpher [10].