Identificarea trăsăturilor predictive ale tulburărilor din spectrul autist într-un eșantion clinic de adolescenți

Subiecte

Abstract

Introducere

Materiale și metode

Eșantion de date și preprocesare

Studiul a fost realizat ca parte a ASD-Net, o rețea de cercetare cu accent pe ASD, finanțată de ministerul federal german al educației și cercetării 44. Toate datele despre participanți au provenit din patru clinici ambulatorii specializate pentru TSA din Germania, unde au fost aplicate procedurile actuale de diagnostic standard pentru confirmarea sau excluderea unui diagnostic de TSA. Toți participanții au fost direcționați de specialiști sau autorizați la secțiile de ambulatoriu. Datele participanților au fost colectate retrospectiv din fișele medicale ale clinicii respective (revizuirea retrospectivă a diagramelor) și combinate într-un singur set de date pentru analiză. Această procedură a fost aprobată de comitetul de etică Charité - Universitätsmedizin Berlin (EA4/129/19) și datorită naturii retrospective a colectării și analizei datelor bazate pe date clinice obținute în mod curent, necesitatea consimțământului informat a fost renunțată de comitetul de etică local. Toate metodele au fost efectuate în conformitate cu ghidurile și reglementările instituționale și internaționale de cercetare relevante.

Procedura de diagnostic a implicat o observare standardizată a comportamentului în toate cazurile (ADOS Module 4 10), un interviu standardizat dacă informațiile părintești erau disponibile (ADI-R 12; îngrijitorii erau disponibili în 62% din toate cazurile (ASD: 71%, non -ASD: 50%)) și un examen diferențial de diagnostic (chestionare structurate stabilite și interviuri clinice structurale utilizate frecvent în țările vorbitoare de limbă germană), care au ajutat clinicienii instruiți și cu experiență în atingerea unui diagnostic clinic cu cea mai bună estimare. Au fost disponibile evaluări multiple pentru unele dintre cazuri, cu toate acestea, doar cea mai recentă evaluare a fost luată în considerare pentru fiecare caz.

Eșantionul nostru a inclus date din 673 de cazuri, dintre care 57% au primit un diagnostic de ASD („ASD”, n = 385) și 43% nu au primit un diagnostic de ASD, dar diagnostice diferențiale relevante, cum ar fi tulburările afective, tulburările de anxietate, ADHD și/sau tulburări de personalitate sau niciun diagnostic psihiatric actual („non-ASD”, n = 288; pentru o descriere mai detaliată a diversității fenotipice vezi Tabelul suplimentar 1). Subtipurile ASD conform ICD-10 (F84.0, F84.1, F84.5) au fost grupate împreună, oferindu-ne o măsură binară a rezultatului claselor „ASD” și „non-ASD” pentru procedurile noastre de învățare automată. Nu a existat nicio diferență semnificativă între cele două grupuri în ceea ce privește vârsta, sexul și coeficientul de inteligență (Tabelul 1).

ADOS este o scară de observație standardizată concepută pentru a surprinde comportamente social-comunicative importante și trăsături comportamentale stereotipe și repetitive 10. În modulul 4, care este destinat adolescenților și adulților fluenți verbal, aceste aspecte sunt codificate pe 31 de elemente diferite. Codurile cad pe o scară ordinală de la 0 (fără anomalii legate de autism) la 2 (dovezi certe de anomalie) și uneori 3 (severitate profundă), cu coduri suplimentare de 7 și 8 pentru comportament anormal sau comportament care nu este prezentat în timpul observării și un cod de 9 pentru valorile lipsă (adică răspunsurile omise sau lăsate necompletate).

Modulul 4 ADOS oferă un algoritm de notare care constă dintr-un subset al celor 11 elemente diagnostice cele mai informative (a se vedea Tabelul 2) din domeniile Interacțiune socială și comunicare pentru calcularea unui scor de comparație, care produce o clasificare a instrumentului de autism, spectru autist sau non -spectru.

Pentru preprocesarea datelor pentru analizele noastre de învățare automată, am recodificat codurile ADOS de la 3 la 2 și codurile de la 7 și 8 la manualul analog ADOS. Valorile lipsă (adică codurile de 9) au fost imputate folosind k imputarea celui mai apropiat vecin cu k = 5knnImpute) folosind built-in-ul preproces () funcția din pachetul caret R 45. În setul nostru de date, șase articole lipseau în 4-10% din toate cazurile (articolele A6, B4, C1, E1, E2, E3), cu toate celelalte articole lipseau răspunsurile în mai puțin de 2,5% din cazuri (pentru un detaliu mai detaliat) descriere privind distribuția codurilor ADOS și a valorilor lipsă în eșantionul nostru, consultați Tabelul suplimentar 2). În plus, toate variabilele numerice au fost normalizate pentru a varia [0; 1].

Învățare automată

Experimentele anterioare de clasificare au folosit diverse tehnici de învățare automată, inclusiv mașini vectoriale de suport, modele bazate pe copaci și modele liniare generale 32. În aceste publicații anterioare, mașinile vectoriale de suport (SVM) s-au numărat printre modelele care au avut cele mai bune performanțe 36,41,42. Mai mult, SVM este unul dintre algoritmii cei mai frecvent utilizați, care a fost utilizat pentru clasificarea ASD datorită puterii sale predictive ridicate 32. Prin urmare, am decis să folosim clasificarea SVM cu nucleul radial folosind svmRadial al pachetului caret R 45 ca clasificator de învățare automată. Am efectuat o analiză suplimentară folosind pădure aleatorie, care a arătat o performanță predictivă ușor mai mică. Datorită constrângerilor de lizibilitate și spațiu, prezentăm doar rezultate pentru SVM. Rezultatele analizei noastre forestiere aleatorii pot fi găsite în supliment (a se vedea tabelul suplimentar 3).

Toate cele 31 de articole ADOS au fost utilizate ca trăsături, iar diagnosticul clinic cel mai bine estimat al indivizilor a fost utilizat ca clasă de predicție (ASD vs. non-ASD). Toate etapele inspecției și preprocesării datelor, inclusiv imputarea și analiza, au fost efectuate folosind versiunea R 3.5.1 în Rstudio 1.1.456.

Pentru a compara performanțele modelului, am evaluat ASC ale predicțiilor obținute din noul nostru set de caracteristici reduse vs. toate cele 31 de articole din ADOS vs. subsetul de 11 itemi propuși de algoritmul ADOS. În plus, am comparat modelul de performanță cu clasificatorul cu 12 articole identificat anterior de Kosmicki și colegii 41 în experimentele lor privind copiii și adolescenții, astfel cum au fost evaluați cu modulul ADOS 3 (pentru o listă a acestor articole, vezi Tabelul 2). Pentru evaluarea diferențelor în ceea ce privește ASC, ne-am bazat pe testul 48 al DeLong pentru două curbe ROC corelate, precum și pe un test de semnificație a reeșantionării bootstrap 49,50 pentru două curbe ROC corelate (comparând de fiecare dată suprapunerea intervalelor de încredere cu 10.000 de iterații bootstrappate).