I2b2 Provocarea obezității Nu este necesară învățarea automată; Blog LingPipe

Am participat la workshopul i2b2 Obesity Challenge în weekend, unde sistemele cu cele mai bune performanțe din toate valorile erau în principal sisteme bazate pe reguli construite manual. Ziarele mi-au dat un sentiment de deja vu; nu au fost construite doar la fel ca sistemele expert din anii 1970 (cum ar fi Mycin), ci au fost motivate de dorința unor concluzii explicabile. Adică, un clinician va trebui să verifice rezultatele aparatului, iar regulile sunt ușor de înțeles.

Sarcina a fost de a clasifica (anonimizate) rezumate ale externării pacienților din Centrul de Greutate al Spitalului General Massachussetts pentru pacienții cu risc de obezitate sau diabet, dacă aceștia erau de fapt obezi și dacă aveau alte 15 comorbidități, cum ar fi diabetul, boala coronariană, congestivele. insuficiență cardiacă, gută și apnee în somn. Aceste rezumate de descărcare de gestiune sunt lungi de sute de propoziții și discută despre toate, de la istoricul familial și istoricul medical al pacientului la rapoartele de teste de laborator și listele de prescripții.

Cele mai performante sisteme de învățare automată care au tratat documentele ca niște simple pungi de cuvinte au învățat reguli precum Ripper și copacii de decizie. Clasificatorii liniari s-au comportat cel mai bine folosind primele câteva caracteristici (de obicei extrase prin măsurarea câștigului de informații, care este entropia de clasificare minus entropia condițională dată fiind caracteristica).

În ceea ce privește extragerea caracteristicilor și analiza documentelor, zonarea a ajutat cu adevărat. Secțiunea de istorie familială (destul de ușor extrasă în aceste date) a fost o sursă comună de fals-pozitive pentru bolile pentru sistemele naive. Al doilea pas important a fost importul dicționarelor de sinonime și abrevieri pentru medicamente și boli. Am văzut o mulțime de utilizare a resurselor precum UMLS și RxNorm pentru asta. Având în vedere că sarcina avea categorii da/nu/necunoscute, toată lumea se aștepta ca abordări precum ChapEx NegEx să aibă un impact mai mare decât au avut (deși o echipă a obținut mai mult kilometraj personalizând NegEx cu un dicționar specializat pentru sarcina obezității).

Toate acestea indică diferența dintre această sarcină și alte sarcini de clasificare, cum ar fi sentimentul general, subiectul, identificarea limbajului - este mai mult o problemă de extragere a informațiilor decât o problemă de clasificare a textului complet. În acest sens, este ca extragerea sentimentului orientată spre aspect.