Prelucrarea limbajului natural pSCANNER

Grupul de lucru pSCANNER Natural Language Processing (NLP) dezvoltă capacitatea de a permite schimbul și refolosirea unor cantități vaste de informații valoroase de sănătate derivate din textele clinice ale tuturor institutelor participante la pSCANNER. Mai exact, aceasta implică crearea unor instrumente NLP generalizate și scalabile pentru extragerea fenotipurilor celor trei condiții de utilizare (adică Insuficiență cardiacă congestivă, obezitate și gestionarea greutății și boala Kawasaki) și stocarea rezultatelor ca un depozit de date al fenotipurilor pacienților în schema OMOP NLP propus de grupul de lucru OHDSI NLP gata să susțină studiile clinice. În prezent, grupul de lucru oferă următoarele capacități NLP pentru site-urile participante la pSCANNER, precum și alte CDRN-uri în PCORnet. Vă rugăm să contactați [email protected] pentru detalii.

CLEAN cNLP Ensemble and Pipeline

Conducta de ansamblu NLP CLEAN (CLinical note rEview and ANnotation) este o platformă securizată, care păstrează confidențialitatea, pentru prelucrarea corpurilor mari de text clinic. CLEAN este capabil să asambleze diferite instrumente NLP într-un ansamblu care sinergizează puterea acestor instrumente pentru a maximiza calitatea rezultatului. CLEAN oferă, de asemenea, un instrument de adnotare interactiv care permite vizualizarea și revizuirea securizată a NLP, protejată de autentificarea în doi factori și de desktopul virtual. Aceste caracteristici se combină pentru a oferi extracție de înaltă calitate din corpusuri mari într-un interval de timp gestionabil.

CLEAN oferă următoarele servicii de procesare NLP:

De-identificare (de-ID)
De-duplicare
Extragerea elementelor de date
- CLAMP http://clamp.uth.edu/
- EFEx https://github.com/department-of-veterans-affairs/efex
- cTAKES http://ctakes.apache.org/
- MetaMap https://metamap.nlm.nih.gov/

Vă rugăm să contactați [email protected] pentru a utiliza CLEAN. Echipa CLEAN va colabora cu dvs. pentru a vă include instituția într-un RBI deja aprobat. Odată ce a fost aprobat, va fi creat un cont pentru a încărca, procesa și vizualiza în siguranță datele dvs. de text clinic.

Cadrul Leo

Infrastructura de procesare a limbajului natural (NLP) dezvoltată de VINCI este un set de servicii și biblioteci care facilitează crearea și implementarea rapidă a adnotatorilor Apache UIMA-AS axate pe procesarea limbajului natural. Suportul UIMA-AS permite Leo să gestioneze scala necesară procesării în timp real. Oferă instrumente de configurare la distanță pentru a permite optimizarea automată a sistemului. Cu utilitățile sale pentru dezvoltatori, funcționalitatea poate fi adăugată și integrată perfect cu serviciile NLP existente. Leo le permite utilizatorilor să genereze programatic descriptori ai motorului de analiză UIMA și descriptori de implementare.