O metodă pentru codificarea seturilor de date clinice cu SNOMED CT BMC Medical Informatics și luarea deciziilor

Abstract

fundal

În ultimul deceniu a existat un număr tot mai mare de literatură despre modul în care Nomenclatura sistematizată a termenilor clinici de medicină (SNOMED CT) poate fi implementată și utilizată în diferite setări clinice. Cu toate acestea, pentru cei însărcinați cu încorporarea SNOMED CT în aplicațiile clinice și sistemele de vocabular ale organizației lor, există puține instrucțiuni detaliate de codificare și exemple disponibile pentru a arăta cum se poate face acest lucru și problemele implicate. Această lucrare descrie o metodă euristică care poate fi utilizată pentru a codifica termeni clinici în SNOMED CT și o ilustrare a modului în care a fost aplicată pentru a codifica un set de date de îngrijire paliativă existent.

Metode

Procesul de codificare implică: identificarea elementelor de date de intrare; curățarea elementelor de date; codificarea articolelor de date curățate; și exportarea termenilor codificați ca seturi de termeni de ieșire. Sunt produse patru ieșiri: setul de referință SNOMED CT; set de terminologie a interfeței; Set de extensii SNOMED CT și set de termeni necodificabili.

Rezultate

Baza de date originală de îngrijire paliativă conținea 211 elemente de date, 145 valori codificate și 37.248 valori de text liber. Am putut codifica

84% din termeni, altul

8% necesită codificare și verificare suplimentară, în timp ce termenii care aveau o frecvență mai mică de cinci nu erau codați (

Concluzii

Din pilot, s-ar părea că metoda noastră de codificare SNOMED CT are potențialul de a deveni o abordare de codificare a terminologiei cu scop general, care poate fi utilizată în diferite sisteme clinice.

fundal

Această lucrare descrie o metodă euristică care poate fi utilizată pentru a codifica termeni clinici în SNOMED CT și o ilustrare a modului în care a fost aplicată pentru a codifica un set de date de îngrijire paliativă existent. Metoda de codificare a fost dezvoltată pentru prima dată ca parte a unui proiect de masterat și de atunci a fost extinsă prin mai multe studii la scară mică cu diferite seturi de date clinice [7] și alte analize nepublicate. Această metodă a fost perfecționată în continuare printr-un proiect-pilot de un an pentru a codifica termenii clinici dintr-un sistem existent de informații de îngrijire paliativă într-o organizație canadiană de asistență medicală în SNOMED CT.

Contextul proiectului

Scopul proiectului, „Un sistem de informații bazat pe standarde de îngrijire paliativă (PCIS) pentru serviciile de sănătate din Alberta, zona Edmonton”, a fost de a explora adoptarea, utilizarea și impactul SNOMED CT. Obiectivele includeau crearea unui subset de îngrijire paliativă SNOMED CT, îmbunătățirea PCIS cu SNOMED CT și determinarea impactului asupra calității îngrijirii, inclusiv satisfacția clinicianului și procesele de management al schimbărilor. Deoarece nu am avut o listă predefinită de termeni pentru codificare cu SNOMED CT, o parte a procesului de dezvoltare a subsetului de îngrijire paliativă a fost explorarea elementelor de date din PCIS care ar putea fi codificate cu SNOMED CT. Deoarece detaliile proiectului pilot sunt publicate în altă parte, această lucrare se concentrează doar pe descrierea metodei de codificare care a fost utilizată pentru a obține subsetul de îngrijire paliativă. Acest proiect a avut aprobarea de etică atât a Regiunii de sănătate a capitalei Edmonton - Health Research Ethics Board (Health Panel, protocol Pro00005461), cât și a University of Victoria Human Ethics Board (protocol 09-182).

Schemele bazei de date, codurile permise și intrările anonimizate cu text liber au fost extrase din PCIS. PCIS are două câmpuri de date, „diagnostic” și „problemă la recomandare”, care sunt utilizate pentru a codifica rezultatele clinice ale pacienților. Există 20 de diagnostice predefinite și 14 probleme predefinite la recomandare care ar putea fi selectate dintr-o listă de selecție. Șaisprezece dintre diagnostice se referă la categorii de cancer (de exemplu, "os și țesut conjunctiv", "melanom" și "ochi, creier și alte părți ale sistemului nervos central") în timp ce patru se referă la categorii non-canceroase (de exemplu, neuromusculare, cardiopulmonare), boli infecțioase și altele). Problema predefinită la sesizare include constatări precum „durere”, „delir”, „greață/vărsături” și „astenie”. Orice detalii suplimentare au fost înregistrate în câmpurile de text liber etichetate ca informații suplimentare. Întrucât au existat doar 34 de articole de listă de selecție predefinite, marea majoritate a acestor informații au fost înregistrate ca text liber. O mostră de captură de ecran a PCIS este prezentată în Figura 1. Pentru acest pilot, a fost utilizată versiunea de lansare internațională 31 iulie 2008 a SNOMED CT.

Captură de ecran a ecranului „Detaliu de caz” al sistemului informațional de îngrijire paliativă.

Metodă

Metoda noastră euristică de codificare CT SNOMED are patru părți: (a) identificarea elementelor de date de intrare; (b) curățarea elementelor de date; (c) codificarea elementelor de date curățate; și (d) exportul termenilor codificați ca seturi de termeni SNOMED CT. O imagine de ansamblu a acestei metode este prezentată în Figura 2. Trei instrumente software sunt utilizate în procesul de codificare - un algoritm de potrivire a loturilor, CliniClue Browser și Microsoft Excel. Algoritmul de potrivire a lotului reduce cantitatea de lucru manual prin automatizarea potrivirii articolelor de date curățate cu SNOMED CT, browserul CliniClue este utilizat pentru a căuta manual concepte, în timp ce Microsoft Excel este utilizat pentru a vizualiza rezultatele.

O prezentare generală a metodei de codare SNOMED CT.

Identificarea elementelor de date de intrare

Identificarea elementelor potențiale de date care trebuie codificate

Primul pas este identificarea potențialelor elemente de date din sursa bazei de date pentru codificare. Există trei tipuri: elemente de date, valori codificate și valori de text liber. Elementele de date se referă la numele câmpurilor de intrare sau pot fi considerate ca o întrebare (de exemplu, „Diagnostic”, ca în „Care este diagnosticul pacientului?”). Răspunsul poate lua forma valorilor codificate sau a valorilor textului liber. Valorile codificate sunt răspunsuri care au fost predefinite și pot fi selectate dintr-o listă de selecție (de exemplu, „Cancer pulmonar” sau „Cancer mamar”). Dacă un pacient are un diagnostic care nu a fost predefinit, detaliile suplimentare de diagnostic pot fi înregistrate într-un câmp de text liber.

Pregătirea listei de elemente de date

La extragerea articolelor de date, este important să păstrăm o urmă de audit a articolelor de date pentru a ne permite să urmărim de unde provin termenii. Această pistă de audit trebuie să includă numele tabelului, numele elementului de date, tipul de date, precum și codul și descrierea, dacă este cazul. Capturile de ecran ale aplicației în care este utilizat elementul de date ar fi, de asemenea, utile pentru a înțelege contextul în care este utilizat.

Extragerea elementelor de date

Numele elementelor de date pot fi extrase manual vizualizând schema bazei de date și copiind numele fiecărui element de date sau utilizând o aplicație software de gestionare a bazei de date pentru a exporta schema într-un fișier text sau foaie de calcul. Elementele de date dintr-o bază de date pot fi clasificate ca fiind cele referitoare la întâlnirile clinice, identificatorii sau pista de audit. Întâlnirile clinice se referă la elemente de date precum numele pacientului, diagnosticul și sexul. Identificatorii se referă la elemente de date care sunt de obicei cheile primare sau străine ale tabelelor. Traseul de audit se referă la elemente de date, cum ar fi informațiile despre contul de utilizator, jurnalele de audit pe care a adăugat sau editat o înregistrare și când a fost modificată. Pista de audit se poate referi, de asemenea, la elemente de date, cum ar fi starea unei valori codificate, indiferent dacă este activă sau nu. Este puțin probabil ca identificatorii și elementele de date ale pistelor de audit să poată fi codate, deoarece SNOMED CT nu a fost conceput în acest scop.

Extragerea valorilor codificate

Valorile codificate sunt în general stocate în tabelele de căutare. Aceste căutări sunt de obicei tabele externe în baza de date și sunt separate de aplicație, deși există cazuri în care valorile codificate sunt încorporate în software-ul în sine. Dacă valorile codificate sunt încorporate în codul programului, poate fi necesar să copiați manual fiecare valoare codificată dacă software-ul nu include o caracteristică de export. Pentru tabelele de căutare care sunt înregistrate în baza de date, în funcție de proiectarea acesteia, valorile codificate pot fi înregistrate într-un singur tabel sau valorile codificate pentru fiecare element de date pot fi în tabele individuale. Atunci când extrageți valori codate, este important să faceți distincția între cod (adică valoare) și descrierea codului (adică semnificația valorii). De exemplu, „Bărbat” este o descriere a codului și poate fi reprezentat cu codul alfabetic „M” sau un cod numeric, cum ar fi 1. Când codificați termenii în SNOMED CT, descrierea codului ar trebui utilizată, dar este important să puteți conectați descrierea codului înapoi la cod. Codificarea valorilor codate cu SNOMED CT poate fi considerată o formă de mapare.