Vorbind despre îngrijirea mea Detectarea mențiunilor despre comportamentul de aderență la terapia hormonală la un sân online
Zhijun Yin
1 Universitatea Vanderbilt, Nashville, Tennessee, SUA
Wei Xie
1 Universitatea Vanderbilt, Nashville, Tennessee, SUA
Bradley A. Malin
1 Universitatea Vanderbilt, Nashville, Tennessee, SUA
Abstract
Introducere
Cancerul de sân este cel mai răspândit cancer în rândul femeilor americane 1 și a doua cauză de deces în rândul femeilor cu cancer (chiar în spatele cancerului pulmonar) 2. Se estimează că aproape 12% dintre femeile americane vor dezvolta în cele din urmă cancer de sân invaziv pe parcursul vieții lor 3. Un tratament inițial obișnuit pentru cancerul de sân este intervenția chirurgicală (de exemplu, lumpectomia sau mastectoctomia), în timp ce terapia adjuvantă (adică tratamentul după intervenția chirurgicală) este adesea invocată pentru a reduce riscul de recurență a cancerului 4. În special, terapia adjuvantă hormonală este un tratament popular cu o experiență dovedită de îmbunătățire semnificativă a ratei de supraviețuire pe termen lung a pacienților cu cancer de sân hormon-receptor pozitiv 5. Acest lucru este remarcabil deoarece acest subtip de boală cuprinde 75% din toate cazurile de cancer mamar 1. Pentru a maximiza acest beneficiu al terapiei hormonale, pacienților li se prescrie un regim de medicamente care se așteaptă să continue pentru cel puțin cinci ani 6. De exemplu, administrarea de tamoxifen (un medicament cu terapie hormonală orală) timp de cinci ani reduce mortalitatea prin cancer de sân cu 33% în deceniul după tratamentul inițial 7. Mai mult, dovezi mai recente 8 sugerează că menținerea unui regim de tamoxifen timp de încă cinci ani poate reduce și mai mult mortalitatea cu aproximativ 50%.
În această lucrare, ne propunem să dezvoltăm un cadru de învățare automată pentru a distinge mențiunile despre comportamentul de aderență la terapia hormonală (HTAB) de alte conținuturi de text liber mai puțin relevante din forumurile de sănătate online. În special, ne interesează studierea comportamentelor pacienților (și a factorilor asociați acestora), cum ar fi luarea unui medicament prescris sau întreruperea tratamentului (de exemplu, oprirea sau întreruperea unui regiment sau trecerea la un alt medicament). În cadrul nostru, sarcina de a distinge mențiunile și nemențiunile HTAB este aruncată ca o problemă de clasificare. Pentru a maximiza performanța predictivă a cadrului nostru, adaptăm și compunem extensiv tehnici de preprocesare și inginerie a caracteristicilor, precum și validăm și interpretăm efectele acestora. Cadrul nostru demonstrează că, prin aplicarea tehnicilor de procesare a limbajului natural și a tehnicilor de învățare automată, putem obține un clasificator eficient pentru a detecta automat mențiunile (și nemențiunile) comportamentelor de aderență la tratamentul terapiei hormonale. În cele din urmă, efectuăm analize de conținut (prin termeni medicali) pentru a obține o perspectivă asupra factorilor care afectează modul în care oamenii comunică luând un comportament medicamentos și întrerupând comportamentul medicamentos.