Utilizarea indexurilor de sânge pentru a prezice stările supraponderale O abordare extremă de învățare bazată pe mașini

Afiliații Colegiul de Inginerie Fizică și Informatică Electronică, Universitatea Wenzhou, Wenzhou, China, Laboratorul cheie de calcul simbolic și inginerie a cunoașterii din Ministerul Educației, Universitatea Jilin, Changchun, China

Afilieri Colegiul de Informatică și Tehnologie, Universitatea Jilin, Changchun, China, Laboratorul cheie de calcul simbolic și ingineria cunoștințelor din Ministerul Educației, Universitatea Jilin, Changchun, China

Colegiul de afiliere inginerie fizică și informație electronică, Universitatea Wenzhou, Wenzhou, China

Colegiul de afiliere pentru științe farmaceutice, Universitatea de Medicină Wenzhou, Wenzhou, China

Departamentul farmaceutic de afiliere, primul spital afiliat al Universității medicale Wenzhou, Wenzhou, China

Huiling Chen,
Bo Yang,
Dayou Liu,
Wenbin Liu,
Yanlong Liu,
Xiuhua Zhang,
Lufeng Hu

Cifre

Abstract

Analiza statistică a fost efectuată utilizând software-ul SPSS 17. IMC, vârsta, sângele și indicii biochimici ai celor două grupuri au fost analizați printr-un test ANOVA unidirecțional pentru a detecta diferențele statistice. Tabelul 2 listează descrieri statistice detaliate. Corelația dintre IMC cu sânge și indicii biochimici au fost analizate folosind un test Spearman. Valorile p care au fost mai mici de 0,05 (nivelul de semnificație de 5%) au fost considerate a indica semnificație statistică în toate analizele.

Metode

1. Scorul Fisher

Scorul Fisher [21] este una dintre cele mai frecvent utilizate și eficiente metode de cântărire a caracteristicilor supravegheate. Determină caracteristicile cele mai discriminatorii în funcție de criteriul pescuitului. Având în vedere setul de date din n instanțe xi, yi>, unde reprezintă că spațiul de caracteristică de intrare are m caracteristici și yi ∈ c> este eticheta de clasă corespunzătoare. Scorul caracteristicii a m-a poate fi măsurat direct după cum urmează: (1) unde, ni reprezintă numărul de instanțe din clasa i, iar μ m reprezintă valoarea medie a clasei i și valoarea medie globală corespunzătoare m- a treia trăsătură, respectiv. și σ m înseamnă varianța clasei i și varianța globală corespunzătoare caracteristicii m-a, respectiv. Conform ecuației (1), valoarea scorului mai mare reprezintă faptul că caracteristica a m-a are o putere discriminativă mai mare între diferitele clase.

2. Mașină de învățare extremă (ELM)

Această secțiune oferă o scurtă descriere a ELM; consultați [12, 22] pentru mai multe informații. Având în vedere un set de date de antrenament cu N eșantioane, xi ∈ R n este vectorul de caracteristică de intrare cu n caracteristici, iar ti ∈ R m reprezintă vectorul țintă cu m dimensiuni. Ieșirea ELM poate fi scrisă după cum urmează [12]: (2) unde g (x) este funcția de activare, k este numărul de neuroni ascunși, βi este vectorul de greutate între neuronul ascuns ith și stratul de ieșire, wi este vectorul de greutate dintre neuronul din stratul ascuns și stratul de intrare și ar indica tendința neuronului din stratul ascuns, oj este vectorul țintă al jth de date de intrare. Dacă ELM poate aproxima aceste N eșantioane cu eroare zero, putem obține. Ecuația de mai sus poate fi reformulată după cum urmează: (3) unde H [23] reprezintă matricea de ieșire a stratului ascuns al rețelei neuronale: (4) β = [β1, ⋯, βk] T este matricea greutăților de ieșire din ascuns strat la stratul de ieșire, iar T = [t1, ⋯, tN] T reprezintă vectorii etichetelor țintă. În ipoteza că [24, 25] greutățile de intrare și părtinirile stratului ascuns ale rețelei neuronale de alimentare cu un singur strat ascuns (SLFN) pot fi date în mod arbitrar, greutățile de ieșire β pot fi determinate analitic de Moor-Penrose (MP) invers generalizat al matricei H, așa cum se arată în următoarea ecuație: (5)

Utilizând metoda inversă MP, performanța generalizării ELM poate fi atinsă cu o viteză de învățare crescută dramatic [22].

3. Metoda propusă

Set de antrenament ← subseturi k-1;

Set de validare ← subset rămas;

Clasificați caracteristicile incremental folosind Scorul Fisher

Antrenează clasificatorul ELM pe fiecare subset de caracteristici fi cu caracteristicile clasate i de top folosind o variație a numărului de neuroni ascunși și a tipului de funcții de activare;