Metodă de estimare a caloriilor alimentare bazate pe învățarea profundă în evaluarea dietetică prin Synced SyncedReview
Datorită îmbunătățirii nivelului de trai al oamenilor, obezitatea crește într-un ritm alarmant, iar acest lucru reflectă riscurile pentru sănătatea oamenilor. Oamenii trebuie să-și controleze aportul zilnic de calorii consumând alimente mai sănătoase, care este metoda cea mai de bază pentru a evita obezitatea. Cu toate acestea, deși ambalajul alimentar vine cu etichete nutriționale (și calorice), nu este încă foarte convenabil pentru oameni să facă referire. Astfel, oamenii de știință au început să folosească algoritmi de învățare automată în vederea computerizată pentru a ajuta oamenii să determine valoarea calorică din alimentele pe care le consumă. În cadrul Summit-ului Rework Deep Learning 2015 din Boston, omul de știință Google Kevin Murphy a prezentat un algoritm de învățare profundă care a fost folosit pentru a analiza imaginea alimentelor statice. Analizând compoziția alimentelor din imagine, algoritmul poate calcula câte calorii are vasul.

Această lucrare încearcă să ofere un mod mai eficient de estimare a caloriilor. În primul rând, are nevoie de imagini de vedere de sus și de vedere laterală a alimentelor analizate. Apoi, va utiliza Faster R-CNN pentru a detecta obiectul alimentar și de calibrare, după care se utilizează un algoritm GrabCur pentru a determina conturul alimentelor. După estimarea volumului de alimente, autorii pot estima în cele din urmă cantitatea de calorii.
Când indicele de masă corporală (IMC) al oamenilor depășește 30 (kg/m2), aceștia sunt, în general, considerați obezi. IMC ridicat poate crește riscul de boli cum ar fi bolile de inimă [1]. Principalul motiv pentru obezitate se datorează dezechilibrului dintre cantitatea de aport caloric (consum) și producția de energie (cheltuială). Din cauza refuzului de a înregistra și a urmări, a lipsei informațiilor nutriționale conexe sau a altor motive, pacienții întâmpină deseori probleme în controlul cantității de calorii pe care le consumă. Există o mulțime de metode propuse pentru a estima caloriile pe baza viziunii computerizate [2, 3, 4, 5], dar după analiza autorilor, precizia detecției și estimarea volumului trebuie încă îmbunătățite. În această lucrare, diferența principală față de alte abordări similare constă în faptul că necesită introducerea a două imagini și utilizarea Faster R-CNN pentru a detecta obiectul și algoritmul GrabCut pentru a obține conturul fiecărui aliment. După aceea, autorii pot estima volumul și caloriile fiecărui aliment.
Această metodă este prezentată în Figura 1. După cum sa menționat anterior, procesul de estimare a caloriilor necesită două imagini din partea superioară și laterală și fiecare imagine ar trebui să includă obiectul de calibrare. Aici, autorii aleg rețele neuronale convoluționale bazate pe regiuni mai rapide (R-CNN mai rapid) [5] pentru a detecta obiecte și algoritmul GrabCut [6] ca algoritm de segmentare.
Autorii au ales Faster R-CNN în loc să folosească metoda de segmentare semantică, cum ar fi Rețelele complet convoluționale (FCN). Aici, după ce imaginile sunt introduse ca canale RGB, autorii pot obține o serie de casete de delimitare, ceea ce înseamnă clasa dacă este judecat.
Acest proces utilizează o abordare de procesare a imaginilor pentru a segmenta fiecare casetă de delimitare. După cum sa menționat mai sus, casetele de delimitare în jurul obiectului de care GrabCut are nevoie pot fi furnizate de Faster R-CNN. După segmentare, putem obține o serie de imagini alimentare stocate în matrice, dar cu valorile pixelilor de fundal înlocuite cu zerouri. Aceasta va lăsa doar pixelii din prim-plan.
Pentru a estima volumul, autorii calculează factorii de scară pe baza obiectelor de calibrare. Autorii folosesc o monedă de 1 CNY pentru a arăta procesul specific de calcul al volumului. Diametrul monedei este de 2,5 cm, iar factorul de scară al vederii laterale a fost calculat cu ecuația 1.
În această ecuație, Ws este lățimea casetei de delimitare, Hs este înălțimea casetei de delimitare. În mod similar, scala vederii de sus poate fi calculată cu ecuația 2.