Standardizarea StandFood a alimentelor folosind un sistem semiautomat pentru clasificare și descriere

Tome Eftimov

1 Departamentul de sisteme informatice, Institutul Jožef Stefan, Jamova cesta 39, 1000 Ljubljana, Slovenia; [email protected] (P.K.); [email protected] (B.K.S.)

sistem

2 Jožef Stefan International Postgraduate School, Jamova cesta 39, 1000 Ljubljana, Slovenia

Peter Korošec

1 Departamentul de sisteme informatice, Institutul Jožef Stefan, Jamova cesta 39, 1000 Ljubljana, Slovenia; [email protected] (P.K.); [email protected] (B.K.S.)

3 Facultatea de matematică, științe naturale și tehnologii informaționale, Glagoljaška ulica 8, 6000 Koper, Slovenia

Barbara Koroušić Seljak

1 Departamentul de sisteme informatice, Institutul Jožef Stefan, Jamova cesta 39, 1000 Ljubljana, Slovenia; [email protected] (P.K.); [email protected] (B.K.S.)

Abstract

1. Introducere

În 2011, Autoritatea Europeană pentru Siguranța Alimentară (EFSA) [1] a introdus un sistem cuprinzător de clasificare și descriere a alimentelor pentru evaluarea expunerii, cunoscut sub numele de FoodEx1 [2], menit să acopere necesitatea descrierii alimentelor în colecțiile de date din diferite domenii de siguranță alimentară. După o fază de testare, în 2015, EFSA a introdus o nouă versiune numită FoodEx2 [2], pentru a corespunde nevoilor exprimate de diferiți utilizatori. Sistemul constă dintr-o mulțime de produse alimentare individuale agregate în grupuri alimentare și categorii mai largi de alimente organizate într-o relație ierarhică. În plus, oferă descrieri generice de alimente care reprezintă nivelul minim de detaliu necesar pentru evaluarea aportului sau a expunerii. Descrierea este furnizată folosind fațete, care sunt o colecție de termeni care descriu proprietățile și aspectele alimentelor din diferite perspective.

În acest studiu, introducem un sistem semi-automat, numit StandFood, pentru a standardiza alimentele în conformitate cu FoodEx2. Sistemul este format din trei părți. Primul identifică ce tip de mâncare este analizată (r, d, s sau c). Aceasta este partea de clasificare care implică o abordare de învățare automată (ML) [7,8]. Al doilea descrie alimentele folosind procesarea limbajului natural (NLP) [9,10] combinate cu teoria probabilității, care rezultă cu termenul listei sau codul FoodEx2 pentru aliment. A treia combină rezultatul din prima și a doua parte prin definirea regulilor de post-procesare pentru a îmbunătăți rezultatul pentru partea de clasificare.