Cum USDA a legat datele federale și comerciale de a arăta lumina asupra valorii nutriționale a alimentelor cu amănuntul

Americanii își cheltuiesc aproximativ jumătate din bugetele alimentare pentru a cumpăra aproximativ două treimi din alimentele lor din magazine. SUA. Departamentul Agriculturii (USDA) achiziționează date de proprietate pentru scanerele de uz casnic și de vânzare cu amănuntul pentru a efectua cercetări privind comportamentul consumatorilor, prețurile alimentelor, produsele noi disponibile și pentru a înțelege cât de sănătoase sunt alegerile alimentare pentru consumatori. Aceste date pot fi utilizate pentru a analiza vânzările în cantități sau în cantități achiziționate în dolari, dar nu pot oferi o imagine completă a calității nutriționale. Deși datele conțin informații despre eticheta Fapte nutriționale enumerate pe unele alimente ambalate, nu există informații despre nutrienți sau profilul nutrițional al alimentelor neambalate, cum ar fi produsele. În plus, datele nu permit o analiză mai detaliată, cum ar fi determinarea cantității de legume în pizza congelată sau cantitatea de carne de vită în chiftele.

Serviciul de Cercetări Economice (ERS) al USDA - Serviciul pentru alimentație și nutriție - Centrul pentru politici și promovare nutrițională (FNS-CNPP) și Serviciul de cercetare agricolă (ARS) au creat recent Trecerea pe piață (PPC), care extinde utilizarea datelor comerciale pentru cercetarea alegerilor alimentare americane. Această trecere de pietoni leagă cele peste 359.000 de produse alimentare dintr-o bază de date a companiei comerciale cu câteva mii de alimente dintr-o serie de baze de date nutriționale USDA. Deoarece nu există identificatori comuni între cele două structuri de date, echipa a folosit metode probabilistice și semantice pentru a reduce efortul manual necesar pentru a lega datele.

Lecții pentru alte agenții

Prin conectarea resurselor de date existente, USDA a reușit să îmbogățească și să extindă capacitățile de analiză ale ambelor seturi de date. Alte agenții pot învăța din abordarea USDA de a lega datele pentru a obține noi informații din datele deja disponibile. Lucrând atât cu părțile interesate interne, cât și cu cele externe, USDA a identificat obiective clare ale proiectului, legând criterii și metode de evaluare. Echipa a căutat un contractor cu expertiză în strategii automate de potrivire a datelor. În plus, o echipă independentă de oameni de știință a datelor efectuează un audit al datelor care implică o revizuire a metodelor, precum și discuții cu părțile interesate actuale și potențiale cu privire la utilizările viitoare și la utilizarea datelor.

Problema

Fără aceste date legate, factorii de decizie și cercetătorii au fost limitați în capacitatea lor de a aborda câteva întrebări importante. De exemplu, de peste un deceniu, ERS a achiziționat și analizat date de proprietate despre achizițiile de alimente de uz casnic și vânzările cu amănuntul de alimente de la IRI, o companie de cercetare a pieței, dar aceste date oferă informații limitate despre valoarea nutrițională a achizițiilor. Pentru a înțelege mai bine modul în care alegerile alimentare ale cumpărătorilor se compară cu recomandările din Ghidurile dietetice pentru americani, datele proprii trebuie să fie legate de bazele de date USDA nutriționale. Bazele de date USDA cuantifică cantitățile de nutrienți (dincolo de eticheta Nutrition Facts) și numărul de porții ale principalelor grupuri de alimente conținute în aproximativ 15.000 de produse alimentare. În plus, legarea seturilor de date va permite USDA să estimeze prețurile la alimente pentru următoarea actualizare a coșului de piață pentru Planul Thrifty Food, baza actualizării anuale pentru alocarea maximă pentru beneficiile Programului suplimentar de asistență nutrițională (SNAP).

Provocări pentru conectarea datelor

Orice problemă de potrivire necesită un set de criterii de potrivire pentru a defini ce potriviri sunt acceptabile. Acest proiect a avut două criterii: nutriție și preț. Adică, baza de date de legătură este utilizată atât pentru a integra datele nutriționale în datele scanerului, cât și pentru a furniza estimări ale prețurilor pentru produsele alimentare în planurile alimentare USDA. Acest criteriu de potrivire dublă s-a adăugat la complexitatea problemei de potrivire și a condus la un cod universal al produsului (UPC) mai neegalat decât dacă echipa ar fi ales pur și simplu unul.