„Proiectul etichetei nutriționale Dataset” abordează Dataset Health and Standards de Berkman Klein Center

Folosim algoritmi pentru a lua decizii în fiecare zi, de la găsirea rutei cel mai puțin traficate, la navigarea în știri, la luarea deciziilor de angajare la locul de muncă. Pe măsură ce luarea deciziilor algoritmice devine mai răspândită, există o mulțime de lucrări importante de făcut pentru a se asigura că algoritmii sunt dezvoltați cu atenție la acuratețe, părtinire și corectitudine. Din ce în ce mai mult, jurnaliștii și academicienii investighează și expun părtinirea rezultatelor algoritmice, dar s-a acordat mai puțină atenție părtinirii din datele utilizate pentru instruirea acestor algoritmi.

Dataset Nutrition Label Project (DNLP), care a fost creat în cadrul programului de asamblare din 2018 găzduit de Berkman Klein Center și MIT Media Lab, încearcă să abordeze acest punct orb în înțelegerea noastră asupra sănătății și calității datelor.

Premisa proiectului este simplă. Integritatea unui model de învățare automată este bazată fundamental pe datele utilizate pentru instruirea acestuia - așa cum se spune, „gunoi în, gunoi în afara”. În loc să aștepte să evalueze modelele după ce au fost create, DNLP își propune să faciliteze evaluarea rapidă a viabilității și aptitudinii unui set de date, înainte de a fi utilizat pentru a antrena un model, dându-i o etichetă „nutrițională”.

În 2018, echipa DNLP a dezvoltat măsuri de sănătate a seturilor de date cantitative și calitative. Acum, echipa lucrează pentru a împacheta aceste măsuri într-o „etichetă nutrițională a setului de date” ușor de utilizat. Consultați aici prima lor etichetă prototip, construită pe setul de date ProPublica’s Dollars for Docs. Echipa a scris, de asemenea, o carte albă care explică cadrul lor și conceptul de etichetă nutrițională a setului de date.

De la programul de asamblare de anul trecut, proiectul a crescut și a evoluat. Am vorbit cu patru dintre membrii echipei actuale ai proiectului - Kasia Chmielinski, liderul proiectului; Sarah Newman, cercetător și strateg; Josh Joseph, Cercetător AI; și Matt Taylor, om de știință de date și facilitator de atelier - pentru a afla mai multe despre modul în care Adunarea i-a reunit și la ce lucrează acum. Interviul a fost editat pentru claritate.

Adunarea adună o mică cohortă de tehnologi, manageri, decidenți politici și alți profesioniști pentru a face față problemelor emergente legate de etica și guvernanța inteligenței artificiale. Programul de patru luni începe cu un proces intensiv de idei de două săptămâni și un curs scurt, în timpul căruia participanții încep să formeze echipe de proiect. Aceasta este urmată de o perioadă de dezvoltare colaborativă de douăsprezece săptămâni, când echipa își construiește proiectele.

Anul trecut a fost a doua versiune a Adunării, cu o cohortă de nouăsprezece persoane. Până la sfârșitul programului, grupul a creat șase proiecte, inclusiv DNLP.

În timpul interviului nostru, echipa DNLP a vorbit despre modul în care programul Adunării i-a reunit și a încurajat colaborarea interdisciplinară.

IOS IOSIF: Ca inginer AI, îmi place foarte mult să construiesc lucruri. Sincer să fiu, înainte de program, nu mă gândisem atât de greu la o mulțime de etică, politici, guvernanță și drept legate de AI. Asamblarea a fost o modalitate de a gândi mai profund la întrebări importante precum „ce înțelegem prin părtinire?” Și, în același timp, de a lucra efectiv la un proiect și de a construi ceva cu oameni care nu sunt toți ingineri. Ca inginer, am obținut multe din provocarea mea în acest fel.

KASIA CHMIELINSKI: De acord. În conversația tehnică etică, se poate simți adesea că există oameni care construiesc tehnologie și apoi există oameni care scriu lucrări despre implicațiile acestei tehnologii. Este rar ca aceștia să poată veni împreună pentru a colabora. Adunarea a fost o oportunitate de a ne gândi la etică și de a pune în aplicare idei în aceste discipline. Grupul nostru este foarte divers. Ne gândim la artă și media, la învățare, la gestionarea produselor și la inginerie. Și asta se reflectă în rezultatele proiectului nostru: un prototip, dar și o lucrare, iar acum vorbim, de asemenea, în mod regulat pe mai multe domenii. Sunt foarte bucuros pentru oportunitatea de a purta aceste conversații în întreaga industrie.

SARAH NEWMAN: Adunarea reunește oameni cu medii foarte diferite, iar programul încurajează și facilitează colaborarea, ceea ce face rezultate cu adevărat unice. Am venit cu un limbaj comun și am fost generosi unul cu celălalt și am conceput proiecte care au fost mai puternice decât ar fi fost altfel, datorită perspectivelor și abordărilor noastre variate pentru rezolvarea problemelor.

Un lucru este să mergi la un eveniment sau la o conferință în care există oameni care provin din diferite domenii sau sectoare diferite. Vă întâlniți, schmooze, vorbiți despre idei. Grozav. Dar există ceva foarte diferit în lucrul efectiv cu oameni dintr-o echipă; trecând prin urcușuri și coborâșuri, tensiuni, succese, fiind într-adevăr în procesul de a lucra împreună. Conexiunea devine mult mai profundă. Deci, unul dintre marile beneficii ale Asamblării pentru proiectul nostru a fost această colaborare între sectoare.