Wieso per Barcode Scanner nicht alle Produkte gefunden werden - und woher unsere Daten stammen
Die Produktdaten in der Speisekammer App stammen aus OpenFoodFacts. Es kann passieren, dass nicht alle Produkte gefunden werden. Wir erklären in diesem Artikel den Crowdsourcing-Ansatz im Hintergrund.
In diesem Artikel geben wir euch einen Blick hinter die Kulissen, wie wir Barcodes verarbeiten und woher unsere Produktdaten stammen.
Wie funktioniert ein Barcode?
Ein Barcode oder auch Strichcode ist eine maschinenlesbare Identifikationsnummer. Diese macht Produkte identifizierbar für die gewerbliche Nutzung und den Einzelhandel - idealerweise global eindeutig.
Eingeführt wurde der erste Barcode (Universal Product Code, abgekürzt UPC) 1973 in den USA. Hinter dem in den USA gebräuchlichen UPC-A stehen 12 Ziffern. Man sieht schnell, dass außer dem Land und der Herstellerfirma in den 12 Ziffern nicht viele Infos stecken.
In Europa wurde drei Jahre später, 1976 die European Article Number (Abkürzung EAN) eingeführt. Diese ist 13-stellig und vom System her zu UPC kompatibel.
Identifikationsschema seit 2015
Seit 2015 wurden die Identifikationsnummern, die weltweit im Handel verwendet werden, umbenannt in Global Trade Item Number (GTIN). Diese ist 8, 12, 13 oder 14-stellig und enthält immer eine Prüfziffer, um Fehler beim maschinellen einlesen entdecken zu können.
Wie kommt man an die Produktdaten?
Die GS1 Germany GmbH aus Köln ist der einzige offizielle Anbieter von EAN8/EAN13 Codes in Deutschland. Wer ein Produkt mit Barcode verkaufen möchte, muss dort einen eindeutigen Barcode kaufen.
30 Barcodes können von dort pro Tag kostenlos abgerufen werden - allerdings ohne die ganzen relevanten Größen, die für die Lagerung von Lebensmittel interessant sind. Es fehlen zum Beispiel Produktname, die Packungsgröße und die Nährwerte.
Als Test habe ich in der offizellen Barcode-Suche der GS1 Germany namens Gepir nach einem zufällig ausgewählten Artikel gesucht: Eine Packung Haribo aus einem Edeka in München. Der Barcode 8426617106201 ergibt direkt Aufschluss auf das Land, das den Barcode vergeben hat: Die zwei Ziffern links stehen für Spanien (84).
Die Suche in Gepir ergibt folgendes Ergebnis: Firmenname "HARIBO ESPAÑA S.A.U." sowie eine Adresse.
Leider können wir damit noch nicht viel anfangen. Eine gewerbliche Nutzung des Dienstes ist kostenintensiv und gibt uns nicht die Daten, für die wir uns interessieren. Das wären zumindest: Name, Menge, Nährwerte des Lebensmittels sowie Hinweise auf eventuell enthaltene Allergene.
Die erste Speisekammer App mit Produktdaten: Crowdsourcing
Als wir 2013 mit der ersten Speisekammer App im App Store gestartet haben, gab es noch nicht einmal einen Barcode Scanner - und dementsprechend auch noch keine hinterlegten Produktdaten.
Jeder Nutzer hat seine Artikel selbst eingepflegt, was entsprechend aufwändig war. Im Dezember 2015 war es dann endlich so weit: Wir haben eine Produktdatenbank für die Speisekammer erstellt, mit der Nutzer zwar nach wie vor Lebensmittel eingeben mussten, diese dann aber unter allen Nutzern geteilt wurden! So waren zumindest gängige Artikel in der Regel schon in der Datenbank und die Erfassung der Vorräte oder des Einkaufs ging deutlich schneller vorwärts.
Nach einiger Zeit haben sich jedoch auch Schwachstellen des Ansatzes gezeigt:
- So gab es pro Artikel nur ein Feld für den Produktnamen - obwohl die App auch international eingesetzt wurde. Leute haben den Namen dann mal schwedisch, mal englisch, mal deutsch befüllt.
- In der App gab es zwar Lagerorte, scheinbar haben diese für die Ordnung der Artikel bei einigen Nutzern aber nicht ausgereicht. So sind schnell kryptische Kategoriebezeichnungen wie "30 Saft", "31 H-Milch" entstanden, die nur für den jeweiligen Nutzer verständlich waren.
- Manche Nutzer haben sehr sorgfältig alle Nährwerte übertragen - andere haben diesen Part komplett übersprungen. Der Detaillierungsgrad der Produkte war dementsprechend unterschiedlich.
Die aktuelle Speisekammer WebApp
Bevor wir unsere aktuelle WebApp in 2019 für die öffentliche Beta freigeschaltet haben, haben wir lange nach dem richtigen Modell bezüglich Produktdatenbank gesucht. Wir haben darüber nachgedacht, wie wir die Qualität der bestehenden Daten erhöhen könnten.
Letztlich haben wir uns aktiv dafür entschieden, unsere eigene Produktdatenbank nicht weiterzuverwenden und stattdessen auf das offene Modell von OpenFoodFacts.org zu wechseln. Produktdaten werden auch hier von freiwilligen Nutzern gepflegt und in einer öffentlich zugänglichen Datenbank abgelegt. Das Projekt hat jedoch einige Vorteile, wie wir im folgenden Abschnitt sehen werden.
Produkte können direkt bei OpenFoodFacts abgerufen werden und für eigene Zwecke genutzt werden. Die Produktdaten sind unter der Open Database License lizenziert - das sichert eine Verwendung der Daten für beliebige Zwecke - so lange neu hinzugefügte Produktdaten zurückgespielt werden - so wird der Crowd-Sourcing Effekt über die Lizenz sichergestellt.
Ein paar Fakten zu OpenFoodFacts
- OpenFoodFacts wurde im Mai 2012 in Frankreich gegründet
- Inzwischen sind dort 1,875,095 Produktdaten aus aller Welt mit Barcode verzeichnet
Im Vergleich zu unserer ersten Datenbank hat OpenFoodFacts ein sehr umfangreiches Datenschema. So sind zum Beispiel Namensfelder für beliebige Sprachen vorgesehen.
Zusätzlich erlaubt OpenFoodFacts, Fotos vom Produkt, von der Inhaltsliste und von der Nährwerttabelle hochzuladen. Damit ist eine maschinelle automatische Qualitätskontrolle der eingegebenen Nährwertangaben möglich, was die Qualität der Angaben deutlich steigert.
Was zur Tüte Haribo im Beispiel von oben alles bei OpenFoodFacts zu finden ist, findet ihr hier.
Speisekammer App und OpenFoodFacts
Wir rufen seit dem 7. Oktober 2019 Produktdaten von OpenFoodFacts ab und spielen diese selbstverständlich auch zurück, zum Vorteil aller Nutzer.
Seitdem haben unsere Nutzer 10.184 Artikel komplett neu angelegt und 20.441 Artikel editiert, zumeist um fehlende Attribute ergänzt.
Damit haben unsere Nutzer 0,5% aller Artikel in der weltweiten Datenbank angelegt - das ist eine stolze Summe, von der gerade Nutzer in Deutschland profitieren! Herzlichen Dank an dieser Stelle für das sorgfältige Einpflegen der Daten, die so allen zukünftigen Nutzern sehr komfortabel zur Verfügung stehen.
Obwohl es immer wieder vorkommen kann, dass einzelne Produkte beim Scannen nicht gefunden werden, glauben wir an den Ansatz: Eine Produktdatenbank, die von Nutzern gepflegt wird, ist unabhängig von den Interessen der Lebensmittelhersteller, bei Bedarf beliebig erweiterbar und ohne Einschränkungen für alle zukünftigen Zwecke einsetzbar.
Wenn du also auf einen Artikel stößt der nicht gefunden wird, und diesen selbst eintragen musst - denk an die vielen Nutzer, die den Artikel auch noch einscannen werden, sie werden dir deinen Produkteintrag danken! 😊