Für Techniker
Hier darf es technisch werden. Ein Überblick über die Architektur und Technologien hinter ChangingGraph.
Warum ein Knowledge Graph?
Daten in isolierten Datenbanken sind schwer zu verknüpfen. Ein Knowledge Graph macht Beziehungen zur nativen Datenstruktur.
Vergleich: Relationale DB vs. Graph
| Aspekt | Relationale DB | Knowledge Graph |
|---|---|---|
| Struktur | Starre Tabellen | Flexible Tripel (Subject-Predicate-Object) |
| Beziehungen | Foreign Keys, JOINs | Native Kanten |
| Schema | Schema-Änderung aufwändig | Erweiterbar ohne Migration |
| Semantik | Keine eingebaute Bedeutung | Ontologien definieren Bedeutung |
| Interoperabilität | Proprietär | Offene Standards (RDF, SPARQL) |
Technologie-Stack
RDF (Resource Description Framework)
ChangingGraph basiert auf RDF – dem W3C-Standard für verknüpfte Daten.
Grundprinzip: Alles ist ein Tripel.
<Apfel> <istEin> <Obst> .
<Apfel> <enthält> <VitaminC> .
<VitaminC> <menge> "5mg/100g" .
SPARQL
Die Abfragesprache für RDF. Ähnlich wie SQL, aber für Graphen.
Beispiel: Finde alle Lebensmittel mit viel Vitamin C
SELECT ?food ?vitaminC WHERE {
?food a cg:Food ;
cg:hasNutrient ?nutrient .
?nutrient cg:nutrientType "Vitamin C" ;
cg:amount ?vitaminC .
FILTER(?vitaminC > 20)
}
Ontologien
ChangingGraph nutzt bestehende Ontologien und erweitert sie:
- FoodOn – Food Ontology (Lebensmittel-Klassifikation)
- ChEBI – Chemical Entities (Inhaltsstoffe)
- Wikidata – Verknüpfungen zu Allgemeinwissen
- SKOS – Taxonomien und Klassifikationen
Datenquellen
ChangingGraph integriert Daten aus verschiedenen Quellen:
Bundeslebensmittelschlüssel (BLS)
Deutsche Referenzdatenbank mit ~7.000 Lebensmitteln und ~120 Nährstoffen pro Lebensmittel.
- Wissenschaftlich validiert (Max Rubner-Institut)
- Tiefe Nährstoffanalyse (Aminosäuren, Fettsäuren, Vitamine, Mineralstoffe)
Open Food Facts (geplant)
Crowd-sourced Produktdatenbank mit Barcodes und Markenprodukten.
Anreicherung
Alle Daten werden mit SKOS-Taxonomien angereichert und mit Wikidata, ChEBI und FoodOn verknüpft.
Architektur-Prinzipien
Design-Ziele:
- Modular: Komponenten sind austauschbar
- Föderierbar: Mehrere Instanzen können miteinander kommunizieren
- Open Standards: RDF, SPARQL, ActivityPub
- Data Sovereignty: Nutzer kontrollieren ihre Daten
Multi-Repository-Design
Daten sind nach Domänen getrennt:
- Food Catalog: Lebensmittel, Nährstoffe, Rezepte
- Actors: Menschen, Initiativen, Organisationen
- User Data: Persönliche Ernährungsdaten, Symptome
Content-Addressed Storage
Versionierung über Content-Hashes – ähnlich wie Git.
Jede Änderung an Daten erzeugt eine neue Version, alte Versionen bleiben verfügbar.
Für Forscher
ChangingGraph soll langfristig Forschung ermöglichen:
- SPARQL Endpoint: Für komplexe Abfragen über die aufbereiteten Daten (API-Zugang kostenpflichtig)
- Anonymisierte Daten: Für Ernährungsstudien (DSGVO-konform)
- Datenquellen: Basiert auf öffentlichen Daten (BLS, OpenFoodFacts) – der Mehrwert liegt in der semantischen Vernetzung und Aufbereitung
Für Entwickler
ChangingGraph ist offen für Kooperationen:
- Standardbasiert: RDF, SPARQL, ActivityPub
- Föderiert: Eigene Instanzen denkbar
- Erweiterbar: Module und Extensions möglich
Open Source Ziel: Sobald durch Mitglieder und Spenden tragfähig finanziert.
Interesse an Kooperation oder technischem Austausch?
Kontakt: office@gsund.rocks
ChangingGraph