In diesem Beispiel entwickeln wir eine skalierbare Anwendung mit Hadoop.
Von der Datenaggregation auf den Nodes, über die Auswertung in Hadoop und den Transfer zurück soll ein kompletter Kreislauf entstehen.
Für eine effiziente Nutzung riesiger Datenmengen benötigt man ein Format um die Daten abzuspeichern.
Daten in diesem Format sollen schnell erzeugt werden können, sie sollen wenig Netzwerkbandbreite verursachen und wenig Festplattenspeicher verbrauchen.