Datenverarbeitung

Der Data Processing Service (sahara) bietet eine Plattform für die Bereitstellung und Verwaltung von Instanzclustern mit Verarbeitungsgeräten wie Hadoop und Spark. Durch das OpenStack Dashboard oder die REST API können Benutzer Framework-Anwendungen hochladen und ausführen, die auf Daten im Objektspeicher oder externen Providern zugreifen können. Der Datenverarbeitungscontroller verwendet den Orchestrierungsdienst (Heat), um Cluster von Instanzen zu erzeugen, die als langlebige Gruppen existieren können, die wachsen und schrumpfen können, wie angefordert, oder als transiente Gruppen, die für eine einzelne Arbeitsbelastung erstellt wurden.