Das Cloud-Angebot soll den Einsatz des Big-Data-Frameworks zur Berechnung auf Clustern vereinfachen und die Zeit zur Entwicklung und Verwaltung komplexer Spark-Workloads verringern.
Auf dem derzeit tagenden Spark Summit 2015 hat Databricks, das maßgeblich hinter dem Big-Data-Framework stehende Unternehmen bekannt gegeben, dass sein gleichnamiger Cloud-Dienst auf Basis von Apache Spark nun offiziell verfügbar sei. Den vor einem Jahr gestarteten Dienst bot Databricks bislang allein über ein geschlossenes Anwenderprogramm an. Das bislang Databricks Cloud genannte Angebot verwendet die Public Cloud von Amazon Web Services, wobei auch schon gemutmaßt wurde, das Angebot über kurz oder lang unter Googles Cloud und Microsofts Azure-Plattform nutzen zu können.
Die laut seinem Betreiber von mehr als 150 Unternehmen genutzte Cloud-Umgebung soll den Einsatz des quelloffenen, auf In-Memory-Verarbeitung setzenden Frameworks zur Berechnung auf Clustern vereinfachen und die Zeit zur Entwicklung mit sowie das Planen und Verwalten von komplexen Spark-Workloads verringern.
Spark hat seine Wurzeln in einem Projekt des AMPLab der UC Berkeley hat. Dort wurde es 2009 gestartet und ein Jahr später unter einer BSD-Lizenz veröffentlicht. 2013 kam Spark in der Apache Software Foundation unter, wo es im Februar 2014 zum Top-Level-Projekt aufstieg. Mittlerweile sehen viele in Spark den legitimen Nachfolger des Big-Data-Frameworks Hadoop.
Databricks wurde 2013 von den maßgeblichen Entwicklern des Frameworks gegründet und hat ziemlich schnell Investoren wie Andreessen Horowitz und New Enterprise Associates gefunden. (ane)