- Offizieller Beitrag
Einleitung
Die Links sind soweit vorhanden zu deutschsprachigen Seiten. Dahinter ist bei [EN] der entsprechende (meist Originalartikel) Artikel in Englisch verlinkt.
Microsoft Azure
Was ist Azure databricks
Cloud_Databricks_01b.jpg | Azure Databricks ist eine Analysesoftware wurde von der amerikanischen Firma Databricks geschrieben. Die Firma wurde von Enwickler von Apache Spark gegründet. Azure Databricks wird als Cloud-Dienst von Microsoft in der Azure Umgebung bereitgestellt. Mit der Software können große Datenmengen verarbeitet, transformiert und ausgewertet werden. Die Basis liefert dabei die Open-Source-Technologie Apache Spark. |
Apache Spark
Cloud_Spark_01b.jpg | Apache Spark ist ein Framework zur Analyse großer Datenmengen. Es integriert High-Level-APIs in Java, Python, Scala und R. Weiterhin bietet es eine optimierte Engine für Tools zum Erstellen von Diagrammen. Integriert sind Tools SQL für SQL und strukturierte Datenverarbeitung, Pandas API auf Spark für Pandas-Workloads, MLlib für maschinelles Lernen, GraphX für die Graphverarbeitung und strukturiertes Streaming für inkrementelle Berechnungen und Stream-Verarbeitung. |