
Die neue Version der Hadoop-Distribution von MapR, MapR 5․0, bringt einige spannende Neuerungen mit sich die vor allem für Echtzeitanalysen von großer Bedeutung sind. Eine der wichtigsten Funktionen ist die automatische Synchronisierung von Speicher, Datenbanken und Suchindizes. Dadurch werden komplexe Echtzeit-Anwendungen ermöglicht, bei denen Daten in Echtzeit analysiert und verarbeitet werden können.
Zusätzlich zu der automatischen Synchronisierung bietet MapR 5․0 ebenfalls neue Auditing-Funktionen. Diese ermöglichen es Unternehmen – die Zugriffe auf ihre Daten & Anwendungen zu überwachen und zu überprüfen. Dadurch wird eine höhere Datensicherheit gewährleistet und es können potenzielle Sicherheitslücken rechtzeitig erkannt werden.
Eine weitere wichtige Neuerung von MapR 5․0 ist die Unterstützung von Apache Drill & Hadoop 2․7. Apache Drill ist ein SQL-Query-Engine die es ermöglicht, Abfragen auf unstrukturierten Daten durchzuführen. Mit der Unterstützung von Apache Drill wird die Analyse von Daten noch flexibler und einfacher.
Darüber hinaus bietet MapR 5․0 auch verbesserte Skalierbarkeit und Leistung. Die neue Version ist optimiert für große Datenmengen und kann große Cluster effizient verwalten. Dadurch werden die Möglichkeiten für Unternehmen erweitert, große Datenmengen in Echtzeit zu analysieren und wertvolle Erkenntnisse daraus zu gewinnen.
Insgesamt ist MapR 5․0 eine leistungsstarke Hadoop-Distribution die speziell auf Echtzeitanalysen ausgelegt ist. Mit den neuen Funktionen & Verbesserungen bietet sie Unternehmen die Möglichkeit, komplexe Anwendungen in Echtzeit zu ausarbeiten und datenbasierte Entscheidungen zu treffen.
0 der eigenen Hadoop-Distribution vorstellen. Die MapR-Distribution basiert auf dem aktuellen Hadoop 2.7 und bindet wie vergleichbare Anbieter darauf abgestimmte Big-Data-Techniken ein.
Das neue Release habe ganz im Zeichen der Veränderungen innerhalb des Hadoop-Ökosystems gestanden, darauffolgend denen sich das Big-Data-Framework weg von einer Plattform zur Verarbeitung von Batch-Prozessen hin zu einer Technik für Echtzeitanalysen bewegt habe, berichtet Fabian Wilckens, EMEA Solution Architect bei MapR, im Gespräch mit heise Developer. Hadoop wird deswegen zunehmend zur Entscheidungsplattform die gleichzeitig Live-Daten verarbeitet & Echtzeitanalysen bereitstellt.
In dem Kontext verfügt nun die MapR-Datenbank über die Fähigkeit der Tabellenreplikation um Daten in Echtzeit zu synchronisieren und für externe Rechenmaschinen verfügbar zu machen. Als Erste wird dabei die auf Lucene basierende Suchplattform Elasticsearch unterstützt um synchronisierte Volltext-Suchindizes automatisch zu ermöglichen. Weitere wie Spark Streaming und Apache Storm werden hier wohl folgen die Nachfrage bei den Kunden nach Elasticsearch war aber am größten, macht verständlich Wilckens.
Kunden haben mitgeholfen
Außerdem sind neue Funktionen in Enterprise-Bereichen wie Sicherheits-Auditing & Autorisierungen hinzugekommen, bei deren Ausarbeitung offenbar auch deutsche Kunden mitgeholfen haben. Hier geht es unter anderem um ein Auditing für den Datenzugriff via Logfiles im JSON-Format für das Reporting jedoch auch um schnelle Analysen mit Drill.
Das Apache-Projekt hilft bei der Analyse und auch beim Einsatz von Batch-Prozessen und ihrer Pipelines mit schnellen und umfangreichen Berechnungen. Im Kontext des neuen Releases soll mit Drill ein sicherer Zugang zu Daten auf Feldebene innerhalb von Dateien gewährt werden um sicherzustellen, dass sich ausschließlich autorisierte Daten analysieren lassen. Datenanalysten können zudem Berechtigungen erhalten Datensets mit anderen zu teilen.
Ebenfalls neu sind die sogenannten Auto-Provisioning Templates die als Quasi-Installer beim Aufsetzen & Bereitstellen von Hadoop-Clustern helfen sollen.
Die neue Version ist voraussichtlich ab Juli 2015 verfügbar und soll die Basis für die drei Konfektionen Community Edition (kostenlos), Enterprise Edition und Enterprise Database Edition stellen.
Kommentare